当前位置：首页 > news >正文

什么网站容易收录百度指数网页版

news 2025/12/20 14:24:43

什么网站容易收录,百度指数网页版,热点新闻事件及评论100字左右,营销型网站建设费用视频合集链接矩阵补充（工业界不常用） 模型结构 embedding可以把用户ID 或者物品ID 映射成向量输入用户ID 和物品ID，输出向量的内积（一个实数），内积越大说明用户对这个物品越感兴趣模型中的两个embed…

视频合集链接

矩阵补充（工业界不常用）

模型结构

embedding可以把用户ID 或者物品ID 映射成向量
输入用户ID 和物品ID，输出向量的内积（一个实数），内积越大说明用户对这个物品越感兴趣
模型中的两个embedding层不共享参数

基本想法

用户 embedding 参数矩阵记作 $A$ 。第 $u$ 号用户对应矩阵第 $u$ 列，记作向量 $a_u$ 。
物品 embedding 参数矩阵记作 $B$ 。第 $i$ 号物品对应矩阵第 $i$ 列，记作向量 $b_i$ 。
內积 $a_u,b_i>$ 是第 $u$ 号用户对第 $i$ 号物品兴趣的预估值。
训练模型的目的是学习矩阵 $A$ 和 $B$ ，使得预估值拟合真实观测的兴趣分数。

在这里插入图片描述

数据集

(用户ID，物品ID，兴趣分数)的集合，记作 $Ω =\{(u, i,y)\}$
数据集中的兴趣分数是系统记录的，比如:
- 曝光但是没有点击，记为0分
- 点击、点赞、收藏、转发，各记1分
- 分数最低是0，最高是4

训练

有一个用户-物品交互矩阵，其中行代表用户，列代表物品，矩阵中的元素代表用户对物品的评分。由于用户通常只对少数物品进行评分，这个矩阵往往是稀疏的。因此需要补全这个矩阵

把用户ID、物品ID映射成向量。
- 第 $u$ 号用户 --> 向量 $a_u$
- 第 $i$ 号物品 --> 向量 $b_i$
训练时要求解优化问题，得到参数A和B
$min_{A,B} ∑_{(u, i, y)\in \Omega}( y-<a_u,b_i>)^2$
其中，A和B是embedding参数矩阵，不是用户-物品交互矩阵
解得A，B之后，根据A和B计算用户-物品交互矩阵中未曝光物品（灰色位置）的兴趣分数补全矩阵
向用户推荐补全的矩阵中分数较高的物品

在这里插入图片描述

缺点

在实践中效果不好…

缺点1:仅用 ID embedding，没利用物品、用户属性。

物品属性:类目、关键词、地理位置、作者信息。
用户属性:性别、年龄、地理定位、感兴趣的类目。
双塔模型可以看做矩阵补充的升级版

缺点2:负样本的选取方式不对。

样本:用户-物品的二元组，记作(u,i)。
正样本:曝光之后，有点击、交互。(正确的做法)
负样本:曝光之后，没有点击、交互。(错误的做法，这是一种想当然的做法，其实没有效果)

缺点3:做训练的方法不好。

內积〈au,bi〉不如余弦相似度。
用平方损失(回归)，不如用交叉熵损失(分类)

模型存储

训练得到矩阵A和B

A的每一列对应一个用户。
B的每一列对应一个物品。

把矩阵A的列存储到 key-value 表。

key是用户ID，value是A的一列。
给定用户ID，返回一个向量(用户的embedding)

矩阵B的存储和索引比较复杂

线上服务

把用户 ID作为 key，查询 key-value 表，得到该用户的向量，记作a°

最近邻查找:查找用户最有可能感兴趣的k个物品，作为召回结果。

第 $i$ 号物品的 embedding 向量记作 $b_i$
內积 $a,b_i>$ 是用户对第 $i$ 号物品兴趣的预估。
返回內积最大的k个物品。

缺点：如果枚举所有物品，时间复杂度正比于物品数量。

加速最近邻查找

支持最近邻查找的系统:Milvus、Faiss、HnswLib等等。
度
衡量最近邻的标准:

欧式距离最小(L2距离)
向量内积最大(内积相似度)
向量夹角余弦最大(cosine相似度，目前常用)

如何用cosine相似度计算最近邻

在进行线上服务之前对数据进行预处理，划分成很多区域

如何划分取决于用什么标准衡量最近邻
- 欧式距离最小：多边形
- cosine相似度：扇形

划分之后每个区域用一个向量表示

这些向量长度都是1（单位向量）
根据向量和点建立索引，把每个区域的向量作为key，区域中所有点的列表作为value，这样给定一个向量就可以取回那个区域所有的点

线上做召回时，把一个用户的向量a和所有索引向量对比，选出最相似的
通过索引找到物品列表，计算区域内每个物品与用户向量的相似度，选出最相似的k个点

这k个点就是最近邻查找的结果

在这里插入图片描述

http://www.wangmingla.cn/news/55923.html

相关文章：

做网站推广和网络推广荆门刚刚发布的

红铃铛网站建设百度指数查询官网入口登录

深圳市专业制作网站公司吗体验营销是什么

git做网站根目录锦州seo推广

高水平的网站建设公司seo对各类网站的作用

传奇新开网站服百度推广渠道商

看手表网站专业网络推广机构

建站园网站推广公司黄页

温州外贸公司网站建设公司排名网络宣传

iis7.5添加php网站营销推广方式都有哪些

安徽网站建设免费接单平台

衡东网站制作短网址链接生成

古镇企业网站建设win10优化大师免费版

专门做优惠劵的网站济南seo网络优化公司

昆山做网站好的公司推广网站

学校网页设计说明seo营销论文

网站商城建设价格线上营销推广方式

个人网站制作流程图片网络营销策划书的范文

东莞高明网站设计软文文章

可以做时时彩的网站军事新闻最新消息今天

网站上传的工具软文代发

什么公司网站建设做的好百度网盘登录入口

网站建设实验报告自动app优化

网站开发这行怎么样seo搜索引擎优化实训总结

做网络销售都做什么网站网站流量来源

iis 网站正在建设中seo工资多少

辽宁省建设教育协会网站怎么做网站主页

仿做静态网站多少钱关键词挖掘网站

怎么参考已有网站做新站投放广告找什么平台

广州做网站信科建设seo优化方案总结