嘿,记得给“机器学习与推荐算法”添加星标
作者 | 小雨姑娘 来源 | 知乎
链接 | https://zhuanlan.zhihu.com/p/148951213 编辑 | 机器学习与推荐算法
1.1 时间权重优化
1.2 用户session优化
2.1 序列次序权重优化
2.2 基于序列的单向相似性优化
在最极端的情况下使得lambda取0,则代表仅考虑正次序相似度。
比较经典的一种基于用户商品热度的优化方法来源于TF-IDF算法[3]:
其中,是全体用户集合,Ui是对商品i感兴趣的用户集合;Wu代表用户u对相似性的贡献度,用户u的行为数量越多,则它的贡献度越低。
策略的核心思想是兴趣广泛的用户的行为更难体现偏好,他的行为纪录多种多样,随机选出两个商品具有较高关联性的概率较低。
另一种基于用户商品热度优化的方法是,降低那些流行商品的相似性[4]:
此方法来源于关联规则分析中的置信度公式。核心思想是流行的商品被买的多,也就更有机会与其他商品计算相似度,因此要降低他们的相似度。
以上方法都是作用在相似度计算环节,也就是召回的Item-to-Item环节,而对于Match的优化聚焦于召回的User-to-Item环节。
与上面的次序权重和时间权重类似,当通过用户历史行为进行matching时,应该让用户临近的行为具有更高的权重:
其中 代表用户u历史行为i出现的时间。
KDD2020-baseline https://tianchi.aliyun.com/forum/postDetail?spm=5176.12586969.1002.12.6c3f29e8H6EQy4&postId=105787
SDM https://dl.acm.org/doi/abs/10.1145/3219819.3219869
Using TF-IDF to Determine Word Relevance in Document Queries https://0bc297c6-a-62cb3a1a-s-sites.googlegroups.com/site/caonmsu/ir/UsingTFIDFtoDetermineWordRelevanceinDocumentQueries.pdf?attachauth=ANoY7cojb_apOWGZxGpXGDoFo94TrILMf13c6yhvUO-SXAbzLg8t5-zdKgC3_gbnc39Fantv9sJDGGxu2ifKgmCaUu9phgd1EWYqeGipMH9HL6j49Oh_vEPUFypeMkEyHn-ER7cxlQw-hdO0-CkSa6sLcOm_JtYmfmC2Cx5MFCEWxv1uMFTXyUkwAprhXM6feYKqf-V-zjYFVchMpImcTG8sGdenKgYGQm5NBUiMX5YzCunLtTILQAZKjNMJz3OGmGJHeZu_4CWTq_LrOOaoDEM6hq2MZNFmoA%3D%3D&attredirects=0
CIKM2019冠军方案 http://zhuanlan.zhihu.com/p/91506866