会员服务 ·

问题描述

在CVR预测问题中，有以下的符号表示：

:训练样本，为样本特征，为 label，表示是否被转化
：真实样本分布
：流式训练中样本分布
：流式训练采样窗口，一般几十分钟
：特征窗口，一般很长，可能一天到一周

在流式训练中，样本可以划分为如下四类：

1），在观察窗口内转化的样本
2），在点击后到转化到样本，内的时间窗口中被识别为负样本
3），超过特定时间没有转化的样本
4），在点击后到转化到样本，后的时间窗口被识别为正样本

对于、样本，在训练样本中的分布和真实分布相同，不需要做特殊处理，现主要对、进行纠偏

方法

如前文描述，由于、作为特征相同、label不同的样本重复加入模型训练，在训练样本中的分布和在真实样本中的分布不一致，训练时的loss需要使用重要性采样：

这里在重要性采样时，第一个近似的地方引入了：

第二个近似的地方将化为CVR预估问题中常用的BCE loss。

由此可见，如果要得到准确的重要性采样结果，需要得到四种样本的

文本通过表示样本种类,则表示样本是的概率。从第一次近似的公式出发，我们可以转化问题为：

这里用表示不同样本的权重

进一步地，分别带入四种样本，可以将上述公式转化为：

其中为引入的延迟参数，用于表示样本是否为FN，令为FN样本的重要性采样权重，对于四种样本的重要性采样权重，则可以推导出以下关系：

其中，因为在训练样本和真实样本中分布一致；

有了以上假设，现在可以针对不同的样本给出准确的loss函数，对于负样本：

对于正样本，可以表示为：

因为也是一个预估模型，预测样本为样本的概率，在中有和项，两个预估项相乘会增大模型的方差，为了减小方差，本文设计了一套多任务学习框架来优化：

对于样本，由于其本身是无偏的，则可以直接训练
对于样本，这部分样本有偏，则会使用上述的重要性采样训练
通过这种两段式的训练，能够降低系统的方差，提高在样本的精度。

具体实例

本文在Criteo和Taobao Dataset数据集上验证了实验效果，为了模拟线上流式样本的训练范式，每个数据集都拆分成了两个部分，如果第一部分的样本在第二部分转化，则第一部分的label设置为0，然后参照流式训练的方式按照小时训练。使用这种训练范式尝试了多种处理样本的算法：

小结

本文主要减轻了CVR延迟反馈样本带来的训练bias，并且有较严格的证明推导与实验结果。在流式场景下引入额外的模块预测负样本是否为延迟样本，进而能够从理论上近似无偏估计，同时结合多任务学习减轻引入额外模块导致的方差变大的问题，整体比较solid。

后台回复关键词【入群】

加入卖萌屋NLP、CV、搜推广与求职讨论群

后台回复关键词【顶会】

获取ACL、CIKM等各大顶会论文集！

登录查看更多

相关内容

时间窗

关注 0

【都灵理工大学博士论文】《基于知识图谱嵌入的推荐系统》

专知会员服务

52+阅读 · 2022年8月27日

王晓伟：图神经网络在快手推荐召回中的应用和挑战

专知会员服务

26+阅读 · 2022年3月23日

ACL2022 | 基于强化学习的实体对齐

专知会员服务

35+阅读 · 2022年3月15日

ICML'21：一种计算用户嵌入表示的新型协同过滤方法

专知会员服务

15+阅读 · 2021年12月31日

【WWW2021】细粒度城市流量预测

专知会员服务

33+阅读 · 2021年4月6日

【WWW2021】场矩阵分解机推荐系统

专知会员服务

33+阅读 · 2021年2月27日

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

Transformer模型框架摘走50万！2020腾讯广告算法比赛冠军（附代码方案）

专知会员服务

33+阅读 · 2020年8月7日

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

专知会员服务

18+阅读 · 2020年3月15日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

多任务学习推荐模型ESMM原理与实现

机器学习与推荐算法

0+阅读 · 2022年6月10日

SIGIR 2022 | 港大、武大提出KGCL：基于知识图谱对比学习的推荐系统

PaperWeekly

0+阅读 · 2022年6月9日

CIKM 2021 | Deep Retrieval：字节跳动深度召回模型论文精读

PaperWeekly

1+阅读 · 2021年12月4日

[SIGIR'21] DMTL：召回场景基于蒸馏的多目标学习方案

图与推荐

0+阅读 · 2021年11月28日

SIGIR20 | 基于用户行为检索的点击率预估模型

机器学习与推荐算法

1+阅读 · 2021年9月28日

KDD21 | 一种使用真负样本的在线延迟反馈建模

图与推荐

0+阅读 · 2021年9月27日

最全推荐系统Embedding召回算法总结

凡人机器学习

30+阅读 · 2020年7月5日

转化率预估(pCVR)系列--延迟预估模型（上篇）

AINLP

31+阅读 · 2020年6月1日

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

AI100

21+阅读 · 2019年9月10日

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

大跨屋盖围护结构风荷载极值概率模型的优化与对比研究

国家自然科学基金

0+阅读 · 2015年12月31日

社会化商务环境下基于中智集和云模型的推荐方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

激光陀螺高反镜缺陷反演算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

移动界面问题中的自适应界面拟合网格快速生成及有限元算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于压缩感知的地铁安全监测数据重构与施工安全风险评估

国家自然科学基金

0+阅读 · 2012年12月31日

Hadoop云存储中基于Ordinal Bloom filter的多维索引关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

社会化网络社区中跨域推荐技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

小光斑LiDAR波形数据特征参数形成机理及提取算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

粗糙双胞胎支持向量机算法的研究及应用

国家自然科学基金

0+阅读 · 2011年12月31日

异常检测的方法研究及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

Reducing Certified Regression to Certified Classification

Arxiv

0+阅读 · 2022年8月29日

Self-supervised Heterogeneous Graph Neural Network with Co-contrastive Learning

Arxiv

15+阅读 · 2021年5月19日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Entity Context and Relational Paths for Knowledge Graph Completion

Arxiv

29+阅读 · 2020年2月17日

Memory Augmented Graph Neural Networks for Sequential Recommendation

Arxiv

13+阅读 · 2019年12月26日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Learning Heterogeneous Knowledge Base Embeddings for Explainable Recommendation

Arxiv

11+阅读 · 2018年5月9日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

Learning over Knowledge-Base Embeddings for Recommendation

Arxiv

23+阅读 · 2018年3月22日

VIP会员

推荐系统用户反馈延迟新解法！阿里提出CVR无偏估计算法

问题描述

方法

具体实例

小结

相关内容