推荐系统的正负样本比例悬殊:600(负):1(正),如何处理?

本人推荐系统小白,最近在做一个CTR,整理出的曝光未点击事件(负样本)和曝光且点击事件(正样本)的比例悬殊,该如何处理?或者用这个数据去训练有无纰漏?
关注者
414
被浏览
174,032
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

比正负样本不均衡更难解决的是:数据太稀疏,导致数据不置信,以及实验对比结果不置信。