[SKR]从虎扑大战吴亦凡聊“集成学习”

2018 年 7 月 31 日 凡人机器学习

点击蓝字关注这个神奇的公众号~



其实我个人比较喜欢嘻哈音乐一点,最近比较火事其实是吴亦凡大战虎扑JR。虎扑有非常多的往右发了diss track,当然吴亦凡也发了一首作为回击。那究竟是吴亦凡的diss track更好听还是虎扑众网友的diss tracks好听呢?这里面就涉及到一个单点对多点评估的问题,有点像集成学习的思路。


集成学习


集成学习也叫模型融合技术,通常我们对于一个结果做预测,是使用单一预测模型,集成学习讲究的是用多个模型共同对一个结果做预测。集成学习用到的分类思想也是机器学习领域通常用到的弱分类器组合成强分类器的思想。那集成学习包含以下几种:

1.最大投票法

最大投票方法通常用于分类问题。这种技术中使用多个模型来预测每个数据点。每个模型的预测都被视为一次“投票”。大多数模型得到的预测被用作最终预测结果。

例如,当你让5位同事评价你的电影时(最高5分); 我们假设其中三位将它评为4,而另外两位给它一个5。由于多数人评分为4,所以最终评分为4。你可以将此视为采用了所有预测的众数(mode)。

最大投票的结果有点像这样:

2.平均法

类似于最大投票技术,这里对每个数据点的多次预测进行平均。在这种方法中,我们从所有模型中取平均值作为最终预测。平均法可用于在回归问题中进行预测或在计算分类问题的概率时使用。

例如,在下面的情况中,平均法将取所有值的平均值。

即(5 + 4 + 5 + 4 + 4)/ 5 = 4.4

3.加权平均法

这是平均法的扩展。为所有模型分配不同的权重,定义每个模型的预测重要性。例如,如果你的两个同事是评论员,而其他人在这方面没有任何经验,那么与其他人相比,这两个朋友的答案就更加重要。

计算结果为[(5 * 0.23)+(4 * 0.23)+(5 * 0.18)+(4 * 0.18)+(4 * 0.18)] = 4.41。

总结


所以说回到diss track这件事上,正确的评价吴亦凡的diss track和虎扑中JR的哪个更好,可以有三种方式:

  1. 拿虎扑里面最好听的跟吴亦凡的比

  2. 取虎扑里面的平均水平的跟吴亦凡的比

  3. 挑一些种子用户的diss track跟吴亦凡的比


哈哈~反正无论谁胜出,大家有好听的rap可以听就好,我觉得虎扑一些top用户的diss track会好一些些

珍惜每一刻每一秒

去充实自己

 

微信号:凡人机器学习

长按二维码关注



登录查看更多
0

相关内容

集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。
【2020新书】社交媒体挖掘,212pdf,Mining Social Media
专知会员服务
60+阅读 · 2020年7月30日
【KDD2020】多源深度域自适应的时序传感数据
专知会员服务
61+阅读 · 2020年5月25日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
常用的模型集成方法介绍:bagging、boosting 、stacking
知识点 | 全面理解支持向量机
机器学习算法与Python学习
9+阅读 · 2019年1月2日
决策树
Datartisan数据工匠
4+阅读 · 2018年4月19日
无监督学习:决策树AI异常检测
AI前线
15+阅读 · 2018年1月14日
ML笔记 | 零基础学懂机器学习(六)
七月在线实验室
5+阅读 · 2017年11月2日
超级干货 :一文读懂集成学习(附学习资源)
数据分析
9+阅读 · 2017年10月30日
为什么『无监督集成学习』乏人问津?
AI研习社
10+阅读 · 2017年10月24日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
深度 | 从Boosting到Stacking,概览集成学习的方法与性能
深度学习世界
3+阅读 · 2017年8月28日
Arxiv
24+阅读 · 2020年3月11日
Arxiv
26+阅读 · 2018年2月27日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关资讯
常用的模型集成方法介绍:bagging、boosting 、stacking
知识点 | 全面理解支持向量机
机器学习算法与Python学习
9+阅读 · 2019年1月2日
决策树
Datartisan数据工匠
4+阅读 · 2018年4月19日
无监督学习:决策树AI异常检测
AI前线
15+阅读 · 2018年1月14日
ML笔记 | 零基础学懂机器学习(六)
七月在线实验室
5+阅读 · 2017年11月2日
超级干货 :一文读懂集成学习(附学习资源)
数据分析
9+阅读 · 2017年10月30日
为什么『无监督集成学习』乏人问津?
AI研习社
10+阅读 · 2017年10月24日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
深度 | 从Boosting到Stacking,概览集成学习的方法与性能
深度学习世界
3+阅读 · 2017年8月28日
Top
微信扫码咨询专知VIP会员