BAT机器学习面试1000题(456~460题)

2018 年 9 月 19 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(456~460题)


456题

如下表是用户是否使用某产品的调查结果( )请计算年龄、地区、学历、收入中对用户是否使用调查产品信息增益最大的属性。(


A、年龄

B、地区

C、学历

D、收入


点击下方空白区域查看答案

正确答案是:C

解析:

信息增益最大,也就是分类以后信息最少,熵最小。没有划分时,原始数据熵为

如果按照年龄进行划分,划分后的熵为

分别按照熵的方法计算出划分以后的熵值,可以发现按照学历划分以后,熵为0,其他选项都大于0。因此,信息增益最大的属性是学历。    


如果不进行计算,可以由观察得出,按照学历划分以后,所有的用户都能正确分类,此时熵最小,信息增益最大。如果按照其他属性分类,都出现了错分的情况,对应的熵大于0。




457题

在其它条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题( )


A、增加训练集数量

B、减少神经网络隐藏层节点数

C、删除稀疏的特征

D、SVM算法中使用高斯核/RBF核代替



点击下方空白区域查看答案

正确答案是:D

解析:

机器学习中发生过拟合的主要原因有: 

(1)使用过于复杂的模型; 

(2)数据噪声较大; 

(3)训练数据少。    


由此对应的降低过拟合的方法有: 

(1)简化模型假设,或者使用惩罚项限制模型复杂度; 

(2)进行数据清洗,减少噪声; 

(3)收集更多训练数据。 


本题中,A对应于增加训练数据,B为简化模型假设,C为数据清洗。D选项中,高斯核的使用增加了模型复杂度,容易引起过拟合。选择合适的核函数以及软边缘参数C就是训练SVM的重要因素。一般来讲,核函数越复杂,模型越偏向于过拟合;C越大模型越偏向于过拟合,反之则拟合不足。





458题

如果线性回归模型中的随机误差存在异方差性,那么参数的OLS估计量是( )


A、无偏的,有效的

B、无偏的,非有效的

C、有偏的,有效的

D、有偏的,非有效的



点击下方空白区域查看答案

正确答案是:B

解析:

OLS即普通最小二乘法。由高斯—马尔可夫定理,在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。根据证明过程可知,随机误差中存在异方差性不会影响其无偏性,而有效性证明中涉及同方差性,即异方差会影响参数OLS估计量的有效性。






459题

一个二进制源X发出符号集为{-1,1},经过离散无记忆信道传输,由于信道中噪音的存在,接收端Y收到符号集为{-1,1,0}。已知P(x=-1)=1/4,P(x=1)=3/4,P(y=-1|x=-1)=4/5,P(y=0|x=-1)=1/5,P(y=1|x=1)=3/4,P(y=0|x=1)=1/4,求条件熵H(Y|X)( )


A、0.2375

B、0.3275

C、0.5273

D、0.5372



点击下方空白区域查看答案

正确答案是:A

解析:

由H(Y|X)= -∑P(X,Y)logP(Y|X)= -∑P(Y|X)P(X)logP(Y|X),将(y=-1,x=-1), (y=0,x=-1), (y=1,x=1), (y=0,x=1)四种情况带入公式求和,得到H(Y|X)≈-(-0.01938-0.03495-0.07028-0.11289)=0.2375。




460题

Fisher线性判别函数的求解过程是将M维特征矢量投影在( )中进行求解。


A、M-1维空间

B、一维空间

C、三维空间

D、二维空间



点击下方空白区域查看答案

正确答案是: B

解析:

 Fisher线性判别函数是将多维空间中的特征矢量投影到一条直线上,也就是把维数压缩到一维。寻找这条最优直线的准则是Fisher准则:两类样本在一维空间的投影满足类内尽可能密集,类间尽可能分开,也就是投影后两类样本均值之差尽可能大,类内部方差尽可能小。一般而言,对于数据分布近似高斯分布的情况,Fisher线性判别准则能够得到很好的分类效果。




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习



今日推荐

我们的

计算机视觉第二期

正在火热报名中

9月22日开课喽

还有2天,2天,2天

还没报名的小伙伴们

抓紧时间喽

2人及2人以上组团

立减100元

想组团者可以添加客服:

julyedukefu_02

让客服帮忙组团享受优惠喔

点击下方“阅读原文

可在线报名



 更多资讯

 请戳一戳


往期推荐

这10种深度学习方法,AI从业者必备!

干货 | 一图掌握整个深度学习核心知识体系【高清下载】

为什么程序员总喜欢在半夜写代码?

2019校招面试必备,15个CNN关键回答集锦【建议收藏】

年薪25万的程序员都选择转行了,究竟是什么行业这么热门?

点击“阅读原文”,立即报名

登录查看更多
0

相关内容

信息增益(Kullback–Leibler divergence)又叫做information divergence,relative entropy 或者KLIC。 在概率论和信息论中,信息增益是非对称的,用以度量两种概率分布P和Q的差异。信息增益描述了当使用Q进行编码时,再使用P进行编码的差异。通常P代表样本或观察值的分布,也有可能是精确计算的理论分布。Q代表一种理论,模型,描述或者对P的近似。
最新《自动微分手册》77页pdf
专知会员服务
97+阅读 · 2020年6月6日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
机器学习速查手册,135页pdf
专知会员服务
336+阅读 · 2020年3月15日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2018年6月12日
Arxiv
4+阅读 · 2018年1月29日
VIP会员
相关VIP内容
最新《自动微分手册》77页pdf
专知会员服务
97+阅读 · 2020年6月6日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
机器学习速查手册,135页pdf
专知会员服务
336+阅读 · 2020年3月15日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
Top
微信扫码咨询专知VIP会员