概率分布,是指用于表述随机变量取值的概率规律。事件的概率表示了一次试验中某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即随机试验的概率分布。如果试验结果用变量X的取值来表示,则随机试验的概率分布就是随机变量的概率分布,即随机变量的可能取值及取得对应值的概率。根据随机变量所属类型的不同,概率分布取不同的表现形式。

VIP内容

题目: NGBoost: Natural Gradient Boosting for Probabilistic Prediction

摘要:

本文提出了一种基于概率预测的自然梯度增强算法。预测不确定性估计在医疗保健和天气预报等许多应用中是至关重要的。概率预测是量化这些不确定性的一种自然方法,它是模型在整个结果空间中输出全概率分布的方法。梯度增强机在结构化输入数据的预测任务中已经取得了广泛的成功,但是对于实值输出的概率预测,目前还没有一个简单的增强方案。NGBoost是一种梯度增强方法,它利用自然梯度来解决现有梯度增强方法难以进行一般概率预测的技术难题。我们的方法是模块化的基础学习者的选择,概率分布和评分规则。我们在几个回归数据集上的经验表明,NGBoost在不确定性估计和传统度量方面都提供了具有竞争力的预测性能。

作者:

Anand Avati现在是斯坦福大学人工智能实验室的计算机科学博士研究生。研究方向是人工智能,机器学习,分布式系统。

Andrew Ng是百度的副总裁兼首席科学家,Coursera的联合主席和联合创始人,还是斯坦福大学的兼职教授。2011年,他主导了斯坦福大学大型开放式网络课程主平台的开发,并教授了一个面向10万多名学生的在线机器学习课程,这促成了Coursera的成立。

成为VIP会员查看完整内容
2+
0+
更多VIP内容
Top