项目名称: 基于概率校准和集成学习的出生缺陷发病风险预测模型研究

项目编号: No.81502897

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 医药、卫生

项目作者: 罗艳虹

作者单位: 山西医科大学

项目金额: 18万元

中文摘要: 出生缺陷已成为影响人口素质和群体健康水平的重要公共卫生问题,准确预测出生缺陷发病风险对预防出生缺陷意义重大。目前,我国的出生缺陷监测方法、诊断技术及分析手段等环节日益完善,但仍存在漏诊、误诊及漏报等不足,使出生缺陷预测概率存在偏差,同时出生缺陷队列数据存在类别不平衡问题,致使构建的风险预测模型其预测性能降低。本项目定位于出生缺陷发病风险预测模型研究,提出利用概率校准技术和效果优良的机器学习算法,构建基于Platt scaling概率校准的随机森林和支持向量机模型,并结合传统logistic模型对预测概率进行集成学习,提高预测性能。相关概率校准和集成学习技术在数值模拟和UCI机器学习公共数据集验证的基础上,对山西省出生队列数据进行实证分析,从而有效筛选出生缺陷高危人群,对风险进行预警和控制。本项目可为制定出生缺陷干预策略提供理论依据,对预防出生缺陷、提高人口素质具有重要意义。

中文关键词: 出生缺陷;概率校准;集成学习;风险预测

英文摘要: Birth defect has become an important public health issue influencing quality of population and population health. To predict birth defects risk accurately is of great significance to prevent birth defects. At present, monitoring methods, diagnosis technologies and analysis methods of birth defects are increasingly perfect in our country, but there are still some deficiencies such as missed diagnosis, misdiagnosis and missing reports, which lead to biased prediction probability of birth defects. Besides, birth defects cohort data belong to class imbalance resulting in decreased predictive performance of the risk prediction model created. This project focuses on risk prediction model of birth defect. Using probability calibration technology and machine learning algorithms with perfect performance, an improved prediction model will be built to predict the risk probability of birth defect by combining random forests and support vector machine model based on Platt scaling probability calibration and the traditional logistic model. Probability calibration and ensemble learning technique are verified based on the numerical simulation and the UCI machine learning public data sets. Then the improved model created will be used for birth cohort data of Shanxi Province to screen risk groups of birth defects effectively and to alert or control the risk found. This project may provide basis for birth defects intervention strategy development and is of great significance for preventing birth defects and improving population quality.

英文关键词: Birth defect;Probability calibration;Ensemble learning;Risk prediction

成为VIP会员查看完整内容
0

相关内容

集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。
2022最新《预测建模笔记》329页PDF
专知会员服务
54+阅读 · 2022年4月24日
专知会员服务
112+阅读 · 2021年10月6日
专知会员服务
23+阅读 · 2021年8月27日
专知会员服务
53+阅读 · 2021年6月15日
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
21+阅读 · 2021年1月30日
专知会员服务
47+阅读 · 2020年12月4日
【AAAI2021】利用先验知识对场景图进行分类
专知会员服务
60+阅读 · 2020年12月3日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
96+阅读 · 2020年1月21日
如何解决工业缺陷检测小样本问题?
极市平台
6+阅读 · 2022年2月24日
KDD21 | 如何纠正推荐系统中的流行度偏差
图与推荐
1+阅读 · 2021年11月25日
【PHM算法】PHM算法 | 故障诊断建模方法
产业智能官
63+阅读 · 2020年3月16日
LASSO回归与XGBoost:融合模型预测房价
论智
30+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
分别基于SVM和ARIMA模型的股票预测 Python实现 附Github源码
数据挖掘入门与实战
15+阅读 · 2017年9月9日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年5月13日
Arxiv
21+阅读 · 2019年3月25日
小贴士
相关VIP内容
2022最新《预测建模笔记》329页PDF
专知会员服务
54+阅读 · 2022年4月24日
专知会员服务
112+阅读 · 2021年10月6日
专知会员服务
23+阅读 · 2021年8月27日
专知会员服务
53+阅读 · 2021年6月15日
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
21+阅读 · 2021年1月30日
专知会员服务
47+阅读 · 2020年12月4日
【AAAI2021】利用先验知识对场景图进行分类
专知会员服务
60+阅读 · 2020年12月3日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
96+阅读 · 2020年1月21日
相关资讯
如何解决工业缺陷检测小样本问题?
极市平台
6+阅读 · 2022年2月24日
KDD21 | 如何纠正推荐系统中的流行度偏差
图与推荐
1+阅读 · 2021年11月25日
【PHM算法】PHM算法 | 故障诊断建模方法
产业智能官
63+阅读 · 2020年3月16日
LASSO回归与XGBoost:融合模型预测房价
论智
30+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
分别基于SVM和ARIMA模型的股票预测 Python实现 附Github源码
数据挖掘入门与实战
15+阅读 · 2017年9月9日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员