混合数据多粒度粗糙计算模型与算法研究 - 专知基金

会员服务 ·

0

粒计算 · 粗糙集 · 混合数据 · 属性约简 ·

2013 年 12 月 31 日

混合数据多粒度粗糙计算模型与算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 混合数据多粒度粗糙计算模型与算法研究

项目编号： No.61303008

项目类型： 青年科学基金项目

立项/批准年度： 2014

项目学科： 自动化技术、计算机技术

项目作者： 魏巍

作者单位： 山西大学

项目金额： 25万元

中文摘要： 现实生活中广泛存在着名义型、数值型、有序型和区间型等多种类型并存的混合数据，这种结构复杂、形式异构的数据模式给传统的数据分析方法带来了挑战。本项目拟借鉴人类多粒度认知和逼近推理的问题求解方法，开展面向混合数据的多粒度粗糙分析模型与算法研究，主要内容有：（1）研究不同类型属性下目标概念的粗糙近似，探索不同类型粗糙近似的融合方法，建立面向混合数据多粒度粗糙集模型；（2）给出能够有效刻画混合数据中不同类型属性下目标决策边界域的大小和结构的粗糙性度量；（3）给出基于混合数据粗糙性度量的属性子集评价方法，建立从对象和属性两个方向同时缩小数据规模的启发式属性约简加速策略；（4）给出基于粗糙性度量的决策树生成算法，建立面向混合数据的随机森林分类方法。本项目研究成果将为面向混合数据的知识发现提供新途径，对数据挖掘和机器学习等领域的研究具有重要的理论意义和应用价值。

中文关键词： 粒计算；粗糙集；混合数据；属性约简；分类

英文摘要： In real-world applications, data usually take on hybrid forms including nominal, numerical, ordered and interval. These data patterns with complex structure and heterogeneous form have brought many challenges for traditional data analysis approaches. Main content includes: (1) Analyzing the rough approximations of target concepts in the context of various types of attribute, exploring fusing approaches for various types of rough approximations, and constructing multigranulation rough set model for hybrid data. (2) Presenting new definitions of roughness which can be used to measure size and structure of boundary region got from hybrid data. (3) Designing roughness-based evaluation algorithms for attribute subsets in hybrid data. (4) Proposing roughness-based approaches for generating decision tree which are applicable for hybrid data, and constructing random forest which can be used to classify hybrid data. Results of this subject will provide new ways for knowledge discovery from hybrid data, which also have theoretical significance and practical application for many areas include data mining and machine learning.

英文关键词： Granular computing；Rough set；Hybrid data；Attribute reduction；Classification

成为VIP会员查看完整内容

0

相关内容

粒计算

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

36+阅读 · 2021年12月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

知识和数据协同驱动的群体智能决策方法研究综述

专知会员服务

125+阅读 · 2021年7月22日

证据推理理论及其应用

专知会员服务

46+阅读 · 2021年5月24日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

【博士论文】基于深度学习的图像处理算法研究

专知会员服务

80+阅读 · 2020年12月6日

【经典书】从算法到Z分数:计算机科学中的概率和统计建模，543页pdf

【经典书】从算法到Z分数:计算机科学中的概率和统计建模，543页pdf

专知会员服务

76+阅读 · 2020年11月11日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

基于FPGA的机器学习硬件加速研究进展

专知会员服务

81+阅读 · 2020年6月20日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知会员服务

147+阅读 · 2020年4月25日

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

机器之心

0+阅读 · 2022年1月5日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

【NeurIPS 2021】基于次模优化的规则学习算法框架

【NeurIPS 2021】基于次模优化的规则学习算法框架

专知

0+阅读 · 2021年11月30日

机器学习计算距离和相似度的方法

机器学习计算距离和相似度的方法

极市平台

10+阅读 · 2019年9月20日

基于TensorFlow和Keras的图像识别

基于TensorFlow和Keras的图像识别

Python程序员

16+阅读 · 2019年6月24日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

计算：XGBoost背后的数学之美

计算：XGBoost背后的数学之美

论智

12+阅读 · 2018年8月20日

计算文本相似度常用的四种方法

计算文本相似度常用的四种方法

论智

33+阅读 · 2018年5月18日

python文本相似度计算

python文本相似度计算

北京思腾合力科技有限公司

24+阅读 · 2017年11月6日

基于多粒度粗糙集的多属性决策方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于多核表示和模糊近似的混合数据分类方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于粒化机理的粗糙计算模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

大数据中的多粒度知识发现模型与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多粒度粗糙集的风险投资项目选择决策分析研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于证据理论的多源模糊信息系统的不确定性研究

国家自然科学基金

6+阅读 · 2013年12月31日

基于决策粗糙集的代价敏感知识获取方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于模糊粗糙集的概率数据挖掘方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于粗糙集与层次分析相融合的多属性决策方法及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

Improved Worst-Group Robustness via Classifier Retraining on Independent Splits

Arxiv

0+阅读 · 2022年4月20日

Radio Galaxy Zoo: Using semi-supervised learning to leverage large unlabelled data-sets for radio galaxy classification under data-set shift

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

AB/BA analysis: A framework for estimating keyword spotting recall improvement while maintaining audio privacy

Arxiv

0+阅读 · 2022年4月18日

Local multiscale model reduction using discontinuous Galerkin coupling for elasticity problems

Arxiv

0+阅读 · 2022年4月16日

Twin-width can be exponential in treewidth

Arxiv

0+阅读 · 2022年4月15日

Statistical-Computational Trade-offs in Tensor PCA and Related Problems via Communication Complexity

Arxiv

0+阅读 · 2022年4月15日

A Statistical Decision-Theoretical Perspective on the Two-Stage Approach to Parameter Estimation

Arxiv

0+阅读 · 2022年4月15日

Distributed Reconstruction of Noisy Pooled Data

Arxiv

0+阅读 · 2022年4月14日

Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges

Arxiv

16+阅读 · 2021年5月2日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

【NTU博士论文】利用强化学习与生成模型推进可靠且可泛化的决策

美海军研发“增强侦察与态势评估系统（ARES）”应用程序以优化作战规划（附研究论文）

【NeurIPS2025】DNA-DetectLLM：基于 DNA 启发的“突变-修复”范式揭示 AI 生成文本

面向深度研究系统的强化学习基础：综述

相关VIP内容

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

36+阅读 · 2021年12月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

知识和数据协同驱动的群体智能决策方法研究综述

专知会员服务

125+阅读 · 2021年7月22日

证据推理理论及其应用

专知会员服务

46+阅读 · 2021年5月24日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

【博士论文】基于深度学习的图像处理算法研究

专知会员服务

80+阅读 · 2020年12月6日

【经典书】从算法到Z分数:计算机科学中的概率和统计建模，543页pdf

【经典书】从算法到Z分数:计算机科学中的概率和统计建模，543页pdf

专知会员服务

76+阅读 · 2020年11月11日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

基于FPGA的机器学习硬件加速研究进展

专知会员服务

81+阅读 · 2020年6月20日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知会员服务

147+阅读 · 2020年4月25日

相关资讯

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

机器之心

0+阅读 · 2022年1月5日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

【NeurIPS 2021】基于次模优化的规则学习算法框架

【NeurIPS 2021】基于次模优化的规则学习算法框架

专知

0+阅读 · 2021年11月30日

机器学习计算距离和相似度的方法

机器学习计算距离和相似度的方法

极市平台

10+阅读 · 2019年9月20日

基于TensorFlow和Keras的图像识别

基于TensorFlow和Keras的图像识别

Python程序员

16+阅读 · 2019年6月24日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

计算：XGBoost背后的数学之美

计算：XGBoost背后的数学之美

论智

12+阅读 · 2018年8月20日

计算文本相似度常用的四种方法

计算文本相似度常用的四种方法

论智

33+阅读 · 2018年5月18日

python文本相似度计算

python文本相似度计算

北京思腾合力科技有限公司

24+阅读 · 2017年11月6日

相关基金

基于多粒度粗糙集的多属性决策方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于多核表示和模糊近似的混合数据分类方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于粒化机理的粗糙计算模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

大数据中的多粒度知识发现模型与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多粒度粗糙集的风险投资项目选择决策分析研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于证据理论的多源模糊信息系统的不确定性研究

国家自然科学基金

6+阅读 · 2013年12月31日

基于决策粗糙集的代价敏感知识获取方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于模糊粗糙集的概率数据挖掘方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于粗糙集与层次分析相融合的多属性决策方法及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Improved Worst-Group Robustness via Classifier Retraining on Independent Splits

Arxiv

0+阅读 · 2022年4月20日

Radio Galaxy Zoo: Using semi-supervised learning to leverage large unlabelled data-sets for radio galaxy classification under data-set shift

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

AB/BA analysis: A framework for estimating keyword spotting recall improvement while maintaining audio privacy

Arxiv

0+阅读 · 2022年4月18日

Local multiscale model reduction using discontinuous Galerkin coupling for elasticity problems

Arxiv

0+阅读 · 2022年4月16日

Twin-width can be exponential in treewidth

Arxiv

0+阅读 · 2022年4月15日

Statistical-Computational Trade-offs in Tensor PCA and Related Problems via Communication Complexity

Arxiv

0+阅读 · 2022年4月15日

A Statistical Decision-Theoretical Perspective on the Two-Stage Approach to Parameter Estimation

Arxiv

0+阅读 · 2022年4月15日

Distributed Reconstruction of Noisy Pooled Data

Arxiv

0+阅读 · 2022年4月14日

Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges

Arxiv

16+阅读 · 2021年5月2日

微信扫码咨询专知VIP会员