项目名称: 文本语义模型和子空间聚类研究

项目编号: No.60905028

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 矿业工程

项目作者: 景丽萍

作者单位: 北京交通大学

项目金额: 19万元

中文摘要: 信息化飞速发展的今天,文本数据海量涌现。如何从这些海量的文本数据中快速、自动地挖掘出对人们有用的知识是当今人们面临的重要任务之一,文本挖掘技术也就成了当今的热点研究方向。本项目将针对文本挖掘核心技术- - 文本表示模型构建和聚类方法设计进行创新性的研究,主要体现在以下几个方面:针对文本数据特性(海量、高维、稀疏、复杂语义),创建同时涵盖语法和语义信息的文本表示模型;设计适合高维稀疏海量数据的快速有效聚类方法;为聚类结果设计出基于知识库的主题概念抽取方法和结果评估方法;进而开发整合文本预处理、文本模型构建、聚类功能和结果评估展现的文本聚类系统原型,该系统可以作为独立的系统运行,同时也可以作为现有数据挖掘系统的子系统模块。

中文关键词: 文本挖掘;语义表示;子空间聚类;高维数据分析;领域知识库

英文摘要:

英文关键词: Text mining;Semantic representation;Subspace clustering;High-dimension data analysis;;Domain knowledge

成为VIP会员查看完整内容
1

相关内容

专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
68+阅读 · 2021年3月27日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
【国防科大】复杂异构数据的表征学习综述
专知会员服务
84+阅读 · 2020年4月23日
交叉描述:图像和文本的语义相似度
TensorFlow
2+阅读 · 2021年6月22日
电子病历文本挖掘研究综述
专知
3+阅读 · 2021年3月27日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
37+阅读 · 2019年8月18日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
用 LDA 和 LSA 两种方法来降维和做 Topic 建模
AI研习社
13+阅读 · 2018年8月24日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
21+阅读 · 2020年10月11日
Arxiv
13+阅读 · 2020年4月12日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Knowledge Representation Learning: A Quantitative Review
小贴士
相关VIP内容
专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
68+阅读 · 2021年3月27日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
【国防科大】复杂异构数据的表征学习综述
专知会员服务
84+阅读 · 2020年4月23日
相关资讯
交叉描述:图像和文本的语义相似度
TensorFlow
2+阅读 · 2021年6月22日
电子病历文本挖掘研究综述
专知
3+阅读 · 2021年3月27日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
37+阅读 · 2019年8月18日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
用 LDA 和 LSA 两种方法来降维和做 Topic 建模
AI研习社
13+阅读 · 2018年8月24日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员