项目名称: 融合GeneRank与机器学习方法实现小鼠生精过程基因筛选和功能预测
项目编号: No.60903113
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 生物科学
项目作者: 刘维湘
作者单位: 深圳大学
项目金额: 18万元
中文摘要: 为了理解小鼠生精过程的内在机理,发现生精过程中功能显著的基因是其关键问题。本项目以GeneRank算法为基础,结合机器学习方法来实现小鼠生精过程重要基因的筛选和功能预测,并辅以生物学实验来验证。(1)以基因表达谱数据为主,融合基因序列、蛋白相互作用、文献数据等可用数据源,采用多种机器学习方法,包括非监督的非负矩阵/张量分解、流形学习、有监督与半监督学习算法等,来构建基因之间的相互关系网络,用GeneRank算法实现显著基因的筛选;(2)筛选出100-200个显著基因,利用各种有监督和半监督机器学习算法实现基因的功能分类预测;(3)选择50~100个显著基因,采用实时定量RT-PCR等生物学方法验证其在小鼠生精过程中的mRNA和蛋白质的表达等功能。本项目对理解生精过程、生殖健康等具有重要意义,对其它生物过程或疾病的基因筛选和功能预测也具有参考价值。
中文关键词: 生精过程;基因筛选;机器学习;GeneRank;矩阵分解
英文摘要:
英文关键词: Spermatogenesis;gene selection;machine learning;GeneRank;matrix factorization