项目名称: Chip-seq数据的位点特异性模体识别算法研究与开发

项目编号: No.31301087

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 生物科学

项目作者: 余泓

作者单位: 中国科学院遗传与发育生物学研究所

项目金额: 22万元

中文摘要: 转录因子作为一种重要的转录调控因子,通过与特异的DNA序列结合,调控下游基因的表达。随着测序技术的发展,ChIP-seq已经成为研究转录因子和DNA结合关系的重要实验手段。如何分析ChIP-seq数据,确定转录因子的特异识别序列,寻找转录因子的特异调控基因,对于理解转录因子的功能具有重要科学意义。现在用于寻找ChIP-seq中的转录因子特异识别序列的模体识别算法存在计算速度缓慢、依赖重复序列过滤、无法区分识别位点真伪等缺点。本项目拟在已发表的ChIP-seq数据基础上,挖掘和总结ChIP-seq数据的特点,针对这些特点,利用朴素贝叶斯分类器、最大似然法和boosting算法,开发新的模体识别算法,从而改善目前算法存在的缺点,大大提高算法对ChIP-seq数据分析的针对性和整体性能。这些研究结果,将全面提高ChIP-seq数据模体识别算法的性能,对转录因子的研究提供新的技术手段和重要工具。

中文关键词: 模体识别;染色质免疫沉淀;位点特异性;大规模测序;

英文摘要: Transcription factors are crucial components for gene regulation. They control the downstream gene expression by interacting with specific DNA elements. With the development of sequencing technologies, ChIP-seq has become one of the most important strategies to investigate the relationship between transcription factors and DNA binding sites. Therefore, how to analyze ChIP-seq data and to identify the specific DNA elements have become one important scientific question. Several motif search algorithms have been developed and applied to identify the specific DNA elements in ChIP-seq data, however, current methods have a few drawbacks, including slow, relying on repeat masking and difficulties in distinguishing real binding sites. Here we propose to develop new motif search algorithms based on na?ve Bayes classifier, maximum likelihood and boosting algorithm and by digging and summarizing the special characteristics of ChIP-seq data. The new algorithm will overcome the drawbacks of old algorithms and will be more efficient for identifying specific targets of transcription factors. Our results will greatly improve the performance of motif search algorihtms on ChIP-seq data and will provide an important tool for studying transcription factors.

英文关键词: motif search;ChIP-seq;Position sentitive;large scale sequencing;

成为VIP会员查看完整内容
0

相关内容

专知会员服务
30+阅读 · 2021年2月7日
深度学习批归一化及其相关算法研究进展
专知会员服务
50+阅读 · 2020年7月17日
零样本图像识别综述论文
专知会员服务
57+阅读 · 2020年4月4日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年5月29日
Arxiv
0+阅读 · 2022年5月28日
Arxiv
0+阅读 · 2022年5月27日
Arxiv
0+阅读 · 2022年5月27日
小贴士
相关主题
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员