科学家开发新的表观遗传通路统计算法 “破解”表观全基因组关联分析关键难点

2018 年 12 月 7 日 中科院之声

近日,国际学术期刊Nature Methods 发表了中国科学院上海营养与健康研究院计算生物学研究所Andrew Teschendorff组的研究论文“Identification of differentially methylated cell types in epigenome-wide association studies”,报道了一种新的有助于识别与疾病相关的表观遗传通路的“CellDMC”统计算法,“破解”了表观全基因组关联分析中的关键难点。


DNA甲基化(DNAm)是DNA的共价修饰,其可以调节基因活性,并且易受到疾病风险因子的影响。表观全基因组关联分析(EWAS)的主要目标是测量大量个体中全基因组DNA甲基化,鉴定与疾病风险相关的DNA甲基化变化。然而,这一过程的主要障碍之一是细胞类型异质性:EWAS所使用的组织是不同细胞类型的复杂混合物,每种细胞类型具有其特有的DNA甲基化谱,因此可能产生错误的分析结论。到目前为止,尚无有效手段来确定驱使DNA甲基化发生变化的细胞类型和表观遗传通路。


在研究员Andrew Teschendorff指导下,博士生郑世杰等人开发了一种名为“CellDMC”的新型统计算法,该算法不仅能够确定特定基因组位点的变化,而且能够确定导致这些DNA甲基化变化的细胞类型。相较于当前无法识别DNA甲基化变化的通用方法,这种算法对于DNA甲基化变化的识别灵敏度超过90% 。随后研究人员利用几个真实EWAS数据进行算法测试,结果表明类风湿性关节炎相关的大量DNA甲基化变化发生于一种特定的血细胞亚型(B细胞),这种B细胞的改变在该疾病的发生机制中特别重要。在另一个测试中,该算法识别了暴露于烟雾致癌物质的正常细胞和肺癌祖源细胞中的DNA甲基化变化,从而有助于将吸烟有关的表观遗传通路与肺癌进行关联。


值得一提的是,EWAS中有一些昂贵且难以实现的技术,如细胞分选技术、单细胞甲基化组测序技术。CellDMC可帮助EWAS的研究人员识别疾病相关细胞类型的改变,而无需使用这些技术。检测疾病相关和疾病风险相关的细胞类型改变的能力,对于鉴定和开发表观遗传疾病风险生物标志物,以及实现P4医学目标具有重要意义。


上述研究得到国家自然科学基金委员会(31571359;31771464; 31401120)和中科院的资助。


 

图:CellDMC 识别差异化甲基化的细胞类型 


来源:中国科学院上海营养与健康研究院


温馨提示:近期,微信公众号信息流改版。每个用户可以设置 常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“中科院之声”的文章,你一定要进行以下操作:进入“中科院之声”公众号 → 点击右上角的 ··· 菜单 → 选择「设为星标」


登录查看更多
0

相关内容

关联分析:多研究事物之间的联系,寻找关联程度高的相关事物,多采用机器学习方法,如聚类,关联性分析。
专知会员服务
26+阅读 · 2020年3月6日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
23+阅读 · 2020年2月23日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
96+阅读 · 2020年1月21日
Science:脂肪细胞外泌体对巨噬细胞发挥调节功能
外泌体之家
18+阅读 · 2019年3月7日
Nature 一周论文导读 | 2018 年 3 月 29 日
科研圈
12+阅读 · 2018年4月7日
基于深度学习的肿瘤图像分割研究取得进展
中科院之声
17+阅读 · 2017年9月17日
Arxiv
99+阅读 · 2020年3月4日
VrR-VG: Refocusing Visually-Relevant Relationships
Arxiv
6+阅读 · 2019年8月26日
VIP会员
Top
微信扫码咨询专知VIP会员