我们的母语从哪来?复旦学者Nature发文揭示世界第二大语系起源

2019 年 4 月 25 日 科研圈

复旦大学金力教授研究团队对汉藏语言中同源词汇进行分析,认为汉语与藏缅语族在 5900 年前左右出现分化,为汉藏语系的“北方起源假说”提供了有力支持。


撰文 戚译引


语言不仅是日常交流的工具,更是文化传承最悠远的载体。语言的分裂和融合背后往往伴随着群体的迁移与交汇,所以近十几年来,科研人员开始将演化研究方法应用于语言学,探索不同语言之间的演化关系。


复旦大学金力团队运用系统发生学方法探讨了汉藏语系的起源。研究对 109 种汉藏语系语言词汇中词语的字根意义进行分析,认为汉语与藏缅语族在 5900 年前左右出现分化,大约相当于仰韶文化晚期、马家窑文化早期,这对汉藏语系起源争议补充了重要的论据。



著名的人面鱼纹彩陶盆,它是仰韶文化的重要文物证据。图片来源:维基百科


这篇论文今天发表于《自然》(Nature)期刊(论文链接)这是中国语言学研究成果第一次登上《自然》主刊。复旦大学遗传工程国家重点实验室、生命科学学院人类遗传学与人类学系教授、中国科学院院士金力为通讯作者,复旦大学人文社会科学数据研究所东亚语言数据中心负责人潘悟云教授参与此项研究。复旦大学现代语言学研究院青年研究员张梦翰为该篇论文的第一作者,复旦大学人类表型组研究院助理研究员严实为共同第一作者。


汉语从哪里来

所有具有同一起源的语言构成一个语系。汉藏语系包含逾 400 种语言和方言,如汉语、缅甸语和藏语等,总使用人数达 15 亿左右,是仅次于印欧语系的第二大语系。语系下一级的分类单位是语族,汉藏语系又分为汉语语族和藏缅语族。



世界主要语系分布图,其中浅绿色为印欧语系,红色为汉藏语系。图片来源:Wikipedia


金力团队研究结果显示,汉语与藏缅语族分开的时间大约在 5900 年以前,这个时间基本上对应中国北方的仰韶文化晚期到马家窑文化早期之间,为汉藏语系的“北方起源假说”提供了有力支持。


汉藏语系的起源在学界仍有争议,“北方起源假说”认为它起源于大约 4000 到 6000 年前中国北方的黄河流域,而“西南起源假说”则认为它起源于至少 9000 年前的东亚西南部某地(即今天的中国西南部到印度东北部一带)。本次研究的主要结论与“北方起源假说”相符,一般认为随着一组人向西迁入西藏,向南迁入缅甸,而另一组人向东和向南迁移而最终成为汉人,这些语言也继而分成了两个语族。


本次研究还确定,汉语是最早从汉藏语系中分离的语言。研究作者之一、复旦大学博士严实介绍,此前学界对汉语和藏缅语族的区分主要是基于语法、形态等特征;但是汉语和藏缅语族是否存在共同祖先、汉语是不是最早从汉藏语系中分离出去的语言,这些问题仍有争议。这次研究回答了相关问题。



追溯语言的“基因”

本次研究对 109 种汉藏语系语言词汇中词语的字根意义进行了贝叶斯系统发生学分析(Bayesian phylogenetic analysis)。系统发生学早已被广泛应用于研究生物之间的演化关系,近几年学界开始将它应用于语言学研究。


在演化研究中,系统发生学根据化石、形态学、基因方面的证据对物种进行分类,并确定物种之间在演化上的关联。如果两个物种具备相似的特征,例如相似的 DNA 片段,那么它们在演化上的关系就比较接近。通过对多个物种进行交叉对比,就可以构建出系统发生树,它就像族谱一样,显示出一个个物种在哪一时刻从共同祖先中分化出来,以及它们的共同祖先之间又有怎样的关联。


论文第一作者、复旦大学现代语言学研究院青年研究员张梦翰介绍:“系统发生学方法的两个前提符合我们对语言演化的认识:允许不同语言在历史演化过程中拥有各自不同的演化速度;允许不同词汇拥有属于各自不同的演化速度。”这些性质允许模型具备更高的灵活性,并且它也更符合我们对语言的认识。


在语言学研究中,潘悟云教授介绍:“同源语素就相当于语言中的基因。”同源语素的认定是鉴定语言关系的关键,例如,表示太阳的“日”在汉语、古汉语和藏语中有相似的发音,那么它就是一个同源语素,是体现这些语言之间关联的一个证据。类似这样的词汇还有太阳月亮、身体部位、亲属关系等。同源语素的认定是对语言应用系统发生学分析的前提,本次研究使用的数据就来自于先前语言学界的相关研究工作。


将生物学方法用于语言演化研究是近些年兴起的一个热门研究方向,在德国的马克斯-普朗克研究所、新西兰奥克兰大学都有相关研究。但先前研究主要针对印欧语系进行,对汉藏语系的研究历史更短,因此复旦大学的这项研究工作在这个方向上具有开创性的意义。


潘悟云评论:“本课题用贝叶斯系统发生学方法取代传统的语言年代学方法,才使得语言年代的确定从猜想走向实证,以此明确提出,汉语的历史为 5900 年。这是现代科学技术对语言学的贡献。”



语言与人群

这次研究独立验证了先前的考古学、遗传学研究工作,研究结论符合语言随农业扩散的观点,而且扩散的时间点与考古证据相符,例如此前的考古证据显示,一些特定的建筑形式和陶器类型有向南扩散的特征。


语言的变迁和人群的活动之间具有密切的联系。研究第一作者张梦翰说:“群体的一些活动,比如分化和混合,可以造成语言的分化和混合;而语言的分化和混合又可以反映不同语言群体各自文化的一些变化。所以对我们来说,语言是架起群体演化和文化演化的一个非常好的桥梁。


汉语中包含的 14 种方言。图片来源:https://www.ethnologue.com/subgroups/sino-tibetan


不过,潘悟云强调,本课题仅针对汉语和藏缅语族之间的关系,对藏缅语族下属各个语支之间关系的描述还有很多不完善的地方,这是由于材料的缺乏和同源词认定的不当。或许随着未来相关研究的发展,在有了确凿的证据后,这些问题将得到更好的解答。


此外,语言的分化和人群的分化不一定是完全同步的。张梦翰说:“基于我们所知的,我们认为语言分化和群体迁移或者分化之间应该是存在一定的时间差。严格来讲,谁在前,谁在后要基于特定的语言情况来定;一般来说群体迁移和分化在语言分化之前,但是我们不能排除例外。”


“整个东亚地区语言非常复杂,这个研究仅仅是一个开始,”张梦翰说。



论文信息


【标题】Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic

【作者】Menghan Zhang, Shi Yan, Wuyun Pan & Li Jin 

【期刊】Nature

【时间】24 April 2019

【DOI】10.1038/s41586-019-1153-z

【链接】

https://www.nature.com/articles/s41586-019-1153-z#Bib1

【摘要】The study of language origin and divergence is important for understanding the history of human populations and their cultures. The Sino-Tibetan language family is the second largest in the world after Indo-European, and there is a long-running debate about its phylogeny and the time depth of its original divergence1. Here we perform a Bayesian phylogenetic analysis to examine two competing hypotheses of the origin of the Sino-Tibetan language family: the ‘northern-origin hypothesis’ and the ‘southwestern-origin hypothesis’. The northern-origin hypothesis states that the initial expansion of Sino-Tibetan languages occurred approximately 4,000–6,000 years before present (BP; taken as AD 1950) in the Yellow River basin of northern China2,3,4, and that this expansion is associated with the development of the Yangshao and/or Majiayao Neolithic cultures. The southwestern-origin hypothesis states that an early expansion of Sino-Tibetan languages occurred before 9,000 years BP from a region in southwest Sichuan province in China5 or in northeast India6, where a high diversity of Tibeto-Burman languages exists today. Consistent with the northern-origin hypothesis, our Bayesian phylogenetic analysis of 109 languages with 949 lexical root-meanings produced an estimated time depth for the divergence of Sino-Tibetan languages of approximately 4,200–7,800 years BP, with an average value of approximately 5,900 years BP. In addition, the phylogeny supported a dichotomy between Sinitic and Tibeto-Burman languages. Our results are compatible with the archaeological records, and with the farming and language dispersal hypothesis7 of agricultural expansion in China. Our findings provide a linguistic foothold for further interdisciplinary studies of prehistoric human activity in East Asia.


参考资料

https://mp.weixin.qq.com/s/Rb9EdBzVpxD2RP-87yh_vA  

https://www.nature.com/articles/d41586-019-01214-6 


本文来自微信公众号“科研圈”。如需转载,请在“科研圈”后台回复“转载”,或通过公众号菜单与我们取得联系。

▽ 精彩回顾 ▽

登录查看更多
0

相关内容

复旦大学,始建于1905年,初名复旦公学,创始人为中国近代知名教育家马相伯,首任校董为国父孙中山先生。“复旦”二字选自《尚书大传·虞夏传》中“日月光华,旦复旦兮”的名句,意在自强不息,寄托当时中国知识分子自主办学、教育强国的希望,是中国人自主创办的第一所高等学校。
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
130+阅读 · 2020年3月25日
专知会员服务
26+阅读 · 2020年3月6日
2019中国硬科技发展白皮书 193页
专知会员服务
77+阅读 · 2019年12月13日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
Nature 一周论文导读 | 2019 年 8 月 8 日
科研圈
6+阅读 · 2019年8月18日
Nature 一周论文导读 | 2019 年 6 月 27 日
科研圈
8+阅读 · 2019年7月7日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
情感计算综述
人工智能学家
31+阅读 · 2019年4月6日
外泌体行业规模2030年预计将达22.8亿美元
外泌体之家
18+阅读 · 2019年3月26日
Science:脂肪细胞外泌体对巨噬细胞发挥调节功能
外泌体之家
18+阅读 · 2019年3月7日
曹雪涛院士团队:刚发完Nature,又发一篇Cell
Arxiv
9+阅读 · 2018年4月20日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关VIP内容
相关资讯
Nature 一周论文导读 | 2019 年 8 月 8 日
科研圈
6+阅读 · 2019年8月18日
Nature 一周论文导读 | 2019 年 6 月 27 日
科研圈
8+阅读 · 2019年7月7日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
情感计算综述
人工智能学家
31+阅读 · 2019年4月6日
外泌体行业规模2030年预计将达22.8亿美元
外泌体之家
18+阅读 · 2019年3月26日
Science:脂肪细胞外泌体对巨噬细胞发挥调节功能
外泌体之家
18+阅读 · 2019年3月7日
曹雪涛院士团队:刚发完Nature,又发一篇Cell
Top
微信扫码咨询专知VIP会员