热点评述

    2022年中国古人DNA研究代表性成果及其进展评述
  • 王传超

    厦门大学教授,厦门大学人类学研究所所长,《人类学学报》编委      

           

    古 DNA是指从考古遗迹和古生物化石标本中获取的古生物遗传物质。古 DNA研究是以分子生物学技术、质谱技术为基础发展起来的一个跨学科研究领域。古DNA研究开始于20世纪 80 年代,此后研究者们一直在为探索古 DNA 实验技术和建立古 DNA 研究标准而努力。随着分子克隆、PCR、二代测序技术、引物延伸捕获和液相杂交捕获等扩增和测序技术的不断涌现,古 DNA 研究结合考古学、历史学、语言学和古生物学等学科,具备分析古代生物的谱系、分子演化理论、人类的起源和迁徙、动植物的家养和驯化过程等内容的能力,现已逐渐成为一个用途广泛、极有发展前景的领域。德国马普研究所 Svante P??bo也因测序了已灭绝的尼安德特人和丹尼索瓦人的基因组,获得了2022年的诺贝尔生理学或医学奖。2022年,中国古代人群DNA研究也取得了一系列新进展,研究者们测序了1.4万年前的蒙自人基因组,重构了新疆5000年来的人群历史,解析了吐蕃古人的遗传源流,也通过Y染色体和线粒体DNA勾画了历史时期中原与边疆地区人群的交流互动的图景,论文发表在Science、Current Biology、iScience、Journal of Systematics and Evolution、American Journal of Biological Anthropology、Frontiers in Genetics、Frontiers in Ecology and EvolutionMolecular Genetics and Genomics等国际期刊上,现选择代表性文章加以介绍。


    一、中国南方早期现代人丰富的体质和遗传多样性

           

             Svante Paabo领导的研究组对尼安德特人和丹尼索瓦人完成了全基因组测序分析,发现非洲之外的现代人群中都有 1%~4%的尼安德特人混血成分,而大洋洲的新几内亚土著人群中发现了大约 6%的丹尼索瓦人混血成分。此后,学界开始把目光聚焦到东亚地区,东亚地区是否存在未知的本土古老型人类?东亚现代人群中是否存在本土古老型人类的混血?如有,占多大比例?中国某些古人类化石呈现出的独特古老特征是否因与古老型人类混血而形成?2022年,中科院昆明动物研究所宿兵、吉学平以及和耀喜团队对云南马鹿洞遗址1.4万年前的蒙自人进行核基因组和线粒体DNA捕获测序,一定程度上回应了上述问题。前期对蒙自人头盖骨的体质测量分析发现,蒙自人虽然处于现代人的变异范围内,但靠近直立人变异范围的边界,具有比较独特的表型特征。古DNA研究发现蒙自人的线粒体单倍群属于现代人的M9*分支,M9单倍群的两个主要分支M9a’b和E目前分别分布于喜马拉雅地区的藏缅人群和东南亚群岛的南岛语人群中。常染色体数据也表明蒙自人属于亚洲早期现代人而非古老型人类,且并不带有更多来自尼安德特人和丹尼索瓦人的混血成分。自末次冰期以来,从南方的云南马鹿洞到北方的黑龙江流域,已形成了东亚人群所共享的祖源成分,这是区别于东南亚和远大洋洲尼格利陀人的遗传谱系,也是美洲原住民最主要的遗传源头(Zhang et al, 2022)蒙自人的研究成果拓展了我们对中国南方早期现代人体质的丰富性及遗传多样性的认识,但关于东亚本土的古老型人类及其对我们可能的遗传贡献这一科学问题还远未解决。中国发现了许多距今30~10万年前、体质特征介于直立人和现代人之间的古人类化石,典型代表如大荔人、金牛山人、马坝人、桐梓人、盘县大洞人、丁村人等,也有发现很多距今10~5万年前的早期现代人样本,如发现于道县、陆那洞、黄龙洞、智人洞等的古人类化石,对于在中国境内发现的这些古人化石的来源及其对现代中国人群有无遗传学贡献,目前还不清楚,这也是国内古人类DNA学界下一步共同努力的方向。
     

    二、东西方人群交流融合

          

    近年来,新疆及其周边地区诸多考古遗址的古人基因组数据陆续发表,使得新疆史前人群的融合演化历史更加清晰。2022年,中科院古脊椎动物与古人类研究所付巧妹、E Andrew Bennett和刘逸宸团队在Science发文,测序了从青铜时代到历史时期新疆39处考古遗址的201例古人基因组,重构了新疆五千年来的人群历史(Kumar et al, 2022)。研究发现,青铜时代的新疆人群主要由贝加尔湖附近的旧石器时代欧亚北部人(ANE成分)、东北亚黑龙江流域的采猎人群(ANA成分)、青铜时代早中期的欧亚草原游牧人群(Yamnaya、Afanasievo等Steppe_EMBA人群)和巴克特里亚·马尔吉亚纳文明人群(BMAC)等混合形成,后又有青铜时代中晚期的欧亚草原游牧人群(Sintashta、Andronovo等)的混入;铁器时代的新疆人群存在明显的遗传亚结构,大部分遗址的样本是由Steppe_MLBA人群、BMAC人群和ANA成分三者混合而成,也有部分样本带有更多的东北亚ANA成分或ANE成分;还有部分铁器时代和历史时期的新疆样本带有Steppe_EMBA人群的成分及其特征性的Y染色体类型R1b1,这与前期发表的石人子沟遗址的结果相吻合,Steppe_EMBA遗传成分在新疆的遗留进一步说明了Steppe_EMBA人群可能与青铜时代印欧语的传播有关;历史时期的新疆人群显示出与铁器时代较强的遗传连续性。新疆在东西方人群不断的融合和基因交流中最终形成你中有我、我中有你、多元一体融合发展的统一体。

    东西方人群的互动交流不只局限于中国西北地区,在蒙古高原也有广泛的接触和融合。吉林大学周慧和蔡大伟团队对元上都古城遗址周围的砧子山墓地出土的9例人骨样本进行了DNA提取和测序,发现这些样本的母系线粒体DNA类型主要为东亚支系,分别是F1a1、D5b1、B4a3、B5a2a1、H6a1a、T2d1、D4o2a、N9a1和Z4a,而父系Y染色体类型主要是西方支系,分别为G-M201、I-M170、J-M304、L-M20、O-M175、Q-M242、R-M207和T-M184,显示出砧子山墓地人群是由东西方人群性别偏向性混合而成。常染色体分析也发现砧子山古代人群的具有较高遗传多样性,有样本趋近于东亚本土人群成分,也有样本几乎完全是印欧血统,大部分样本的遗传组成介于东西方成分之间(Li et al, 2022)

    欧亚西部诸多考古遗址的古人DNA在前期研究中多有报道,为国内开展东西方人群遗传混合研究提供了丰富的参考人群数据,且中国西北和蒙古高原的古人样本保存条件相对较好,内源性DNA含量相对较高,这些都是相关研究能够顺利开展的有利条件。同时,东西方人群遗传混合研究也存在瓶颈,如国内样本中的西方遗传成分比例一般不高,在数据量和可用位点有限的情况下,在数据模拟中可能存在多个成立的混合模型,难以准确判别其西方成分的具体来源,而且可能存在多层次多批次的混合,现有数据分析方法或难以厘清其不同的混合层次。随着测序价格的逐渐降低,学界或可考虑将位点有限的捕获测序转为全基因组测序,挑选内源DNA含量高且污染率低的样本直接进行全基因组测序来获得高质量高覆盖度的全基因组序列,大幅提高可用位点数目,增加群体历史分析中的解析度。


    三、汉藏人群的形成与迁徙流动

           

    汉藏语系是全世界第二大语系,有15亿以上母语使用者。由于其使用人口众多且地理分布面广,对东亚其他语系形成和发展的影响较大,厘清其起源和演化历程对理解中华民族形成和中华文明演化有着至关重要的意义。

    对汉藏语系及人群的起源和演化的探索离不开在中华文明“多元一体”格局下梳理新石器时代相关考古学文化的形成及其之间的关系。位于陕西省神木市的石峁遗址距今约4300-3800年,是龙山时代中国北方最大的城址之一,也是具有政治中心和宗教中心双重性质的都邑性城址。位于山西南部的陶寺遗址是龙山时代另一重要遗址,它与石峁遗址隔黄河相望,并与石峁遗址在文化上呈现出诸多相似性,但这两处遗址人群间的关系此前仍不清楚。中科院古脊椎所付巧妹团队和社科院考古所何驽研究员合作,使用线粒体捕获测序技术,从陕北石峁文化相关遗址和晋南陶寺遗址中成功获得172例仰韶时代晚期到龙山时代的古人线粒体全基因组。研究发现石峁人群与陕北本地更早期人群具有相似线粒体类型,比如A、C、D、G、Z、B、F和M等,并且单倍群D的频率很高。石峁城内与石峁城周边人群同属于石峁文化的人群(木柱柱梁遗址、神圪垯梁遗址、新华遗址、寨山遗址),且具有较近的母系遗传联系。石峁人群与同时期龙山时代黄河中下游的古人群有着紧密的母系遗传关系,其中与陶寺人群的关系最为密切。这些结果表明石峁人群主要起源于陕北本地更早期人群,而且在新石器时代晚期黄河流域诸多古代人群之间不仅有文化的交流,也同样有着较为广泛的人群互动(Xue et al, 2022)

    前期研究发现新石器时代黄河流域的农业人群是汉藏人群遗传学上的主要祖先人群,实证了原始汉藏人群的北方起源假说,而且青藏高原上的藏缅人群有着较强的遗传连续性,青藏高原东缘的南北向通道藏彝走廊在藏缅语人群的形成与分化过程中起到重要作用,但历史时期青藏高原人群的古基因组却鲜有研究报道。吐蕃王朝是中国西藏历史上第一个有明确史料记载的政权,以往对吐蕃的研究都集中于文献史料、宗教艺术、石像板画及出土文物等,而对于吐蕃人群来源、文化传播模式等科学问题却鲜有涉及。复旦大学李辉团队对青海省都兰县热水墓群哇沿水库遗址中的8个古人样本进行了DNA提取和测序,发现其母系线粒体DNA类型主要为A21、C4b1a、C4d、D4g、D4g2a1、D4j1b、M9a1b1和M13a2,显示出与东北亚人群的近缘关系;父系Y染色体类型为N1b2-F830, O2, O2a2b1a1a1-F8, O2a2b-CTS11109*和R1a1a1b2a-Z94,显示出与汉藏人群的近缘关系,同时也受到北方游牧人群的影响。对其中测序覆盖度较好的3个样本进行常染色体群体分析后,发现有2个样本与藏族人群聚类,1个样本与突厥语人群和草原游牧人群相近,这与Y染色体的分析结果相吻合(Yu et al, 2022)。复旦大学文少卿与厦门大学王传超团队合作,从热水墓群哇沿水库遗址中成功提取和测序了10例古代个体全基因组,并进行了群体遗传分析。研究发现,样本中的9个古代个体拥有与现代核心藏族人群相似的遗传成分,这也是目前为止发现带有相似遗传成分的古代青藏高原人群古基因组中最东北缘的个体,反映了核心藏族人群向青藏高原东北缘的迁徙和扩张。吐蕃古人中的上述核心藏族遗传成分主要来自于新石器时代黄河流域的农业人群,实证了吐蕃古人属于汉藏人群,反驳了吐蕃来源中的“鲜卑说”和“印度南来说”。此外,研究还发现1例出自竖穴土坑墓的样本与同期的欧亚大陆草原游牧人群拥有相似的遗传成分,表明了都兰区域与中亚地区可能存在人群交流互动。综合已有的考古学证据,该研究认为吐蕃政权的扩张属于人群和文化共扩张的现象,吐蕃政权在与吐谷浑长期争夺都兰地区控制权的过程中,伴随着大量的人群迁徙。同时,都兰地区本土文化也逐渐受到吐蕃文化的影响,并最终被吐蕃文化所取代(Zhu et al, 2022)

    尽管目前古基因组学为汉藏语人群的同源演化历史提供了证据,但现有研究主要是围绕黄河流域史前农业人群及其如何走上青藏高原来展开,而较少涉及青藏高原核心腹地的古基因组,迄今仍未发现青藏高原上采集狩猎人群的古基因组,也缺乏中国南方地区的采集狩猎人群和长江流域新石器时代农业人群的古基因组数据,难以回溯汉藏人群与壮侗语、南岛语和南亚语的祖先人群混合形成现今南方少数民族的过程。我们期待通过后续更多针对汉藏分离后的南北方古汉族和古藏缅语人群的相关考古遗址的古基因组研究,充分了解汉藏语分离后的人群遗传历史,更好地认识新石器时代到历史时期北方人群不断迁徙南下而形成南方汉族的过程。


    四、历史时期中原与边疆地区人群的交流互动

          

           近年来,在边疆与中原地区古代人群和文化互动交流、共同推动中华民族共同体形成和发展等方面,学界取得了丰富的研究成果。2022年,复旦大学文少卿、生膨菲和厦门大学王传超团队使用环境考古、14C测年、同位素和古DNA等技术方法对新疆汉代石城子屯田城址古代遗迹遗物和人骨进行研究分析,发现石城子屯田城址的一部分古人遗传成分来自于ANA成分,也有遗传成分来自于黄河流域的古代农业人群,虽遗传来源不同,但他们因地制宜,充分利用一切可以利用的资源和办法,发展屯田农业和畜牧业,共同建设、共同发展(Allen et al, 2022)。复旦大学文少卿、李辉和谭婧泽团队应用捕获测序和多重PCR技术对甘肃张掖的汉代黑水国墓地的31个古人样本进行了Y染色体和线粒体DNA的分型。黑水国墓地古人的Y染色体类型与频率分布与现代汉族人群类似,比如汉族人群中常见的三个Y染色体分支类型Oγ-002611、Oα-M117和Oβ-F46在黑水国墓地古人中的频率也很高,占比达43.3%;而线粒体DNA的多样性却很高,有D4、D5、B5、R11、B4、C4、F1、G1、G3、M11、M33、M9和N9等类型,其频率分布与现代蒙古语人群接近,也和西北汉族接近。文章认为黑水国墓地古代人群的形成具有明显的性别差异,他们的父系大都来自黄河流域中原地区,而母系则是西北地区的当地土著,这与历史记载相符:汉代戍边移民多是男性且大都不能携带家人戍边,所以多和边疆当地女性结合(Xiong et al, 2022a)。使用同样的方法,复旦大学文少卿、李辉和甘肃省文物考古所陈国科联合团队对甘肃敦煌佛爷庙湾墓地34个古人进行了Y染色体和线粒体DNA分型,发现佛爷庙湾人群在父系上与藏缅人群聚集在一起,同时也包含部分北部欧亚支系和少量东亚南部支系;而在母系上与蒙古语系人群关系较近,除有东亚常见类型外,还有少量的欧亚大陆西部类型,这揭示了佛爷庙湾人群复杂的混合历史(Xiong et al, 2022b)。历史时期各朝代治理边疆的各种政策客观上推动了中原地区与边疆地区的互动往来,中原人群与边疆各民族有着长期的交流和融合,由此逐渐奠定了中华民族共同体意识的实体基础。历史上不同族群之间的通婚也推动了民族交流和融合。北周是由鲜卑族宇文氏建立的,北周武帝宇文邕在位前期对突厥采取联合态度,迎娶了突厥木杆可汗阿史那俟斤之女为皇后。阿史那氏去世后与宇文邕合葬在孝陵,留下了珍贵的遗骨,这对于追溯突厥源流史具有极其重要的意义。复旦大学文少卿和王传超团队合作提取、测序和分析了突厥阿史那皇后的基因组,从遗传学上看阿史那皇后主要带有ANA血统,由此推断突厥阿史那部可能起源于东北亚地区,即今天的黑龙江流域到贝加尔湖和蒙古高原东部一带。突厥语人群发展过程中受到了欧亚草原游牧人群的影响,带有大量欧亚西部的遗传混合成分(Yang et al, 2022)。早期的古DNA研究一般很少涉及历史时期的样本,一是因为史前样本具有更重要意义,学界无暇顾及历史时期的海量样本;二是不同学科研究范式不同,历史时期古DNA个例结果的解读可能与历史学和考古学的观点相左,引发不同学科间的误会和矛盾。近年来,随着国内古DNA研究的不断推进,史前人群遗传框架已越发明晰,现在学界开始关注历史时期古人DNA研究,未来几年将重建大量的历史时期古人基因组,对于理解中华民族的形成和发展有重要意义,并且大量的数据也将拓展我们对各族群遗传疾病和健康状况等问题的认识。高通量测序方法的成熟应用,高精度的Y染色体和线粒体DNA谱系的建立以及古DNA数据的积累,使得学界开始尝试去解决历史学相关问题,比如名人家系的历史演变等,开始探索民族谱系研究的新范式。
           

    五、总结

      

    古DNA研究源起于欧美,数次技术革命均由国外研究机构引领,近十年来已有数千例欧美古人全基因组发表,改写了当代欧洲人的形成历史,重构了美洲人群起源迁徙历史。我国古DNA研究长期滞后,但近年来中国科学院、复旦大学、厦门大学、吉林大学等国内单位也建立起了具有国际领先水平的古DNA超净实验室和大数据分析平台,对国内及周边国家和地区重要考古遗址的人骨开展了大量的研究工作,取得了一系列的成果,已有蓬勃发展之势,但仍有诸多问题亟待解决。一是古DNA研究无经济效益,经费申请渠道有限,而且学科归属模糊,研究团队散落在地学、生物学、考古学、社会学和人类学等诸多学科中,难以形成合力;二是古DNA涉及考古学、体质人类学、分子生物学、生物信息学、历史学、化学等众多学科,不同学科间缺乏有效的沟通、交流与合作,在科研经费和招生指标有限的情况下,跨学科人才培养异常困难;三是与欧美相比,中国尤其是中国南方的古人遗骸和动植物遗物保存情况相对较差,如何有效地提取和富集古DNA是国内研究的难点,也是有待突破的关键点,但目前国内尚未着眼于技术改进方面的研究。针对目前中国古DNA研究现状,我们期待学界统筹、深度融合自然学科和人文社会学科的众多学科,加强学科间的沟通交流与合作互信,积极拓展经费申请渠道,以回答大的科学问题为导向,鼓励和支持开展跨区域、跨学科合作研究,提高数据产生的效率及数量,同时着眼于技术改进,提升实验室分析和测试的技术水平,由跟跑欧美发展为领跑世界。


    致谢:感谢厦门大学社会与人类学院博士研究生沈曲协助审读和校稿。



         

    参考文献:


         

    Allen E, Yu Y, Yang X, et al. Multidisciplinary lines of evidence reveal East/Northeast Asian origins of agriculturalist/pastoralist residents at a Han dynasty military outpost in ancient Xinjiang[J]. Frontiers in Ecology and Evolution, 2022, 10: 932004

    Kumar V, Wang W, Zhang J, et al. Bronze and Iron Age population movements underlie Xinjiang population history[J]. Science, 2022, 376(6588): 62-69

    Li J, Zhu H, Wei J, et al. Ancient genomes reveal complex genetic history of an international metropolis at Kublai Khan's Upper Capital (Xanadu)[J]. American Journal of Biological Anthropology, 2022, 178(4): 636-646

    Xiong J, Du P, Chen G, et al. Sex-biased population admixture mediated subsistence strategy transition of Heishuiguo people in Han Dynasty Hexi Corridor[J]. Frontiers in Genetics, 2022a, 13

    Xiong J, Tao Y, Ben M, et al. Uniparental Genetic Analyses Reveal Multi-Ethnic Background of Dunhuang Foyemiaowan Population (220–907 CE) With Typical Han Chinese Archaological Culture[J]. Frontiers in Ecology and Evolution, 2022b, 424

    Xue J, Wang W, Shao J, et al. Ancient mitogenomes reveal the origins and genetic structure of the Neolithic Shimao population in northern China[J]. Frontiers in Genetics, 2022, 13

    Yang X, Meng H, Zhang J, et al. Ancient genome of Empress Ashina reveals the Northeast Asian origin of G?ktürk Khanate. Journal of Systematics and Evolution, 2022, doi: 10.1111/jse.12938

    Yu XE, Sun C, Zou YT, et al. Ancient DNA from Tubo Kingdom-related tombs in northeastern Tibetan Plateau revealed their genetic affinity to both Tibeto-Burman and Altaic populations. Mol Genet Genomics. 2022;297(6):1755-1765

    Zhang X, Ji X, Li C, et al. A Late Pleistocene human genome from Southwest China[J]. Current Biology, 2022, 32(14): 3095-3109.e5

    Zhu K, Du P, Li J, et al. Cultural and demic co-diffusion of Tubo Empire on Tibetan Plateau[J]. iScience, 2022: 105636

  • 发布日期: 2022-12-31  浏览: 3567