基因系谱专家与计算机科学家组成了研究团队,创建了一个迄今为止最大的家谱。(图片来源:Adobe Stock)
【看中国2018年3月4日讯】(看中国记者忆文编译)基因系谱专家与计算机科学家组成了研究团队,创建了一个迄今为止最大的家谱。其中包括1300万个成员,平均有11代。其研究成果发表在本星期的《科学》杂志上。大量的数据揭示了很多信息,包括人们是什么时候开始停止近亲结婚的?为了成婚,是男人更愿意离开家乡,还是女人更倾向于迁徙?长寿基因的承传等等,这个包含1300万人世界上最大的家谱也印证了中国的一句老话。
据《洛杉矶时报》报导,这个家谱是基于大约3百万家族树爱好者汇集的数据,他们在Geni.com网站上填写了超过8600万人的家族关系。
据悉,美国总统唐纳德・川普(特朗普)(Donald Trump)和影星凯文.培根(Kevin Bacon)的信息都在该网站上。
不过,并不是网站数据库中的每一个人都包含在这项研究当中。作者仅使用了用户同意公开文件中的数据。
该论文的第一作者是哥伦比亚大学计算机科学家严倪.埃利克(Yaniv Erlich)。埃利克说,他带领的团队首先必须确保数据的准确性,这花了很多时间。但因为这些数据由几百万人提供,也不是原始数据,因此,并不象预期的那样有误。
研究人员发现,有关父亲信息的平均错误率是2%,有关母亲信息的平均错误率是0.3%,此外,约0.3%的个人资料含有明显错误,比如一个人的亲生父母超过2个。为了纠正这些错误,团队开发了“修剪”家族树的计算机程序,删除了无效的姻亲关系。他们生成了530万个没有关联的家谱——其中最大的一个包含1300万人。
在系统中,研究人员比较了从1985年到2000年间,位于美国东北部与加拿大接壤的佛蒙特州(Vermont)8万人的死亡记录。他们发现,家谱并不能显示出贫富的差异。但是,这些人更可能是白人。其原因可能是数据库里的多数人来自欧洲和美国。就美国而言,多数人是高加索人的后裔。埃利克补充说,他希望更多的非白人也能把其家谱信息上传到该网站。白人有摆家谱的传统,有些家庭的墙上挂着家族树,很多小学生做过关于家谱的作业。
这个由庞大数据库构建的巨型家族树,追溯到几百年前,它解答了很多疑问。
例如,在分析了家谱里的迁徙模式后,研究人员发现:女性离开家乡人数比男性多,但当男性迁徙时,他们往往搬到更加遥远的地方。这种模式一直在延续,300年前是这样,300年后的今天依然如此。
此外,数据还被用来确定人们是什么时代停止近亲结婚的。研究人员发现,在1750年以前,大多数人的结婚对象在6英里之内。1870年工业革命后,这一距离迅速增加到约60英里。在1650年到1850年之间,已婚夫妇的平均遗传关系约为4代表亲。1850年以后,约为7代表亲。
研究人员在数据中发现了一些奇怪的现象。在1800年和1850年之间,结婚对象之间的距离增加了一倍——这可能是因为在欧洲和美国的大部分地区,随着交通工具的发达,铁路旅行成为可能。在这50年时间里,人们可以走得更远以寻找配偶。然而,距离增加了,婚姻伴侣之间的平均遗传关系反而更近了。埃利克说:“那时家庭变得分散,人们却开始搭着火车去和他们的第几代表亲结婚。”
作者还讨论了长寿基因的承传,根据他们的数据分析,以前的研究高估了寿命的遗传性,应降低通过基因子据预测寿命的期望值。
埃利克表示,这些研究只是目前从这个巨大的家谱中所能认知的皮毛,还有更多的问题有待解析。不过,这项发表在《科学》杂志上的论文却印证了中国的一句老话:我们都是炎帝黄帝的子孙。