常常有人认为,科学不过是个现代版的起源神话,这个说法非常聪明。犹太人有他们的亚当和夏娃,苏美尔人有他们的马杜克神和吉尔伽美什王,希腊人有宙斯和奥林匹斯诸神,古挪威人有瓦尔哈拉殿堂。某些聪明人会说,进化论不过是神话传说的现代等价物,并不比之前好,也不比之前坏,并不比之前更真实,也不比之前更虚假。有个非常时兴的沙龙哲学,叫作文化相对论。这种哲学认为,科学并不比部落神话更贴近真理:科学不过是被现代西方偏好的神话。有一次,我在一位人类学家同事的“督促”下,对这一观点发表了见解。我说:“假设有一个部落相信月亮是人们扔到天上去的一个葫芦,其高度只不过比树顶高那么一点点。那你真会认为我们的科学真相——月球距离我们约38.4万千米,相当于地球直径的1/4,比那些部落认为的葫芦更接近真相吗?”“不,”我的同事说,“我们所成长的文化环境使我们习惯于从科学角度来看待这个世界。他们的成长环境则惯于从另一个角度看世界。没有哪个角度比另一个角度更接近真相。”
随便给我找个文化相对论者,离着3万千米开外,我都能向你证实他是个伪君子。人类之所以能建造飞机,就是因为科学原理是有效的。飞机不仅可以飞在天上不掉下来,还可以把人们送到他们想去的地方。以部落或神话传说所提供的观念建造起来的飞机,譬如雨林中的邪教组织制造的飞机或伊卡罗斯用蜂蜡粘上的翅膀,根本飞不起来。(我并非头一次使用这段论证。必须在此强调,这些话仅针对那些像我同事一样对“葫芦理论”表示认可的人。令人迷惑的是,还有另一群自称文化相对论者的人,虽然他们的观点与之前所讲的完全不同,而且完全合理。对他们来说,文化相对论是说如果你想要从自身文化出发去理解其他文化之中的信仰是无法做到的。你需要在该文化信仰构成的大背景下去试图了解文化之中的信仰。我想,这种合理的文化相对论可能是其最初形态。而我所批评的是一种堕落的极端表现,虽然这种极端表现很普遍。这些通情达理的相对论者应该努力将自己与那些愚昧的相对论者划清界限。)
如果你要乘飞机去参加一个人类学或文学批评界的国际盛会,你能顺利到达会场,没有半路掉到麦田里,正是因为许多接受过西方科学培训的工程师在计算过程中万无一失。西方科学以证据为基础,证明了月球在38.4万千米之外围绕地球旋转,还利用计算机和火箭成功地将人类送往了月球表面。而相信月球就在树顶不远处的部落人只能在梦里才能触摸到月球。
几乎每次公开演讲,观众席里都会有人一脸阳光地站起来提问,说出一些与我那位同事同一个论调的话来,而且还能收到席间一阵阵表示认同的点头和私语。毫无疑问,点头者会自我感觉良好,认为自己思想自由,毫无种族偏见。而能引发强烈共鸣的往往是这样一些话:“从本质上讲,进化论也是一种信仰,因此也并不比相信伊甸园的人强到哪儿去。”
每个部落都有关于起源的神话,都有关于宇宙、生命和人性的故事。从某种意义上讲,科学的确提供了某种相似的解释,至少是为现代社会中受过教育的人们提供了相似的解释。科学甚至有可能被描述为一种宗教信仰,而我也曾发表过一篇文章,半开玩笑地呼吁将科学列为宗教教育课程之中的一门正式课程(在英国,宗教教育是学校课程体系中的必修部分,和美国不同。美国因为担心会冒犯数不清的彼此无法兼容的信教者取缔了宗教教育。)科学与宗教相同的一点在于,两者都认为自己能够回答关于起源、生命本质和宇宙的深刻问题。但两者的相同点仅止于此,科学信仰有证据作为支持,并且能够产出结果;神话和宗教信仰没有证据,也没有结果。
在所有关于起源的神话中,犹太教的伊甸园传说在西方文化中广为流传,就连关于人类祖先的一个重要科学理论都以其命名——“非洲夏娃”。本章内容主要围绕非洲夏娃展开,一部分原因在于这可以助我引出DNA之河的类比,还有一部分原因在于我想以这一科学假设作为对比,来审视广为传颂的伊甸园夏娃。如果我能做到,那么读者将发现,真理比神话传说更加有趣,甚至更富有诗意。我们先来一段纯推理练习,其相关性随后便会明了。
你有两位家长,4位祖父母,8位曾祖父母……每前推一代人,人们的祖先的数量都会翻倍。往前追溯n代人,祖先数量就是2n。只不过,不用多费脑子,我们很快就能想明白,实情不可能如此。为了证实这一点,我们只需沿着历史向前追溯一点点,比如回到2 000年前。保守来讲,假设一个世纪有4代人,也就是说,人们平均在25岁时生儿育女,那么2 000年就是80代人。真实的数字可能比这个要多(以前许多女性都在很小的年龄开始生孩子),但我们做的就是个粗略估算,无须太过细致,也能得出结论。280是个巨大的数字,1后面跟着24个零。也就是说,在那个时代的还有你的一亿亿亿位祖先,而且我也有这么多祖先!但当时的世界人口总数不过是我们刚才得出的数字的一个微不足道的零头。
很明显,哪里出了问题,但究竟是哪里呢?我们的计算没有错。唯一搞错的,就是我们关于每一代祖先的数量翻倍的假设。实际上,我们忘记了表亲也能结婚。每个人都有8位曾祖父母,而表亲婚姻家庭的子女只有6位曾祖父母。因为这对表亲夫妻共享两位祖父母,而这两位祖父母又同时是孩子的曾祖父母。说到这里,你可能会问:“那又怎么样呢?”人们偶尔会和表亲结婚,达尔文与妻子艾玛·韦奇伍德(Emma Wedgwood)就是表亲关系,但这种事肯定不会频繁到产生什么影响力。事实上,的确会有影响,因为表亲可能意味着远房相隔两层的表亲、相隔五层的表亲、相隔六层的表亲等。
当你将这些远房表亲计算在内来看,每一桩婚事都是表亲联姻。你可能听说过某人吹嘘自己是英国女王的远亲,这样的说法着实有些卖弄,因为所有人都可以称自己是英国女王的远亲,也是其他每一个人的远亲。人们彼此之间的亲缘关系盘根错节,无从追溯。皇室和贵族唯一与众不同的地方,在于他们可以清清楚楚地追溯自己的祖先。正如第十四世霍姆伯爵在面对政治对手对其头衔的嘲讽时说过的那样:“威尔逊先生,如果你细想一下,你自己也是第十四世威尔逊先生。”
由此可知,人们彼此之间都是比先前意识中关系更近的表亲,我们的祖先数量也比简单的计算结果要少许多。一次上课时,为了让学生沿着我这条思路进行思考,我提出让一位学生在现有知识的基础之上猜测一下,我与她的共同祖先生活在哪个历史时期。这位学生望着我,毫不犹豫地用缓慢而略带乡村味道的口音回答:“猿猴时代。”这是个从直觉出发的思考结果,可以理解,但百分之一万是错误的。如果是这样,那我与她的分离就发生在数百万年之前。实情是,她与我的最近一位共同祖先,很可能就生活在几百年之前,可能在征服者威廉一世之后。而且,我们之间肯定同时存在很多种不同的表亲关系。
导致我们给出错误祖先数量的计算模型,是一个不断开枝散叶的树形结构。若将这个结构倒置过来,变作后代树形模型,同样也是错误的。典型的情况下,一个人会有两个孩子、4个孙子、8个重孙,以此类推,直到几百年后产生一个万亿级别的庞大后代群。更贴近现实的祖先与后代模型,就是我们在上一章提出的不断流淌的基因之河。在河岸之内,基因沿时间线不断翻滚,向前流动。
基因顺着时间之河奔腾不息,水流分分合合。在这条河流的中途各点打一桶水上来,桶中的分子以前曾是伙伴,在河水中流淌的间歇点上是伙伴,以后也会再次成为伙伴。它们在过去曾相距遥远,未来也将遥遥相望。我们很难追踪到这些伙伴相遇的时间点,但从数学上能证实,相遇的确发生过。通过数学,我们了解到,如果两个基因在某个特定点没有相遇,无须沿河流的两个方向追溯多久,就能发现它们相遇的迹象。
你可能不知道自己和丈夫是远亲,但从统计学角度讲,你不用向上追溯多久,就能发现自己与他的血统有所重叠。展望未来,你与丈夫或妻子共同养育后代的可能性也是很大的。但这里有个更加有趣的想法。下一次当你身处人群之中时,比如在音乐厅或足球比赛现场,请看看周围,然后想一想:如果你在遥远的未来拥有后代,那么与你身处同一间音乐厅的这群人里,很可能某位就是未来与你拥有共同后代的人。
同一群孩子的共同祖父母通常知道他们是共同祖先,这样的事实无疑会让他们有一种亲密感,不管双方是否会为此采取行动。他们在想到对方时可能会说:“我不怎么看得上这个人,但他的DNA和我的DNA在我们的孙子身上混为一体,很可能在我们都驾鹤西去之后很久还有共同的后代。这样的事实的确会让我们产生联结感。”但我想说的是,如果你在遥远的未来还有后代,那么与你共处一间音乐厅的陌生听众之中,很有可能有人与你是共同祖先的关系。你可以对这群人展开调查,琢磨一下哪个人(无论男女)会命中注定与你共享后代。你与我,无论你是谁,无论你的肤色与性别,都有可能是共享后代的共同祖先。你的DNA可能命中注定会与我的DNA融为一体。
现在,假设我们可以乘坐时光机回到过去,回到罗马圆形大剧场的人群之中,或是更加久远的乌尔国的集市,或是再往前追溯。我们对那里的人群展开调查,把这群早已不在人世的个体分为两类:你的祖先,非你的祖先。这一点简单明了,但现在,我们能揭开一个令人震惊的真相。如果时光机带你回到了足够遥远的过去,那么你就能将自己见到的人分为两类,一类是生活在1995年的每一个人类的祖先,另一类则是没有后代活到1995年的人类祖先,没有中间情况。当你踏出时光机,眼睛看见的每一个人要么是全体人类的共同祖先,要么谁的祖先也不是。
这是一个值得思考的问题,也非常容易得到证明。你需要做的,就是驾驶想象中的时光机飞到足够遥远的过去,比如3.5亿年之前。那时,我们的祖先还是长着肺的肉鳍鱼,刚从水里出来,正要变成两栖动物。如果某条鱼是我的祖先,很难想象它不是你的祖先。如果它不是,那么就意味着继承到你的血统和继承到我的血统是彼此独立的,没有交叉,一路从鱼类到两栖动物、爬行动物、哺乳动物、灵长类动物、猿猴和类人动物,最后你我还生得如此相似,可以彼此对谈,而且如果我们是不同的性别,还能交配生子。你我之间的道理,对任何一对人类来说都适用。
我们已经证明,如果回到足够久远的过去,那么我们遇见的每一个人,要么一定是所有人的祖先,要么谁的祖先也不是。但多远才算足够久远?很明显,利用归谬法可以证明,我们无须回到肉鳍鱼时代,但是究竟要追溯到何时,才能找到所有生活在1995年的每一位人类的共同祖先呢?这是个难度更大的问题,也是我接下来想要讨论的。这个问题不是我们简单讨论便能得出结论的,我们需要真实的信息,需要对现实世界的特定事实进行考察。
著名英国遗传学家兼数学家罗纳德·费希尔爵士(Sir Ronald Fisher),完全有资格被誉为20世纪杰出的达尔文继承者,以及现代统计学之父。他曾在1930年说过这样一段话:“不同人种之间的性交,只存在地理等其他障碍。除了最近1 000年以外,这些障碍阻止了整个人类拥有同样的祖先。往前追溯500年以上,同一个国家国民的祖先可能就是同一个人。前往追溯2 000年,唯一可能存在的就是人种学种族之间的差异。这些差异可能的确是非常古老的,但只有在数千年间彼此隔离的两个族群之间几乎不存在混血的情况下,才有可能存在。”
关于河流这个比喻,费希尔是基于以下事实,即一个在地理上统一的种族之中所有成员的基因,都沿同一条河流潺潺流淌。但他提到的实际数字——500年、2 000年,费希尔肯定是在现有知识的基础上做出的猜测。他那个时代的人们尚没有能力收集相关证据。而分子生物学革命发生之后,我们甚至会因为信息太多而无从下手。正是分子生物学赐予了我们魅力四射的非洲夏娃。
数字之河并不是我们用过的唯一一个比喻。我们可以将自己体内的DNA看作一部家族族谱,DNA是一条很长的文本,是以一种由4个字母组成的文字写成的。这些字母被一丝不苟地从我们的祖先那里拷贝过来,就算相隔许多世代,也可以高保真度。通过对不同个体所保留的文本进行对比,我们就有可能重建他们之间的亲缘关系,并追溯到同一位共同祖先。远亲的DNA有更多的时间去彼此分离,比如挪威人和澳大利亚土著的DNA中就有大量不同的文字。研究人员可以针对文献的不同版本进行比对。除此之外,在DNA档案的问题上,还存在一个小困难——性。
性是DNA档案研究人员的噩梦。性的存在令祖先文本无法保持原封不动,造成了不可避免的问题。性中精力充沛、毫无节制的插手干预会对证据造成严重破坏。性对DNA档案的破坏,远远超过公牛对瓷器店的损毁。而在《圣经》研究学者的工作中,根本不存在这样的问题。诚然,对《雅歌》的起源进行追溯的学者,肯定知道原版不可能如此。
《雅歌》的段落前后不搭,说明这就是几个不同的诗歌段落的拼凑。其内容存在错误、突变,特别是在翻译过程中更容易出问题。“那些小狐狸,把那些破坏葡萄藤的小狐狸给我们抓来”是个错译,虽然许多人一生中都在不断重复这句话,令其拥有了某种挥之不去的吸引力,但也无法与正确翻译的语句相提并论:“把狐蝠给我们抓来,那些小狐蝠……看呀,冬天逝去,雨过天晴。大地绽放着鲜花,鸟儿歌唱的时候到了,乌龟也开始鸣叫。”
这段诗歌如此美好,我真不想咬文嚼字、破坏其中的美感,但这里无疑也存在一处“突变”。现代版的翻译用“鸽子”替换掉了“乌龟”,准确倒是做到了,却凭空添了沉闷,整首诗的韵味也破坏殆尽。但这些都是微不足道的错误,是无法避免的小差错,完全可以理解。因为这些文件并不是批量印刷出来的,也不是存在高保真的计算机磁盘上的,而是人们亲手在稀有而脆弱的蒲草纸上一遍又一遍抄录下来的。
现在,我们将引入性这个话题。在此,我不是指《雅歌》中的性描述,而是指以随机选择碎片的形式生生夺走一半的文件,将其与另一半横刀夺来,同样被撕扯得乱七八糟的文件相混合。这种不可思议的破坏性就是性细胞生成时会发生的情况。举例来说,当一位男性产生一枚精子细胞时,他从父亲身上遗传得到的染色体,与他从母亲身上遗传得到的染色体相互配对,其中很大一部分都变换了位置。
一个孩子的染色体是其祖父母染色体混乱纷杂、无可挽回、完全对不上号的大杂烩。再往更久远的祖先追溯,其情况可想而知。利用古代文献的比喻,其中的字母,甚至词汇,都有可能在世代继承的过程中被完整保留下来,但章节、页面,甚至段落,都已被残酷无情地扭曲、合并,若想沿这些线索去追溯历史根本无从下手。当我们谈到历史遗传时,性无疑是个巨大的障眼法。
只要不存在性的问题,我们就能利用DNA档案重建历史。我能想到两个重要案例,其一就是非洲夏娃,其二是对更加久远的世系进行重建——寻找物种之间的关系,而非物种之内的关系。正如我们在前一章了解到的,性混合只会发生在物种之内。当亲本物种生成子代物种时,基因之河就形成了两个支流。在支流各自流淌一段时间之后,每条河流之中的性混合就能实实在在地帮助到物种之间世系和亲缘关系的重建工作,而非遗传档案学家的绊脚石。只有在物种内部的亲缘关系问题上,性才会毁灭证据。而当我们讨论物种间亲缘关系的问题时,性能发挥助力作用,因为性可以自动确保每一个个体都是整个物种的优秀遗传样本。无论你从这条经过充分混合的河水中打出哪一桶水,这桶水都可以作为整条河的代表。
研究人员从不同物种代表身上获取了DNA文本,对其进行逐个字母的比对,并成功地构建了物种谱系。一个颇具影响力的研究学派认为,我们甚至有可能对物种谱系这棵大树的枝叶进行年代鉴定。这个想法源于颇具争议的“分子钟”理论。分子钟理论假设,遗传文本任意给定位置每百万年发生突变的速率是恒定的。
基因之中描述蛋白质的“段落”是细胞色素c,共有339个字母。人与马是远亲,人类细胞色素c和马细胞色素c之间有12个字母是不同的。而人与猴(相对较近的近亲)之间只有一个细胞色素c的字母是不同的。马和驴有一个字母不同,马和猪有3个字母不同。人类与酵母菌有45个字母不同,猪和酵母菌也有45个字母不同。数字相同并不足为奇,因为当我们沿着河流向上追溯找到人类的起源时,这条支流与猪的支流汇聚的时间,比它们一起与酵母菌支流汇聚的时间要近得多。
但是,这些数字里面存在一点小干扰。将马与酵母菌区别开来的细胞色素c的不同字母数不是45个,而是46个。这并不是说猪与酵母菌的亲缘关系,比马与酵母菌的亲缘关系更近。马和猪与所有脊椎动物一样,和酵母菌的亲疏远近是相同的。也许,在马和猪共享祖先的时代,有一个额外的变化悄悄潜入了发展成为马的世系之中,个中原因究竟为何并不重要。总体来看,将生物彼此隔离的细胞色素c字母数量,和我们之前讨论的进化之树开枝散叶的模式如出一辙。
之前提到过的分子钟理论认为,某个给定DNA片段的变化速率在每百万年间是基本恒定不变的。在这一假设的基础上,将马与酵母菌区分开来的46个细胞色素c字母的改变,其中约有一半发生在从共同祖先到现代马的进化过程中,另一半发生在从共同祖先到现代酵母菌的进化过程中(显而易见,这两条进化道路需要同样的时间才能完成)。乍看起来,这是个令人颇感吃惊的假设。毕竟,共同祖先和酵母菌的相似程度,很可能比其与马的相似程度更高。而令人接纳这一说法的关键,就在于由著名日本遗传学家木村资生(Motoo Kimura)提出的一个日益为人们所接纳的假设。该假设认为,很大一部分遗传文本都能在不影响意义的情况下自由变化。
一个很贴切的类比,就是对打印句子中的字体设计进行改变。
马是哺乳动物。
酵母菌是真菌。
就算每个词都用上了不同的字体,上面两句话的意思也能清晰表达。随着百万年的流逝,分子钟滴滴答答,坐看毫无意义的字体变化。受制于自然选择的变化,描述出马与酵母菌的不同之处的变化,也就是句子意义的变化,不过是冰山一角。
一些分子比另一些有着更快的时钟速率。细胞色素c的进化速度相对缓慢,约每2 500万年发生一次字母变化。这可能是因为,细胞色素c对于有机体生存的重要性严格取决于其具体形状。这类形状十分重要的分子发生的变化,绝大多数不为自然选择所容纳。其他一些蛋白质,诸如血纤维蛋白肽等,虽然也很重要,但在各种形状之下都可以正常工作。
血纤维蛋白肽与凝血作用有关,我们可以对其具体形状进行改变而不会影响到其凝血能力。这些蛋白质的突变速率是每60万年发生一次,比细胞色素c快40多倍。由此可见,血纤维蛋白肽不适用于重建远古世系,只适用于更近期的世系重建,比如哺乳动物之间的世系关系。科学家目前发现了数百种不同的蛋白质,每一种都有自身独特的每百万年变化速率,而每一种都能被单独用来进行谱系重建。这些蛋白质都能得出基本相同的谱系,而这也是非常好的证据,可以用来证明进化论是正确的。
我们先前讲到性混合搞乱了历史记录,并由此展开了上述讨论,提到了两种不受性影响的情况。上述讨论承袭了性不会将不同物种的基因进行混合的事实,而对其中一种情况进行了分析。这就开启了一种可能性,即利用DNA序列来重建我们的祖先尚未成为人类时的远古谱系。如果追溯到如此久远的过去,人类的祖先无疑是同一位单一个体。我们想要知道的是,究竟是在距离现今多近的时代,我们是与所有其他人类共享同一位共同祖先的。为了找到问题的答案,我们需要去寻找另一种不同的DNA证据。而说到这里,非洲夏娃便盈盈走入我们的视线。
非洲夏娃有时也被称为线粒体夏娃。线粒体个头很小,呈菱形。人类身体的每个细胞内部都充斥着数以千计的线粒体。线粒体基本呈中空,但有着由膜状挡板构成的复杂内部结构。这些膜状结构的表面积比线粒体的外表看起来要大出许多,而且能发挥作用。这些膜状结构是一座化学工厂的生产线。更准确地说不应叫化学工厂,而是一座发电站。
沿薄膜存在一条经精细控制的化学反应链,这条链上的反应步骤比任何人类化工厂之中的反应步骤都要多。结果就是,源自食物分子的能量通过被控制的步骤得到释放,并以可重复利用的形式储存起来,以备后用。无论何时需要,无论身体的哪个部位需要,都可以调用。若没有线粒体的存在,人类会一秒毙命。
我们现在更关注的是线粒体从何而来,在远古进化史中,线粒体曾是细菌。这一优秀理论得到了业界牛人,马萨诸塞大学安姆斯特分校(University of Massachusetts Amherst)的林恩·马古利斯(Lynn Margulis)的坚定拥护。从最初的异端邪说,到勉为其难的一点点兴趣,再到如今全体一致接纳的大胜利。20亿年前,线粒体的远古祖先还是自由存在的细菌,和其他类型的细菌一起,在更大的细胞内安营扎寨。由此产生的细菌群落(“原核”)成为人类自身拥有的大细胞(“真核”)。我们每一个人都是由数以万亿计的相互依存的真核细胞构成的群落,其中的每一个细胞都是数以千计的各有特色的细胞组成的群落,而这些细菌都完全封存于细胞之内,像正常细菌一样增殖。
有人曾做过计算,如果将人体内所有线粒体一个个排好队,其长度能围着地球绕2 000圈。某只动物或某棵植物,是由彼此互动的层叠群落积聚而成的巨大群落,就像雨林一样。热带雨林是活跃着数千万个物种的群落,而每个物种的每一个个体本身也是由被驯化的细菌构成的一个群落。马古利斯博士提出的起源理论,即细胞是封闭细菌花园,远比伊甸园的故事更能给人以启迪,也更加令人激动和振奋。而且,这一理论还有个额外的优势,那就是我们几乎可以肯定其正确性。
我和绝大多数生物学家一样,都坚信马古利斯理论的真实性,在本章提到这一理论,是为了引出这样一个特定话题:线粒体拥有自身的DNA。线粒体的DNA和其他细菌一样,限定于单一的环状染色体。线粒体DNA不参与任何性混合,无论是与体内的主“核”DNA,还是与其他线粒体的DNA。线粒体和许多细菌一样,只通过分裂的形式实现繁殖。一个线粒体无论何时分裂成为两个子线粒体,每个子线粒体都能获得与初始线粒体完全一致的拷贝,只会偶尔出现突变。现在我们就能从长距离谱系学者的角度看到其中的美妙之处了。我们发现,当考虑到人类的普通DNA文本时,在每一世代,性都会将证据打乱,将父系和母系的贡献通通混淆,而线粒体DNA则如受到庇佑般岿然不动。
人类的线粒体都来源于母亲,因为精子个头太小,容不下几个线粒体,其内部的线粒体只能为其提供足够的能量,让精子甩动尾巴,游向卵子。当卵子受精时,精子的头部被卵子吸收,而其内部的线粒体也随尾巴一同脱落。相比之下,卵子硕大无比,其巨大的、充满液体的内部空间蕴藏着丰富的线粒体种质,这些种质便是胎儿身体的种子。因此,无论你是女性还是男性,你的线粒体全部继承自你母亲线粒体的最初接种。无论你是女性还是男性,你的线粒体全部承袭于你外祖母的线粒体,没有一个来自祖母。线粒体包含了一个关于过往的独立记录,没有受到主核DNA的污染。而主核DNA来自你4位祖父母中的每一位、8位曾祖父母之中的每一位的可能性是相同的。
线粒体DNA没有受到污染,但并不能免于突变,即拷贝过程中发生的随机错误。事实上,其突变的速度比人类“自身”DNA的突变速度更快,正如所有细菌的情况一样,线粒体缺乏细胞从古至今进化而来的复杂的校读机制。你的线粒体DNA和我的线粒体DNA之间会存在一些不同之处,而这些不同的数量就是我们的祖先在多久之前分离开来的测量方法。并非任意一位祖先,而是母亲、外祖母这条女性专属线索。
如果你的母亲是血统纯正的澳大利亚原住民,或是血统纯正的中国人,抑或是血统纯正的卡拉哈里沙漠桑人,那么你的线粒体DNA和我的线粒体DNA之间就会存在许多不同。你父亲是谁并不重要,无论他是英国侯爵还是印第安酋长,都不会对你的线粒体产生丝毫影响,同样的道理,对你所有的男性祖先都适用。
因此,你的体内存在一本和主要的家庭族谱一同继承下来的独立的线粒体次谱,而这本次谱很大的好处就在于只沿母系继承。这并不是性别歧视:如果能做到只沿父系继承,也能带来同样的好处。线粒体DNA的好处就在于其不受干扰的完整性,在于其不会在每一代都被剪碎再融合。DNA遗传学家需要寻找的恰恰就是通过任一性别,而非两种性别的持续继承。Y染色体就像姓氏一样,只沿男性继承,从理论上讲应该也同样适用,但其中包含的信息量太少,不够用。线粒体DNA是寻找同一物种的共同祖先生存年代的理想工具。
有一个与加州大学伯克利分校已故科学家艾伦·威尔逊(Allan Wilson)共事的研究团队曾对线粒体DNA展开研究。在20世纪80年代,威尔逊和同事们对来自世界各地的135位女性进行了线粒体DNA序列取样。这些女性包括澳大利亚原住民、新几内亚高地人、美国土著、欧洲人和来自非洲的各类人种代表。研究团队针对每位女性与其他每一位女性之间的字母差异数量进行了统计,并将数字输入计算机,建立了一个最“节俭”的谱系。之所以在这里用“节俭”这个词,是因为研究人员在建模时尽可能地避免了对巧合的假设。
请回忆一下我们之前讨论过的马、猪和酵母菌,以及对细胞色素c字母序列的分析:马和猪只有3个字母之差,猪和酵母菌有45个字母之差,马和酵母菌有46个字母之差。从理论上来讲,我们认为由于马和猪拥有相对近期的共同祖先,所以二者与酵母菌之间的亲疏远近应该是完全相同的。45和46是个异常现象,在理想的世界本不应存在。这样的差异可能是因为在发展到马的道路上出现了一个额外的突变,或在发展到猪的道路上出现了一个重复突变。
从理论上来讲,猪和酵母菌之间的关系的确有可能比马与酵母菌更近,而猪和马是因为一场巨大的巧合才进化出高度相似性的(它们的细胞色素c只有3个字母之差,它们的身体也都具备几乎一致的哺乳动物模式)。我们之所以不相信会有这样的情况发生,是因为猪和马的相似程度远远超过猪和酵母菌的相似程度。
诚然,猪和酵母菌的关系,比马和酵母菌的关系,少了一个DNA字母之差,但这在马与猪的其他无法计数的相似性面前完全不值一提。这段论证便是“节俭”的案例之一。假设猪与马的关系很近,那么我们只需考虑一种巧合的相似之处。假设猪与酵母菌的关系很近,那么我们就要去构想一种极度超现实的情况,即它们彼此独立地获得了完全出于巧合的相似性。
在马、猪和酵母菌的问题上,节俭论证十分强大,无人质疑。但若在不同人种的线粒体DNA中寻找相似性,就不会出现上述论证之中的天差地别。节俭论证依然适用,却是细微的量化论证,而非能将问题一举击溃的强大论证。从理论上讲,计算机需要列出这135名女性所有可能存在的谱系,之后对这些可能存在的谱系进行核查,找出最节俭的一个,也就是将巧合相似性数量降到最低的一个。
我们必须接受,就算是最优秀的谱系,也有可能会强迫我们接纳几个小巧合,就像我们需要被迫接受因一个DNA字母之差而引出的酵母菌与猪的关系比酵母菌与马的关系更近一样。但是至少从理论上讲,计算机应该有能力处理这样的问题并表明,在这许许多多可能存在的谱系之中,哪一个是最节俭的,也就是将尽可能多的巧合排除在外的谱系。
上述都是理论,在实际情况中我们面临着一个障碍:可能存在的谱系数量比你、我以及任何一位数学家所能想象到的都要多。对于马、猪和酵母菌来说,只有3个可能存在的谱系。显而易见,正确的谱系是[(猪 马)酵母菌],猪和马被框在了最里面的括号里,酵母菌则是无关的“外组”。另外两个理论上存在的谱系是[(猪 酵母菌)马]和[(马 酵母菌)猪]。如果我们增加第4种生物,比如鱿鱼,那么可能存在的谱系数量就增长到了15种。我就不在此将所有15个谱系都列举出来了,但最节俭的是{[(猪 马)鱿鱼]酵母菌}。猪和马作为近亲,再一次紧密地团结在最内层的括号里。
下一个加入其中的是鱿鱼,与酵母相比,其与猪/马世系拥有更近期的共同祖先。其余14个谱系中的任何一个都没有最优谱系那么节俭。如果说猪与鱿鱼之间真的是更近的近亲,马与酵母菌之间是更近的近亲,然后猪和马彼此独立进化出了数量繁多的相似性,这种可能性简直微乎其微。
如果针对3种生物能画出3个可能存在的谱系,针对4种生物能画出15个可能存在的谱系,那么针对135位女性能建起多少个可能存在的谱系呢?答案是一个巨大无比的数字,根本没有写出来的必要。如果我们用现今世界上最大最快的计算机来列举所有可能存在的谱系,那么在计算机完成这项任务之前,世界末日早已降临人间。
尽管如此,这个问题也不是完全无望得以解决。我们可以利用审慎的取样方法,来驯服巨大到无法估量的数字。我们无法逐一算清亚马孙盆地中的昆虫数量,但可以通过对雨林各处的小地块进行随机取样,并假设这些小地块具有代表性,进而估算出总数。我们的计算机无法对135名女性的所有可能存在的谱系进行检索,但可以对所有可能存在的谱系进行随机取样。如果在浩如烟海的可能存在的谱系中进行取样,并留意到样本中最节俭的几个谱系都具备某些共同特征,你就能认定,也许所有谱系中最吝啬的一个具有同样的特征。
这就是研究人员实际完成的工作。但完成这一工作的最佳方法并非一眼就能识破的。正如昆虫学家可能就如何在巴西雨林中取样才最具代表性的问题争论不休一样,DNA谱系学家也运用过不同的取样方法。不幸的是,结果并不完全一致。尽管如此,伯克利团队对人类线粒体DNA分析的最初研究成果还是具备一定的参考价值的。他们的结论非常有趣,研究结果显示,最节俭的谱系原来牢牢扎根于非洲。这就意味着,一些非洲人与另一些非洲人之间的亲缘关系,比某些非洲人与全世界其他任何地方的某个人之间的亲缘关系更为疏远。
其他地方的人,包括欧洲人、美国土著、澳大利亚原住民、新几内亚人、因纽特人,形成了一个关系相对紧密的亲缘群体。一些非洲人属于这个紧密的团体,而另一些非洲人则不在此列。根据这一分析,最节俭的谱系是这样的:{一些非洲人[另一些非洲人(还有一些非洲人)还有一些非洲人和其余每一个人]}。由此,研究人员总结认为,所有人的母系祖先生活在非洲,而这位母系祖先就是“非洲夏娃”。我之前提到过,这一结论颇具争议。还有一些研究人员认为,在非洲以外的最外端的分支上也能找到同样节俭的谱系。他们还认为,伯克利的研究团队之所以得到这份结果,是因为计算机寻找可能存在的谱系时所采用的顺序。很明显,寻找的顺序不应该是个问题。大部分专家可能还是会更加相信线粒体夏娃来自非洲,但他们也并非信心满满。
伯克利的研究团队给出的另一个结论就没有那么大的争议了。无论线粒体夏娃生活在哪里,研究团队都能够估测其生存年代。我们已知线粒体夏娃的进化速度,因此可以在线粒体DNA谱系的每个分岔节点都标注上大致时间。而让所有女性联合起来的分岔节点即线粒体夏娃的出生日期,预估是在距今25万~15万年之间。
无论线粒体夏娃是否来自非洲,我们都要避免一种可能存在的理解混淆,那就是人类的祖先来自非洲,这一点毋庸置疑。线粒体夏娃是所有现代人类的近期祖先,她是“智人”物种的一员。研究人员在非洲以及非洲以外的地方,都发现过更早期的原始“直立人”化石。诸如能人和各种南方古猿(包括新近发现的拥有400多万年历史的新物种南方古猿)等比直立人更为久远的祖先化石,只在非洲发现过。因此,如果我们是过去25万年间从非洲迁徙到世界各地的人类的后裔,这次迁徙也是第二次非洲迁徙。
还有一次更早的非洲大迁徙,很可能发生在150万年前。当时,直立人慢慢游荡到非洲以外,在中东和亚洲各处安营扎寨。非洲夏娃理论并不是否认这些更早期的亚洲移民的存在,而是认为这些移民没有留下幸存的后代。无论你怎么看待这个问题,追溯到200万年之前,所有人类都是非洲人。除此之外,非洲夏娃理论还认为,如果仅仅追溯到几十万年前,当时幸存下来的人类也都是非洲人。如果能找到新的证据支持,那么就有可能沿所有现代线粒体DNA追溯到一位非洲以外的母系祖先(比如“亚洲夏娃”),并认为人类更为久远的祖先只能在非洲找到。
现在,让我们假设伯克利的研究团队得出的结论是正确的,并对其结论的意义进行检验。“夏娃”这个雅号带来了不幸的后果。一些激情满怀的人竟然凭空认为此夏娃是位孤独的女性,是地球上唯一的女性,是终极的遗传瓶颈,甚至将其作为为《创世记》辩护论证的依据。这种理解大错特错,正确的说法是,她并非当时地球上的唯一女性,甚至当时的人口规模也并不算小。她身边有着众多的伙伴,而且很能生养。
直至今日,他们可能还有为数众多的后代。但这些祖先的线粒体在所有后代身上都不复存在了,因为祖先与我们之间的联结,在某个节点上是通过男性建立起来的。同样,一个高贵的姓氏(姓氏与Y染色体一样,只沿男性向下继承,恰好与线粒体呈镜像关系)也会消失,但这并不意味着该姓氏的拥有者没有后代。他们可能通过各种路径拥有了数量众多的后代,只不过没有走通“只有男性”的这条路。正确的说法应该是,线粒体夏娃是距离现今最近的一位女性,在女性专属继承路径上,所有现代人类都是她的后代。一定存在这样一位女性可以让我们得出这样的结论,唯一需要争论的是她曾经生活在这里还是那里,是这个年代还是那个年代。她的确曾在某个地方、某个时代存在过,这一点毋庸置疑。
现在人们中间还存在一个更为常见的误解。就连在线粒体DNA领域工作的顶尖科学家也会犯同样的错误——线粒体夏娃是距今最近的人类共同祖先。这是把“距今最近的共同祖先”和“沿女性专属继承路径向上追溯的距今最近的共同祖先”搞混了。线粒体夏娃是女性专属继承路径上距今最近的人类共同祖先,而还有许多其他方式可以成为祖先的后代,而无须沿袭女性专属路径,可以说人们还有成百上千万条其他的路可以走。让我们回到祖先数量的计算题上(暂且忘记之前讨论过的表亲联姻的话题),你有8位曾祖父母,但其中只有一位属于这条女性专属继承路径;你拥有16位曾曾祖父母,但其中只有一位属于这条女性专属继承路径。就算表亲联姻在某个给定世代使得祖先数量降了下来,也仍然存在比女性专属继承路径多得多的成为祖先的方式。
当我们沿着人类基因之河向上追溯到久远的古代,可能会找到许多位夏娃和亚当。我们可以说,1995年生活在地球上的所有人类都是这些焦点人物的后代,线粒体夏娃只不过是其中一位。我们没有理由认为在所有这些亚当和夏娃之中,线粒体夏娃是距今最近的一位。恰恰相反。她有着一个特别的定义:我们是沿着后代之河,通过一条特定的路径成为她的后代的。与这条女性专属路径并行不悖的还有无数条可能存在的路径,这些路径的总数是如此巨大,使得线粒体夏娃在这许多亚当和夏娃之中,很难成为距今最近的一位。以女性专属路径继承下来,是非常有特色的一点,而如果这条特别的路径又碰巧距今最近,那就是个令人不敢相信的巧合了。
还有一件挺有意思的事,那就是人类距今最近的共同祖先更有可能是一位亚当,而不是一位夏娃。妻妾成群的现象比一妻多夫的可能性更大。从生理上讲,男性更有可能拥有成百甚至上千个孩子。《吉尼斯世界纪录》记载的拥有孩子数量最多的人有1 000多个孩子。这位父亲名叫穆莱·伊什梅尔(Moulay Ishmael),人送绰号“嗜血者”。(穆莱·伊什梅尔完全可以被女性主义者用来作为令人不爽的男性形象代表。据说,他可以在拔出宝剑的同时借势跃上马鞍,顺手砍下牵着缰绳的奴隶的脑袋,脱缰驰骋。虽然这幅画面血腥得让人不敢想象,但这段传说再加上他手刃万人的名声,也许能让我们大致了解这种类型的男性身上“受人尊崇”的特质。)
而在理想情况下,一位女性最多只能生育几十个孩子。平均而言,女性拥有孩子数量比男性多。可能有些男性的孩子数量多得不可思议,而这也意味着另一些男性一个孩子都没有。如果说有一个人没能成功繁育后代,那么此人更有可能是一位男性,而非女性。如果一个人拥有比例不均的子孙后代,那么此人也更有可能是一位男性。同样的道理适用于所有人类距今最近的共同祖先。由此来看,他更有可能是一位亚当,而非夏娃。举个极端的例子,你认为谁更有可能是现如今所有摩洛哥人的祖先,嗜血者穆莱·伊什梅尔,还是他庞大后宫之中的任意一位女子?
我们可以得出如下结论:第一,一定存在一位我们可以称其为线粒体夏娃的女性。她是沿女性专属继承路线向上追溯的距今最近的所有现代人类的共同祖先。第二,一定存在一个不知性别的人,我们可以将其称为焦点祖先。她或他是沿任意路径向上追溯的所有现代人类的共同祖先。第三,虽然线粒体夏娃和焦点祖先有可能是同一个人,但这种可能性小到微乎其微。第四,焦点祖先更有可能是一位男性而非女性。第五,线粒体夏娃很可能生活在距今25万年。第六,关于线粒体夏娃生活在哪里,学界尚存在争议,但在对以事实为依据提出的各种意见进行权衡之后,我们还是偏向于非洲。第五条和第六条结论取决于对科学证据的检验。前4条完全是利用一般的知识体系推理得出的结论。
但我说过,祖先掌握着理解生命本质的钥匙,非洲夏娃的故事只不过是更为久远的宏伟生命画卷上的一个狭小的人类缩影。在此,我们重回基因之河的比喻,回到那条流出伊甸园的河流之上。这一次,我们要逆流而上,追溯比传说中的夏娃生活的历史和非洲夏娃那数十万年的历史都要久远得多的时间点上。DNA之河从未间断,一路随着我们的祖先流传至今,而其时间跨度也不止30亿年。