基因的概念如今已经广为人知。但基因不会是凭空出现的,它们最初是如何诞生的呢?
达尔文创立进化论的时候,人类还没有基因这个概念。虽然同时代的孟德尔已经发现了遗传因子,也就是基因的前身。但是达尔文却没能注意到这个同样伟大的生物学发现。因此,在达尔文最初的进化论框架中就留下了一个难以解释的问题,那就是遗传为何会发生改变,而改变的主体究竟是什么?
今天,我们对于这个问题已经有了明确的答案:遗传中发生改变的正是承载在DNA分子上的基因。不过,新的问题又产生了。如果说遗传中基因发生了变化,那么出现一个新基因就意味着旧基因的消失,结果整个地球上的所有生命都将拥有数量相同的基因。
然而事实显然并非如此。近二十多年来基因组学的不断研究已经发现,人类拥有约2万多个编码蛋白质的基因,鲤鱼有将近5万个基因,而酵母只有6千多个基因,我们肠道里的大肠杆菌只有4千多个基因。很显然,在进化的过程中,生物有可能获得新的基因。但它们从何而来呢?
目前认为,最主要的一种产生新基因的方式就是通过基因的重复,它也催生了将近90%的基因。严格来讲,大多数基因重复事件是一个错误。当细胞分裂时,基因组需要复制出一份来,分配到新的细胞中。由于某些复制错误,就会导致承载着某个基因的那段DNA被错误地装配了两次。于是,这个基因在新的细胞中就出现了一个一模一样的拷贝。
接下来,随着成千上万年的时间过去,生物的每个基因都可能因为突变而发生变化。于是,这两个本来一样的拷贝就会变得渐渐不同,甚至最终成为功能不同的基因。这样一来,就诞生了新的基因。
在我们人类的基因组中就有这样两个已经分化,但还没有离得太远的基因。它们分别编码了我们的长波和中波彩色视蛋白。如果不是因为基因重复诞生了它们两个基因,那么灵长类就会像其他哺乳动物一样成为色盲。不过,正是因为这两个基因是重复所造就的,所以差别直到今天也不大,这就让人类的彩色辨别能力变得比较弱。另外,因为这两个基因在染色体上离得比较近,所以也很容易在复制时丢掉其中一个,从而导致了红绿色盲这种病症。
另外一个产生新基因的方式很可能就是突变本身。我们都知道,基因组中有很多不具备明确功能的区域,但是这些区域也有可能在某个突变发生之后就变得能够编码蛋白质。如果这种蛋白质还恰好对生命的生存有好处,那么它的编码区域就会被自然选择保留下来,成为一个稳定的基因序列。这种由突变积累成为基因的方式也算是“无中生有”了。
近来,科学家们又发现了一种新的基因产生方式,它解决了小RNA编码基因的起源问题。前面讨论的基因主要是指编码蛋白质的基因,而随着RNA功能研究的深入,科学家们发现细胞内有大量起着调控作用的小RNA,并且也是由基因组中的对应基因来编码的。这些小RNA为了保持稳定,往往都有回文序列,也就是在前后两段序列恰好是倒序互补的,所以能对接在一起。科学家们一直感到很困惑,不知道像这样前后恰好互补的序列是如何出现的?难道也要靠一位一位的突变积累?
新的研究发现,实际上,这种回文仅靠一次复制错误就能实现。当基因组复制时,如果遇到错误导致复制停止,那么新合成的DNA链可能与本侧的模板脱离,并恰好漂到对侧的DNA模板上反向连接。如果此时DNA复制得以继续,那么用对面模板反向合成出来的就一定是倒序互补序列。就这样,小RNA的基本骨架在一次复制错误中就直接诞生了,也是另一种“无中生有”。(文章内容来源于星空计划。)