<转载>适应度地形(fitness landscape)与进化

作者:Philip Yang 中山大学教授,研究进化基因组学/生物信息学/系统生物学
中山大学进化基因组与系统生物学研究组

来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


适应度地形(fitness landscape)与进化



如果我们把生物在特定环境下生存的能力用适应度(fitness)来进行衡量的话,生物的进化[注1],实际上就是通过改变基因型,不断提升自身在这个环境下的适应度的过程。为了更直观地阐明这个问题,Sewall Wright于1932年[1]第一次提出,把基因型和适应度的对应关系用“适应度地形”(fitness landscape,也有译作"适应度景观")来进行描述。

楼主 Reformatskies  发布于 2016-11-06 23:04:00 +0800 CST  





上图是引用自[2]的一张3维的适应度地形图。图中有三个高度不一的“山峰”。图中“地表”的海拔高度(深蓝色是低,红色是高)就是生物的适应度,进化的目标实际上就是通过突变(沿着“地表”移动),找到一条通往山顶的路径,如图中的白色虚线箭头所示。当然,山越高越好,否则如果另一座更高的山上有另一个物种,那么第二高的山上的物种,理论上就只能等死了。


生物进化的死胡同
为什么“理论上只能等死”呢?进化的过程中,生物只能依靠突变(改变基因型)来在适应度地形上移动,并且只有那些能提升适应度的突变能够在进化中被保留下来[注2]。例如图上沿着白色虚线走,每个突变只能让你移动到下一个”海拔更高“的白点,而不能连跳两个。这个移动速度主要是由基因突变的类型决定的,例如最普遍的单核甘酸突变只能使物种移动一点点,而稀有却规模更大的突变(例如全基因组复制, Whole genome duplication)则可能迈的步子大一些。但不难想象,一个大突变刚好使物种完全离开某座山峰,并恰好落在海拔更高的地方,概率非常非常低。而任何指向其它山峰的小突变,都不可避免地是降低适应度的,因而在进化上不可能被保留到物种的基因组中。于是这就形成了进化上的“死胡同”[注3]——物种的进化趋于停滞,无法更进一步提高适应度。


前面说过,适应度景观描述的是基因型与适应度之间的关系。前面的讨论我们都只关心了适应度,如果加上基因型的话,我们可以用一个更具体的模型来描述很小范围的适应度地形,从而方便我们对进化的死胡同进行描述。

楼主 Reformatskies  发布于 2016-11-06 23:07:00 +0800 CST  


上图来自[3],表示的是一个局部的适应度地形,它只考虑了两个遗传位点/基因座(Genetic loci)的基因型,每个位点可以有两种状态(基因座1为a或A,基因座2为b或B)。跟之前一样,图中的颜色或地形的高低表示该基因型的适应度,高/红色表示适应度高,低/蓝色表示适应度低。假如物种目前基因型为 ab ,它进化的目标是 AB [注4],但问题是,两个进化的中间态(aB 和 Ab)都是适应度很低的基因型,所以两种突变(a->A,或b->B)都不能在进化中被保留下来,然则能到达 AB 的下一步突变,显然也无法发生。这里,ab 就可以看作是这个适应度地形里的一个死胡同。


在更大的适应度地形里,死胡同也是非常普遍的。2006年,Daniel Weinreich [4]发现,如果大肠杆菌的 β-内酰胺酶蛋白质序列的 5 个氨基酸发生特定的突变,可以让大肠杆菌对一种抗生素(cefotaxime)的耐药性提高1000倍。理论上,这 5 个突变可以以任意顺序发生,因此一共有 5! = 120 条可能的进化路径。然而,当他测定了所有 2^5=32 个基因型的对抗生素的耐药性之后,他发现其中只有18条路径是可用的。只有在这18条路径上,每一步的突变都是提升耐药性而不是降低。剩下的102条进化路径都被困在了某个进化的死胡同里。
如何逃出进化的死胡同



以上面的模型为基础,我将介绍一些比较有代表性的理论研究。

1) 群体遗传学(Population Genetics)的观点
任意一个物种都不是只有一个个体,而是一个种群。从群体遗传学的观点看,种群能否逃出进化的死胡同,就是在问,降低物种适应度的突变(有害突变)是否/在什么条件下可以扩散到种群中的每一个个体身上。在这个理论框架下,一个突变是否可以被进化所接受,其回答就不再是简单地看突变本身是提升还是降低适应度了。当前至少有两种群体遗传学的理论,可以解释有害突变如何在进化中被保留下来,并最终使物种能逃出进化的死胡同。


第一种理论是,如果种群很小,某个降低适应度的突变可能在遗传漂变(Genetic drift)的作用下,随机地"占领"了种群中的所有个体。打个比方,在抛硬币的游戏里,如果用的硬币是正面重而反面轻,只要你抛的次数足够多,重的正面朝下的概率必然会比较高。但如果你只抛了10次,10次全是正面朝上的概率也不是那么的低。换成有害突变,就可能是其他没有有害突变的个体(上面模型中的 ab)都因为各种偶然原因死掉了,反而种群里只剩下带有有害突变的个体(例如 Ab)。接下来 Ab->AB 的突变就水到渠成了。


另一种理论适用的条件刚好与上面的相反。如果种群很大,种群里面可能暂时性地保留有一些包含有害突变的个体,假如两个包含有害突变(ab->aB 和 ab->Ab)的基因座恰好通过重组被带到了一起,基因型就变成了AB,从而得以逃出进化的死胡同。另外,种群大的时候还有另一种可能的机制能达到上述效果[5],但这篇文章我自己没太理解透,就不细说了。


2) 靠表型突变(Phenotypic mutation)来探路
所谓的“表型突变”(Phenotypic mutation),指的是基因组上没发生变化,但表型却发生了变化的情况。典型的例子就是细胞内各种随机发生的错误,例如DNA转录出mRNA或mRNA翻译成蛋白质的过程中发生的错误,基因组上明明编码的是 a ,但是翻译出来却变成了 A 。[6]发现,如果表型突变频繁到一定程度[注5],基因型是 aB 的个体就有可能“错误”地翻译出一批“看起来”是基因型 AB 的蛋白质。 这时只要 AB 型的蛋白质带来的适应度提升足够大,那么其背后的真实基因型 aB 就有可能被进化保留下来,从而帮助物种逃出进化的死胡同。这种现象被称作表型突变的“前瞻效应"(look-ahead effect)。



3) 环境变化带来的新机遇

生物实际生存的环境是千变万化的。严格来说,一个适应度地形只能解释一个特定环境下的基因型与适应度的对应关系。换句话说,如果环境发生了变化,适应度地形就要变样了。[7]里面用经典的大肠杆菌乳糖操纵子(lac operon)建立了一个模型,用来研究环境及其对应的适应度地形的变化,是否真的可以为进化开辟新的道路。当环境中的细胞的”食物“(碳源)只有乳糖或其类似物的时候,乳糖操纵子会被激活,使细胞吸收和利用乳糖。当环境中有大量葡萄糖的时候,它则会处于抑制状态,让细胞优先使用葡萄糖,因为细胞利用葡萄糖的效率比较高。乳糖操纵子的启动子及其相关转录因子的基因型,决定了乳糖代谢被激活的时候,活性有多高,即在有乳糖时,细胞能否有效利用乳糖,来保证快速生长;它也决定了乳糖代谢被抑制的时候,活性有多低,即在有葡萄糖时,细胞是否不浪费资源处理乳糖,而专注于利用葡萄糖来保证细胞快速生长。换句话说,在只有乳糖的环境下,物种的适应度主要反映启动子激活基因表达的能力,而在有葡萄糖的环境下,物种的适应度主要反映启动子抑制基因表达的能力。


[7]的作者发现,如果大肠杆菌只在一个环境下生长,它很快就会被困在进化的死胡同里,无法进一步优化上述启动子的激活/抑制基因表达的能力。有意思的是,环境的变化却能给进化开辟出新的路径,如下图(引用自[7]):





图中x轴表示启动子和转录因子发生的突变,橙色线及其对应的右侧y轴表示启动子的激活能力,而蓝色线及其对应的左侧y轴则表示启动子的抑制能力,两条纵向的灰色虚线表示环境发生了变化。上图描述了一条由环境变化开辟出的进化路径:第一步突变发生在有葡萄糖的环境里,它使启动子的抑制能力提高了,因此提高了大肠杆菌在此环境下的适应度。但若继续留在有葡萄糖的环境里,第二个突变是不能被接受的,因为它降低了抑制能力(沿着蓝线继续走)。如果此时切换到了只有乳糖的环境(纵向的虚线),适应度就变成了橙线,即启动子的激活能力,于是第2、3步突变就可以发生了。后面的情形以此类推,结果就是大肠杆菌逃出了中间的几个死胡同。值得指出的是,环境变化导致物种有时要优化抑制能力,有时要优化激活能力,但最后其得到的抑制能力和激活能力,都要优于物种一直只关注抑制能力(一直停留在有葡萄糖的环境),或一直只关注激活能力(一直停留在只有乳糖的环境)时的结果。


研究这个有什么用
在演化生物学的领域,相关研究的价值是不言自明的。基于演化生物学的基础地位,相关研究也对其它生物学相关学科有重要的理论价值。例如一般认为肿瘤的发生发展就是典型的演化过程,因此研究肿瘤是如何不停演化并保证不会被困在死胡同里面,就很可能可以进一步加深我们对肿瘤的认识。


再往远一点说——可能有的朋友读本文读到一小半就发现,这就是个典型的找最优解(最高适应度)的问题。特别地,进化的死胡同就是局部最优,然后目标是找全局最优。相关的演化生物学研究能揭示生物在演化的过程中采取了什么策略来避免停在局部最优,并为算法设计者所借鉴,也算是某种意义上的“仿生学”了。


----------
最后打个广告:我2016年会新建实验室,现正物色科研助手和研究生,有兴趣的请私信联系。谢谢大家!
----------

注解:
[注1] 我认为evolution应该翻译做"演化",而不是"进化"。但本文提到的“进化”,确实是有“进”的意思。用英文术语来说的话,更接近"adaptation",而不是"evolution"。因为这篇文章里,和相关研究文献,都是不考虑中性进化的。但当然,我也并不认为说"adaptation"就应该翻译做"进化"。
[注2] 同[注1],忽略中性突变。
[注3] 意义比较接近的英文术语应该是"evolutionary dead-end",不过这个术语本身有别的意思,所以这里就不在文中特别强调了。
[注4] 进化本身没有所谓“目标”的,所以更严谨地说,这里描述的应该是一个回顾性的问题,即已知物种从"ab"进化到了"AB",它是如何发生的呢?这个问题一般称作进化的反向可预测性,backward predictability of evolution。
[注5] 实际上表型突变并不算太稀有。以mRNA翻译错误为例,大概是每2000个密码子就会出错一次。假如按人类蛋白编码基因长度的中位数(约400个氨基酸)算,有20%的蛋白质分子至少包含一个错误的氨基酸。


参考文献:
[1] Wright, Sewall. “The Roles of Mutation, Inbreeding, Crossbreeding and Selection in Evolution.” Proceedings of the Sixth International Congress of Genetics 1 (1932).
[2] de Visser, J. Arjan G. M., and Joachim Krug. “Empirical Fitness Landscapes and the Predictability of Evolution.” Nature Reviews Genetics advance online publication (June 10, 2014). doi:10.1038/nrg3744.
[3] Gutiérrez, Jayson, and Steven Maere. “Modeling the Evolution of Molecular Systems from a Mechanistic Perspective.” Trends in Plant Science 19, no. 5 (May 2014): 292–303. doi:10.1016/j.tplants.2014.03.004.
[4] Weinreich, Daniel M., Nigel F. Delaney, Mark A. DePristo, and Daniel L. Hartl. “Darwinian Evolution Can Follow Only Very Few Mutational Paths to Fitter Proteins.” Science 312, no. 5770 (April 7, 2006): 111–14. doi:10.1126/science.1123539.
[5] Weinreich, Daniel M., and Lin Chao. “Rapid Evolutionary Escape by Large Populations from Local Fitness Peaks Is Likely in Nature.” Evolution 59, no. 6 (June 1, 2005): 1175–82. doi:10.1111/j.0014-3820.2005.tb01769.x.
[6] Whitehead, Dion J., Claus O. Wilke, David Vernazobres, and Erich Bornberg-Bauer. “The Look-Ahead Effect of Phenotypic Mutations.” Biology Direct 3, no. 1 (May 14, 2008): 18. doi:10.1186/1745-6150-3-18.
[7] Vos, Marjon G. J. de, Alexandre Dawid, Vanda Sunderlikova, and Sander J. Tans. “Breaking Evolutionary Constraint with a Tradeoff Ratchet.” Proceedings of the National Academy of Sciences, November 13, 2015, 201510282. doi:10.1073/pnas.1510282112.

楼主 Reformatskies  发布于 2016-11-06 23:09:00 +0800 CST  

楼主:Reformatskies

字数:5972

发表时间:2016-11-07 07:04:00 +0800 CST

更新时间:2016-12-28 21:13:21 +0800 CST

评论数:8条评论

帖子来源:百度贴吧  访问原帖

 

热门帖子

随机列表

大家在看