对于生命而言,蛋白质的重要性,怎么强调都不过分。2024年的诺贝尔化学奖就颁发给了三位在蛋白质领域做出杰出贡献的的科学家,他们是David Baker,Demis Hassabis和John M. Jumper。想要理解为什么蛋白质如此重要,以及三位获奖人的工作,我们就需要先从生命开始说起。
那么,什么是生命呢?如果我们想要将某个东西归类为生命,那么它就必须符合以下标准:
生命必须维持一个相对稳定的内部环境,比如我们人类需要保持恒定的体温和盐平衡。
生命需要对周围环境做出反应。比如当我们感觉冷的时候,就会颤抖,这样会增加摩擦,从而产生热量。
生命的基本结构和功能单位是细胞。
生命会吸收和转化营养物质以满足需求。这就是我们所说的新陈代谢。
生命可以繁殖,它可以无性繁殖和有性繁殖。
但是,假如没有蛋白质,那么刚才提到的这些标准就都无法满足!那么什么是蛋白质呢?
蛋白质主要是由20种不同的氨基酸组成的。这些氨基酸可以以无数种不同的组合,像珍珠一样串连在一起。蛋白质之所以如此神通广大,是因为这些珍珠串或者说氨基酸链,会扭曲并折叠成特定的三维结构。正是蛋白质的三维结构决定了每一种蛋白质的特定功能。例如,有的蛋白质会形成皮肤、骨骼和肌肉;有的会形成酶,以确保体内化学反应有效进行;有的则会在血液的帮助下,将各种物质输送到全身。
在过去的50多年里,科学家一直梦想着能够在只知道氨基酸序列的情况下,预测蛋白质的三维结构。但是这个领域的进展一直非常缓慢,直到2020年。
在那一年,Demis Hassabis和John Jumper开发了一种人工智能模型,叫AlphaFold2。如果我们知道了氨基酸的序列,那么它就可以预测蛋白质的结构。
为了训练AlphaFold2,他们给它输入了大量的数据。具体来说,通过向AlphaFold2输入已知的氨基酸序列,以及它们形成的蛋白质的三维结构,AlphaFold2学会了理解序列及其结构之间的模式和关系。我们可以把这类比于教一个小孩识别和搭建各种乐高模型。一开始,你会给他很多完整的乐高玩具,比如宇宙飞船、汽车和房子。通过看到这么多的例子,他学会了识别哪些部件应该放在哪里,以及如何自己组装类似的组件。他从他见过的所有不同的模型中学习模式和技术。
经过训练后,AlphaFold2就可以通过新获取的氨基酸序列,来预测蛋白质的结构。具体来说,当它接收到一个它以前没有见过的新氨基酸序列时,它会开始将这个新序列与它从训练数据中学到的大量序列和结构进行比较。通过识别新序列和记忆中的序列之间的模式和相似性,AlphaFold2会尝试将新的序列组装成一个合理的三维结构,它会测试不同的组装方式,并利用它的知识来估计哪种方式最有可能是正确的。结果表明,AlphaFold2是极其强大的,它成功地解决了化学家苦苦思索了50年的问题。
如今,在AlphaFold2的帮助下,研究人员可以预测发现的几乎所有2亿个蛋白质的结构。全世界已经有200多万人使用它,并取得了重大的科研进展。
现在,我们已经知道Demis Hassabis和John Jumper采用的方法是从氨基酸序列开始预测蛋白质的结构,但David Baker则采用了相反的方法:他从一个蛋白质的三维结构开始,然后使用一个名为Rosetta的计算机程序,来找出构建这个结构所需要的氨基酸。
David Baker的团队会使用Rosetta来设计一个具有特定结构和功能的蛋白质的三维模型。然后,Rosetta会计算出哪些氨基酸会自然地聚集在一起形成设计的蛋白质结构。根据它确定的氨基酸序列,他们在实验室合成了这种蛋白质,然后使用了一种叫做X射线晶体学的精确方法来确定蛋白质的实际三维结构,看看它是否符合他们的设计。
结果表明实际结构与设计的假想蛋白质结构是相匹配的。这证实了Rosetta可以准确地预测产生特定三维蛋白质结构所需的氨基酸序列。
现在,科学家不仅可以从氨基酸序列开始,创造一个完整的蛋白质;也可以从一个想要的蛋白质结构开始,找出相应的氨基酸序列来创造它。这种双重能力就像既能按照指示用积木制作玩具,又能通过先决定玩具的结构,然后找出使用哪些积木来发明新玩具。
总而言之,更好地了解蛋白质的三维结构不仅可以增加我们对疾病的了解,也为未来开发新的药物铺平了道路。同样重要的是,我们现在有能力创造出具有新功能的蛋白质,这对于设计新的纳米材料、开发靶向药物,以及制造疫苗都具有重大意义。
因此,三位获奖人所开发的工具不仅让我们能够更加深入地了解生命,也使我们能够创造一个更加健康和创新的未来。(文章内容来源于星空计划。)