现在“AI for Science(人工智能驱动的科学研究)”已成为全球人工智能新前沿。什么是AI for Science?是如何发挥作用的?有哪些关键问题?我们来一起探索一下。
什么是AI for Science?
近年来,人工智能(AI)技术发展迅猛。20世纪末,人工智能在手写数字识别方面取得了较高的准确率,并在国际象棋中击败了人类。2017年,围棋人工智能超过了人类职业顶尖水平。
过去五年间,人工智能在图像生成、自动驾驶、聊天机器人、视频生成、音乐生成等领域取得了重大突破。人工智能技术的发展达到了前所未有的高度。
当今世界,科学技术是第一生产力。除了上述领域之外,人们希望能够使用人工智能来驱动科学研究,为科技发展提供帮助,这被称为AI for Science(人工智能驱动的科学研究)。
科学研究是一个多方面的过程,一般包括假说的提出、实验的设计、数据的收集与分析。AI for Science的目标是使用人工智能来增强和加速这其中的每一个阶段,使科学研究变得更加高效。
早在20世纪50年代人工智能诞生初期,科学家们就试图使用计算机来解决科学问题,这个时期的研究主要集中在数学和物理学领域,利用计算机进行数值模拟和复杂计算,这也推动了计算机技术的进步。
20世纪80年代,专家系统开始兴起,专家系统内含有特定领域的专家知识和经验,它可以使用这些知识和经验通过逻辑学进行推理与判断,模拟人类专家去解决特定领域的问题。
随着近20年来机器学习技术的成熟,人工智能不再局限于传统的逻辑推断,而是能够从大量的数据之中挖掘出数据的内在联系,在数学、物理、化学、天文、生物等学科中取得了重要成果。现在AI for Science已经成为全球人工智能新前沿。
AI for Science是如何发挥作用的?
人类科学历史的发展经历了四个阶段,经验科学、理论科学、计算科学、数据科学。
在经验科学阶段,科学发展依赖于对自然现象的观察与总结。例如,16世纪哥白尼通过观察行星运动提出了日心说。
在理论科学阶段,人们不仅总结自然现象的规律,还探讨其背后的科学理论,17世纪牛顿总结出的物体运动的三个基本定律是这一阶段的代表之一。
20世纪,随着计算机的发展,人们进入了计算科学阶段,借助计算机的强大计算能力,人们可以根据物理定律进行建模和模拟,如流体运动仿真和气象预测。
21世纪,大数据技术的兴起推动了数据科学的发展,科学家通过处理与分析海量的实验数据,从中发现新的科学规律。
AI for Science是一个新兴的科学研究手段,是这四个发展阶段科学研究方法的有机结合。它使用已知的科学规律进行建模,同时又挖掘海量数据的规律,在计算机的强大算力的加持下,进行科学问题的研究。
人工智能(AI)作为计算机学科的一个新兴分支,它在科研领域发挥的作用与传统的计算机科学不同。计算机最早是为了辅助人类计算而发明的,它计算速度快、准确度高、可以自动化执行,在科研领域产生了重要的影响。
但传统计算机只是代替人类完成复杂繁琐的计算,而人工智能更加追求“智能”,希望计算机能够代替人类的智能,像人类一样学习、推理与决策。
下面,我们通过一个例子来介绍 AI for Science 的具体应用。
AI for Science的应用-机器化学家
最近,中国科学技术大学的研究人员开发了全球首个集阅读文献、设计实验、自主优化等功能于一体,覆盖化学品开发全流程的机器化学家平台,它被科研人员形象地称为“机器化学家”。
在“高熵非贵金属产氧催化剂”材料研究中,机器化学家展现出了AI for Science的极大潜力。为了寻找合适的材料,按照以往的方法,科研人员要从29种非贵金属元素中选出5种进行超过55万种配比组合,“试错”研究可能需要1400年。而有了机器化学家的帮助,只需要几周时间就可以完成。
机器化学家首先从文献数据库中阅读1.6万篇相关论文,总结规律然后挑选出可能满足要求的材料组合,使用计算机进行模拟计算。它将模拟计算进一步挑选出的材料组合进行自动化实验以验证材料的真实性能。它可以根据预先设定好的流程利用自动化技术自动完成从材料合成到性能测试的全流程实验,并对实验数据进行处理与分析,最终挑选出合适的材料。
机器化学家的优势在于它将大数据与人工智能相结合,利用人工智能进行人类难以完成的海量文献阅读,并从中获取经验。在获取经验的基础上,机器化学家自主提出可能的方案并进行实验验证,从而代替了先前需要大量人工的试错过程,加速了科学研究的进展。
AI for Science有哪些关键问题?
在AI for Science发展的过程中,它仍然面临着以下几个关键问题:数据、算法、算力、人才。
数据问题:为了让人工智能能够自主决策,科学家需要提供数据以供学习,如何获取高质量的数据已经成为了提高人工智能能力的瓶颈。特别是在科研领域,科学家面临的问题都是人类知识的边界,人工智能所能利用的数据比其它领域更为稀少。
在机器化学家的研发中,为了获得足够的数据,研究人员用了3年时间收集教科书、论文、专利中“沉淀”的化学经验和知识。但这些数据来源繁杂,质量参差不齐,仍然需要进一步丰富和优化。
算法问题:在人工智能应用于具体的科学领域时,人工智能并不能从零开始依据数据学习到所有的规律,这就需要相应领域的专家依据当前领域已有的规律或经验为人工智能设计对应的算法。不仅需要AI for Science,有时也需要Science for AI,如何进行计算机科学与其它各领域的交叉融合也是一个重要的问题。
算力问题:人工智能模型的训练以及应用需要大量的算力作为支撑,归根到底人工智能仍然是计算机技术,计算机的性能会制约人工智能的能力。在机器化学家的训练迭代和应用过程中,需要消耗大量算力。因此,为了让人工智能取得广泛应用,高性能计算机的研发是不可或缺的。
人才问题:在AI for Science中,人工智能始终是辅助科研人员进行研究的技术,它尚未发展至可以完全不依赖于人的控制自行解决所有问题的程度,因此我们需要更多的科研人员参与进来,推动AI for Science的发展。机器化学家正是在一批多学科背景的科研人员的通力合作、协同攻关下取得了成功。
期待在未来,随着人工智能的发展,AI for Science可以在科学领域产出更多的成果,促进人类的科技进步。
参考文献:
1.Wang, H., Fu, T., Du, Y. et al. Scientific discovery in the age of artificial intelligence. Nature 620, 47–60 (2023).
(文章内容来源于中国科普博览。)