大数据和人工智能(AI)的突破性进展正在深刻改变科学研究的范式。“相关性取代因果关系”的范式备受争议,而“数据密集型科学发现”范式逐渐成为主流。随着AI技术的持续成熟,“机器人科学家”范式正在逐步成为现实。该范式意味着AI能够自主完成科学研究的每一个步骤。
目前新一代通用人工智能(AGI)算法有望实现整个科学研究周期的自动化,使数据密集型科学迈入机器人科学家的时代。已有研究表明,机器人科学家在需要高通量和高精度实验的领域中展现出了卓越的自主研究能力。例如,Adam能够分析酵母代谢中基因与酶的关系,Eve专注于自动化早期药物开发,AI化学家能够自动阅读科学文献,提出实验计划并执行完整的化学实验流程。
鉴于此,中国科学院青藏高原研究所李新研究员等系统总结并展望了大数据和AI时代科学研究范式的变化。在回顾科学研究的传统范式的基础上,批判了“相关性取代因果关系”范式,检视了“数据密集型科学发现”范式,并深入分析了正在出现的 “机器人科学家”范式。研究成果近期以“Paradigm shifts from data-intensive science to robot scientists” 为题发表在《Science Bulletin》上。
文章详细阐述了科学研究在“数据密集型科学发现”范式向“机器人科学家”范式转变过程中的每个环节,包括观测、数据分析、提出假设、模拟预测、假设检验和理论化(图1)。同时,研究指出,这场由大数据和AI推动的范式转变,不仅加快了知识发现的速度,还为科学研究提供了全新的框架。大数据的引入实现了假设驱动与数据驱动方法的融合,溯因推理将成为机器人科学家范式中的核心逻辑推理工具。此外,AI的可追溯性与可解释性大幅提升,使其形成的假说和理论将更具稳健性和普适性。机器人科学家仍遵循科学方法从观测到理论化的整体流程,但大数据和AI极大提升了科研效率和自动化水平。未来,机器人科学家将凭借其广泛的知识储备、强大的计算和推理能力、自主实验设计以及执行的能力实现真正的科学理解与创造性思维,从而具有自主发现科学问题并完成整个科学研究过程的能力(图2)。它们将人工智能的角色从单纯的辅助工具提升为主动且富有创造性的研究者,积极探索超越现有知识前沿的领域,提升科学发现效率、深化科学理解。
我所李新研究员为论文第一和通讯作者,郭彦龙特别研究助理(博士后)为论文共同通讯作者。该研究由国家自然科学基金委青藏高原地球系统基础科学中心(BCTPES,41988101)以及国家自然科学基金项目(42371067)联合资助。
文章链接:https://www.sciencedirect.com/science/article/pii/S2095927324006807
图1 科学研究中的范式转变
(a)传统范式 (b)“相关性取代因果关系”范式 (c)“数据密集型科学发现”范式 (d)机器人科学家范式
图2 机器人科学家范式
(a)无限的知识范围 (b)自动化分析过程 (c)科学理解 (d)创造性思维