机器化学者诞生记:我国科研团队历时8年打造“最强大脑”
在中国科学技术大学的机械化学者实验室里,可以看到——具科技感的“敦实”,动作敏捷的机器人穿梭于操作台之间,伸出机器人的手臂调制试剂的场景。 在实验室的另一边,年轻的科研人员输入指令,对机器人进行“隔离”控制。 在大部分的情况下,这个机器人就像是一个自主思考实验步骤和方案,不知疲倦的“小化学家”。
这是中国科学技术大学化学物理学系教授江俊团队的“作品”,该团队通过阅读全球文献,自主设计实验,开发出涵盖材料开发全流程的机械化学者平台,在数亿种可能的组合中找到最优解,加速材料开发。 “实验数据经过处理后,输入平台自主的计算大脑,生成理想的人工智能模型,有助于科研人员优化实验方案。 ”江俊说。
江俊团队有近30名成员,其中大多是90后、95后。 10月上旬,团队又增加了科研进展——,通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,他们开发了数据智能驱动的全流程机械化学者。
该研究成果论文在最新一期《国家科学评论》学术杂志上发表。 国际审阅者评价说,这一成果“机器人系统、工作站、智能化学大脑都是最先进的”“对化学科学产生了巨大的影响”。 业内专家认为,机械化学者的研究工作摆脱了传统的试错研究范式的限制,显示出“最强化大脑”指导的智能新范式的巨大优势,将推动化学研究朝着知识理解数字化、操作指令化、模板化的未来趋势前进。
那么,进行化学实验的“聪明”机器人是如何诞生的,其背后凝聚着年轻人怎样的努力和心血呢? 中青报中青网记者进行了采访。
"建立中国人自己的材料数据库. "
随着化学研究对象的日益复杂和高维化,传统研究范式成本高、周期跨度长的问题日益突出。 近年来,科技界逐渐认识到数据对学术研究和产业创新发展的重要意义,大数据科学与人工智能技术相结合的手段也在先进材料研发方面崭露头角。
团队核心成员肖恒宇出生于1995年,他本科就读于中国科技大学少年班学院,出于兴趣自学了人工智能。 有一次,他写的智能程序有问题,于是向时任班主任的江俊请教。 江俊指出:“算法没有问题,但算法所依赖的实验数据过于片面。”
江俊发现,一段时间以来,中国科研团队将科研数据写成英文论文,并在国外期刊发表,但在引用数据之前,必须额外花钱购买。“建立中国人自己的材料数据库”成了江俊的梦想。 在他的影响下,肖恒宇等人一起踏上了实现这个梦想的道路。
肖恒宇的同学霍姚远、冯超学习数学和化学,喜欢研究数据。 从2014年开始,3人收集数据,挖掘文献,寻找框架,江俊提供原理指导和研究资源。 2016年,他们搭建了第一代材料数据检索平台,但反馈使用不太理想,有老师抱怨“数据不准确”。
肖恒宇等人注意到,数据不仅多,而且质量好。 他们的数据库缺少最重要的一环——知识图,这导致数据质量恶化,无法进行有效的检索。
制作知识地图并不容易。 学生们必须用专业知识区分数据的关联性,在图像上打上识别标签,让计算机知道每个数据背后的物理意义。
团队成员张百成博士说,最初几个同学都是靠自己“贴标签”,几个星期没日没夜地贴标签。 大家读了文献后脑子一片混乱,但只完成了任务量的1%,记得几近绝望。
为此,江俊找到了中国科大校董会,开展了有奖阅读文献比赛,与更多专业背景的大学生合作参与。 由此,他们首次生成了高质量的标记数据。
“人捡柴火焰高,在大数据时代,必须融合知识、整合资源。 ”张百成表示,通过利用这些数据训练智能算法,他们实现了第一代化学命名实体识别程序,在后续的标记工作中,可以先让计算机自动识别,然后进行人工检测,大大提高了效率。
最终,他们擦亮了我国第一代材料科学知识图谱。 2021年,团队通过图像赋予机器人“小”的科学思考,团队的自然语言处理技术也随之“鸟枪换炮”,机器自动读取和识别的精度提高到了90%。
“将数据转化为实际生产力”
2016年,肖恒宇参加互联网+创新创业大赛,获得安徽省冠军、全国银奖。 投资机构将为他和团队提供第一笔创业资金。 公司成立后,团队三次重复知识图谱,建立了包含9000万个化合物、1100万条化学反应途径的大规模材料数据库。 小组借此帮助一些科研机构解决了技术难题。
例如,一家航天企业发现需要改进发动机内置配件的材料,尝试了很多方案也没能实现。 肖恒宇等人利用数据平台模拟燃烧流场、大涡流场,找到了记忆金属设计配方。 这为该公司节省了4300多万元成本。
肖恒宇团队还迎来了意外之喜——,他们在为这家企业解决问题的过程中,收集了10万种合金演化结构数据和金属原子间相互作用能数据,这些反过来丰富和完善了他们现有的数据库平台体系。“在以往的研究中,有人习惯于按照自己希望的方向调整数值,但研究需要数据的多样性,必须记录有偏见和误差的数据。 ”江俊表示,数据是科研和产业的通用语言,数据库平台是连接科研和产业的桥梁,相信必须产生更高标准的数据来反哺科研,把数据转化为实际生产力。
目前,该团队还建立了材料基因创新研究平台,建设了亚洲最大的材料数据库平台——架大型材料库。
江俊表示,机械化学者平台具有更强的化学智能和广泛的新材料开发能力,涵盖光催化和电催化材料、发光分子、光学薄膜材料等领域,适用范围随着平台的升级和扩大将继续扩大。
“决不腐朽,决不应对交往”
在每周的小组会议上,江俊只需向机器人提出希望其解决的问题,学生们就会自己讨论实施方案。 如果设备没有基本驱动程序,学生们会智能升级。 后来,在会上,江俊只能坐在一边听,甚至不敢说话。
幸运的是,几个有交叉学科背景的年轻博士正在成长为团队的“主心骨”。 肖恒宇设计软件框架。 张百成编写程序,让机器人阅读论文,提出科学假设,形成实验报告和方案; 赵路远先生主导电化学测试,负责干燥设备、光谱仪等硬件的驱动程序开发。
25岁的赵路来自电子科技。 在她看来,克服科研难题主要靠耐心。 她和师徒曹嘉祺一起写某驱动程序时,因为对信息掌握不够,不能准确理解呼叫界面,“我们反复联系了机器制造商和代理商,但是没有回应。 我们决定自力更生。 ”
在三周的时间里,两人像两个机器人一样,除了吃饭睡觉以外,还反复发送信号、等待反馈、记录响应等尝试3000次,一点点反向尝试基础控制逻辑,成功实现了机器人的远程控制。
“此时,设备代理商正积极地找到我们,打算购买我们的驱动器。 我们感到非常自豪。 ”赵路远说。
2021年,团队满怀信心开始了机器人的首次试运行,不料化学设备单独正常运行,但在参与系统调试时无法使用。 大家查到半夜还没有线索。
就在这时,肖恒宇突然意识到化学设备和机械臂使用了红外检测设备,可能会相互干扰。 于是,他转向机械臂,很容易就解决了问题。
“在今后的开发调试中,不同领域的仪器设备、不同系统的代码协议之间出现了类似的‘磨合’难题,但我们通过交叉学科的思考,将它们一一击破。 ”肖恒宇说。
“即使一个方案受挫,大家也不会腐烂,不会应对交叉,而是反复测试,调查哪个环节出了问题。 ”肖恒宇说,科研伙伴有相似的特质——对流程和技术的执着。 执行任务时,团队成员总是比自己想得多一点,不仅想出方案,还想备选方案和一些发泄选项。在他看来,从测试开发,到迭代改进、升级,一个实验分支由一个全部负责,每个人都在成长为“全能人才”。 肖恒宇说,当全身心地投入科研时,所有知识都有用处。 他一直在自学3D动画。 项目组拍摄科普电影时,他把摄像头和脚本分开写。
肖恒宇在宁夏回族自治区海原县一中支教。 他利用闲置的传感器等仪器,建造了两个小实验室,带着学生学习化学、物理和信息,激发孩子们的科学兴趣。 他一直有一个梦想,希望有更多的年轻人合作开发更高水平、更具科研智慧的实验平台,让中国智能化学闪耀世界。
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~