关闭广告

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技1745人阅读

有了 AI,科学研究是否有一天可以摆脱对湿实验的高度依赖,通过在计算机中构建“虚拟细胞”,来模拟和理解新药可能产生的生物效应?如今,这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 VCWorld,构建了如同“生物世界模拟器”的虚拟细胞模型,为新药效果预测开辟了全新的计算路径。


图 | 郑双佳(来源:郑双佳)

他告诉 DeepTech:“其核心技术在于,我们基于 AI 科学家系统,发展了一种大语言模型与知识图谱混合增强的预测方式。我们构建了一个知识图谱,将人类已知的知识,如药物与靶点的关系、靶点与疾病的关系等,以显式、结构化的方式建模起来。”


(来源:https://arxiv.org/abs/2512.00306)

VCWorld:像侦探一样推理的白盒模型

VCWorld 的突破在于,它不是一个只会猜测的黑盒子,而是一个能像生物学家一样推理的白盒模型。它把 AI 变成了一个细胞侦探,既可以给出答案,还可以给你查看它的破案笔记。

VCWorld 的核心思想非常巧妙:

首先是构建一个生物知识宇宙,整合多个权威的生物数据库,把药物、基因、蛋白质、信号通路之间的关系,像地图一样连接起来,形成一个巨大的生物知识图谱;

其次,使用语言模型来理解知识,让一个大语言模型来读懂生物知识图谱中的复杂关系,并使用人类可以理解的语言描述出来;

最后,像侦探一样检索和推理,当被问到药物 A 对于基因 B 有什么影响的时候,VCWorld 不是去直接猜测,而是在知识图谱里查找药物 A 的作用机制和基因 B 的功能,以及去历史档案也就是训练数据里寻找最相似的案例比如作用机制相似的药物 C 是如何影响基因B的,然后像撰写推理报告一样,一步一步分析这些线索,综合得出一个结论并解释为什么。

在论文里,郑双佳等人举了一个例子:预测抗癌药物 Larotrectinib 对于增殖标记基因 MKI67 的影响。MKI67 基因产生的蛋白叫做 Ki-67,是细胞正在活跃分裂的指示灯。如果一种药物能够抑制癌细胞分裂,那么 Ki-67 的水平通常会下降。


(来源:https://arxiv.org/abs/2512.00306)

虽然之前没有直接实验证明 Larotrectinib 会影响 MKI67,但 VCWorld 是的推理是这样的:

第一步,寻找相似药物,借此发现 Larotrectinib 是一种激酶抑制剂。在历史案例中,作用机制相似的药物 Afatinib(另一种激酶抑制剂)被证明能够降低 MKI67 的表达;

第二步,寻找共同模式,其他一些能够引起 DNA 损伤或者细胞应激的药物,也会改变 MKI67 的水平。这说明,凡是干扰细胞生长和分裂过程的扰动,都有可能影响这个指示灯;

第三步,得出结论也就是 Larotrectinib 很可能通过抑制肿瘤细胞的增殖信号通路导致 MKI67 的表达出现下降。

这个预测与后来查到的真实实验结果完全一致。此前有文献记载称,使用 Larotrectinib 治疗之后,Ki-67 阳性的增殖细胞确实显著减少了,这证明 VCWorld 的推理不仅准确,而且有着坚实的生物学逻辑。

郑双佳表示:“我们的整个预测过程逻辑链路非常明确。模型能够解释为什么我认为这个药物会在这个细胞系上引起这个基因的差异化表达,并提供一套可追溯的知识推理链条。这就将传统的、黑箱式的虚拟细胞预测,变成了一个白箱式的、引入了因果推理引擎的过程。”


(来源:https://arxiv.org/abs/2512.00306)

什么是虚拟细胞?

细胞是我们身体里最小的生命单位,就像一个超级迷你的工厂,里面有无数的机器也就是蛋白质在不停地工作。科学家们一直想弄明白的是:如果给细胞喂一种新药,会有什么反应?哪些基因会被激活?哪些会被抑制?这对于治疗疾病和研发新药至关重要。

传统方法是在实验室里培养真实的细胞,加入药物之后再使用昂贵的仪器来检测变化。这个过程不仅耗时和耗钱,而且每次只能测试有限的药物。于是,虚拟细胞的概念诞生了:能不能在电脑里建设一个细胞的数字模型,让 AI 来预测药物的效果?

其实,已经有不少 AI 模型尝试过这个任务。但是这些模型非常挑食,它们需要海量的高质量数据来训练,如果遇到一种全新的、训练数据里没有出现的药物,就有可能预测不准。而且,这些模型依旧存在黑盒问题。而 VCWorld 则解决了这些问题。

郑双佳表示:“虚拟细胞这个概念其实已有二三十年的历史。近年再次兴起,有几个重要原因:单细胞多组学测序技术在前几年取得了重大突破,无论是蛋白质组学还是其他组学,高通量检测设备的水平提高、成本下降、精度提升,使得多组学数据大量积累。有了海量数据,人们自然会想到能否用这些数据构建类似 ChatGPT 的模型,去理解细胞尺度的语言,而不仅仅是 DNA、RNA 序列层面的语言。”

他继续说道,目前的虚拟细胞模型更像一个疾病解码器或基于表型的建模工具。但基于表型建模的最大问题是难以逆向设计药物:假设知道药物A会产生某种扰动信号,但很难根据想要的信号反向设计出分子 A。这是基于表型的药物发现的一个固有弊端。

因此,他和团队正在尝试向药物设计方向进行反向推理。例如,基于某种特定的、非药物手段(如敲低某个基因)或疾病状态产生的扰动信号,基于所期望逆转的细胞状态,能否根据这个期望的响应,反向设计出一个能实现该扰动的分子?“这是我们正在努力探索的方向。”他表示。

参考资料:

相关论文

https://arxiv.org/abs/2512.00306

排版:KIK

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五一档票房超7亿,《给阿嬷的情书》开分9.0

澎湃新闻 浏览 442

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 2552

千人冒雪送“棋圣”,韩国“围棋皇帝”曹薰铉专程道别:盼未来与聂老天堂对弈

国是直通车 浏览 1724

乌克兰:大量哥伦比亚人参与对俄作战

每日经济新闻 浏览 2276

官方:利物浦与19岁前锋基兰-莫里森续约

懂球帝 浏览 9

柬泰签署停火联合声明 中方回应

北京日报 浏览 1911

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

Yuki女人故事 浏览 1541

AI越来越强,程序员和软件产业就要消失了?

诗与星空 浏览 655

“双11”本地之战 | 紧邻美团,京东折扣超市北京首店将落地门头沟 为何大厂偏爱五环外

北京商报 浏览 2269

红军城陷落在即 俄军或迎巴赫穆特后最大胜利

北京日报客户端 浏览 2362

光线传媒:前三季度净利润同比增长407%

网易财经 浏览 2347

达成停火22天内 仅有商定数量24%的卡车进入加沙

上观新闻 浏览 2200

5部电影亏了8亿,古天乐不甘心,又带来三部生猛大片

娱乐圈笔娱君 浏览 1803

王学圻出山,易烊千玺入局,郑保瑞这部统一台湾的大片要火了

娱乐圈笔娱君 浏览 2436

稳了,“毁容式”出演县长的胡歌,已经走上了演员的“上坡路”

娱乐圈笔娱君 浏览 1593

活塞112-105复仇绿军迎4连胜,坎宁安32+10,布朗空砍34分

懂球帝 浏览 1955

哈登:我以前从未如此不顺但我仍充满信心,这是对我们的考验

懂球帝 浏览 2099

苹果公司总市值首次升破4万亿美元

证券时报 浏览 2013

女佣自杀,最贵凶宅诞生!许家印好牌友要吐血

说财猫 浏览 2734

Melody对“难搞的客人”做澄清:不记得发生过,请不要刻意抹黑

素素娱乐 浏览 1563

继女子吃辣条中一根金条后 又有人吃泡面中1克黄金

上观新闻 浏览 5559
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1