一键生成新分子?ChatGPT 热潮下的 AI 制药

  • 发表时间:
    , 文章来源:MyZaker, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    *(photo:MyZaker)

    图片来源 @视觉中国

    文 | 同写意,作者 | Daisy,编辑 | 于靖

    2 月 14 日,百度宣布完成对医疗信息化数据提供商 GBI 的并购,期望结合 " 文心一言 ",利用 AI 技术为医疗垂直行业助力,以实现 "AI+ 医疗大数据智能化全链条洞察 "。

    GBI 的服务客户不仅覆盖礼来、赛诺菲、辉瑞等跨国药企,也包括信达生物、复星医药、基石药业等创新药企业和药明康德等 CRO 企业。随着 GBI 的加入、" 文心一言 " 的发布在即,百度跨入制药行业并不是多么难以预料的事情。

    早在 2020 年,百度就成立百图生科,专攻 AI 制药。2022 年,百图生科透露,其将基于生物计算引擎 de novo 设计全新蛋白质药物。其实不只是百度,更多的科技公司对于这种结合表现出浓厚兴趣。

    如果说,过去几年是以 AlphaFold 为代表的产品挑动业界的情绪,那么当下,ChatGPT 似乎将 " 大行其道 "。2 月,随着 ChatGPT 在国内的热度走高,业界对 AI 制药产生了更多的遐想。

    ChatGPT 是一款基于 AI 技术驱动的自然语言处理工具,检索信息并综合处理的能力让人惊讶。比尔 · 盖茨称,ChatGPT 等模型在全球范围内开启了一种新形式的革命。Forbes 上的一篇文章也写道,ChatGPT 等先进的生成式 AI 工具将深刻变革医疗健康领域。

    我们走到 AI 制药的关键节点了吗?或许需要放置在更广泛的背景下讨论。

    虽然 AI 制药 " 热潮 " 在去年似乎有所退却,但纵观全球,该领域还是取得了许多里程碑进展。

    7 月,DeepMind 在官网公布,其与欧洲生物信息研究所(EMBL-EBI)合作,利用蛋白结构 AI 预测算法 AlphaFold 成功预测了来自 100 万个物种的约 2 亿种蛋白质结构,几乎涵盖了地球上所有已知的蛋白质。

    11 月,Meta(前身为 Facebook)的研究人员使用 AI 仅花了 2 周时间预测了来自细菌、病毒和其他尚未表征的微生物约 6 亿种蛋白质的结构。

    此外,Science 和 Nature Biotechnology 也分别报道了利用 AI 生产全新蛋白和预测蛋白结构的新技术。

    融资方面,虽增速放缓,但依旧吸引着大量资本的投入。

    根据智药局不完全统计,2022 年全年 AI+ 药物研发相关融资总事件达 144 起(2021 年是 73 起),总金额为 62.02 亿美元(2021 年总金额为 42 亿美元)。

    得益于 AI 制药的蓬勃发展,2022 年,众多 MNC 不断加码与 AI 企业的合作,以期利用 AI 技术为自身研究添砖加瓦。

    其中最大的订单来自赛诺菲与 Exscientia 的合作,潜在总额高达 53 亿美元。作为头部 AI 制药公司,Exscientia 此前已与拜耳、BMS、华东医药等多家跨国药企建立合作。此次与赛诺菲签约也成为 Exscientia 有史以来单笔最高的订单。

    此外,赛诺菲还与 Atomwise 建立了合作,将利用后者 AtomNet 平台进行计算发现和研究多达 5 个药物靶点。

    来自国内的 AI 制药公司英矽智能也官宣了与赛诺菲的合作。赛诺菲将利用英矽智能的 Pharma.AI 药物发现平台,推进基于不超过 6 个创新靶点的候选药物研发,总潜在价值达 12 亿美元。

    与赛诺菲同样大力布局 AI 赛道的还有礼来,在 TOP10 AI 合作中也占据了三席。

    *(photo:MyZaker)

    国内另一 AI 制药公司晶泰科技,也在去年与新加坡国家药物研发平台实验药物研发中心(EDDC)、 齐鲁制药、启德医药、正大天晴、青煜医药、联邦制药、华润医药研究院、杨森制药等达成或进一步扩大学术或商业合作,开发药物涉及新型 ADC、抗肿瘤小分子新药等。

    除了寻求合作之外,很多制药公司已经开始建立内部 AI 能力,GSK 在 2017 年成立了内部 AI 部门,成为 " 第一个吃螃蟹的人 ";2019 年,诺华宣布成立 AI 创新实验室,并选择微软作为其 AI 战略和数据科学合作伙伴;罗氏、拜耳等公司也都开始尝试。

    据市场研究机构 Research and Markets 发布的一份报告预测,全球医疗保健市场的 AI 规模预计将从 2020 年的 42 亿美元增长到 2025 年的 272 亿美元,年复合增长率为 45.3%。

    AI 与制药已有诸多交叉,而 ChatGPT 这类语言生成模型的巨大突破,让研究者开始探索能否在生物制药领域搭建类似的 AI 模型。生成式 AI 因其在靶点发现上的优异表现引起了业界的兴趣。

    生成式 AI 技术始于 2014 年,诞生于 Yoshua Bengio 与 Ian Goodfellow 发表的开创性论文 " 生成对抗网络(GAN)"。如今,生成式 AI 已被用于缩短各种用途的药物设计周期,减少了制药行业的药物研发成本和时间。

    从条件来说,生成式 AI 模型通常要在大型数据集上进行训练学习,并使用机器学习算法生成与训练数据相似的新内容。比较有代表性的生成式 AI 模型包括 DALL-E、DALL-E2、ProGen 以及 ChatGPT 等。该算法的突破也意味着 AI 开始走向了创造新内容的发展路径。

    那么,生成式 AI 能否为生物医药带来创造性变革?

    Gartner 分析师 Brian Burke 表示,制药公司正在使用生成式 AI 设计针对疾病的蛋白质模型的特性或功能。" 几乎所有大型制药公司和许多小型制药初创公司都在致力于生成式人工智能,它已经开发了几年。一些药物现在正在进行临床试验。这将是制药行业的重大转变。"

    早在 2019 年,研究人员发表在 ACS Central Science 上的一篇论文中就描述了如何使用 ChatGPT 识别新的抗菌药物。该研究表明,ChatGPT 在药物发现中的应用可以帮助药物研发人员更快速、高效地开发新的化合物。

    剑桥大学的研究人员已经利用 ChatGPT 确定了一个治疗阿尔茨海默病的新靶点;旧金山加利福尼亚大学的研究人员也通过 ChatGPT 分析电子健康记录,识别了现实环境中存在的潜在药物间相互作用关系。

    ChatGPT 之外,英矽智能刚于本月宣布其新冠小分子药物 ISM3312 正式获批进入临床,这是英矽智能第二款使用生成式 AI 设计的小分子药物。

    去年 12 月,Meta AI 利用其基于 2.5 亿条天然蛋白质序列的预训练语言模型,生成了 228 条蛋白质序列,其中 152 条序列能够进行可溶性表达,且蛋白序列的新颖性极佳。

    Salesforce Research 在 Nature Biotechnology 上发表的一篇文章也力证了生成式 AI 制药的可能性:通过 ProGen 模型进行蛋白质生成的工作,该模型生成的具备特定属性的蛋白序列多样性强,且生成的酶能够展现出与天然酶相似的活性。

    除了药物发现外,生成式 AI 在药物设计、剂量选择等药物开发环节中也为提高效率、完善治疗效果扮演着令人惊喜的角色。

    根据公开数据,去年生成式 AI 领域投资超过 13.7 亿美元。预计到 2040 年,生成式 AI 可能会为医疗健康行业带来 1 万亿美元的价值。

    在制药领域,生成式 AI 可能在某种程度上可以帮助发现靶点、生成分子,甚至产生一些之前未曾考虑过的新想法。业界也不仅仅满足于其在药物发现阶段的成功,但将其应用到其他环节还需要很多的研究和探索。

    以 ChatGPT 举例,一方面,它是基于大数据大模型,核对事实能力有限,更适合比较宽泛的逻辑梳理和信息归纳。然而,生物医药领域对生成算法的结果有更高、更具体的要求,需要更精确的产出(比如同时具有多个特定性质的小分子或者蛋白质片段),以 ChatGPT 目前的能力还无法胜任。

    另一方面,基础数据源无法得到保证。首当其冲的是准确性,ChatGPT 没有接受过整个生物医学数据库的培训,也没有经过生物医学专家的测试或培训,所以 AI 系统的响应未必正确。临床部分,虽然 ChatGPT 可以进行一些医学检查,但 AI 工具具体的应用范围以及在通过监管机构认可等方面还需要更多讨论。此外,全球能否公开真实数据也还要打个问号。更重要的是,人类对医学仍然知之甚少。

    晶泰科技联合创始人赖力鹏也曾表示,如何开源分享私有数据、防止滥用和数据偏见也都是类似生成式 AI 工具应用在生命科学领域中需要面对的问题。

    而对于大分子药物能否利用生成式 AI 迅速生成,这个问题也仍然无解。

    晶泰科技的一篇文章解释了一些原因:一是没有满足常规的以靶点为对象的药物设计理念,二是没有纳入对多种成药性目标(如免疫原性、理化性质)的考量。换句话说,上述技术可以一键生成接近 " 天然 "、可以正常折叠表达的蛋白,并使其符合某种宽泛要求(如具备溶菌酶活性),但还不足以成药。

    除了数据训练外,研发费用和时间精力也是不菲的一项投入,对于应用于医疗这一细分赛道众多且精细度高的领域更是如此。

    另外,去年底由 Facebook 母公司 Meta 的 Galactica 生成式系统引发了大家对版权、剽窃等原创性问题的讨论,也为这类模型的发展添上了一些不稳定因素。该模型使用学术论文作为数据集进行训练,然而该系统按要求生成的文章实际上完全虚假。Meta 几天后不得不撤回了这一系统。

    从长远来看,生成式 AI 仍然具备颠覆现有 AI 的能力,而要获得更加通用、好用的模型,还需要更多领域相关的数据积累和算法创新。同时,由于相关方向跨学科的性质,各专业的科学家需要通力合作,以期产生新的变革。

    说到底,AI 只是一个辅助工具,即使帮助我们提高了寻找到靶点的概率,但成药的困难依旧,创新药仍然是一条漫长的 " 打怪升级 " 之路。

    参考文献

    AI 制药迈入临床,人工智能只是开发药的工具之一需冷静对待;贤集网

    ChatGPT 是生物医药发展的新机遇?专家:暂不建议用于制药领域;生辉

    2022 年回顾:风投宠儿 AI+ 制药; 博勘医讯

    与默沙东、BMS 携手同行!这些 AI 生物技术公司有何长处?| AI 制药新风向;药明康德

    " 生物版 ChatGPT",才是医药圈最值得关注的黑科技!;晶泰科技

    2022 年 AI 制药投融资「图鉴」;医药魔方

    ChatGPT 能够颠覆医疗 AI 吗?;动脉网

    更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App