一种新的计算模型可以更准确地预测抗体结构

王浩然 • 2025年1月3日下午3:00 • AI前沿 • 89 views

利用该模型，研究人员或许能够识别出可针对多种传染病的抗体药物。

通过采用被称为大型语言模型的人工智能模型，研究人员在根据蛋白质序列预测其结构方面取得了巨大进步。然而，这种方法对抗体并不那么成功，部分原因是这种类型的蛋白质具有高度变异性。

为了克服这一限制，麻省理工学院的研究人员开发了一种计算技术，使大型语言模型能够更准确地预测抗体结构。他们的工作可以让研究人员筛选数百万种可能的抗体，以找出可用于治疗 SARS-CoV-2 和其他传染病的抗体。

“我们的方法可以让我们扩大规模，而其他人则不能，以至于我们实际上可以在大海捞针，”西蒙斯数学教授、麻省理工学院计算机科学与人工智能实验室 (CSAIL) 计算与生物学小组负责人、新研究的资深作者之一邦妮·伯杰 (Bonnie Berger) 说。“如果我们可以帮助阻止制药公司使用错误的药物进行临床试验，那么这真的可以节省很多钱。”

该技术专注于模拟抗体的高变区，也有可能分析个体的整个抗体库。这可能有助于研究对艾滋病毒等疾病有超级反应的人的免疫反应，以帮助弄清楚为什么他们的抗体能如此有效地抵御病毒。

麻省理工学院生物工程副教授、麻省总医院、麻省理工学院和哈佛大学拉根研究所成员 Bryan Bryson 也是该论文的资深作者，该论文本周发表在《美国国家科学院院刊》上。前 CSAIL 研究科学家、现任杜克大学生物统计学和生物信息学及细胞生物学助理教授的 Rohit Singh 和 Chiho Im ‘22 是该论文的主要作者。赛诺菲和苏黎世联邦理工学院的研究人员也参与了这项研究。

建模高变异性

蛋白质由长链氨基酸组成，这些氨基酸可以折叠成大量可能的结构。近年来，使用 AlphaFold 等人工智能程序，预测这些结构变得容易得多。许多这样的程序，如 ESMFold 和 OmegaFold，都是基于大型语言模型，这些模型最初是为分析大量文本而开发的，使它们能够学会预测序列中的下一个单词。同样的方法也可以用于蛋白质序列——通过了解哪些蛋白质结构最有可能由不同的氨基酸模式形成。

然而，这种技术并不总是适用于抗体，尤其是抗体中被称为高变区的片段。抗体通常具有 Y 形结构，这些高变区位于 Y 的尖端，它们在那里检测并结合外来蛋白质（也称为抗原）。Y 的底部提供结构支撑并帮助抗体与免疫细胞相互作用。

高变区的长度各不相同，但通常包含少于 40 个氨基酸。据估计，人类免疫系统可以通过改变这些氨基酸的序列产生多达 1 千万亿种不同的抗体，有助于确保身体能够对大量潜在抗原作出反应。这些序列不像其他蛋白质序列那样受到进化的限制，因此大型语言模型很难学会准确预测它们的结构。

“语言模型能够很好地预测蛋白质结构的原因之一是，进化限制了这些序列，而模型可以解读这些限制的含义，”辛格说。“这类似于通过查看句子中单词的上下文来学习语法规则，让你弄清楚它的含义。”

为了对这些高变区域进行建模，研究人员创建了两个基于现有蛋白质语言模型的模块。其中一个模块使用蛋白质数据库 (PDB) 中发现的约 3,000 个抗体结构的高变序列进行训练，使其能够了解哪些序列倾向于产生相似的结构。另一个模块使用将约 3,700 个抗体序列与它们结合三种不同抗原的强度相关联的数据进行训练。

由此产生的计算模型称为 AbMap，可以根据抗体的氨基酸序列预测抗体的结构和结合强度。为了证明该模型的实用性，研究人员用它来预测能够强烈中和 SARS-CoV-2 病毒刺突蛋白的抗体结构。

研究人员从一组预测会与该靶标结合的抗体开始，然后通过改变高变区生成数百万个变体。他们的模型能够识别最成功的抗体结构，比基于大型语言模型的传统蛋白质结构模型准确得多。

然后，研究人员采取了额外的步骤，将抗体聚类成具有相似结构的组。他们与赛诺菲的研究人员合作，从每个簇中选择抗体进行实验测试。这些实验发现，82% 的抗体比模型中原始抗体的结合强度更高。

研究人员表示，在开发过程的早期识别出各种优秀的候选药物可以帮助制药公司避免花费大量资金测试最终失败的候选药物。

“他们不想把鸡蛋都放在一个篮子里，”辛格说。“他们不想说，我要用这种抗体进行临床前试验，然后发现它是有毒的。他们宁愿有一系列好的可能性，并将它们全部进行试验，这样如果其中一个出了问题，他们还有一些选择。”

比较抗体

利用这项技术，研究人员还可以尝试解答一些长期存在的问题，即为什么不同的人对感染的反应不同。例如，为什么有些人会发展成更严重的新冠肺炎，为什么有些人接触艾滋病毒后从未被感染？

科学家们一直在尝试通过对个体免疫细胞进行单细胞 RNA 测序并进行比较来回答这些问题——这一过程称为抗体库分析。之前的研究表明，来自两个不同人的抗体库可能只有 10% 的重叠。然而，测序并不能像结构信息那样全面地反映抗体的性能，因为具有不同序列的两种抗体可能具有相似的结构和功能。

新模型可以帮助解决这一问题，快速生成个体中发现的所有抗体的结构。在这项研究中，研究人员表明，当考虑结构时，个体之间的重叠比序列比较中看到的 10% 要多得多。他们现在计划进一步研究这些结构如何有助于人体对特定病原体的整体免疫反应。

“语言模型非常适合这个领域，因为它具有基于序列的分析的可扩展性，但接近基于结构的分析的准确性，”辛格说。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/yi-zhong-xin-de-ji-suan-mo-xing-ke-yi-geng-zhun-que-di-yu

CSAIL 人工智能实验室大型语言模型美国国家科学院院刊计算模型预测抗体结构

Like (0)

王浩然作者

0 0

人形机器人为中国汽车制造商制造汽车

Previous 2025年1月3日

需要研究假设吗？问问人工智能。

Next 2025年1月3日

AI前沿

为何各国以主权人工智能的名义竞相建立人工智能工厂

如今，人工智能已成为一项至关重要的技术，世界也陷入了激烈的地缘政治斗争，“主权人工智能”成为国家问题也就不足为奇了。想想看，美国会允许其为人工智能生成的数据在中国存储和处理吗？欧盟…

王浩然
2024年10月2日
000
AI前沿

DeepMind 的 Genie 2 可以生成类似视频游戏的交互式世界

谷歌的人工智能研究机构 DeepMind 推出了一个可以生成“无限”可玩 3D 世界的模型。该模型名为 Genie 2，是今年早些时候发布的 DeepMind Genie 的继任…

王浩然
2024年12月5日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

OpenAI已开始组建其机器人团队

OpenAI 以其人工智能模型而闻名，迄今为止，这些模型主要存在于云服务器、其网站以及适用于 PC 和移动设备的应用程序中。不过，该公司的雄心并不局限于软件领域：今天在 X 上，…

王浩然
2025年1月11日
000
AI前沿

“不受限制”的人工智能集团 Nous Research 推出首个聊天机器人

Nous Research是一家致力于创建“个性化、不受限制”的人工智能模型的人工智能研究机构，旨在替代 OpenAI、Anthropic、Google、Meta 等较为保守的企业…

王浩然
2024年11月9日
000
AI前沿

Meta 的 AI 负责人表示，世界模型是实现“人类水平的 AI”的关键，但可能还需要 10 年时间

当今的人工智能模型真的能像人脑一样记忆、思考、规划和推理吗？一些人工智能实验室会让你相信它们是的，但根据 Meta 首席人工智能科学家 Yann LeCun 的说法，答案是否定的。…

点点
2024年10月19日
000
AI前沿

科技领袖对 DeepSeek 的快速崛起做出回应

如果你还没听说过，那么现在城里出现了一颗新的人工智能明星：DeepSeek，香港量化分析公司 High-Flyer Capital Management 的子公司，本周早些时候发布…

王浩然
2025年1月25日
000
AI前沿

OpenAI 似乎准备以每月 200 美元的价格推出 ChatGPT Pro 订阅计划

OpenAI 似乎正在为其标志性聊天机器人产品 ChatGPT 推出新的订阅层服务。第三方 AI 工程师 Tibor Blaho 在 X上发布的截图显示，新的服务级别 ChatG…

王浩然
2024年12月6日
000
AI前沿

利用人工智能进行漏洞评估

根据Cybersecurity Ventures 2023 年的一份报告，到 2025 年，网络犯罪估计每年将给世界造成 10.5 万亿美元的损失。每年记录在案的网络犯罪数量都…

点点
2024年10月7日
000
AI前沿

OpenAI 正在资助“人工智能道德”研究

OpenAI 正在资助能够预测人类道德判断的算法的学术研究。在提交给美国国税局的文件中，OpenAI 的非盈利组织 OpenAI Inc. 披露，它向杜克大学的研究人员提供了一项…

王浩然
2024年11月30日
000
AI前沿

英国获得63亿英镑数据基础设施投资

美国四大公司宣布计划向英国数据基础设施投资总计 63 亿英镑。英国科技大臣彼得·凯尔在国际投资峰会上宣布了这一消息，称这是对英国与企业合作推动增长的方式的“信任投票”…

点点
2024年10月15日
000
AI前沿

Meta在Instagram上测试AI生成评论

在社交媒体巨头Meta的不断探索中，人工智能（AI）的应用正逐渐渗透到其各个产品之中。近日，有消息称Meta正在其旗下热门图片和视频分享平台Instagram上测试AI生成的评论功…

王浩然
2025年3月25日
000
AI前沿

以下是 2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据数据，人工智能公司在第三季度筹集了 189 亿美元。这一…

王浩然
2024年10月12日
000
AI前沿

欧盟人工智能法案：早期准备可使企业获得竞争优势

《欧盟人工智能法案》预计将于 2026 年 8 月全面生效，但一些条款的生效时间甚至会更早。该立法为人工智能系统建立了首个监管框架，采用基于风险的方法，根据人工智能应用对安全、人…

点点
2024年10月24日
000
AI前沿

Salesforce 发现，93% 的 IT 领导者看到了 AI 代理的价值，但难以实现

每个人都在谈论人工智能代理。但到目前为止，很多都还只是说说而已。 Salesforce 表示，这种情况将在 2025 年发生改变——人工智能代理终于成为现实。根据其集成…

王浩然
2025年2月4日
000
AI前沿

微软的 AI 生态系统如何胜过 Salesforce 和 AWS

人工智能代理是一种自主系统，旨在执行通常需要人类参与的任务。通过使用高级算法，这些代理可以处理各种功能，从回答客户查询到预测业务趋势。这种自动化不仅简化了重复流程，还使人类工作者能…

王浩然
2024年12月26日
000
AI前沿

Sensei 再获 1600 万美元融资，Contactles 商店将在欧洲扩张

虽然 Amazon Go 率先开创了完全无接触式商店的概念，但 7-Eleven 和沃尔玛等其他公司也已进入该领域。而且该领域正在不断壮大，部分原因是 Standard Cogni…

王浩然
2024年10月23日
000
AI前沿

一种新的时间一致稳定扩散视频特征系统

阿里巴巴集团的一项新举措提供了我所见过的最佳方法之一，即通过基于稳定扩散的基础模型生成全身人体化身。该系统名为MIMO（MIM icking with O bject Inter…

点点
2024年9月27日
000
AI前沿

大型语言模型中的灾难性过度训练：研究人员的警告

在人工智能领域，大型语言模型（LLM）正逐渐成为研究和应用的核心。然而，随着这些模型规模的不断扩大和能力的不断增强，一个潜在的问题也逐渐浮出水面——灾难性过度训练。近日，研究人员纷…

王浩然
2025年3月31日
000
AI前沿

开源开发者：以智慧与决心对抗AI爬虫

在数字世界的广袤疆域中，一场无声的战役正在悄然上演。这场战役的主角是开源开发者，他们正以前所未有的智慧和决心，对抗着日益猖獗的AI爬虫。这些爬虫，利用人工智能技术，无孔不入地搜集着…

王浩然
2025年3月28日
000

发表回复

Please Login to Comment

一种新的计算模型可以更准确地预测抗体结构

相关推荐

发表回复

Share To :