洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

2024-04-19 16:23:43     来源:

 

近日,天鹜科技创始人&首席科学家洪亮教授团队,在生物信息学和人工智能研究领域的国际权威学术期刊JCIM(Journal of Chemical Information and Modeling)上发表最新研究成果:“基于微环境感知图神经网络构建指导蛋白质定向进化的通用人工智能”(Protein Engineering with Lightweight Graph Denoising Neural Networks)。在此项研究中,该团队设计了一种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分布,用于指导蛋白质氨基酸位点设计,最终实现蛋白质指定功能的提升。

原文链接:https://pubs.acs.org/doi/10.1021/acs.jcim.4c00036

根据研究介绍,在生物化学实验的基础上,课题组证实了ProtLGN是一项通用的人工智能方法,在极少甚至没有实验数据的情况下,成功地实现了针对特定蛋白质性质的定向进化,包括提高抗体的亲和力和稳定性、增强多种荧光蛋白的荧光强度,以及提升核酸内切酶的DNA切割活性。这是全球首次也是唯一一次经湿实验验证,我们可以通过建立通用人工智能,在极少实验数据甚至无实验数据下实现不同蛋白特定性质的定向进化

人工智能的进步正在改变生命科学领域的研究方法和思维范式,尤其是在生物医药领域,而蛋白质设计作为该领域的关键技术之一,正受到人工智能技术的深刻影响。传统的蛋白质设计方法存在效率低下、成本高昂、时间耗费长等难以解决的问题,基于深度学习的预测和筛选在蛋白质设计中被逐步应用并验证。

但现有方法大多是基于多序列比对(MSA)或蛋白质语言模型(PLM)对蛋白质序列进行特征提取。前者高度依赖于同源序列的数量,但在实际应用中,并非所有蛋白质序列都能进行深度的同源比对;后者需要大量训练数据和复杂的模型设计,导致训练成本很高。即使是使用当前主流的自然语言预训练模型的思路,考虑到每个蛋白质都有独特的性质和进化方向,使用通用预训练模型处理独特蛋白质时,不经重新训练直接应用也会带来泛化性和表达能力的挑战。

洪亮团队设计的能够提取氨基酸周围微观环境信息的等变图神经网络的预训练框架ProtLGN,结合蛋白质的结构信息对蛋白质上的每个氨基酸进行同步编码,学习蛋白质三维结构中有益的氨基酸突变位点和突变类型,用于指导具有不同功能的蛋白质单位点突变和多位点突变设计

图1 ProtLGN框架示意图

LGN的零样本学习训练框架如上图所示。首先,输入蛋白质数据集中的每个序列被k临近邻居算法转换成一个蛋白质图,并基于氨基酸性质提取出节点特征、边特征、以及氨基酸的三维坐标信息。接着,对一部分的节点特征进行噪声扰动后输入到等变图神经网络中学习图上的节点表示。这一节点表示被全连接层解码后可以预测多个不同的目标,比如去噪的节点氨基酸类型标签,SASA和B-factor数值等。这里的预测误差用于构建损失函数并传导回网络层进行反向传导。在预测阶段,模型输出突变蛋白质的氨基酸概率,与野生型比对后,通过处理和计算得出突变体的评分。

为了验证ProtLGN对蛋白质突变体活性的预测效果,作者在不同蛋白质的多种生理功能性质上进行了充分验证,确保ProtLGN预测效果的通用性,包括VHH抗体、荧光蛋白(绿色、蓝色、橙色)、核酸内切酶(KmAgo)等多种蛋白的热稳定性、结合能力、荧光强度、单链DNA剪切活性等蛋白质工程常规关注和改造的多种关键功能指标。

图2 荧光蛋白发光强度(FP),VHH抗体结合强度与热稳定性,以及中温核酸剪切酶(KmAgo)剪切活性的多点位突变结果

湿实验结果表明,ProtLGN可以在没有湿实验数据或仅少量类似功能蛋白质的实验数据基础上达到40%的单点位改造成功率,并且在部分单位点上实现了多种功能协同提升。

上述结果表明ProtLGN能够极大改善传统蛋白质工程方法中成本高、成功率低、数据稀缺等问题。更为重要的是,本文首次使用深度学习模型在学习单位点突变体活性数据后,准确预测组合位点的活性,并且在单轮湿实验中即可筛选出功能显著优于低位点突变体的高位点突变体,表明ProtLGN能够有效挖掘蛋白质定向进化中的正上位效应,为蛋白质的深度进化提供一条有效途径。

ProtLGN作为一种新型的蛋白质设计方法,为生物学家和药物研发人员提供了一个强大且可靠的计算工具。ProtLGN不仅能够深入解析蛋白质的结构与功能的复杂关系,而且能够突破传统蛋白质设计方法遇到的瓶颈,为基于蛋白质的医药研究、生物技术开发等提供了全新并且有效的解决方案。

自然科学研究院/上海国家应用数学中心(上海交通大学分中心)助理研究员周冰心博士,密歇根大学神经科学研究所/细胞与发育生物学研究所博士后郑力荣博士,生命科学技术学院博士研究生吴邦昊,上海人工智能实验室/华东理工大学信息科学与工程学院硕士研究生谭扬为共同第一作者。自然科学研究院/物理与天文学院/张江高等研究院洪亮教授为通讯作者。

该工作得到了国家自然科学基金委、上海市科委、教委、上海人工智能国家实验室和张江高等研究院的支持。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

正力新能发布170kWh产品,纯电MPV超长续航超1000公里
狮桥集团ABS发行利率首次进入“2%”时代,再创资本市场利率新低
Create 2024百度AI开发者大会:轻舸、扬楫公开课带你驾驭AI时代营销浪潮
美丽中国的“智慧之眼”
5月18日!2024西湖论剑·数字安全大会正式定档
学魁图书代理大会新疆站:学魁榜创始人邱崇、史家昕与合作伙伴热切交流!
知名酷跑手游《忍者必须死3》搭载硬核游戏安全方案ACE!
融合自然灵感与创新科技 Galaxy S24系列诠释三星Design5.0
OpenStack公布重大安全漏洞,这个超隐秘组件你关闭了吗?
凯迪仕连续八年入选“房建供应链首选供应商”,18%品牌首选指数稳居智能门锁类第一
钉钉会议DR-SwWPE算法登上国际顶会ICASSP2024
钉钉发布Agoal,用AI助力企业实现管理数智化
八维学院到底好在哪里?优势在何
特斯联以领域大模型助力华南师大附中打造“零碳校园”
覆盖教育全场景全链路丨华为擎云携智慧教育方案亮相83届教装展
聚力赋能!云快充助力广大桩企降本增效
maono闪克闪耀HKTDC与NAB,以卓越技术赢得国际认可
与上野千鹤子畅聊女性主义,今日头条“以书之名”聚焦不同视角下的文学之路
创领行业安全新标杆!山东临沂兰山区城发集团与雅迪签署充电桩战略合作协议!
百度文库「一站式AI内容创作平台」再上新!重磅发布「跨模态AI漫画及画本生产能力」
ThinkBook 16p AI元启版震撼发布,重塑创作青年高效办公极致体验
威创三大看点闪耀北京InfoComm China 2024
春渐远 夏将至 用墨迹天气看降雨预报实现有备出行
宇谷科技发布端侧通用智能锂电池大模型,化解锂电池应用技术难题
首份中国AIGC应用全景图谱发布 新壹科技落地应用抢眼
揭秘德源药业吡格列酮二甲双胍片(复瑞彤®)研发背后的故事
把握春天的最后一次回眸,墨迹天气紧扣天气变化服务生产与生活
春日经济升温 WiFi万能钥匙助力用户春游网络连接
迎合自动驾驶技术潮流,u-blox赢得重要自动驾驶新项目
第一期公益软件培训班落幕,金山办公为百名藏籍学生普及信创软件技能