本文内容速览:
AlphaFold的相关背景
总结AlphaFold实现精准预测的原因,主要有以下几点:(一)深度学习。AlphaFold使用人工神经网络直接学习序列和结构之间的复杂关系,而传统的工具多依赖于物理模型或简单的机器学习。(二)多序列比对(MSA)。有些传统工具虽然也能利用MSA提取氨基酸的保守信息,从而帮助预测蛋白质局部的二级结构,但这难以推测远距离残基之间的相互作用,而AlphaFold可以深度学习MSA并获得氨基酸序列之间的协同变化(即一个位置的变化会导致另一个位置的变化)。(三)迭代优化。传统工具在完成蛋白结构的初步预测后,对结构的优化通常是局部且单次的。AlphaFold可以反复利用上一次的结构,进一步的微调氨基酸的残基接触以及角度等。正是由于这种迭代,可以让预测出来的蛋白结构更接近真实自然的状态。(四)端到端的预测架构。简单来说就是AlphaFold采用了一种从序列输入到预测结构输出的整体架构,这样可以减少多个独立步骤组合导致的误差积累。除了以上几点主要原因之外,AlphaFold实现精准预测也离不开基于大量已有的蛋白数据的模型训练。此外,DeepMind对AlphaFold的持续优化和更新也是其预测能力不断提高的重要因素,截至目前AlphaFold已经更新到了第三代。AlphaFold 3在前几代的基础上不仅进一步提高了预测的精准度,而且还能够实现蛋白与其他物质,如小分子、蛋白、核酸等的相互作用。
AlphaFold在实际研究中的应用
前文提到,目前AlphaFold已经发展到第三代,但由于AlphaFold 3是在今年五月刚刚发布,植物领域的相关研究还较为稀缺。不过,AlphaFold 2的升级版——AlphaFold-Multimer(专用于预测蛋白质间的相互作用)已有不少实际应用,后续小远将为大家介绍相关文献案例。在此之前,先来分享一下AlphaFold 3在Nature上的问世之作。
2024年5月8日,DeepMind公司在Nature杂志上发表了一篇题为“Accurate structure prediction of biomolecular interactions with AlphaFold 3”的研究论文,该研究介绍了AlphaFold系列工具的最新版本AlphaFold 3。该研究称,在前代工具的基础上,AlphaFold 3进一步提升了预测精度(图1G、H),此外还能够联合预测包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物的结构。
图1 AlphaFold 3的应用场景及预测准确度(Josh et al., 2024)。(A)人类40S小核糖体亚基(紫色)翻译起始因子eIF1A和eIF5B形成复合物(蓝色);(B)EXTL3同型二聚体的糖基化球状部分;(C)间皮素C末端与单克隆抗体15B6结合(绿色为预测的抗体);(D)抑制剂LGK974与PORCN结合并与WNT3A肽形成复合物;(E)(5S,6S)-O7-磺基DADH与AziU3/U2复合物结合;(F)NIH-12848类似物与PI5P4Kγ的变构位点结合;(A-F)灰色的部分表示实际的结构,彩色部分为预测的结构;(G)AlphaFold 3在蛋白质-小分子配体结构预测、蛋白质-核酸复合物结构预测、共价修饰以及蛋白与蛋白复合物预测方面的预测效果;(H)AlphaFold 3各种类型预测的准确度评估,数值ipTM和pLDDT数值越高表示准确度越高。
由于AlphaFold 3强大的功能,已经有相关研究使用了该工具。2024年10月,中国科学院分子植物科学卓越创新中心赵杨课题组在The EMBO Journal杂志上发表了一篇题为“Osmotic signaling releases PP2C-mediated inhibition of Arabidopsis SnRK2s via the receptor-like cytoplasmic kinase BIK1”的研究论文。在前期实验中,作者发现渗透胁迫下,拟南芥中BIK1可以磷酸化SnRK2s并将其从SnRK2.6-PP2C复合体中释放出来,之后SnRK2s向下传递胁迫信号。为了进一步探索这种磷酸化介导的SnRK2s释放的原因,作者通过AlphaFold 3预测SnRK2s磷酸化前后与ABI1(PP2C家族成员之一)的互作情况,结果发现SnRK2s磷酸化破坏了与ABI1互作的模型,结合文章前期的实验数据综合说明SnRK2s可能因此从复合体中被释放出来(图2)。
图2 AlphaFold 3预测SnRK2s磷酸化前后与ABI1互作的情况(Li et al., 2024)。
2024年7月,南京农业大学王源超课题组在Molecular Plant杂志上发表了一篇题为“AlphaFold-guided redesign of a plant pectin methylesterase inhibitor for broad-spectrum disease resistance”的研究论文。作者在前期研究中发现疫霉菌侵染大豆时,GmPMI1(果胶甲酯酶抑制蛋白)可以阻止疫霉菌分泌的PsPME1(果胶甲酯酶)对大豆细胞壁的破坏,但GmPMI1的过表达又使植株难以兼顾生长发育和防御反应之间的平衡(因为GmPMI1与自身GmPME1也会互作,相当于攻击病原菌的同时也限制了自身的正常生长),因此作者通过AlphaFold-Multimer工具重新设计了GmPMI1蛋白,替换了原蛋白序列中的9个氨基酸,并命名为GmPMI1R,改造后的蛋白GmPMI1R与GmPME1的互作强度减弱,但不会与PsPME1的互作强度并不会减弱(图3A-G),同样地,Co-IP也得出相同的结论(图3H),这也使得正常情况下过表达GmPMI1R并不会影响大豆自身细胞壁的果胶甲酯化程度。该研究充分展现了AlphaFold工具的辅助为加快植物保护策略的发展提供了一种新思路。
图3 通过AlphaFold辅助改造GmPMI1(Xia et al., 2024)。(A-G)GmPMI1突变9个氨基酸后改造为GmPMI1R,AlphaFold-Multimer预测了GmPMI1改造前后与GmPME1和PsPME1的互作情况,互作界面的氢键越少则互作越弱;(H)通过Co-IP验证GmPMI1改造前后与GmPME1和PsPME1的互作情况;(I)通过MST(微量热泳动)验证GmPMI1R与PsPME1的结合情况。
2023年12月,斯坦福Carnegie研究所王志勇课题组与南方科技大学郭红卫/姜凯课题组联合在The Plant Cell杂志上发表了一篇题为“Structure-based virtual screening identifies small molecule inhibitors of O-fucosyltransferase SPINDLY”的研究论文。由于蛋白质的O-糖基化是一种重要的蛋白质翻译后修饰,对糖信号传导有着关键作用,而拟南芥中SPINDLY(SPY)介导了O-岩藻糖基化修饰,因此为了研究SPY的功能及相关的生物学过程,开发靶向SPY的化学抑制剂就十分重要。该研究中,作者通过AlphaFold工具预测了SPY的结构并筛选了能与之结合的小分子化合物,最后从候选小分子化合物中选择了SOFTI(图4A、B)。后续实验证明SOFTI可以有效的抑制SPY自身的O-岩藻糖基化(图4C)。该研究进一步说明了AlphaFold可以有效地辅助开发蛋白抑制剂。
图4 通过AlphaFold辅助开发特定蛋白的抑制剂(Aizezi et al., 2023)。
第一部分是最上面的一些预测打分的说明及当前结构的打分值。plDDT指的是每个原子的置信度估计,简单来说就是打分值越高就表示该位置预测的可信度越高,从图6左下侧的结构图来看就是越蓝越准确,一般来说这个打分值高于70就说明对应的结构预测的比较可靠。pTM为整个复合物结构预测的可信度打分,这个打分值高于0.5就说明整体结构比较可靠。ipTM表示对接界面的可信度打分,这个打分值大于0.8就说明对接的可信度比较高。
第二部分是左下侧两个蛋白分子对接的结构(由于此处GmPMI1与GmPME1的序列来源与前述的原文不同,且使用的AlphaFold版本不同,所以结构有些差别)。
第三部分是右下侧的PAE矩阵。该结果是对预测复合物中各结构的相对位置的误差估计,简单说就是在某个残基上对齐时,另外一个残基位置的误差,该数值越小表示误差越小。
对接可信度主要看的还是plDDT、pTM和ipTM这几个指标,以GmPMI1与GmPME1的对接来看,首先整个结构中的氨基酸残基plDDT打分基本上都高于70,另外pTM高达0.7说明整体结构可信度较高,ipTM的值也达到了0.78,这说明对接的也比较准确。
此外,还有几个问题在前面分享过的“Accurate structure prediction of biomolecular interactions with AlphaFold 3”文章中作者也曾提到,AlphaFold 3有时候会找错手性(化学中的概念,即两个分子镜像对称),这时常发生在蛋白与核酸的复合物中,这说明我们在实际使用时也要注意可能有时蛋白与核酸对接的结构可能并不准确。
另外,对于相分离的蛋白来说,通常会有一段无序区,这段区域通常是属于未折叠的状态,而AlphaFold 3总倾向于将其预测为折叠后的结构,小远猜测其原因可能是相分离在细胞内是一个动态的过程,这种过程对于AlphaFold 3来说很难通过计算机程序去预先考虑到,即使AlphaFold 3能够从已知的蛋白结构中学习氨基酸之间潜在的联系。不过,作者发现AlphaFold 2 在这方面的预测效果要稍好,所以可能会考虑将其结合到AlphaFold 3中。