中国企业网财经

人工智能破解了50年来蛋白质生物学问题

2020-12-01 17:54:32 网络
蛋白质生物学

 

解决旧的复杂问题的新解决方案?

蛋白质是分子机器,可以在人类和其他生物体内执行支撑生命的生理过程。蛋白质组学研究领域的重点是研究蛋白质组,鉴定蛋白质,表征和分析其生物学,近年来,蛋白质组学研究领域的发展和发展速度惊人。

蛋白质的广泛而多样的功能在很大程度上与它们的形状和结构有关。蛋白质能够将自身折叠成非常特定的形状和结构,从而精确地决定了它们如何与其他分子相互作用。以药理为例;几乎所有药物通过靶向人体蛋白质来激发它们的作用。因此,确定蛋白质结构是蛋白质组学研究的基本组成部分,具有广阔的应用前景。然而,由于存在大量蛋白质,并且它们可以摄取多种不同的形状,因此这并非易事。

多年来,已经开发出了多种分析技术来尝试解决该问题,包括X射线晶体学,低温电子显微镜和基于质谱的方法。但是,这些方法可能很复杂,成本很高,整个研究项目(例如博士学位)可以专门用于确定一种蛋白质的结构。

AlphaFold采用AI通过将蛋白质比作“空间图”来预测和确定蛋白质的结构和形状。“我们创建了一个基于注意力的神经网络系统,经过端到端训练,试图解释该图的结构,同时对所构建的隐式图进行推理。它使用与进化相关的序列,多序列比对(MSA) ,并用氨基酸残基对表示来完善该图。” AlphaFold的开发人员说。

John Moult教授和Krzysztof Fidelis教授于1993年创立了蛋白质结构预测的关键评估(CASP),以促进蛋白质结构预测的研究。CASP选择最近被确定为研究组目标的蛋白质结构,以测试其预测方法的准确性。计分表称为全球距离测试(GDT),范围是0-100,其中90通常被认为是“竞争性”结果。AlphaFold在所有目标上的GDT得分均达到92.4。

该系统能够对蛋白质的物理结构进行强有力的预测,并能在几天内确定高度准确的结构。

开发商说,“我们对该系统进行了公开的数据培训,该系统包含来自蛋白质数据库的约170,000种蛋白质结构以及包含未知结构的蛋白质序列的大型数据库。它使用大约128个TPUv3内核(约等于100-200个GPU)数周的时间,相对于当今机器学习中使用的大多数大型最新模型而言,这是相对较少的计算。”

拓展科学知识的前沿

马克斯·普朗克发展研究所所长安德烈·卢帕斯教授说: “ AlphaFold惊人的准确模型使我们能够解决近十年来被困的蛋白质结构,重新开始了我们的工作,以了解信号如何在细胞膜之间传输。”生物学。

在他们的公告中,开发人员表示了蛋白质结构预测系统在未来大流行反应策略中的潜在用途。在过去的几个月中,表征SARS-Cov-2蛋白质的结构以及与之相互作用以感染宿主细胞的人类蛋白质一直是许多研究小组的主要研究重点。DeepMind表示“今年年初,我们预测了SARS冠状病毒2型病毒的几种蛋白质结构,包括ORF3a,其结构是先前未知的。”

发布:xiuyue

---------------------------------

关注中国企业报微信公众号ID:zgqybnews

经济进退、行业冷暖、牛企动静、观察者发言,关于财经你想知道的这都有!

 

免责声明:本站文章除我单位采编人员采写外,其他部分用户投递或转载内容,不代表本站的观点和立场。文章中的相关数据仅供参考,不构成投资建议,请以中国证监会指定上市公司信息披露媒体为准,本站不做任何形式的担保。若涉及侵权,请及时与本站联系!

上一篇: 港股恒指涨0.86% 中资金融股强势招商证券涨7%
下一篇:最后一页

蛋白质生物学相关新闻

©2016中国企业网
网页版