搜索

大问题解决了!蛋白质三维结构可以用人工智能来分析

发布时间:2021-01-07 20:01:26

作者:袁柳

DeepMind用于确定蛋白质三维形状的深度学习技术可能会给生物学带来新的变化。蓝色是计算机预测的蛋白质结构,绿色是实验结果,两者之间的相似性很高。(图片来源:DeepMind)

生物学上最大的挑战之一,蛋白质三维结构分析,现在有望破解。深度学习计划google旗下的人工智能公司DeepMind能够准确预测其三维形状。

如果把生物体比作建筑工地,那么蛋白质就像一块砖块。人体中有成千上万种不同的蛋白质,每种蛋白质都含有数十个氨基酸。这些氨基酸的顺序决定了蛋白质的形状和功能。结构就是功能是分子生物学的理论。如果能根据蛋白质的氨基酸序列推断出蛋白质的结构,将有助于人们加快对细胞组成和操作的理解,一些新药的研究和开发也将得到更快的进展。

长期以来,人们需要用实验来确定完整的蛋白质结构,如x射线结晶和冷冻电子显微镜,这些方法通常需要数月甚至几年,在人类发现的2亿蛋白质中,只有不到200000被分析过。

现在,人工智能也有能力给出准确的预测方法,甚至几天甚至半小时。最近,在蛋白质预测结构挑战赛上,DeepMind推出了一个字母程序,在100多个团队中脱颖而出。Casp竞赛的规则之一是,参赛者预测的蛋白质结构必须经过测试,但没有公布。预测结果将通过实验方法匿名测试,两者之间的相似性越高,得分就越高。

在竞争中,DeepMind的字母折叠将深入学习和张力控制算法结合起来,并将其应用于结构和遗传数据。深度学习网络由迄今已知的170000种蛋白质组成。结合蛋白质折叠的物理结构和几何约束信息,字母折叠可以预测目标蛋白的序列结构--甚至是嵌入细胞膜的蛋白质,这是了解许多人类疾病的关键。

但字母折叠也不是完美的,在预测由52个小重复片段组成的蛋白质结构方面,字母折叠也没有得到高分。到目前为止,DeepMind已经发布了第一个版本的字母折叠的细节,供其他研究人员复制。DeepMind的研究和开发团队表示,它还将继续对字母折叠进行训练,以便更好地分析更复杂的蛋白质结构。

上一篇:2020年互联网行业前八名最佳雇主

下一篇:最后一页