新闻中,据说 DeepMind 的 AlphaFold 用神经网络解决了蛋白质折叠问题,但这不是只有优化过的量子计算机才能解决的问题吗?
据我所知,问题是在模拟氨基酸链如何折叠时需要考虑太多变量(原子力),在这种情况下,只能使用量子计算机来模拟它。
神经网络只是做出了很好的估计,还是模拟了实际的蛋白质结构?
新闻中,据说 DeepMind 的 AlphaFold 用神经网络解决了蛋白质折叠问题,但这不是只有优化过的量子计算机才能解决的问题吗?
据我所知,问题是在模拟氨基酸链如何折叠时需要考虑太多变量(原子力),在这种情况下,只能使用量子计算机来模拟它。
神经网络只是做出了很好的估计,还是模拟了实际的蛋白质结构?
AlphaFold(版本1和2)根据氨基酸序列预测(因此估计)蛋白质的 3D 形状。AlphaFold 的性能是通过全局距离测试 (GDT)来衡量的,它是两种蛋白质结构(预测和真实情况)之间相似性的度量,范围从 0 到 100。
有一个简短的视频和一个较长的视频(均来自 DeepMind),总结了蛋白质折叠的问题,它的重要性,AlphaFold 解决它的程度(在蛋白质结构预测(CASP)的关键评估竞赛中),即 AlphaFold 2 的 GDT 中位数为 92.4(最硬的蛋白质为 87),远高于 AlphaFold 1 的 GDT 分数 58(这是当时的最高分数),根据John Moult(该公司总裁CASP),90 左右的分数被认为是蛋白质折叠问题的令人满意的解决方案。您可以在这篇 DeepMind 博客文章中找到有关 AlphaFold 2 的更多详细信息,并在今年发表在《自然》杂志上的另一篇博文或相关论文。您可以在此处找到 AlphaFold 1 的代码,但还有其他社区/开源实现。
尽管问题和成就很重要,但显然有很多关于这一突破的炒作(也考虑到它是由 DeepMind 实现的)。Lex Fridman在这段视频中也讨论了这一点。
问题是在模拟氨基酸链如何折叠时需要考虑太多变量(原子力),在这种情况下,只能使用量子计算机来模拟它。
这些许多变量,以你提到的原子力为例,为了便于计算,以某种方式进行了分组;因此,没有必要绝对同时模拟所有内容。
一个值得注意的例子是,当 K 计算机(日本最强大的超级计算机之一,但远不是优化的量子计算机)计算解开组蛋白 DNA 链所需的力时(不考虑每个核苷酸之间的相互作用) )。
1:37 -
通过将多个原子视为一个粒子,我们可以增加模拟中的现象数量
基本上,他们从以下问题开始:“我们可以在模拟中从分析对象中排除多少元素和交互,以便在没有太多损失和高精度的情况下仍然保留其属性?”
另一个如何做到这一点的例子是当他们应用有限元方法来研究心脏的血流动力学时。
他们只是将心脏转变为一组规则的四面体,但仍然设法模拟了非常广泛的现象——例如心脏各部分的 ATP 消耗率以及功能期间心肌厚度的变化。
换句话说,他们远不想模拟心脏的所有组织细节。相反,它们尽可能地简化,以便在我们当前的超级计算机上进行模拟。