纽结理论长期困扰着数学家,但随着人工智能的进步,有研究者在生物学中找到了突破口,因为纽结结构存在于许多重要的生物分子中,例如蛋白质、DNA等。对于难以识别归类的复杂纽结结构,AI给出了令人惊讶的结果。
任何一个有经验的水手都明白,一个正确的绳结意味着生命的保障,无论是升起风帆还是固定锚链,绳子的作用取决于它的绳结。同样的道理也适用于维持人类生命体征的分子,例如最常见的蛋白质分子。
蛋白质是由氨基酸组成的大分子化合物,是构成生物体的基本物质之一。氨基酸通过肽键连接形成肽链,进而通过螺旋、折叠等方式形成复杂的空间结构,使分子能够相互耦合。长期以来,人们认为,尽管蛋白质可能高度缠绕,但在正常条件下它们不能形成纽结,因为这会阻碍蛋白质的折叠[译者注1]。
图 1:如图所示,有些蛋白质的纽结结构非常清晰。第二行的图像展示了每个分子的简化视图。每个图像下方的数字表示蛋白质自身交叉重叠的次数,“+”和“-”则表示它们是镜像结构。例如,-31 和 +31 是“三叶结”的镜像形式。需要注意的是,蛋白质形成的是“开放的结”,因为它们的两端并没有连接在一起。不过,这通常并不影响我们在分子中定义一个纽结结构。图片来源:参考文献[1]
曲折的历史:
错误的涡旋原子理论
图 2:彼得·格思里·泰特和其他早期的纽结理论家花费多年时间编制了一份全面的纽结列表。上图摘自他们的结表,列出了最多9个交叉点的纽结——即“九阶纽结”[译者注3]。图片来源:University of St Andrews Library, ID sfQC3-T2-Vol-1-6.
识别纽结:寻找拓扑不变量
图 3:爱丁堡大学的博士生乔尔杰·米哈伊洛维奇开发了一款名为“识别纽结”的在线游戏。读者不妨尝试思考一下:在上图中,第一行的纽结等价于第二行的哪个呢?图片来源:Djordje Mihajlovic
图 4:Dowker–Thistlethwaite记法是一种于1983年提出的纽结不变量。这种方法通过两次遍历纽结,为每个交叉点分配一个整数,最终的整数序列即表示为该纽结。图片来源:wikipedia
纽结不变量:代数与几何方法
亚历山大多项式属于所谓的“代数不变量”。它通过构造一个矩阵(其行数和列数与结的交叉点数量相同)并计算其行列式来确定。这类代数不变量是从结的二维投影中构造出来的,有点像纽结的影子,不过我们可以辨别每次交叉时哪个部分在上面。然而,像我这样的软物质物理学家希望对蛋白质和DNA等分子中的纽结进行分类,它们是三维的,并且不断受到热能的干扰,将这些分子简化为二维投影会抹去一些对其功能至关重要的空间特征。
一种有说服力的替代方法是使用“几何不变量”。这类不变量通过在三维空间中遍历纽结并通过计算某些几何属性(例如曲率)来确定。其中一种我非常喜欢的方式是计算绞拧数[译者注5](writhe,或称缠绕数),同样是由泰特提出的。绞拧数可以通过在二维投影中数“上方”和“下方”的交叉点,并用两者相减来计算(见图5b)。
图 5:刻画纽结的一种方法是计算绞拧数,它量化了纽结的扭曲程度。(a) 每次纽结出现交叉时,交叉点可以被定义为上交叉(左图)或下交叉(右图)。绞拧数通过用上交叉点数量减去下交叉点数量来计算。(b) 绞拧数的计算示例:对于五叶结(左),它的绞拧数为+5;对于八字结(右),它的绞拧数为0。(c) 绞拧数还可以作为几何量在三维分子(如蛋白质)上进行计算。几何绞拧数可以作为整体量或局部量(在相邻的短链段之间)来计算。局部绞拧数值越大表明这些链段彼此缠绕得越紧。达维德·米基耶莱托及其同事证明,基于局部绞拧数训练的神经网络能够高精度地刻画纽结的拓扑结构。)图片来源:(a)参考文献[4]; (b) Djordje Mihajlovic; (c) 参考文献[5]
人工智能与绞拧数
更具挑战性的任务:
局部绞拧数识别复杂纽结
图 6:纽结的完全不变量在光滑形变下保持不变。不同的拓扑结构具有不同的完全不变量。(a)中的两幅图像展示的是同一个结吗?仅凭人类的直觉往往难以区分。事实上,这两幅图显示的是两种略微不同的结——康威结和KT结。由于很难区分这两个结,它们可以用来测试神经网络是否可以识别纽结。(b)展示了两种结的不同构型——51结(也称五叶结,上图)和72结(下图)。在达维德·米基耶莱托及其同事的神经网络研究中,五叶结是第一个训练数据集的一部分,而72结则包含在更大的数据集中。图片来源:(a)参考文献[5];(b) Davide Michieletto
最后的验证——
瓦西里耶夫不变量
纽结的确很重要
译者注
参考文献
策划制作
来源丨返朴
责编丨杨雅萍
审校丨徐来 林林
点亮“在看”
一起长知识!