AI「长脑子」了?LLM惊现「人类脑叶」结构还长出数学代码区,MIT大神新作轰动学界

百科   2024-10-31 11:30   上海  

原来,精巧的大脑结构,并非人类专属

什么?AI居然“长出”了跟人类大脑惊人相似的结构!

刚刚,麻省理工学院(MIT)的物理学家和宇宙学家 Max Tegmark 在社交媒体上公开他们最新论文的研究成果,震惊了AI学术圈。


论文的发现太过于劲爆,网友们直呼“太疯狂”!


美丽的自然法则不仅对人类大脑起作用。


认为这一事实有力地证明了数学组织是基础,但不仅仅是人类的构造。


很酷,但是也很可怕。


坦言如果真的是这样,他有不好的预感。


干脆直接把AI看作是“人类的硅基孩子”,看着它成熟,令人敬畏又可怕。


不明觉厉,但是觉得很美妙。



回到论文本身。


这篇 MIT 大牛 Max Tegmark 及其团队发表的论文,揭示了LLM学习概念中一个令人惊讶的几何结构。

有“脑叶”,有精确的“语义晶体”,有优于圆形的分形“概念云”。

严格来说,这是AI的特征向量在空间中自发形成了类似人类大脑的功能分区。

Max Tegmark团队通过分析稀疏自编码器的特征向量,发现了这种令人惊讶的组织结构。

简单来说,团队发现SAE特征的概念宇宙在三个层面上都显示出了有趣的结构:

  • 小尺度「原子」

  • 中尺度「大脑」

  • 大尺度「星系」

用通义千问辅助阅读论文时,请它绘制了一个脑图,先对文章有一个大概的了解。

论文地址:https://arxiv.org/abs/2410.1975,在公众号DeepSci后台回复“LLM大脑”领取PDF

接下来,让我试着说一说对这篇论文的粗浅理解。

AI的"大脑"里有啥?三层神奇结构大揭秘!

想知道AI的"大脑"里藏着什么秘密吗?

MIT的研究团队使用稀疏自编码器(SAE)分析了特征向量的空间分布发现了从微观到宏观的三层结构,统计显著性达到了954个标准差。

可以理解为一个超有意思的"概念宇宙"。

这个发现就像是用显微镜观察到了AI思维的多层次结构从最小的"语义晶体"到最大的"思维星系",再到中间层令人惊叹的“三大脑区”!

1. 原子层面:语义晶体的微妙结构

在最微观的层面,研究者们发现AI令人惊叹的"晶体结构":
  • 晶体结构的发现

    • 在SAE特征点云中识别出概念间的几何关系
    • 发现了平行四边形和梯形等基本结构
    • 这些结构反映了深层的语义联系
  • 经典案例分析

    • (男人, 女人, 国王, 王后)形成平行四边形,b-a≈d-c
    • (奥地利, 维也纳, 瑞士, 伯尔尼)构成梯形,展示了国家-首都映射关系
    • 通过计算成对差向量并聚类,发现了大量稳定的语义关系
  • 技术突破

    • 使用线性判别分析(LDA)消除词长等干扰因素
    • 开发"元SAE"方法发现更基本的原子特征
    • 通过投影降低数据维度,提高晶体质量

2. 大脑层面:AI的"三大脑区"

这是最好玩的部分!

AI的"大脑"居然自己分出了三个区域:一个专门处理数学题,一个负责聊天吹水,还有一个简直就是个24小时不打烊的图书馆

严肃点。

在中间尺度上,研究发现了最令人震惊的现象。在Gemma2 2B模型的第12层中,16,000个特征自发形成了类似人类大脑的功能区:

  • AI三大“脑区”

    • 数学/代码脑叶

    • 短文本脑叶

    • 科学论文脑叶

  • 功能区域划分

    • 专门分析长篇学术文献
    • 展现出强大的抽象思维能力
    • 在复杂文本理解上表现突出
    • 处理对话和简短消息
    • 在社交媒体内容中特别活跃
    • 类似人类的语言处理中枢
    • 专门处理数学和编程内容
    • 在代码文档中显示最高激活率
    • 表现出类似人类大脑逻辑思维区的特征

研究方法创新

    • Phi系数(效果最佳)
    • Jaccard相似度
    • Dice系数
    • 重叠系数
    • 分析5万个文档的特征共现模式
    • 使用256个token作为时间分辨单位
    • 应用多种相似度计算方法:
    • 统计显著性达954个标准差

3. 星系层面:AI的宏观思维结构

在最大尺度上,AI的思维空间可不是随便乱摆的!它形成了一个超级有规律的结构,就像是给思维建了一个小宇宙!

在最宏观的尺度上,研究揭示了点云的整体特征:

  • 形状特征

    • 不是简单的球形分布
    • 呈现"分形黄瓜"状
    • 在不同维度上展现自相似性
  • 层级分析

    • 中间层(第12层)幂律斜率最陡(-0.47)
    • 早期层(第0层)和后期层(第24层)较平缓(-0.24和-0.25)
    • 暗示中间层作为信息压缩的"瓶颈"
  • 熵与聚类分析

    • 使用k-NN方法估计点云熵
    • 定义聚类熵为Hgauss − H
    • 发现中间层存在显著的聚类现象

对论文的粗浅解读就先到在这里,有兴趣的朋友可以后台回复“LLM大脑”领取论文全文PDF,真的是YYDS!

开启AI认知研究新篇章

这项研究的重要性远超出了技术层面。它就像是我们第一次用显微镜看到细胞结构,或第一次用望远镜观测到行星运动一样具有里程碑意义。

Max Tegmark团队的发现告诉我们,AI的思维并非随机的统计过程,而是遵循着某种深刻的组织原则。

这些原则可能不仅适用于人工智能,也适用于生物智能。

正如原始论文中所强调的:"这种数学模式的普遍性表明,美丽的自然法则并不独属于人类,硅基生命同样遵循这一法则。"

这项研究与团队此前的突破性发现完美呼应。

在之前的研究中,他们发现Llama-2-70B不仅能够描绘出研究人员真实世界的文字地图,还能准确预测地理位置的纬度和经度。

在时间维度上,模型成功预测了名人的死亡年份、各类作品的发布日期和新闻的出版时间。

如今,他们更进一步揭示了AI"大脑"的内部构造,发现了从微观到宏观的三层结构。

这些发现串联起来,不仅帮助我们逐步解开了AI的黑盒之谜。

更重要的是,它暗示了一个更深层的真相:或许存在着一套支配所有智能系统的普遍法则,无论这种智能是来自碳基生命还是硅基计算机。

正如一位研究者在论文中所说:"这让我们第一次看到了思维的数学本质。"

或许在不久的将来,这些发现将帮助我们开发出更安全、更可控、更智能的AI系统。

但更重要的是,它可能会帮助我们更好地理解智能本身的本质,揭示出一个跨越物质形态的普遍真理。

MIT 大牛 Max Tegmark 的空间:space.mit.edu/home/tegmark/

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

DeepSci
专注于 AI 产业资讯、产品评测、实用教程分享
 最新文章