追问daily | 神经回归方法或误导大脑模型选择；全球首款渐冻症基因疗法在中国获批上市；非侵入性远程神经刺激新方法

学术 2024-10-15 17:42 上海

█ 脑科学动态

借助迷你大脑模型找到治疗路易体痴呆症的新希望

单步扩展技术实现纳米级成像，降低高分辨率显微成本

迷走神经刺激增强小鼠感知学习能力

小脑在长期运动技能记忆中的关键作用

磁电纳米圆盘实现非侵入性远程大脑刺激

人类特异性基因揭示大脑发育与神经发育障碍的关联

新的行为特征可以量化特定人际关系的社会价值

█ AI行业动态

全球首款渐冻症基因疗法在中国获批上市

Apple 开发出无需元数据的深度图生成 AI 模型

李飞飞团队推出数字表亲：突破机器人零样本学习

█ AI研发动态

神经回归方法或误导大脑模型选择

AI 聊天机器人提供的药物信息准确性和安全性存疑

AI技术助力生成高质量MRI图像，提升脑部疾病诊断能力

人工智能在医学影像中的应用未必提高临床工作效率

情境与背景知识对情绪识别的深远影响

AI在抽象推理上的突破与瓶颈

脑科学动态

借助迷你大脑模型找到治疗路易体痴呆症的新希望

路易体痴呆症（Lewy body dementia，LBD）是一种难以诊断的神经退行性疾病，常伴随幻觉、运动障碍、认知问题和抑郁等症状。梅奥诊所的研究团队，主要由神经科学家Na Zhao带领，通过创建迷你大脑模型，探索LBD的发病机制和潜在治疗方案。这些类器官模型通过患者捐赠的皮肤细胞培养而成，模拟了LBD患者大脑的病变。

研究人员利用LBD患者皮肤细胞转化为干细胞，开发了携带SNCA基因三倍体的迷你大脑模型，并通过单细胞RNA测序技术检测这些类器官中的遗传物质。研究发现，SNCA基因表达增加的兴奋性神经元中存在严重的突触和线粒体功能障碍，这与尸检证实的LBD患者大脑中的观察结果一致。为进一步寻找潜在的治疗药物，研究人员筛选了1280种FDA批准的药物，最终发现四种候选药物，包括恩他卡朋（entacapone）、托卡朋（tolcapone）、盐酸非那吡啶（phenazopyridine hydrochloride）和扎西他滨（zalcitabine）。这些药物被证明可以抑制α-突触核蛋白（α-SYN）的聚集，并改善神经元中的线粒体功能。这些研究结果为未来LBD及相关痴呆症的治疗带来了新的可能性。研究发表在 Science Advances 上。

#大脑健康 #路易体痴呆 #迷你大脑 #α-突触核蛋白 #药物筛选

阅读论文：

Jin, Yunjung, et al. “Modeling Lewy Body Disease with SNCA Triplication iPSC-Derived Cortical Organoids and Identifying Therapeutic Drugs.” Science Advances, vol. 10, no. 37, Sept. 2024, p. eadk3700. science.org (Atypon), https://doi.org/10.1126/sciadv.adk3700

单步扩展技术实现纳米级成像，降低高分辨率显微成本

麻省理工学院的研究团队开发了一种新型膨胀显微镜技术，旨在帮助无法负担昂贵超分辨率显微镜的实验室实现纳米级成像。这项研究由神经技术教授Edward Boyden和化学教授Laura Kiessling领导。

传统的纳米成像技术依赖于昂贵的超分辨率显微镜，而麻省理工的团队通过膨胀显微镜（Expansion Microscopy，ExM）提出了一种简化的20倍组织扩展方法（20ExM）。这一技术仅需单步即可将组织扩展20倍，从而利用常规光学显微镜达到小于20纳米的分辨率，足以观测到微管、线粒体等细胞结构，以及蛋白质簇。

实验方案的核心是使用由N,N-二甲基丙烯酰胺（DMAA）和丙烯酸钠组成的凝胶，该凝胶具备极强的吸水性和机械稳定性。与之前的二次扩展技术相比，单步扩展大大简化了操作过程。此外，研究人员通过去氧处理提高了凝胶的稳定性和扩展效果。该技术尤其适用于脑组织的高分辨率成像，并在未来可望广泛应用于癌症、神经系统疾病的研究中。此项技术不仅降低了成像设备的成本，还为科学家们提供了更便捷的纳米级研究工具。研究成果发表在 Nature Methods 期刊上。

#神经技术 #膨胀显微镜 #纳米成像 #生物分子标记 #显微技术

阅读论文：

Wang, Shiwei, et al. “Single-Shot 20-Fold Expansion Microscopy.” Nature Methods, Oct. 2024, pp. 1–7. www.nature.com, https://doi.org/10.1038/s41592-024-02454-9

迷走神经刺激增强小鼠感知学习能力

纽约大学医学院的研究团队通过研究迷走神经刺激（VNS），探讨其对小鼠神经活动和感知学习的影响。迷走神经是人体最长的脑神经，负责心率、消化等关键生理过程。先前的研究已经表明，VNS 能增强大脑可塑性，从而可能促进感知学习。

该研究开发了一项听觉辨别任务，研究 VNS 对小鼠感知学习的影响。研究人员在小鼠身上植入了微型VNS电极，并通过训练任务让小鼠根据不同音调做出舔食反应。实验过程中，VNS逐渐提高了小鼠的辨别能力，特别是在区分相近音调的任务上表现显著优于对照组。

通过双光子成像，研究发现 VNS 诱导了小鼠听觉皮层反应的变化，并激活了皮层投射的胆碱能轴突（cholinergic axons，一种帮助神经元沟通并调节大脑功能的神经纤维）。进一步的解剖学和光遗传学实验表明，VNS 通过激活中枢胆碱能系统（central cholinergic system，使用乙酰胆碱与其他神经元交流的神经网络）来增强小鼠的任务表现。

研究结果显示，VNS 能够在几周的时间内，通过每日训练和刺激，使小鼠在最具挑战性的任务上取得持久的改善。这项研究为未来 VNS 在临床上的应用，例如提升人工耳蜗患者的使用效果，提供了新思路。研究发表在 Nature Neuroscience 上。

#神经技术 #迷走神经刺激 #感知学习 #神经可塑性

阅读论文：

Martin, Kathleen A., et al. “Vagus Nerve Stimulation Recruits the Central Cholinergic System to Enhance Perceptual Learning.” Nature Neuroscience, Sept. 2024, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41593-024-01767-4

小脑在长期运动技能记忆中的关键作用

哈佛大学约翰·A·保尔森工程与应用科学学院的研究团队，包括Maurice Smith教授和Alkis Hadjiosif博士后，揭示了小脑在运动技能长期记忆中的关键作用。此前，神经科学家已知内侧颞叶损伤会影响长期陈述性记忆，但对运动技能记忆的影响尚不明确。该研究进一步阐明了大脑不同区域对短期和长期记忆的分工。

研究团队通过对患有小脑性共济失调（cerebellar degeneration）的患者进行实验，深入分析了他们在感觉运动学习过程中的记忆表现。研究将记忆分为短期的“暂时易失性”记忆（temporally-volatile memory），该记忆在15至20秒内迅速消退，不会形成长期记忆；以及长期的“暂时持续性”记忆（temporally-persistent memory），这种记忆可稳定60秒以上，并形成长期记忆。

结果显示，患者在短时间间隔内表现正常，但当时间间隔增加到25秒以上时，记忆形成能力显著受损。这一研究证明了小脑在长期感觉运动记忆形成中的独特作用，与短期记忆系统相对独立。研究结果不仅解释了此前小脑损伤对学习能力影响的差异，也为理解记忆的神经机制提供了新的视角。该研究发表在 PNAS 上。

#神经科学 #运动技能记忆 #小脑 #长期记忆 #感觉运动学习

阅读论文：

Hadjiosif, Alkis M., et al. “The Cerebellum Acts as the Analog to the Medial Temporal Lobe for Sensorimotor Memory.” Proceedings of the National Academy of Sciences, vol. 121, no. 42, Oct. 2024, p. e2411459121. world, www.pnas.org, https://doi.org/10.1073/pnas.2411459121

磁电纳米圆盘实现非侵入性远程神经刺激

深部脑刺激（DBS）是治疗帕金森病和强迫症等神经疾病的常用方法，但由于其侵入性和手术难度，应用范围受到限制。麻省理工学院的 Polina Anikeeva 教授团队，致力于寻找一种无需植入电极的替代方案。他们在材料科学、脑与认知科学等多个领域的跨学科合作下，开发了磁电纳米圆盘（MENDs），为远程神经刺激提供了新的可能性。

研究团队合成了具有核-双壳结构的磁电纳米圆盘（MENDs），其中包含 Fe3O4、CoFe2O4 和 BaTiO3 材料，直径为250纳米，厚度为50纳米。实验表明，尽管单个圆盘的电位低于神经元的兴奋阈值，但通过重复亚阈下去极化的方式，MENDs 仍能在体外的神经元实验中实现远程磁场刺激。在小鼠实验中，研究人员将 MENDs 注射到小鼠大脑中的特定区域，如腹侧被盖区和丘脑底核，分别成功地控制了小鼠的奖励和运动行为。这些结果表明，该技术在临床应用中有望替代传统的深部脑刺激，为治疗神经和精神疾病提供了更安全、非侵入性的选择。研究发表在 Nature Nanotechnology 上。

#神经技术 #远程刺激 #磁电纳米材料 #深部脑刺激 #神经科学

阅读论文：

Kim, Ye Ji, et al. “Magnetoelectric Nanodiscs Enable Wireless Transgene-Free Neuromodulation.” Nature Nanotechnology, Oct. 2024, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41565-024-01798-9

人类特异性基因揭示大脑发育与神经发育障碍的关联

人类大脑的发育与其他哺乳动物不同，具有长期性的特点，这种延迟的突触成熟被认为与高级认知能力的形成有关。然而，研究人员也推测，大脑发育过程中的异常可能与智力障碍和孤独症等神经发育障碍相关。由 VIB-KU Leuven 的 Pierre Vanderhaeghen 教授领导的研究团队，与哥伦比亚大学和巴黎高等师范学院的科学家共同合作，揭示了人类大脑发育的分子机制以及它们与神经发育障碍的联系。

研究团队通过关闭人类特异性基因 SRGAP2B 和 SRGAP2C，在小鼠大脑中移植了人类神经元，并进行长达 18 个月的突触发育监测。结果显示，当关闭这些基因时，神经元的突触发育显著加快，类似于 5-10 岁儿童的突触特征。此外，研究还发现 SRGAP2B 和 SRGAP2C 通过增加 SYNGAP1（智力障碍和孤独症谱系障碍相关基因）在突触中的水平，来减缓突触成熟的速度。研究表明，SRGAP2A（突触基因）和 SYNGAP1 之间的拮抗作用决定了突触发育的节奏，而 SRGAP2B 和 SRGAP2C 则通过干预这种关系，保持人类大脑的长期发育。这一发现为理解神经发育障碍的发病机制提供了重要线索。该研究发表在 Neuron 上。

#大脑健康 #突触发育 #孤独症

阅读论文：

Libé-Philippot, Baptiste, et al. “Synaptic Neoteny of Human Cortical Neurons Requires Species-Specific Balancing of SRGAP2-SYNGAP1 Cross-Inhibition.” Neuron, vol. 0, no. 0, Oct. 2024. www.cell.com, https://doi.org/10.1016/j.neuron.2024.08.021

新的行为特征可以量化特定人际关系的社会价值

加州大学洛杉矶分校的 João F. Guassi Moreira 和 Carolyn Parkinson 团队在研究中发现了一种新的行为特征，能够量化人们赋予特定人际关系的价值。此前，心理学界很少具体讨论人们如何衡量人际关系中的社会价值，而这一发现为理解人们在社会决策中的行为提供了新的研究方法。

研究人员设计了一种实验方法来捕捉个人在面对有限资源时对社会行为的优先选择，结合经济学中的机会成本（opportunity cost）概念，通过分析1111名参与者的社交行为，得出了行为特征的权重。他们将这些行为特征应用于特定的人际关系（如父母、朋友和熟人），并发现这些特征能够反映社会价值的不同表现形式。研究结果表明，社会价值得分不仅与关系的质量相关，还能够预测参与者在不同任务中的决策偏好。该研究通过对社会价值的行为标志进行量化，为心理学领域提供了更精确的研究工具。研究发表在 Communications Psychology 上。

#认知科学 #社会价值 #行为特征 #心理学 #人际关系

阅读论文：

Guassi Moreira, João F., and Carolyn Parkinson. “A Behavioral Signature for Quantifying the Social Value of Interpersonal Relationships with Specific Others.” Communications Psychology, vol. 2, no. 1, Sept. 2024, pp. 1–17. www.nature.com, https://doi.org/10.1038/s44271-024-00132-2

AI 行业动态

全球首款渐冻症基因疗法在中国获批上市

近日，渤健生物科技（上海）有限公司生产的创新药物托夫生注射液（Tofersen）正式获批在中国上市。该药物主要用于治疗携带超氧化物歧化酶1（SOD1，Superoxide Dismutase 1，一种与神经退行性疾病相关的基因突变）基因突变的渐冻症（ALS，肌萎缩侧索硬化）成人患者。这标志着全球首款针对渐冻症的基因靶向疗法正式进入中国市场。

ALS是一种致命的神经退行性疾病，患者通常在确诊后仅能生存3-5年，症状包括肌肉无力、萎缩，最终因呼吸衰竭死亡。在所有ALS患者中，携带SOD1基因突变的患者约占2%。尽管目前国内已有利鲁唑和依达拉奉等药物，但其效果有限，无法显著延缓病情进展。托夫生注射液通过反义寡核苷酸（ASO，Antisense Oligonucleotide，一种能够靶向特定基因进行治疗的分子技术）技术抑制SOD1基因的表达，从源头上减少SOD1蛋白的生成，填补了现有治疗手段的空白。

中国是ALS患者数量最多的国家之一，有超过4万名患者，其中携带SOD1基因突变的患者超过1200人。托夫生注射液的上市，为这类患者带来了新的治疗希望。

#ALS #渐冻症 #基因疗法 #托夫生 #渤健

阅读更多：

https://mp.weixin.qq.com/s/rbpO3PO2mZi5SZnuB57Kag

Apple 开发出无需元数据的深度图生成 AI 模型

Apple 的工程师团队开发了名为 Depth Pro 的深度估计模型，旨在解决智能手机仅依靠单摄像头生成深度信息的限制。现有技术通常依赖双摄像头或元数据来生成3D效果，而 Depth Pro 能够以更快的速度、无需额外数据实现这一功能。

Depth Pro 是一款基于零样本度量的单目深度估计模型，利用高效的多尺度视觉变换器（vision transformer）进行密集预测。该模型通过结合真实数据和合成数据集进行训练，不仅提高了深度图的精度，还能够追踪图像边界的细微差异。研究表明，Depth Pro 能够在标准 GPU 上以每秒 0.3 秒的速度生成 2.25 兆像素的深度图，且不依赖于传统的相机内在参数（camera intrinsics）等元数据。这意味着该模型可以在单镜头设备上实现高质量的 3D 图像生成，尤其是在边界细节和焦距估计方面表现出色。研究团队进行了大量实验，验证了 Depth Pro 在多个维度上优于现有技术，为未来机器人和自动驾驶汽车等实时 3D 图像生成应用提供了新的可能性。

#深度估计 #人工智能 #视觉技术 #3D映射

阅读更多：

Bochkovskii, Aleksei, et al. Depth Pro: Sharp Monocular Metric Depth in Less Than a Second. arXiv:2410.02073, arXiv, 2 Oct. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2410.02073

李飞飞团队推出数字表亲：突破机器人零样本学习，模拟到现实成功率达90%

李飞飞团队近期提出了数字表亲（Digital Cousins）概念，为解决机器人学习中从模拟到现实（sim2real）迁移的难题提供了全新思路。与传统的数字孪生（Digital Twins）不同，数字表亲不仅大幅降低了生成成本，还提高了跨域泛化能力，使机器人可以在虚拟环境中更有效地进行训练。

数字孪生在模拟真实世界环境时精度极高，但其构建成本昂贵且泛化能力有限。而数字表亲虽然不精确模拟现实中的场景，却能够捕捉关键的几何和语义信息，帮助机器人更好地应对多样化的任务场景。团队开发了一种全自动化流程，称为ACDC（Automatic Creation of Digital Cousins），通过从单张RGB图像生成虚拟交互式场景，使机器人在这些虚拟环境中学习各种操作策略。

实验结果显示，基于数字表亲训练的机器人策略在实际场景中的零样本部署成功率高达90%，远超传统数字孪生的25%。该研究突破了机器人从模拟环境迁移到现实环境的瓶颈，未来或将加速通用机器人的发展。

#数字表亲 #机器人训练 #sim2real #跨域泛化 #自动化场景生成

阅读更多：

https://digital-cousins.github.io/

AI 研发动态

神经回归方法或误导大脑模型选择

一项来自斯坦福大学和麻省理工学院的最新研究指出，当前广泛应用于神经科学和人工智能领域的神经回归方法可能无法准确识别与大脑相似的模型。研究者发现，这种方法过度依赖线性回归得分（如R²），忽略了大脑系统的复杂性，从而可能导致错误的科学结论。

这项研究特别聚焦于网格细胞——一种关键的神经细胞模型。尽管回归得分高的人工神经网络在预测网格细胞的神经活动方面表现优异，但这些模型却未能捕捉网格细胞的核心特性，如周期性调谐曲线和模块化结构。研究人员指出，这类模型的成功更多地源于线性回归的隐含偏差，而非与大脑的实际相似性。

通过多项实验证明，回归方法所依赖的指标与模型的复杂性高度相关，却无法准确反映模型与大脑的相似程度。研究呼吁神经科学和AI领域重新评估这一方法，并建议未来在模型比较时引入更多维度，如神经动态和行为数据，以减少对单一得分的过度依赖。

#神经回归 #网格细胞 #人工智能 #神经网络 #计算神经科学

阅读更多：

https://openreview.net/pdf?id=vbtj05J68r

AI 聊天机器人提供的药物信息准确性和安全性存疑

随着 2023 年人工智能聊天机器人的广泛应用，搜索引擎开始提供更复杂的药物信息。然而，由英国研究团队发表的一项研究表明，这些工具并不总能提供准确或安全的答案，且某些回答可能导致患者误解或危险后果。研究团队来自多所医疗机构，并与临床药剂师和药理学专家合作。

研究人员通过 Bing copilot 对 2020 年美国门诊市场上最常用的 50 种药物进行了实验。每种药物的常见问题共生成了 500 个回答，涵盖了药物的适应症、使用说明和禁忌症等。研究发现，聊天机器人的答案在 Flesch 阅读轻松度分数（Flesch Reading Ease Score）中得分较低，平均可读性仅为 37，显示出大部分患者难以理解这些信息。

同时，尽管回答的平均完整性和准确性达到了 100%，但专家分析了其中 20 个回答后，发现 66% 的答案可能存在潜在的安全隐患，其中 42% 的回答可能会导致中度或轻度伤害，22% 的回答可能导致严重伤害甚至死亡。研究表明，AI 聊天机器人虽然能够提供大量信息，但其复杂性和潜在错误可能对患者的药物安全构成威胁，建议患者在获取药物信息时仍应谨慎依赖此类工具，优先咨询专业医护人员。研究发表在 BMJ Quality & Safety 上。

#认知科学 #药物安全 #人工智能 #患者安全 #健康科技

阅读更多：

Andrikyan, Wahram, et al. “Artificial Intelligence-Powered Chatbots in Search Engines: A Cross-Sectional Study on the Quality and Risks of Drug Information for Patients.” BMJ Quality & Safety, Sept. 2024. qualitysafety.bmj.com, https://doi.org/10.1136/bmjqs-2024-017476

AI技术助力生成高质量MRI图像，提升脑部疾病诊断能力

在医学成像领域，7T MRI由于其更高的分辨率被认为能够更好地帮助识别和监测大脑病变组织。然而，由于7T MRI设备的稀缺性，全球仅有少量设备可用于临床诊断。为了解决这一问题，加州大学旧金山分校的研究团队开发了一种基于机器学习的算法，旨在利用3T MRI图像生成接近7T质量的合成图像。这一研究由Reza Abbasi-Asl博士领导，团队希望通过这一技术解决当前医疗资源受限的问题。

该研究采用了监督深度学习技术，利用V-Net卷积神经网络从3T MRI生成高质量的7T类图像。研究团队训练了模型，使用来自8名轻度创伤性脑损伤（TBI）患者的3T-7T MRI配对数据，成功提升了病理组织的细节可视化能力。尤其是在白质病变和微出血的分辨上，合成的7T图像提供了更清晰的病理特征分离，改善了临床诊断的精确度。此外，研究团队还通过数据增强技术提高了模型的鲁棒性，使其能够适应不同扫描仪下的成像差异。研究结果表明，该技术在多个机构的数据集上表现出色，展示了合成7T图像在神经退行性疾病诊断中的广泛应用前景。研究发表在 MICCAI 上。

#大脑健康 #神经技术 #MRI #机器学习 #创伤性脑损伤

阅读更多：

Cui, Qiming, et al. “7T MRI Synthesization from 3T Acquisitions.” Medical Image Computing and Computer Assisted Intervention – MICCAI 2024, edited by Marius George Linguraru et al., Springer Nature Switzerland, 2024, pp. 35–44. Springer Link, https://doi.org/10.1007/978-3-031-72104-5_4

人工智能在医学影像中的应用未必提高临床工作效率

人工智能（AI）在医疗领域，特别是放射学、基因组学等影像密集型专业中得到了广泛应用。波恩大学医院和波恩大学的研究团队通过对AI在医学成像领域的应用进行系统回顾，探讨其对临床工作流程的实际影响。该团队成员包括波恩大学患者安全研究所（IfPS）主任Matthias Weigl教授、Katharina Wenderott博士。

研究团队对六个医学数据库进行了全面搜索，筛选了13,756条记录，最终纳入了48项研究。研究重点是评估AI在临床工作流程中的应用，尤其是医学成像领域的效率提升。在纳入的33项研究中，67%的研究报告工作时间有所减少。然而，针对12项研究进行的三项元分析并未显示AI的实施显著提高了工作效率。这表明，AI在日常临床实践中的作用仍存在不确定性，尤其是在工作流程的具体优化上。研究确定了五种不同的工作流程适应AI的使用，最常见的是AI作为辅助工具，帮助识别影像中的异常。这些发现强调了需要更系统化的报告和标准化数据，以更好地评估AI在临床中的效用。研究发表在 npj Digital Medicine 上。

#神经技术 #人工智能 #医学成像 #临床效率 #系统回顾

阅读更多：

Wenderott, Katharina, et al. “Effects of Artificial Intelligence Implementation on Efficiency in Medical Imaging—a Systematic Literature Review and Meta-Analysis.” Npj Digital Medicine, vol. 7, no. 1, Sept. 2024, pp. 1–16. www.nature.com, https://doi.org/10.1038/s41746-024-01248-9

情境与背景知识对情绪识别的深远影响

由德国波鸿鲁尔大学哲学研究所的 Leda Berio 博士和 Albert Newen 教授领导的研究团队，探讨了情绪识别不仅依赖于面部表情，还包括情境、身体特征和个人背景等因素。他们的研究挑战了传统的情绪识别理论，提出了一个更具包容性的情绪识别模型。

该研究基于构建主义情绪理论，提出情绪识别不仅仅是对面部表情的解读，而是一个多维度的过程，涉及上下文、人物模型和情境模型等因素。研究人员认为，情绪识别是形成对一个人总体印象的子过程，受到文化、身体特征以及情境背景的影响。他们引入的情境模型和人物模型有助于描述背景信息在情绪识别中的作用。例如，当看到一个人受到威胁时，即使没有面部表情的明显线索，我们也可以通过身体姿势来识别恐惧情绪。

通过这些模型，研究指出情绪识别是一个动态的过程，识别结果会影响甚至改变我们对人物的印象。研究表明，当前的人工智能情绪识别系统由于仅依赖面部表情而存在局限性，未来系统需要更广泛的情境线索来提高情绪识别的准确性。研究发表在 Philosophy and Phenomenological Research 上。

#认知科学 #情绪识别 #人工智能 #社会认知 #多维模型

阅读更多：

Berio, Leda, and Albert Newen. “I Expect You to Be Happy, so I See You Smile: A Multidimensional Account of Emotion Attribution.” Philosophy and Phenomenological Research, Sept. 2024. onlinelibrary.wiley.com, https://doi.org/10.1111/phpr.13113.

AI在抽象推理上的突破与瓶颈

南加州大学维特比工程信息科学研究所的一项最新研究，测试了人工智能（AI）在抽象推理中的表现，尤其是通过解决类似于人类智商测试的视觉难题。该研究发现，虽然闭源AI模型（如GPT-4V）在处理这些问题上表现相对较好，但仍然远不及人类认知水平。开源模型在这些非语言的推理任务中表现更为挣扎。

研究人员 Kian Ahrabian 和 Zhivar Sourati 通过基于 Raven 渐进矩阵（Raven's Progressive Matrices）的谜题测试了24个多模态大语言模型（MLLM），发现闭源模型得益于更强的训练资源，表现更优。而为了提高AI推理的准确性，研究团队探索了“思维链提示”（Chain of Thought prompting）技术，通过引导AI逐步推理，这种方法在部分案例中显著提升了性能。

#人工智能 #抽象推理 #多模态语言模型 #思维链提示 #南加州大学

阅读更多：

Ahrabian, Kian, et al. The Curious Case of Nonverbal Abstract Reasoning with Multi-Modal Large Language Models. 2024. openreview.net, https://openreview.net/forum?id=eDWcNqiQWW#discussion

整理｜ChatGPT

编辑｜丹雀、1900、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或添加小助手微信questionlab，加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute, TCCl）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了TCCI加州理工神经科学研究院。

TCCI建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括学术会议和交流、夏校培训、AI驱动科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。

http://mp.weixin.qq.com/s?__biz=MzI3MjQ4MDMyOQ==&mid=2247518384&idx=2&sn=c2411c61b15a9e89b6991f5adecf8013

追问nextquestion

科研就是不断探索问题的边界