█ 脑科学动态
AI与生物信号结合,开发更精确的疼痛评估系统
θ相进动有助于人类情景记忆的形成与检索
3D 小鼠大脑图谱提供了更动态的 360 度发育图
在家使用经颅直流电刺激治疗抑郁症,也能安全有效
恐惧记忆随时间演变的机制或为 PTSD 治疗提供新思路
阿尔茨海默病可能在两个阶段损害大脑
PLD3 和 PLD4 酶揭示 BMP 合成机制,助力神经退行性疾病研究
█ AI行业动态
苹果AI竞赛失利?内部员工揭露落后两年
Gemini并入DeepMind,谷歌重组AI团队
Newton AI模型:自主发现物理规律的AI基础模型
Meta FAIR发布新一代AI工具,推动开源与可重复性研究
微软率先推出自动化代理工具
█ AI研发动态
无监督学习对人类和机器的影响
人工智能有望提高医院质量报告效率
革命性AI助力癌症诊断,精准度达96%
罕见病新希望:哈佛AI模型助力发现17000种治疗药物
大语言模型在医疗诊断中易受认知偏差影响
脑科学动态
AI与生物信号结合,开发更精确的疼痛评估系统
东北大学的研究团队正在致力于开发一种基于生理信号和人工智能技术的疼痛客观测量工具。受其个人经历启发,研究人员希望通过科学方法解决传统疼痛评分系统的不精确性,特别是针对无法清晰表达疼痛的患者群体。该研究团队包括机械工程专家和医院的患者安全总监,致力于探索在临床和家庭环境中应用的潜力。
研究人员通过多种实验手段,客观测量疼痛。参与者接受了如针刺和冰水浸手等实验,在此过程中,团队使用传感器记录参与者的心率、呼吸、肌肉运动及脑电波等生理信号,这些信号通过机器学习算法处理并生成疼痛评分。为了确保临床环境中的实用性,研究人员尝试了多种信号组合,以确定最佳的疼痛指示器。该团队的研究结果表明,不同生理信号之间的结合(如脑电图EEG和皮肤电导)能够为疼痛提供可靠的量化评估,有望改善疼痛管理,尤其是对婴儿、麻醉患者等无法主观表达疼痛的群体。林教授预计未来几年将进一步推动该研究的商业应用,以开发适用于家庭的慢性疼痛监测设备。研究发表在 Nature 上。
#神经技术 #疼痛管理 #人工智能 #生理信号 #机器学习
阅读论文:
Dolgin, Elie. “How a ‘Pain-o-Meter’ Could Improve Treatments.” Nature, vol. 633, no. 8031, Sept. 2024, pp. S26–27. www.nature.com, https://doi.org/10.1038/d41586-024-03003-2
θ相位进动有助于人类情景记忆的形成与检索
加州大学戴维斯分校、哈佛医学院、多伦多西部医院和雪松-西奈医学中心的研究人员开展了一项实验,旨在验证θ相位进动(theta phase precession)在记忆形成与检索中的作用。这一概念早在动物研究中得到了提示,但在以往的人类研究中尚未得到实验证实。
研究团队招募了22名参与者,通过记录他们在观看和回忆电影片段时内侧颞叶中的单神经元活动和局部场电位,分析了θ相位进动的作用。实验中的电影片段经过设计,包含情境转换(即事件边界)。参与者观看这些片段后,被要求回忆片段中的事件及其顺序。结果表明,θ相位进动出现在情境转换时,并且这种神经现象与记忆检索中的表现息息相关。
θ相位进动指的是神经元相对于脑中θ波振荡逐渐提前放电的现象。这种现象不仅在观看电影时出现,还在回忆阶段持续。研究团队进一步发现,θ相位进动的强度能够预测参与者在回忆事件顺序时的准确性。此次研究首次在人类实验中证实了θ相位进动在情景记忆形成和检索中的关键作用,拓展了神经科学领域对记忆机制的理解。研究发表在 Nature Human Behaviour 上。
#神经科学 #情景记忆 #θ相进动 #神经元 #记忆检索
阅读论文:
Zheng, Jie, et al. “Theta Phase Precession Supports Memory Formation and Retrieval of Naturalistic Experience in Humans.” Nature Human Behaviour, Oct. 2024, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41562-024-01983-9
3D 小鼠大脑图谱提供了更动态的 360 度发育图
宾夕法尼亚州立大学医学院与其他五个研究机构合作,研究团队由Yongsoo Kim教授领导,他们致力于开发一个发育中小鼠大脑的3D参考图谱。该图谱提供了一个标准的空间框架,用于研究大脑的发育过程,特别是神经发育障碍的成因和表现。
研究团队利用核磁共振成像(MRI)和光片荧光显微镜技术,构建了一个跨越胚胎和出生后不同时期的小鼠大脑3D图谱(DevCCF)。这一图谱覆盖了从胚胎11.5天(E11.5)到出生后56天(P56)的七个关键时间点,并通过高分辨率成像技术生成未失真的大脑模板。为了验证该图谱的应用,研究人员聚焦于与精神分裂症、孤独症等疾病相关的GABA能神经元,揭示了这些神经元在胚胎大脑中的出现与发展过程。该研究还将来自Allen脑图谱和空间转录组的细胞类型数据映射到了P56图谱中。这一资源现已通过网络平台公开,旨在降低技术壁垒,促进全球神经科学领域的数据整合与合作。该研究为利用机器学习和人工智能推动大脑研究的下一阶段奠定了基础。研究发表在 Nature Communications 上。
#神经技术 #小鼠大脑发育 #GABA能神经元 #3D图谱 #大脑成像技术
阅读论文:
Kronman, Fae N., et al. “Developmental Mouse Brain Common Coordinate Framework.” Nature Communications, vol. 15, no. 1, Oct. 2024, p. 9072. www.nature.com, https://doi.org/10.1038/s41467-024-53254-w
在家使用经颅直流电刺激治疗抑郁症,也能安全有效
德克萨斯大学休斯顿健康科学中心、伦敦国王学院和东伦敦大学的研究团队联合开展了一项国际研究,评估在家使用经颅直流电刺激(tDCS)设备治疗抑郁症的安全性和有效性。该研究由 Rodrigo Machado-Vieira 和 Cynthia Fu 领导,研究成果为那些对传统药物治疗不适应的患者提供了新的可能。
该研究是一项随机、双盲、安慰剂对照的多地点试验,共有174名中度至重度抑郁症患者参与。参与者被随机分配至主动tDCS组或假治疗组。tDCS设备通过两个电极施加微弱的直流电流,刺激大脑的左背外侧前额皮质和右背外侧前额皮质区域(2 mA),每次治疗持续30分钟。为期10周的治疗显示,主动治疗组的患者在汉密尔顿抑郁评定量表上的分数显著下降,平均改善9.41分,而假治疗组仅改善7.14分。研究结果证明,家庭tDCS治疗在安全性和疗效方面具有高度可接受性。这项技术为中重度抑郁症患者提供了新的、低副作用的治疗选择,特别适合那些难以获得常规治疗的患者。研究发表在 Nature Medicine 上。
#大脑健康 #抑郁症 #经颅直流电刺激 #神经技术 #远程治疗
阅读论文:
Woodham, Rachel D., et al. “Home-Based Transcranial Direct Current Stimulation Treatment for Major Depressive Disorder: A Fully Remote Phase 2 Randomized Sham-Controlled Trial.” Nature Medicine, Oct. 2024, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41591-024-03305-y
恐惧记忆随时间演变的机制或为 PTSD 治疗提供新思路
本项研究由索尼计算机科学实验室、ATR 计算神经科学实验室和东京大学的研究人员共同完成,研究探讨了恐惧记忆的形成和演变机制,研究团队由 Dr. Aurelio Cortese 和 Dr. Ai Koizumi 领衔,揭示了大脑如何在创伤后优先处理联想记忆,并通过时间的推移整合情景记忆。
研究人员使用功能磁共振成像(fMRI)和机器学习算法跟踪参与者在模拟威胁事件中的大脑活动。实验设计通过一种新的情景威胁调节范式,让参与者同时形成两种记忆表征:提示联想和事件顺序。研究发现,恐惧记忆最初依赖联想记忆,这种记忆覆盖范围广,未受事件顺序的限制。然而,在事件发生后的第二天,背外侧前额叶皮层逐渐接管记忆的调节,将事件按时间顺序进行整合,使得恐惧的范围减小。对于焦虑程度较高的人群,这种记忆的整合能力较弱,提示他们在创伤后更容易形成持续的恐惧反应。这一发现为创伤后应激障碍(PTSD)的治疗提供了新的思路,未来干预措施可能会专注于加强情景记忆的整合能力,帮助患者减少创伤后的过度恐惧。研究成果发表在 Nature Communications 上。
#神经技术 #创伤后应激障碍 #恐惧记忆 #情景记忆
阅读论文:
Cortese, Aurelio, et al. “Time-Dependent Neural Arbitration between Cue Associative and Episodic Fear Memories.” Nature Communications, vol. 15, no. 1, Oct. 2024, p. 8706. www.nature.com, https://doi.org/10.1038/s41467-024-52733-4
阿尔茨海默病可能在两个阶段损害大脑
阿尔茨海默病作为老年人痴呆的主要原因,如何损害大脑一直是科学界的重大难题。由美国国立卫生研究院(NIH)和西雅图艾伦研究所的Mariano I. Gabitto和Kyle J. Travaglini带领的研究团队,使用了BRAIN Initiative的创新技术,研究了阿尔茨海默病在大脑不同阶段的影响,揭示了疾病的两阶段损害模型。
该研究通过多组学(multiomics)、空间基因组学(spatial genomics)等先进工具,分析了84位患有不同阿尔茨海默病病理的捐赠者的大脑样本。这些捐赠者包括33名男性和51名女性,平均死亡年龄为88岁。研究团队对中颞回(middle temporal gyrus)区域的细胞类型进行详细研究,发现该区域的神经元在疾病的不同阶段表现出不同的变化。早期阶段,病理增加较为缓慢,炎症性小胶质细胞、反应性星形胶质细胞的活跃,以及抑制性神经元如生长抑素+(somatostatin+)神经元的丧失都与疾病进展相关。随着疾病进入晚期,病理增长显著加速,兴奋性神经元和其他类型抑制性神经元的损失逐渐加重。这些发现不仅在其他阿尔茨海默病研究中得到了验证,还为未来的治疗方向提供了新的启示。该研究发表在 Nature Neuroscience 杂志上。
#大脑健康 #阿尔茨海默病 #神经技术 #细胞分析 #病理研究
阅读论文:
Gabitto, Mariano I., et al. “Integrated Multimodal Cell Atlas of Alzheimer’s Disease.” Nature Neuroscience, Oct. 2024, pp. 1–18. www.nature.com, https://doi.org/10.1038/s41593-024-01774-5
PLD3 和 PLD4 酶揭示 BMP 合成机制,助力神经退行性疾病研究
霍华德休斯医学研究所的Tobias Walther 和 Robert Farese领导的研究团队,揭示了调节大脑脂质水平的关键酶 PLD3 和 PLD4 及其在神经退行性疾病中的作用,可能为额颞叶痴呆(FTD)和阿尔茨海默病的治疗带来突破。
研究团队通过一系列实验发现,双(单酰基甘油)磷酸酯(BMP)是大脑中负责脂质降解的关键磷脂,而 PLD3 和 PLD4 酶在 BMP 的合成中起到重要作用。研究通过删除小鼠体内的 PLD3 或 PLD4 酶,证实了这些酶的缺失会导致神经节苷脂(gangliosides,一种与神经退行性疾病相关的脂质)在脑内堆积,进而引发神经退行性病变。特别是,研究发现 PLD3 的突变不仅与脊髓小脑共济失调等罕见病相关,还增加了阿尔茨海默病的风险。BMP 的独特 S,S 立体化学构象赋予其稳定性,使其能够在溶酶体中维持脂质的正常降解。该研究揭示了 PLD3 和 PLD4 在 BMP 合成中的催化作用,为未来的神经退行性疾病治疗提供了新的方向。该研究发表在 Cell 上。
#大脑健康 #脂质代谢 #神经退行性疾病 #PLD酶 #神经节苷脂
阅读论文:
Singh, Shubham, et al. “PLD3 and PLD4 Synthesize S,S-BMP, a Key Phospholipid Enabling Lipid Degradation in Lysosomes.” bioRxiv: The Preprint Server for Biology, Mar. 2024, p. 2024.03.21.586175. PubMed, https://doi.org/10.1101/2024.03.21.586175
AI 行业动态
苹果AI竞赛失利?内部员工揭露落后两年
苹果近期推出了新款 iPad mini,但这并未掩盖其在人工智能领域的落后问题。根据彭博社记者 Mark Gurman 的报道,苹果内部员工透露,公司的生成式AI技术与行业领先公司相比,落后两年以上。这一消息引发了广泛讨论,许多人质疑苹果在AI赛道上的竞争力。
据报道,苹果的内部研究显示,OpenAI 的 ChatGPT 在准确性上领先苹果的 Siri 25%,并能回答更多的问题。此外,苹果的生成式AI技术目前落后于包括 Alphabet(谷歌)、Meta 和微软等公司。Gurman 指出,虽然苹果新款 iPhone 销售可能依赖于其他因素,但AI并非其核心竞争力。
尽管如此,苹果的资源优势依然不容忽视。该公司可以通过合作或收购来弥补技术差距,且拥有庞大的用户基础和推送新功能的能力。未来,苹果是否能在AI竞赛中赶上竞争对手,仍需观察。
#苹果 #生成式AI #Siri #AI竞赛 #MarkGurman
阅读更多:
https://www.bloomberg.com/news/newsletters/2024-10-20/apple-s-latest-ipad-mini-highlights-ai-advantage-sonos-considers-new-headphones-m2hkz4mn
Gemini并入DeepMind,谷歌重组AI团队
谷歌近期宣布了一项重要调整,将其AI产品线的Gemini团队并入Google DeepMind,进一步整合人工智能研发力量。据悉,此次调整将于下个月开始生效。Gemini团队原本负责谷歌AI面向消费者的应用,而DeepMind由知名研究人员Demis Hassabis领导,主攻通用人工智能系统的开发。
这一变化同时伴随着谷歌高层的调整。Google原搜索和广告产品负责人Prabhakar Raghavan卸任,接任者是谷歌资深高管Nick Fox。Fox自2003年起就在Google工作,此次升任体现了公司对他在AI战略中的信任。
谷歌过去半年一直在整合其AI团队,目标是提升Gemini模型的性能,以在竞争中超越OpenAI和Anthropic等公司。今年早些时候,谷歌已经将Google Brain与DeepMind合并,而现在再将Gemini团队纳入,旨在通过资源整合促进AI技术的创新。Gemini模型自推出以来已经迭代至1.5 Pro版本,具备处理多模态数据的能力,这次整合有望进一步提升其技术能力。
Hassabis在此前的采访中透露,谷歌希望借助这次整合创造新的突破,尤其是在多模态AI和通用人工智能领域。
#Google #Gemini #DeepMind #AI整合 #人工智能
阅读更多:
https://www.bloomberg.com/news/articles/2024-10-17/google-adds-gemini-team-to-deepmind-continuing-ai-consolidation
Newton AI模型:自主发现物理规律的AI基础模型
Archetype AI团队近日推出了一项创新人工智能平台Newton™,这是一种能够通过实时传感器数据(如雷达、摄像头、加速度计、温度传感器等)自主发现物理规律的基础模型。不同于传统的AI,Newton模型不依赖预设的物理定律(如能量守恒定律),而是通过分析传感器数据自行推导出物理现象,展现了AI理解物理世界的新路径。
Newton的最大亮点在于其“零次预测”能力。通过处理从未接触过的物理系统数据,模型可以预测复杂系统的未来行为,例如城市电力需求或工业设备的温度变化。这种不需要提前学习具体物理知识的特性使其具备广泛的跨领域应用潜力。
该模型基于超过5.9亿条开源物理数据样本预训练,涵盖了从流体流动到光学现象等多种物理过程。通过自主学习,Newton展示了超越传统AI模型的泛化能力,为能源管理、工业控制等领域带来了巨大的应用前景。
#NewtonAI #自主学习 #物理规律 #零次预测 #传感器数据
阅读更多:
https://cdn.prod.website-files.com/669fb9b0365257a2d64b9744/671062d53917e78989931495_Phenomenological%20AI%20Foundation%20Model%202024.pdf
Meta FAIR发布新一代AI工具,推动开源与可重复性研究
Meta基础人工智能研究团队(Meta FAIR)于2024年10月18日发布了一系列新的研究成果,包括更新后的Segment Anything Model 2.1(SAM 2.1)和Meta Spirit LM等,旨在实现高级机器智能(Advanced Machine Intelligence, AMI)并推动开源与科学研究的可重复性。此次发布的SAM 2.1不仅改进了遮挡处理能力,还通过增强数据增强技术提升了模型的精度。此外,Meta Spirit LM是一种新型多模态语言模型,可以自然地混合语音和文本,提升了语音生成的表达能力。
此次发布还涵盖了提升大型语言模型性能的Layer Skip技术,及应用于后量子密码学验证的SALSA工具。Meta希望通过这些开源工具,激发研究社区的创新,推动AI技术在多个领域的进步,包括无机材料发现、语音与文本集成等。
这些工具的开放性不仅有助于加速AI领域的研究进展,还进一步验证了Meta在实现AMI以及支持全球AI社区合作方面的承诺。Meta期望这些工具能为未来的技术发展带来更多可能性。
#Meta #SegmentAnything #AI #机器智能 #开源
阅读更多:
https://github.com/facebookresearch/spiritlm
微软率先推出自动化代理工具,抢占市场先机
微软近日发布了其最新的自动化代理工具Copilot Studio,领先于Anthropic。这款工具允许用户创建、管理和连接完全由人工智能驱动的自动化代理,能够代表个人、团队或职能部门执行并协调业务流程。用户无需手动操作,即可让这些代理处理复杂的任务。
Unilever、Clifford Chance、McKinsey & Company、Pets at Home和Thomson Reuters等知名公司,已经开始使用Copilot Studio服务,来提升他们的营销能力、个人合规代理以及防欺诈系统。此外,微软还将在Dynamics 365中新增十个自动化代理,帮助销售、服务、财务和供应链团队提高工作效率。
通过这一举措,微软展示了其在企业自动化解决方案领域的技术优势,有望为各行业的数字化转型提供强大的推动力。
#微软 #自动化代理 #CopilotStudio #Dynamics365 #企业数字化
阅读更多:
https://x.com/Prashant_1722/status/1848339259545244074
AI 研发动态
无监督学习对人类和机器的影响
马克斯·普朗克学会的神经科学家Franziska Bröker领导的研究,着眼于无监督学习在人类和机器学习中的影响。该团队探讨了当缺乏外部反馈时,人类和机器如何自我强化他们的预测,并揭示了这一过程对学习进展的影响。
研究通过对多领域的学习现象进行观察和分析,发现人类和机器在无反馈情况下的学习效果取决于内在预测与实际任务的吻合度。当预测准确时,学习者能够更好地理解和处理新信息,表现出显著的进步;但当预测不准确时,错误的自我强化机制可能使学习者陷入错误的循环。这一现象在包括动物识别、语言学习以及运动技能等领域中都有所体现。
研究指出,尽管无监督学习在某些简单任务中可能有效,但在复杂任务(如语言规则或运动技能)中,外部反馈仍然是不可或缺的,尤其是在初期阶段。此外,研究揭示了自我强化机制在无监督学习中的重要性,强调了在不同情境下,初始理解与任务的匹配程度如何决定学习的成败。研究的成果为未来的教学设计和终身学习提供了新的启示。研究发表在 Trends in Cognitive Sciences 上。
#认知科学 #无监督学习 #自我强化 #学习机制 #反馈作用
阅读更多:
Bröker, Franziska, et al. “Demystifying Unsupervised Learning: How It Helps and Hurts.” Trends in Cognitive Sciences, vol. 0, no. 0, Sept. 2024. www.cell.com, https://doi.org/10.1016/j.tics.2024.09.005
人工智能有望提高医院质量报告效率
随着医疗系统对质量报告的依赖增加,医院需要更高效、准确的方式进行数据处理。加州大学圣地亚哥分校医学院的研究团队与琼和欧文雅各布斯健康创新中心(JCHI)合作,开发了一项试点研究,旨在验证大型语言模型(LLMs)在医院质量报告中的应用潜力。研究由Aaron Boussina博士后领导,参与者还包括Shamim Nemati等人。
该研究通过让LLM系统处理2022年加州大学圣地亚哥健康中心手动报告的100个严重败血症和败血性休克管理包(SEP-1)样本,验证了其在质量抽象中的有效性。传统的SEP-1处理方法需要耗费数周的时间,涉及63个步骤的细致评估,而LLM系统能够在几秒钟内完成相同任务,并且与手动报告结果达成了90%的一致性(κ=0.82)。专家审查发现,LLM系统在一些不一致的病例中,表现优于人工处理,进一步表明LLMs可以帮助减少医院质量报告中的错误和资源消耗。这项研究不仅降低了行政成本,还提升了质量评估的实时性和可靠性,展示了LLM在医疗保健领域的巨大潜力。研究发表在 NEJM AI 上。
#大脑健康 #人工智能 #医院质量 #大型语言模型 #医疗创新
阅读更多:
Boussina, Aaron, et al. “Large Language Models for More Efficient Reporting of Hospital Quality Measures.” NEJM AI, vol. 0, no. 0, Oct. 2024, p. AIcs2400420. ai.nejm.org (Atypon), https://doi.org/10.1056/AIcs2400420
革命性AI助力癌症诊断,精准度达96%
哈佛医学院的研究人员开发了一种名为CHIEF(Clinical Histopathology Imaging Evaluation Foundation)的多功能人工智能模型,能够诊断多种癌症并预测患者的治疗结果,其准确率达到了96%。这一系统不仅可以检测癌细胞,还能预测肿瘤的分子特征,并预测患者的生存情况,远超现有的AI模型。CHIEF的灵活性类似于ChatGPT,通过分析19种癌症类型的组织切片,该系统可辅助医生做出更准确的诊断和治疗决策。
CHIEF是首个在全球多个患者群体中验证患者预后的人工智能模型,能够准确识别肿瘤微环境中的细胞特征,进而预测患者对手术、化疗、放疗和免疫疗法的反应。研究人员指出,该模型不仅提高了癌症诊断的效率,还具备发现新的肿瘤特征的潜力。通过快速识别图像中的基因异常,CHIEF有望为临床医生提供一种快速且经济有效的替代方案,填补现有基因组测序的空白。
研究团队的负责人Kun-Hsing Yu表示,CHIEF在多个癌症类型中的表现令人印象深刻,有望在全球范围内广泛应用,特别是帮助那些无法获得高级医疗资源的地区。该研究发表于 Nature 上。
#癌症诊断 #人工智能 #肿瘤预测 #癌症治疗 #哈佛医学院
阅读更多:
Wang, Xiyue, et al. “A Pathology Foundation Model for Cancer Diagnosis and Prognosis Prediction.” Nature, Sept. 2024, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41586-024-07894-z
罕见病新希望:哈佛AI模型助力发现17000种治疗药物
哈佛医学院研究团队近期发布了一项重大突破,他们与合作者共同开发了一款名为TxGNN的人工智能(AI)模型,专门用于识别罕见疾病和无药可治病症的候选药物。这款基于图神经网络(GNN)的模型已从现有药物中筛选出超过17000种疾病的潜在治疗药物,展示了药物再利用的新潜力。
罕见病患者面临着药物短缺的困境,传统药物开发周期长且成本高昂,而TxGNN通过嵌入医学知识图谱,能够在现有药物和疾病的复杂关系中找到潜在的治疗方法。与其他方法相比,TxGNN的候选药物识别能力提升近50%,禁忌症预测的准确率也高出35%。
此外,TxGNN特别设计了一个解释模块,能够展示药物与疾病之间的潜在联系,让医生和研究人员追溯预测的科学依据。这一功能极大提高了模型在医学应用中的可信度。
TxGNN的开发为罕见病药物发现带来了革命性突破,尤其是在超过95%罕见病无现有治疗药物的情况下,为未来加速药物开发提供了新的方向。研究发表在 Nature Medicine 上。
#人工智能 #罕见病 #药物再利用 #哈佛医学院 #TxGNN
阅读更多:
Huang, Kexin, et al. “A Foundation Model for Clinician-Centered Drug Repurposing.” Nature Medicine, Sept. 2024, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41591-024-03233-x
大语言模型在医疗诊断中易受认知偏差影响
由于医疗领域的认知偏差常常导致诊断和决策错误,研究团队希望通过改进大语言模型(LLMs)来帮助解决这一问题。该团队来自哈佛大学医学院和麻省理工学院的研究人员,专注于如何提高 LLMs 在医疗场景下的鲁棒性,特别是在面对真实世界复杂互动的场景时,减少认知偏差对决策的影响。
研究团队开发了一个名为 BiasMedQA 的数据集,包含 1273 个从美国医疗执照考试(USMLE)问题中修改的问题,以模拟常见的临床认知偏差。这些偏差包括确认偏差、锚定偏差和现状偏见等。研究测试了 6 个大型语言模型(LLMs),包括 GPT-4 和 Llama 2 70B-chat。结果显示,尽管 GPT-4 在抵御这些偏差方面表现较好,其准确率相对保持稳定,但 Llama 2 70B-chat 和 PMC Llama 13B 的表现大幅下降,出现了 10% 到 26% 的准确性下降。
此外,研究还提出了三种减少认知偏差影响的策略,尽管这些策略提高了模型的准确性,但仍未能完全恢复其准确性。研究结果表明,LLMs 在实际临床应用中的表现可能会比标准化考试中的表现更差,需要进一步提高其对认知偏差的鲁棒性。此研究发表在 Npj Digital Medicine 上。
#神经技术 #认知偏差 #医疗语言模型 #偏差缓解 #诊断准确性
阅读更多:
Schmidgall, Samuel, et al. “Evaluation and Mitigation of Cognitive Biases in Medical Language Models.” Npj Digital Medicine, vol. 7, no. 1, Oct. 2024, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41746-024-01283-6
整理|ChatGPT
编辑|丹雀、1900、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。
TCCI建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括学术会议和交流、夏校培训、AI驱动科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。