IEEE'24 | 从黑箱到透明！解锁大脑秘密：3D-PIUNet在神经科学中的三维重建！

科技 2024-11-09 00:01 江苏

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

来源：3D视觉工坊

添加小助理：cv3d001，备注：方向+学校/公司+昵称，拉你入群。文末附3D视觉行业细分群。

扫描下方二维码，加入「3D视觉从入门到精通」知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！

0.这篇文章干了啥？

这篇文章提出了一种名为3D-PIUNet的混合方法，用于解决源定位等逆问题。该方法结合了物理建模和深度学习的优势，通过未学习的物理伪逆和直接在源空间操作的3D卷积网络相结合，显著提高了重建精度和噪声鲁棒性。实验结果表明，3D-PIUNet在各种噪声条件、源大小和数量下表现优于当前的最先进方法，且能够有效预测稀疏和扩展的源。尽管存在对数据质量的依赖和时间动态的忽视等限制，研究者认为此方法有助于深入理解大脑功能，并在神经疾病诊断等临床应用中具有潜在价值。

下面一起来阅读一下这项工作~

1. 论文信息

论文题目：Enhancing Brain Source Reconstruction through Physics-Informed 3D Neural Networks

作者：Marco Morik, Ali Hashemi等

作者机构：The Berlin Institute for the Foundations of Learning and Data等

论文链接：https://arxiv.org/pdf/2411.00143

2. 摘要

脑源重建是神经科学中的一个基础性挑战，对理解脑功能及其障碍具有重要意义。脑电图（EEG）信号具有较高的时间分辨率，但由于问题的病态结构，难以准确确定这些信号的脑源空间位置。传统方法主要依赖人工设计的先验知识，缺乏数据驱动学习的灵活性；而最近的深度学习方法则专注于端到端学习，通常仅在生成训练数据时使用前向模型的物理信息。我们提出了一种新的混合方法3D-PIUNet用于EEG源定位，有效地整合了传统方法和深度学习技术的优点。3D-PIUNet从基于伪逆的物理引导初始估计开始，将测量数据映射到源空间。其次，通过将大脑视为三维体积，我们使用三维卷积U-Net捕捉空间依赖关系，并根据学习到的数据先验优化解。在模拟的伪真实脑源数据上训练模型，涵盖不同的源分布。通过该数据训练后，我们的模型显著提升了空间精度，表现优于传统方法和端到端数据驱动方法。此外，我们通过视觉任务的真实EEG数据验证了我们的结果，3D-PIUNet成功识别了视觉皮层并重建了预期的时间行为，从而展示了其实用性。

3. 效果展示

我们创造了不同的大脑激活环境。从左到右，我们有1。具有最小宽度（10mm）的单个有源源，2.4个有源源，具有最小宽度，3.单个中等尺寸（20mm）有源源，4.单个大有源源（80mm），以及5.具有4个不同大小的活动源的多样化样本，其中两个源部分重叠。

来自3D-PIUNet、全连接网络和eLORETA的地面实况激活和重建，用于SNR为0 dB的顶部单个有源源和SNR为40 dB的底部3个有源源。3D-PIUNet将事先学习的数据合并，并细化活动区域的形状以匹配地面实况。当多个信号源处于活跃状态时，它会集中在最强的信号源上，而忽略大脑其他部分的弱激活。

4. 主要贡献

提出了混合方法3D-PIUNet，将前向模型的物理信息通过其伪逆解引入深度学习框架；
展示了在源空间中利用三维卷积学习空间模式的优势；
在多种情境下对我们的方法进行了广泛的基准测试，展示了其在不同的信噪比、源数量和源大小条件下相较于经典方法和端到端方法的优越性。

5. 基本原理是啥？

3D-PIUNet 的基本原理结合了物理建模和深度学习：

混合方法：3D-PIUNet 采用了一种混合模型，结合了未学习的基于物理的伪逆方法和经过学习的3D卷积神经网络（CNN）。伪逆方法利用物理模型的知识来进行初步计算，而 CNN 则用于精细化这些计算结果，从而提高预测精度。推荐课程：基于深度学习的三维重建MVSNet系列 [论文+源码+应用+科研]
源定位：该模型的核心任务是源定位，旨在从脑电图（EEG）等信号中重建脑活动源的位置。通过使用深度学习网络，3D-PIUNet 可以在源空间中直接处理信号，捕捉更复杂的空间模式和非线性关系。
噪声鲁棒性：3D-PIUNet 展示了对不同噪声水平的鲁棒性，能够在高噪声环境中依然进行有效的源定位。这一特性使得该方法在实际应用中更加可靠。
空间和时间特性：尽管当前版本主要关注空间特性，但其设计理念是可以扩展的，未来可以考虑将时间域信息纳入模型，以提高对动态神经活动的捕捉能力。
性能提升：通过将物理知识与数据驱动的方法结合，3D-PIUNet 能够在不需要针对不同类型源进行特定训练的情况下，有效预测稀疏和扩展源，提高了重建的准确性。

6. 实验结果

A. 视觉结果

在单一活跃源的情况下，通过比较eLORETA和3D-PIUNet的预测，3D-PIUNet的重建显示了对eLORETA解的明显改进，能够更准确地捕捉到真实源的空间范围和峰值激活。

B. 信噪比的影响

实验系统地改变信噪比（SNR），从高噪声设置（0dB）到几乎无噪声的观察（40dB）。在所有评估的指标（如地球移动者距离（EMD）、均方误差（MSE）和加权余弦相似度）中，3D-PIUNet在高于10dB的SNR水平上显示出优于全连接网络（FCN）的性能，表明U-Net架构能够更好地利用高SNR数据中的附加信息。

C. 源的大小

3D-PIUNet在不同大小的活跃源上表现出色，尤其是在10mm的小型源上，低EMD表明其预测接近正确源。尽管高归一化MSE显示出没有任何方法在体素级别完美匹配源，但3D-PIUNet对于源大小的变化表现出鲁棒性，能够有效处理稀疏和分散源。

D. 源的数量

在20dB的中等噪声设置下，3D-PIUNet在源数量增加时仍然优于FCN，但随着源数量的增加，性能有所下降，特别是在归一化EMD方面。相较之下，eLORETA的表现保持相对稳定，因为其将估计的源活动平滑分布在整个源空间中。

E. 对真实数据的可转移性

使用预训练模型在真实数据（如THING-EEG2数据集）上验证3D-PIUNet。通过对多个相同图像呈现的EEG信号进行集成平均，3D-PIUNet在激活预测方面表现出色，能够清晰地捕捉到视觉皮层的主要激活。

F. 计算效率

尽管3D-PIUNet提供了更好的重建准确性，但其训练时间为5小时，推理速度虽然比FCN慢，但仍在1秒内完成推理，表现出卷积网络的参数效率。

7. 总结 & 未来工作

逆问题，如源定位，由于其病态特性而 notoriously 难以解决。尽管端到端学习模型（如神经网络）对该领域的近期进展有所贡献，但我们提出了一种混合方法——3D-PIUNet，结合了基于物理的建模和深度学习的优势。3D-PIUNet将未学习的基于物理的伪逆与直接在源空间中操作的学习型3D卷积网络相结合。这种协同作用实现了显著的性能提升，即使使用标准头模型。我们的结果表明，与当前的最先进方法相比，重建准确性和噪声鲁棒性得到了增强，能够有效预测稀疏和扩展源，而无需针对不同类型进行特定训练。这一进展可能为深入了解大脑功能提供更深的洞察，并为临床应用的改进铺平道路，例如诊断神经系统疾病。

数据先验的质量高度依赖于用于训练模型的仿真。尽管我们使用了多样的仿真设置，变化的源大小和数量，但我们对源形状施加了高斯先验，未来的工作中可以用更现实的假设替代，以细化先验。此外，结合源之间已知的相关结构可能进一步改善学习到的先验。此外，我们关注源定位的空间方面，忽视了时间动态。由于单次测量所包含的信息有限，纳入时间域可能会进一步提高准确性，特别是在区分多个活动源时。然而，所提的混合方法是通用的，结合伪逆和深度学习的核心思想也可以适应包含时间域，这是我们计划在未来工作中探索的方向。像许多先进的学习方法一样，所提出的3D-PIUNet在可解释性方面也存在挑战。神经网络虽然效果显著，但有时被视为“黑箱”。在未来的研究中，我们旨在整合最近在神经网络可解释性方面的进展，以增强基于神经网络的源定位方法的透明度和可靠性。

本文仅做学术分享，如有侵权，请联系删文。

3D视觉交流群，成立啦！

目前我们已经建立了3D视觉方向多个社群，包括2D计算机视觉、最前沿、工业3D视觉、SLAM、自动驾驶、三维重建、无人机等方向，细分群包括：

工业3D视觉：相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM：视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶：深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建：3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机：四旋翼建模、无人机飞控等

2D计算机视觉：图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿：具身智能、大模型、Mamba、扩散模型等

除了这些，还有求职、硬件选型、视觉产品落地、产品、行业新闻等交流群

添加小助理: cv3d001，备注：研究方向+学校/公司+昵称（如3D点云+清华+小草莓）, 拉你入群。

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球，已沉淀6年，星球内资料包括：秘制视频课程近20门（包括结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云等）、项目对接、3D视觉学习路线总结、最新顶会论文&代码、3D视觉行业最新模组、3D视觉优质源码汇总、书籍推荐、编程基础&学习工具、实战项目&作业、求职招聘&面经&面试题等等。欢迎加入3D视觉从入门到精通知识星球，一起学习进步。

▲长按扫码加入星球

3D视觉工坊官网：www.3dcver.com

具身智能、3DGS、NeRF、结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测、BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制、无人机仿真、C++、三维视觉python、dToF、相机标定、ROS2、机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap、线面结构光、硬件结构光扫描仪等。

3D视觉模组选型：www.3dcver.com

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

3D视觉科技前沿进展日日相见 ~

http://mp.weixin.qq.com/s?__biz=MzU1MjY4MTA1MQ==&mid=2247710158&idx=3&sn=f892dd5bf9719b608d18c94137767a2c

3D视觉工坊

专注于工业3D视觉、SLAM、自动驾驶、三维重建、无人机、具身智能、扩散模型等前沿技术分享与产业落地，力争打造为国内最专业的3D视觉社区。官网：www.3dcver.com 佳v：cv3d007 或 13451707958

最新文章

谷歌2024博士奖学金名单公布

还在用3DGS？更快、更真、更准的3DLS即将开源！

彻底搞懂扩散模型数学基础剖析、公式推导、代码讲解

最新 IROS 2024：实时调整，灵活抓取！大语言模型赋能机械臂抓取

机器学习中有哪些形式简单却很巧妙的idea？

高精度三维重建，KW-P 3D相机能行吗？

彻底解决尺度漂移！浙大新作BEV-ODOM：使用BEV增强单目VO！定位精度SOTA！

用深度强化学习实现机械臂抓取，请问大家都是怎么做的仿真？现在有点迷茫?

为什么现在的 AI 大模型好像只有中美在做，世界上其他国家都好像完全消失了？

已注销！985新校区，不建了

COLMAP即将Out！图像没有任何重叠也能估计位姿！爆拉LoFTR & Dust3D十倍精度！

突破维度限制！GenXD：拿捏真实通用3D、4D生成！

给工坊的深度相机精度排个名，JD-500第6，第一名没有争议！

3D视觉课程&硬件汇总

国内外高校具身智能实验室汇总（国内、北美、欧洲篇）

告别CAD模型依赖！GS2Pose：用3D高斯点云重塑6D姿态估计！

UC伯克利开源！深度估计、光流、分割大一统！

配套源码！让VINS-Mono原地起飞！转弯也不跟丢！

结构光视觉如何用于工件位置和姿态测量，与双目视觉相比有何优劣势？

三维重建 3D reconstruction 有哪些实用算法？

持续提高SuperPoint+LightGlue匹配质量！万能辅助！任何情况都不会对结果产生负面影响！

NeurlPS'24开源 | Point-PRC：全新通用点云分析框架！

魔改一个loss可以发啥水平的文章?

新文章提出取消作者姓名排序，人人都是一作，你赞同这种署名方案吗？

复旦&蔚来开源DG-SLAM：第一个动态环境下的鲁棒GS SLAM！

更智能！更高效！国科大重磅！无人机视角下的目标识别：UEVAVD数据集与IBE-MAP策略

学LLM大模型算法，简历上写了“精通大模型”后......

为什么说px4仍然是无人机控制的核心？

NeurIPS'24开源 | 无惧遮挡！多实例点云配准新SOTA！简单而强大的3D聚焦和匹配网络

ECCV 2024 oral | 通过跟踪实现在线高清地图重建，达到SOTA性能！

全局与局部提示分离！GlocalCLIP：零样本异常检测！实现跨领域异常检测的高效突破！

各位被拒稿的理由都是啥？

MIT全新开源！回环准确性和语义一致性SOTA！SEO-SLAM：视觉SLAM的语义增强！

NeurIPS'24 | 端到端！英伟达全新LSM框架：从无姿态图像到语义3D重建！

AIGC是否会颠覆未来的生产模式？普通人如何利用AI提高效率？

国内 AI 大模型已近 200 个，为什么没有一个比的上 GPT-4o？

MIT开源！轨迹精度暴涨37%！ROMAN：无惧特征稀疏和感知混淆，超鲁棒的全局定位！

精度0.05mm！一款轻量化DLP单目结构光3D相机

李飞飞团队新作：空间智能版ImageNet来了！

研二计算机视觉方向，没有idea也不会写代码，该怎么办？

具身智能、扩散模型、大模型微信交流群成立啦！

2024年图像匹配挑战赛：银牌解决方案！

1W | 飞行器和地面车辆线路协同巡检项目(租借进行演示)

无惧透明物体！重新思考曲面重建：NeuS再升级！（中科院&NTU重磅开源）

站在AI前沿！为什么现在是学习LLM算法工程师的最好时机？

请问有哪些计算机视觉 CCF-B、C 类期刊和会议比较容易中稿？

今年毕业，要不要选3D视觉这个赛道？

比LoFTR快5倍！比LightGlue精度高20%！ETO：超快局部特征匹配！（浙大章国锋团队）

在所有基准创下新高！微软开源PF3plat：无需位姿先验，全新3DGS重建和新视角合成框架！

当审稿人给的意见，你无法修改的时候怎么办？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉