学生党狂喜，物理图表动起来！受力分析、光学、电路图等全自动交互

科技 2024-11-09 10:13 北京

新智元报道

编辑：LRS

【新智元导读】增强物理（Augmented Physics）可以将物理教科书中的静态图表转换成交互式模拟的工具，通过动态图示、双向绑定和参数可视化等增强策略，为学生提供了一个更直观、更个性化的物理学习体验，能够帮助学生更好地理解和掌握物理概念。

在上物理课的时候，大家应该都有过那种「图太抽象了」的体会吧，需要靠空间想象力才能感受到出题人的想法。

而在电子教学时代，物理图可以是动态、可交互的，有助于更深入地理解复杂原理，能够比教科书或视频提供更丰富、更难忘的学习体验，也可以让学生更积极参与到复杂概念的实验中，

但是创建交互式模拟既耗时又需要大量的编程工作，所以大部分教学场景只能用已经制作好的模拟图，有时无法完全满足学生对学习材料的特定需求，甚至切换教科书和外部交互视频的过程还会分散学生注意力。

最近，卡尔加里大学、科罗拉多大学博尔德分校及Adobe的研究人员提出了一个全新的方法增强物理（Augmented Physics），通过从静态教科书图表中提取和增强内容来创建交互式物理模拟；利用「Segment-Anything」和多模态LLM等先进的计算机视觉技术，可以半自动地从教科书页面中提取图表，并基于提取的内容生成交互式模拟。

论文链接：https://arxiv.org/pdf/2405.18614

简单来说，这种增强实验的功能就像是给教科书里的静态图像增添了生命力，学生们不再只是被动地阅读和观看图像，而是能够亲手操作这些图像中的元素，进行实验。

比如，学生可以把一个物体在虚拟的模拟环境中移动到透镜旁边，亲眼看到图像是如何变化的。在电路的学习中，也可以调整电路中的电压和电阻，实时看到电流的变化，这样的互动方式使得学习过程更加直观和有趣。

该系统可以支持各种类型的模拟，如牛顿运动、光学、电路和循环动画，并通过简单的创作过程，用户可以选择图表中的特定对象进行分割，操纵分割对象，并调整参数值以动态与模拟结果互动。

体验感最好的是，交互式视觉输出直接通过基于网络的界面无缝叠加到教科书PDF上，学生可以很方便地学习、实验，而无需寻找外部材料。

通过与七位物理教师的引导研究，文中探索了四种关键的增强策略：增强实验、动画图表、双向绑定、参数可视化，然后通过对系统进行技术评估、可用性研究（N=12）和专家访谈（N=12）来评估系统，结果表明，该系统可以促进物理教育中更具吸引力和个性化的学习体验。

增强物理：系统设计

步骤1：导入教科书图表

用户通过网页界面导入图表，系统支持包括桌面和移动设备，用户也可以上传教科书页面的PDF文件，或者使用智能手机拍摄并上传教科书页面的照片。

步骤2：选择模拟类型

导入图表后，系统会要求用户从可用选项中选择模拟类型：运动学、光学和电路；系统还额外提供动画选项，以适用于不需要特定模拟类型的场景。

步骤3：分割图像

用户通过在图表上选择特定区域（用方框或点选）来启动分割。

例如，用户可能选择一棵树和一个透镜，从光学相关的图表中分割出这些对象。在另一个例子中，用户可以分割与牛顿运动相关的图表中的各种对象，如物体和斜坡；用户还可以分割一条线来提取路径，创建跟随线条的动画。

步骤4：为分割对象分配角色

分割完成后，用户为每个分割的对象分配一个标签，在模拟中提供特定角色；系统为每种模拟类型提供了一组可用的角色，供用户选择。

例如，在光学模拟中，用户可能将一棵树标记为要投影的物体，将透镜简单地标记为透镜，将一个点标记为焦点。

在与重力相关的情境中，分割的项目可以被分类为受重力影响的动态物体，或保持静止的静态物体，还可以使用弹簧或绳子等标签用于运动学图表；对于电路模拟，系统使用图像识别自动对对象（如电阻和电池）进行分类。

步骤5：生成和运行模拟

用户分割图像并分配角色后，系统会将分割的图像转换成具有适当物理属性的多边形，生成模拟。

系统可以精确复制滑雪者和斜坡，分别创建动态和静态物体的多边形，能够确保模拟与原始图表无缝集成，实现形状和位置的对齐；用户可以通过点击运行按钮或与渲染的多边形互动来启动模拟，观察动态的视觉输出，点击模拟对象，并选择更改参数。

步骤6：通过参数操作与模拟互动

用户可以灵活地调整模拟内的参数。根据不同的角色，不同的对象带有各种参数，如动态物体的质量、静态物体的摩擦力和弹簧的力常数。

系统可以在文本或图像中识别参数值，使用户能够操纵页面上的数值。例如，在电路模拟中，用户可以修改电阻和电池的值，动态更改模拟结果；系统自动将文本中的数值与模拟中对象的特定属性链接起来，用户可以编辑这些属性。

增强特性

动态图示（Animated Diagrams）

提供了一种创建循环动画的方法，用户可以为分割对象指定路径，然后创建模拟运动的动画。

通过分割对象并为动画定义路径，可以让光线根据角度的不同而沿着各种反射路径传播，该特性也使得用户能够直接从教科书内容中创建出有吸引力的动画，比如地球绕太阳旋转；并且与受限于可用模拟的增强实验不同，动态图示可以应用于任何图示。

双向绑定（Bi-directional Binding）

作者可以将文本中的参数值与相关的模拟实验相链接，学生能够直接在文本中调整这些值，并实时观察变化。

刚开始的时候系统会识别并高亮显示提供的图像中的所有数字供作者选择，然后作者可以从文本中选择一个特定的数值，并通过一个下拉菜单为其分配一个模拟属性，菜单中显示所有可用的属性。

上图中，用户将文本中的值绑定到压缩属性上，系统能够使用这个值来模拟场景，然后通过改变弹簧的压缩程度，为学习者提供了一种直观的方式来理解参数变化对实验结果的影响。

参数可视化（Parameter Visualization）

系统通过一个基本的时间序列图表来实现，可以让作者通过动态图表来展示选定的值，比如用户观察到一个图表，描绘摆锤在接近其平衡位置时，其角度在简谐运动中的变动。

该功能类似于一个动态的进度条，以图形的方式展示了某个变量（比如摆锤的角度）随时间的变化情况，帮助用户更直观地理解动态过程中的数值变化。

实验结果

根据技术评估结果，不同模拟组件的成功率为：运动学为64%，光学为44%，电路为40%（62%经过轻微编辑后成功），动画为66%；其中对象分割的成功率高达86%

其中对象分割的成功率高达86%，也显著促进了运动学、光学和动画组件的相对更高成功率，在运动学中，多边形生成和放置的成功率分别为72%和70%，通过适当的分割有效地转换成了可进行物理模拟的实体。

然而，由于某些特性的支持限制（6%），如旋转运动、特定物体的重力、不支持的物体如绳索，以及模拟曲面平滑性的问题，运动学模拟仍然有困难。

此外，有74%的图表仅需要进行轻微调整，如修改模拟参数才能获得准确的模拟结果，没有任何创作和修改过程的成功率为40%；尽管使用了相同的「Segment Anything」技术，线分割的成功率却较低。

电路模拟流程采用线检测方法来定位和识别导线，并结合Gemini模型来检测符号，其中线检测的成功率较低为45%，导致整体模拟成功率在进行轻微连接编辑后为62%；没有任何编辑的情况下，流程的成功率为40%，主要是因为图表中的导线重叠或交叉，而符号识别的准确度相当高为72%

参考资料：

https://arxiv.org/pdf/2405.18614

http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652537315&idx=3&sn=35764e0fc20410cbe628166597d629c0

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

周鸿祎黑客短剧震撼首秀，直接带火纳米搜索！搜学写创，开启AI搜索3.0时代

数字孪生心脏全球首次实现0.84秒超实时模拟！智源突破计算极限，180倍性能提升

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

当AI创造AI，就是库兹韦尔「奇点」临近时？人类正处于自我改进AI爆炸边缘

招人！新智元邀你勇闯ASI之巅

十年再登巅峰！刚刚，Ilya和GAN之父斩获NeurIPS 2024时间检验奖

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

招人！新智元邀你勇闯ASI之巅

Sora半夜泄露3小时，物理效果惊人！奥特曼急拔网线，艺术家抗议被白嫖

逃回大厂！谷歌天才科学家Yi Tay——639天创业血泪史

打破LLM数据孤岛！Anthropic革命性MCP让大模型解锁全网数据，AGI要来了？

AI视频两巨头开战！Runway秒生现实大片，Luma动嘴创作电影

「学术版ChatGPT」登场！Ai2打造科研效率神器OpenScholar，让LLM帮你搞定文献综述

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

招人！新智元邀你勇闯ASI之巅

GAN之父新冠后惊传罹患双重顽疾！听力减退心动过速，全网求医

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超4500种任务

世界模型挑战赛，单项奖金10000美元！英伟达全新分词器助力下一帧预测

招人！新智元邀你勇闯ASI之巅

Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

扩散模型=进化算法！生物学大佬用数学揭示本质

招人！新智元邀你勇闯ASI之巅

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

英特尔错失AI芯片浪潮，从放弃收购英伟达开始

一只暹罗猫竟是论文作者！谷歌学术20岁，创始人首次公开最魔幻学术故事

招人！新智元邀你勇闯ASI之巅

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

5年浴火，800余岁巴黎圣母院重生！马斯克激动转发，AI数字建模创奇迹

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

机器人训练数据不缺了！英伟达团队推出DexMG：数据增强200倍

招人！新智元邀你勇闯ASI之巅

全面进攻谷歌！OpenAI被曝打造浏览器，已挖Chrome创始大牛

预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

世界最大AI Agent生态系统！微软推出全新「自主AI智能体」，10万企业工作流被改变

招人！新智元邀你勇闯ASI之巅

OpenAI看好的方向，文心智能体技术抢先爆发！

「全球最严榜单」，阶跃拿下中国TOP 1！杀入世界前五，超过GPT-4o紧跟o1-mini

收敛速度最高8倍，准确率提升超30%！华科发布MoE Jetpack框架 | NeurIPS 2024

405B大模型也能线性化！斯坦福MIT最新研究，0.2%训练量让线性注意力提分20+

招人！新智元邀你勇闯ASI之巅

美国AI曼哈顿计划793页文件曝光！全力研发AGI，十大战略直指中国

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉