一周AI丨AI助巴黎圣母院重生;OpenAI拟自研浏览器;谷歌云推新智能体平台;英伟达开源AI制药框架;Kimi发布推理模型……

科技   2024-11-22 18:13   上海  


要闻列表

AI万象

AI数字建模奇迹,5年浴火800余岁巴黎圣母院重生!


反电话诈骗有奇招!英国电信巨头打造AI老奶奶遏制网络诈骗

大平台动作

OpenAI考虑开发AI浏览器,已聘请2位Chrome浏览器创始人


谷歌云推出新智能体平台:AI Agent Space


英伟达开源AI制药框架,扩大全球生物制药和科学行业的规模


三星推出全新Gauss 2 AI模型或将成为下一个Galaxy大脑


全新突破!YouTube Shorts上线AI视频背景生成功能

新力量崛起

Kimi正式发布数学推理模型k0-math


AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互

投融资风向

Gyges Labs完成数千万元Pre-A轮融资,AI智能硬件迎来新风口





01

AI数字建模奇迹,5年浴火800余岁巴黎圣母院重生!




AI万象


时隔5年,巴黎圣母院终于完成修复,将在12月7日重新开放。在这场耗资7亿欧元的浩大工程中,3D建模等关键AI技术发挥了关键作用,让历经800多年沧桑的教堂与现代科技完美融合。


重建工程的一大技术亮点是数字孪生技术的运用。知名设计软件公司Autodesk受邀开发了巴黎圣母院的数字模型。团队在现代建筑信息模型(BIM)软件和云计算技术的支持下,完成了包含12000个对象、超30000平方米石墙、3900多平方米铅制屋顶以及186个教堂拱顶的精确建模工作。


更为关键的是,设计公司Art Graphique et Patrimoine(AGP)在大火前就完成了教堂内部结构的详细数字扫描。这些珍贵的数据为重建工作提供了重要参考。修复团队采用激光扫描技术,以1-2毫米的精度每秒采集数十万个数据点,确保了重建工作的精准性。


整个修复工程堪称传统工艺与现代科技的完美融合。修复团队使用了2400棵橡树重建屋顶,同时对2000多座雕塑和装饰物进行了精心修复。通过3D建模技术,工程师们不仅能评估建筑结构的稳定性,还能模拟不同的照明方案,优化施工设备的布置。


11月8日,巴黎圣母院北钟楼的钟声再次响彻巴黎上空,象征着这座古老建筑的重生。如今,教堂内部的中殿已经焕然一新,座椅和礼仪家具排列整齐,标志性的玫瑰窗重现往日光彩。


新闻拓展:

‍https://mp.weixin.qq.com/s/fMvymGzd91yyjVdcj8dwhA




02

反电话诈骗有奇招!英国电信巨头打造AI老奶奶遏制网络诈骗




AI万象


英国移动运营商Virgin Media O2日前推出了一项创新的反诈骗技术——一个名为"Daisy"的AI虚拟奶奶,专门设计用来应对日益猖獗的电话诈骗。这位虚拟奶奶的唯一任务,就是接听诈骗电话并尽可能拖住骗子的时间。


当诈骗分子拨打运营商设置的特定号码时,这位"难以与真人区分"的AI机器人就会接听电话。据O2透露,他们利用多项前沿AI技术和模型训练了这位听起来像老年女性的聊天机器人,著名的反诈YouTuber Jim Browning也参与了训练过程。


整个通话过程完全自动化:AI会实时监听并将来电者的语音转换为文字,随后通过定制的大语言模型和角色性格层生成回应,最后再经由AI语音合成模型转化为自然的对话语音。这一切都在实时进行,无需人工干预。


虽然Daisy听起来像是一位容易上当的老年人,但她实际上是诈骗分子的噩梦。她可能会漫无边际地讲述孙子们的故事或自己的兴趣爱好,表现出对技术的一无所知,或者提供一些毫无用处的虚假银行信息。不管采用哪种方式,她的目的只有一个:耗费诈骗者的时间,让他们无暇去骚扰真实的受害者。


据悉,英国有67%的人担心成为诈骗受害者,每周有四分之一的人经历某种程度的诈骗。O2希望通过Daisy缓解当前局面,遏制网络诈骗。


新闻拓展:

https://news.virginmediao2.co.uk/o2-unveils-daisy-the-ai-granny-wasting-scammers-time/




03

OpenAI考虑开发AI浏览器,已聘请2位Chrome浏览器创始人




大平台动作


11月22日,据Information报道,OpenAI最近考虑开发一款网络浏览器,并计划将其与聊天机器人结合使用,同时还单独讨论或达成了一些协议,为旅游、食品、房地产和零售网站提供搜索功能。


几个月前,OpenAI聘请了Chrome团队的创始成员Ben Goodger,表明其对浏览器的兴趣。另一位最近加入的是Darin Fisher,他与Goodger一起开发了 Chrome。


OpenAI已与网站和应用程序开发商,如康泰纳仕(Condé Nast)、Redfin、Eventbrite和Priceline讨论了搜索产品。据知情人士透露,OpenAI还与三星这家Google的重要业务合作伙伴讨论了在其设备上提供人工智能功能,类似于最近与苹果达成的协议。


OpenAI本月初在ChatGPT中新增了搜索功能,正式进军搜索领域。这一功能使用第三方搜索技术,并结合合作伙伴直接提供的内容,为用户快速提供最新信息及相关链接。其背后的技术依托于微调后的GPT-4模型,目前已向ChatGPT Plus和Team/用户开放,未来将逐步覆盖企业、教育机构和免费用户。


与此同时,OpenAI已与包括美联社、《金融时报》、赫斯特、《时代》杂志等在内的众多新闻出版商达成合作,收集搜索功能的反馈,允许合作伙伴选择是否出现在搜索结果中。这种与内容提供商的广泛合作,不仅增强了OpenAI的内容资源库,还进一步巩固了其在搜索市场中的竞争力。


新闻拓展:

https://mp.weixin.qq.com/s/OfG9P_sM3Hu2whjPEmQYAg




04

谷歌云推出新智能体平台:AI Agent Space




大平台动作


随着微软、亚马逊等竞争对手不断推出创新工具,谷歌云周三推出了一个新的AI Agent Space,目的是让客户能够更轻松地找到并部署合作伙伴构建的人工智能代理。


人工智能代理也被称为代理式人工智能,是全球增长最快的人工智能细分市场之一。IT研究公司Gartner预测,到2028年,至少15%的日常工作决策将通过代理式人工智能自主完成,而2024年这一比例为零。


AI Agent Space的推出标志着谷歌云在企业服务领域的进一步布局。通过这一新生态,谷歌为合作伙伴提供了丰富的工具和资源,包括其AI技术的早期预览、工程团队的直接支持和开发最佳实践,以帮助他们开发高度可定制的AI代理。此外,谷歌还计划在其Google Cloud Marketplace上推广新代理,帮助合作伙伴将其开发的代理推广至更广泛的受众。


目前,已知的一些企业应用案例包括克森美孚、德勤、普华永道等。不过,谷歌的AI代理空间在数量上仍落后于竞争对手。目前在AI Agent Space中仅有19种不同的代理模型,而微软、SAP和Salesforce等公司已推出数百甚至上千种AI代理解决方案。虽然谷歌在不断承诺未来会增加更多代理,但当前的数字仍显得较为稀少。


新闻拓展:

https://cloud.google.com/blog/topics/partners/build-deploy-and-promote-ai-agents-through-the-google-cloud-ai-agent-ecosystem-program




05

英伟达开源AI制药框架,扩大全球生物制药和科学行业的规模




大平台动作


英伟达11月19日宣布,其开源的BioNeMo™生物分子AI框架在制药领域获得广泛应用,吸引了大批制药公司、生物科技创新者和AI研究人员的关注。这一框架的推出,标志着AI辅助药物研发正式进入超算时代。


作为一套专门面向生物分子研究的AI工具集,BioNeMo框架为制药行业带来了革命性突破。研究人员可以借助该框架大幅提升AI模型的运算规模,更高效地分析海量数据集,显著加快新药设计和开发进程。


英伟达还推出了端到端的BioNeMo平台,将AI药物研发的全流程整合到一个统一的系统中。该平台包含三大核心组件:基础性的BioNeMo框架、用于安全可扩展AI推理的NVIDIA NIM™微服务,以及面向实验室和计算工作流的优化参考设计BioNeMo Blueprints。


在微服务方面,英伟达为BioNeMo新增了多个重要功能,支持AlphaFold2蛋白质结构预测、DiffDock2.0分子取向预测等业界领先模型。同时还集成了RFdiffusion和ProteinMPNN,可加速治疗用途的新型蛋白质设计。


值得注意的是,BioNeMo Blueprints提供了可定制的参考AI工作流,帮助开发者将AI部署扩展为企业级生产流水线。以虚拟筛选蓝图为例,它极大地简化了小分子设计过程。


目前,已有超过200家机构选择将BioNeMo整合进其药物研发工作流程中。包括埃森哲、AWS和德勤在内的全球系统集成商也正在向全球企业推广BioNeMo Blueprints解决方案。


新闻拓展:

https://mp.weixin.qq.com/s/-sTjL-Iu2q5F3KtGwh8Odw




06

三星推出全新Gauss 2 AI模型或将成为下一个Galaxy大脑




大平台动作


11月21日,三星电子举办韩国三星开发者大会SDC24,正式发布了第二代人工智能专利模型Samsung Gauss2。这一突破性的多模态语言模型,能够同时处理文本、代码和图像等多种数据类型,为Galaxy系列智能生态系统注入了新的活力。


Gauss 2的核心功能是支持多种输入输出形式,使其在各类应用场景下表现出色。该模型提供了三种不同规格:精简版(Compact)、均衡版(Balanced)和至尊版(Supreme),旨在满足不同计算环境的需求。


“精简版”注重在资源受限的设备上高效运行;“均衡版”在性能、速度和效率之间取得平衡;“至尊版”则通过“专家混合”技术,在保证高性能的同时,大幅降低了训练和推理的计算成本。


三星表示,Gauss2的运行速度比前代快1.5到3倍,并支持多达14种语言,为未来的设备智能化铺平了道路。目前,三星已在内部广泛应用Gauss2来提升效率。超过60%的三星DX部门开发者使用该模型进行代码编写、翻译、文档汇总等工作。呼叫中心也将其用于客户互动的分类和汇总。


新闻拓展:

https://news.samsung.com/global/samsung-electronics-hosts-samsung-developer-conference-korea-2024-unveils-its-improved-gen-ai-model




07

全新突破!YouTube Shorts上线AI视频背景生成功能




大平台动作


YouTube在本周四为其Shorts功能带来重磅更新。通过整合Google DeepMind的Veo视频生成模型,Dream Screen功能现已支持AI视频背景生成,可输出1080p高清视频,让创作者们的短视频创作如虎添翼。


这项技术的应用极为简单直观。创作者只需打开Shorts相机,点击"绿幕"图标,选择"Dream Screen"功能,输入想要的场景描述,比如"糖果世界"或"溪流穿过的魔法森林"。选定动画风格后,系统便会生成多个视频背景供选择,创作者可以在这些动态背景前录制视频内容。


这一功能为创作者开启了无限可能:无论是将自己置身于心爱小说的场景中,还是为短视频制作独特的动画开场,都能轻松实现。YouTube更透露,未来还将推出6秒独立视频片段的生成功能,进一步丰富创作选项。


值得注意的是,这项创新功能让YouTube在短视频领域占据了技术优势。目前短视频市场的领军平台TikTok仅支持AI静态背景图片生成,尚未推出视频背景生成功能。


目前,这项新功能已在美国、加拿大、澳大利亚和新西兰率先上线。


新闻拓展:

https://techcrunch.com/2024/11/21/youtube-shorts-dream-screen-feature-can-now-generate-ai-video-backgrounds/




08

Kimi正式发布数学推理模型k0-math




新力量崛起


11月16日,Kimi正式发布新一代数学推理模型k0-math。据介绍,k0-math在多项基准测试中表现出色,其数学能力足以与全球领先的模型相媲美。


Kimi创始人杨植麟表示,当前AI领域正经历技术范式的转变,新技术如强化学习、合成数据及思维链的应用,正逐步解决高质量数据缺乏的问题,从而推动AI在多个领域和场景中的推理能力及智能水平上限的提升。


k0-math模型采用了这些先进技术,特别是强化学习和思维链推理技术,显著增强了其数学推理能力。通过模拟人类的思考和反思过程,该模型能够更有效地解决复杂的数学问题,帮助用户应对更具挑战性的数学任务。


在做题过程中,与常规模型追求快速给出答案不同,k0-math愿意花更多时间进行推理,包括深入思考和规划解题思路,甚至在必要时进行自我反思和改进,以提高答题的成功率。


据悉,k0-math模型和更强大的Kimi探索版,未来几周将会分批陆续上线Kimi网页版和Kimi智能助手APP,帮助大家解决更有挑战的数学和搜索调研类任务。


新闻拓展:

https://mp.weixin.qq.com/s/J65Eiz6DkTTV_hrydwP0TA




09

AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互




新力量崛起


随着人工技术的飞速发展,人类似乎离电影《黑帝国》中的虚拟场景又近了一步。近日,一个名为“The Matrix”的AI基础世界模拟器问世,能够实现无限生成高保真的720p真实场景视频,并且支持实时交互。


该模拟器展示了一个14分钟的演示视频,实际上它可以持续生成长达一个小时的内容,涵盖沙漠、草原、水体和城市等多场景。在体验过程中,用户可以通过键盘的 W、A、S、D 键进行实时控制,感受每秒16帧的动态画面。


该项目的核心亮点在于其提供了前所未有的帧级控制,让用户的每一个操作都能得到即时响应。更为惊人的是,TheMatrix能够以第一人称视角展现真实世界中的物体和人物,使得用户有身临其境的感受。


“The Matrix” 核心由三个模块构成:交互模块、移窗去噪过程模型和流一致性模型。交互模块负责理解用户的输入并整合到视频生成中,而移窗去噪过程模型则使长视频的生成变得可行,解决了传统模型在长序列生成时的瓶颈。最后,流一致性模型的集成使得推理速度大幅提升,实现了实时生成。


除了能够无限生成视频和高质量的画面之外,“The Matrix”还具备了零样本泛化的。这意味着,模拟器可以在没有相应训练数据的情况下,理解并预测不同环境中物体的行为和交互。


该模拟的训练数据主要来源于《极限竞速:地平线5》和《赛博朋克2077》等三款3A游戏的监督数据和大量现实场景的无监督视频。与以往的研究不同,这一技术的创新在于它的学习能力,使其能在未见过的环境中进行准确的生成。


新闻拓展:

https://mp.weixin.qq.com/s/9FzRjmeszpVRvdCagQB6oA




10

Gyges Labs完成数千万元Pre-A轮融资,AI智能硬件迎来新风口




投融资风向


11月21日,Gyges Labs宣布完成数千万元Pre-A轮融资,投资方为金沙江创投、韶音创始人陈皞、NYX Ventures。


Gyges Labs(前仙瞬科技)成立于2022年,致力于利用光学+协同式AI技术能力,打造智能可穿戴设备。其CEO为斯坦福大学博士贾捷阳,曾在多家硅谷初创公司担任核心研发职责。


Gyges Labs的核心技术DigiWindow,将光学模组的体积从厘米级缩小到毫米级,从而使智能眼镜接近普通眼镜的佩戴体验。同时,DigiWindow无需镜片,避免了其他光学方案带来的漏光和彩虹纹等问题,不仅提升了视觉体验,还保障了隐私安全性。


值得一提的是,DigiWindow技术兼容普通视光学镜片,无需定制即可满足近视和远视用户的需求。


目前,Gyges Labs已将DigiWindow技术应用其与moody打造的首款AI眼镜产品上,该产品将于2025年1月CES展会期间发布。据Gyges Labs CEO贾捷阳介绍,通过优化光学显示方案,以及优化眼镜结构设计,这款智能眼镜重量仅为30多克。


新闻拓展:

https://mp.weixin.qq.com/s/hMBRKMn28yUx45OuihECBA



息来源:WAIC综合整理





点击阅读原文观看WAIC 2024精彩

世界人工智能大会
聚焦人工智能行业前沿,跟踪世界人工智能大会信息
 最新文章