一周AI丨格莱美提名披头士AI修复曲;亚马逊1.1亿推自研芯片;百度发布文心iRAG和秒哒;欧洲两大公司联手造自主搜索索引……

科技   2024-11-15 17:17   上海  


要闻列表

AI万象

披头士乐队借AI修复歌曲《Now and Then》获两项格莱美提名


梵蒂冈携手微软,用AI打造圣彼得大教堂的首个数字孪生体

大平台动作

亚马逊砸1.1亿投资,推动Trainium芯片的AI研究


Waymo无人驾驶出租车服务在洛杉矶全面开放


百度发布文心iRAG与无代码工具“秒哒”,李彦宏展望AI应用新时代


小米隐秘布局AI眼镜,预计明年二季度发布


昆仑万维SkyReels AI短剧平台将于12月10日在美国正式上线

新力量崛起

欧洲两大公司联手打造自主搜索索引,摆脱科技巨头依赖


AI模型FastGlioma十秒识别脑瘤残留,准确率达92%

投融资风向

光刻机巨头ASML看好芯片前景:到2030年约40%的芯片业务将围绕人工智能展开





01

披头士乐队借AI修复歌曲《Now and Then》获两项格莱美提名




AI万象


11月9日,2025年第67届格莱美提名名单揭晓,传奇乐队披头士(The Beatles)在解散近50年后,凭借AI的帮助,他们的最后一首歌《Now and Then》成功入围"年度制作"和"最佳摇滚表现"两项大奖,这标志着首个获得格莱美提名的AI辅助歌曲诞生。


这首引发广泛关注的作品于去年末发布,其创作过程颇具传奇色彩。《Now and Then》最初是约翰·列侬在20世纪70年代末录制的一个小样,但最终没有全部完成。


列侬去世后其遗孀小野洋子于1994年将两盘磁带交给了保罗·麦卡特尼,其中一盘包括《Grow Old With Me》和《Now And Then》。其余三名披头士成员决定对《Now And Then》重新制作,但由于无法完美提取出约翰·列侬的人声,计划暂时搁置。


2022年,导演彼得·杰克逊和录音师借助机器学习算法,把约翰·列侬的声音从《Now and Then》的原始小样中分离,让乐队其他成员得以继续参与完成这首歌。


虽然《Now and Then》是通过机器学习完成的,但它仍然在格莱美人工智能规则的范围之内。目前的指导方针规定,"只有人类创作者才有资格提交格莱美奖的评审、提名或获奖",但包含人工智能素材"元素"的作品有资格进入适用类别


新闻拓展:

https://mp.weixin.qq.com/s/deyR5DJ0NuolE00RB2qtmw




02

梵蒂冈携手微软,用AI打造圣彼得大教堂的首个数字孪生体




AI万象


美联社11日报道称,梵蒂冈城国和美国科技企业微软当天宣布,在双方合作下,用AI“复刻”的数字版圣彼得大教堂正式上线。


据悉,该项目是为了庆祝即将到来的2025年“禧年”而特别策划的。专家团队使用无人机、高分辨率摄像机以及激光成像等技术手段,在三周之内捕捉到超过40万张圣彼得大教堂的图像。这些图像由微软AI For Good实验室与法国公司Iconem合作转化为超高精度的3D模型,同时辅以先进的AI算法以确保数字孪生模型能够以毫米级精度反映大教堂的复杂结构。


据路透社12日发布的照片和视频显示,在展厅内,游客能看到圣彼得大教堂的全息影像,AI的复刻画面不仅能更清晰地展示大教堂各种装饰的细节,也能带游客以影像的形式看到大教堂不对外开放的房间以及内部结构的样子。


据历史记载,位于梵蒂冈的圣彼得大教堂始建于1506年,被誉为文艺复兴时期最杰出的建筑。微软总裁布拉德·史密斯在接受采访时说:“我们不仅要把圣彼得大教堂介绍给全世界,还要用一种更适合我们这个时代的方式,将它介绍给新时代的年轻人。”


将与数字孪生项目一同推出的还有“Petros Eni”和“Petros Eni Octagon”两个新的互动展览,让游客通过沉浸式流程深入了解大教堂的演变。这些展览有望为亲赴大教堂的参观者们提供新的体验维度。


新闻拓展:

https://unlocked.microsoft.com/vatican/




03

亚马逊砸1.1亿投资,推动Trainium芯片的AI研究




大平台动作


11月13日,亚马逊云计算部门(AWS)宣布了一项重大投资项目“Build on Trainium”,将向科研人员免费提供其最新的AI算力,标志着该公司希望通过这一举措在人工智能领域中与英伟达展开直接竞争。亚马逊的这一决定旨在吸引更多的研究人员使用其基于Trainium芯片的计算能力,进而挑战当前在市场上占主导地位的英伟达。


该项目将为研究人员提供使用Trainium芯片的机会,以便他们开发新的AI架构、机器学习库以及针对大规模分布式AWS Trainium UltraClusters的性能提升。


AWS Trainium是一种专门为深度学习训练和推理任务设计的定制机器学习芯片。亚马逊表示,这一项目涵盖了从算法创新到AI加速器性能提升的广泛研究方向,还包括大规模分布式系统的研究。作为“Build on Trainium”计划的一部分,亚马逊已经建立了一个包含多达40,000个Trainium芯片的研究UltraCluster,这些芯片专为AI的独特工作负载和计算结构进行优化。


亚马逊进一步表示,项目中创造的任何AI进展都将以开源方式发布,允许研究人员和开发者继续推动他们的创新。此外,亚马逊在8月份宣布了对Claude开发者和OpenAI竞争者Anthropic的40亿美元投资。


新闻拓展:

https://www.aboutamazon.com/news/aws/amazon-trainium-investment-university-ai-research




04

Waymo无人驾驶出租车服务在洛杉矶全面开放




大平台动作


11月12日,Alphabet(谷歌母公司)旗下的自动驾驶子公司Waymo表示,现已对美国洛杉矶的所有消费者开放了其自动驾驶出租车服务Waymo One,这标志着自动驾驶技术的迅速发展和普及。


尽管面临严格的监管审查,但汽车制造商和科技公司仍在自动驾驶技术上投入巨资,以期推动自动驾驶技术的未来增长。上个月,Waymo刚完成了一轮56亿美元的融资。


Waymo是自动驾驶技术的先驱企业,于2020年在亚利桑那州凤凰城推出了美国首家无人驾驶出租车服务。今年6月份,Waymo又在旧金山向所有人开放了无人驾驶出租车服务Waymo One。Waymo表示,自其在旧金山开启商业运营以来,已有约30万人注册了Waymo的服务加入了等候名单,这一数字充分显示了市场对自动驾驶出租车服务的强劲需求。


Waymo联合首席执行官Tekedra Mawakana说道:“我们的服务迅速成熟,乘客们正在享受全自动驾驶技术带来的诸多好处。”


今年10月份,美国电动汽车制造商特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,明年将在加利福尼亚州和得克萨斯州推出无人驾驶出租车服务,这表明无人驾驶出租车领域的竞争日益激烈。


新闻拓展:

‍https://mp.weixin.qq.com/s/S8cTz_zAF9pjKyZd1b1bqQ




05

百度发布文心iRAG与无代码工具“秒哒”,李彦宏展望AI应用新时代




大平台动作


11月12日,在百度世界2024大会上,百度创始人李彦宏发表了题为《应用来了》的主题演讲,正式宣布了两项重大技术发布:检索增强的文生图技术iRAG和无代码工具“秒哒”,这两项技术被视为推动AI应用进入新时代的重要力量。


李彦宏在演讲中指出,过去24个月里,AI行业经历的最大变革之一是大模型基本消除了“幻觉”问题,即生成内容的不真实或不合理现象。在此基础上,百度推出了文心iRAG技术,该技术将百度搜索的亿级图片资源与强大的基础模型能力相结合,能够生成各种超真实的图片。


据介绍,文心iRAG技术的整体效果远远超过传统的文生图原生系统,生成的图片不仅更加真实自然,而且去除了以往机器生成的“机器味”,极大地提高了AI生成图片的可用性和观赏性。此外,该技术还具备无幻觉、超真实、零成本、立等可取等显著商业价值,有望为相关行业带来革命性的变革。


除了iRAG技术外,李彦宏还发布了无代码工具“秒哒”。这款工具具备无代码编程、多智能体协作和多工具调用三大特点,用户只需通过自然语言描述需求,即可快速搭建出各种应用。李彦宏表示,“秒哒”的推出将极大地降低应用开发的门槛,使得每个人都能够成为应用开发者,从而推动AI应用的爆发式增长。


新闻拓展:

‍https://mp.weixin.qq.com/s/P4_aIyutV3LBie_Cc7XvBw




06

小米隐秘布局AI眼镜,预计明年二季度发布




大平台动作


11月13日,据36氪报道,小米正计划推出新一代AI眼镜,数月前已与歌尔合作,该产品预计于2025年Q2(大概率是4月份的米粉节)发布。对于这款产品的出货量,雷军的预期“在三十万台往上”。


知情人士表示,小米AI眼镜将“全面对标Meta Ray-ban”,搭载AI功能、音频耳机模块、摄像头模块,并将以小米自有品牌形式发布。


据悉,Meta二代产品Meta Ray-ban搭载高通骁龙AR1 Gen1芯片,1200万像素摄像头,支持60秒的1080p 60fps格式的视频录制。另外,眼镜整体重量只有49g,佩戴舒适,起售价299美元,解决了重量、成本的痛点。


截至2024年5月,一代产品Ray-Ban Meta智能眼镜的全球销量已突破100万台,根据IDC预测,2024年Q2 Meta Ray-Ban年化销量或达200万台。


被视为最有希望的大模型落地硬件,国内已经有多家大厂在评估AI眼镜项目,包括OPPO、vivo、华为、腾讯、字节;苹果也被外媒曝光已组织团队重点评估AI眼镜市场。


新闻拓展:

https://mp.weixin.qq.com/s/m7jib6LDfFhrZyXAPUky0A




07

昆仑万维SkyReels AI短剧平台将于12月10日在美国正式上线




大平台动作


11月10日,昆仑万维宣布,旗下AI短剧平台SkyReels将于12月10日正式在美国上线。这标志着昆仑万维在全球AI娱乐市场的进一步扩张,同时也将为北美观众带来全新的智能短剧体验。


今年8月19日,昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels对视频内容创作流程进行全面颠覆,让创作者从繁琐、复杂的制作流程中解放出来,专注于创意实现与灵感表达,让“一人一剧”的梦想真正成为现实。


SkyReels平台集合了昆仑万维自主研发的剧本大模型SkyScript、分镜大模型StoryboardGen、3D生成大模型Sky3DGen,以及业界首个深度融合AI3D引擎与视频大模型的创新平台WorldEngine。在过去几个月中,SkyReels在剧本生成、角色生成、分镜生成、视频生成、BGM和TTS匹配等方面取得了突破性进展。


在剧本生成方面,SkyReels丰富了海量的爆款创意模板。其中剧本大模型生成能力大幅提升,尤其是优化了短剧的爽点生成能力,当前生成效果平均在人工剧本评级中可达到A甚至S的评级。


在角色生成方面,研发团队增加了 AI 演员库。同时构建了演员属性标签,基于多模态大模型能力,智能帮助用户找到最适合剧本人物的形象。


在视频生成方面,SkyReels 视频生成成功率提升21%;在BGM和TTS匹配方面,SkyReels构建了带情感的演员音色库以及短剧BGM库,让匹配精准度提升了35%。


新闻拓展:

‍https://mp.weixin.qq.com/s/b-6LvY31HyDSmXNwU5tcTg




08

欧洲两大公司联手打造自主搜索索引,摆脱科技巨头依赖




新力量崛起


当地时间周二,欧洲两家互联网搜索公司——Ecosia和Qwant宣布建立合作伙伴关系,将联手打造欧洲搜索索引,以打破谷歌在搜索市场一家独大的局面。


据报道,Ecosia和Qwant同意成立一家名为“欧洲搜索展望”(EuropeansearchPerspective,EUSP)的合资企业,双方股权各占50%。该公司将于2025年初在法国成立,旨在提供“优化”的法语和德语搜索结果。


Qwant总部位于巴黎,是一家以注重隐私为特色的搜索引擎公司,承诺不会跟踪用户或转售他们的个人数据。Ecosia总部位于柏林,其主要特色是注重环保,承诺用户在其平台上每进行50次搜索,他们就会种植一棵树。


Ecosia首席执行官克里斯蒂安·克罗尔(Christian Kroll)表示,该合作项目之所以成为可能,部分原因是欧盟出台了以科技为重点的新竞争规则。今年早些时候,欧洲的《数字市场法案(DMA)》正式生效。该法案要求被其列为“看门人”的大型科技公司需要提高其平台的开放度。比如,根据DMA,谷歌需要对外共享其对训练搜索模型有用的数据。


目前,全球前五搜索引擎分别是谷歌、Bing、雅虎、百度和Yandex。其中,谷歌的市场份额占到了90%左右,几乎垄断了整个市场。像Ecosia、Qwant和DuckDuckGo这样的替代搜索引擎都没有开发自己的后端基础设施,仍必须依赖微软等公司现有的技术来提供搜索结果。然而,在新的合资企业中,他们将从零开始建立自己的搜索索引,从不同的搜索引擎中收集结果。


新闻拓展:

https://finance.china.com.cn/industry/20241113/6185413.shtml




09

AI模型FastGlioma十秒识别脑瘤残留,准确率达92%




新力量崛起


近日,美国密歇根大学和加利福尼亚大学旧金山分校领导的研究人员开发出一款名为FastGlioma的人工智能(AI)模型。在脑手术中,该模型仅用10秒就判断出是否还有残留的癌性肿瘤。在识别肿瘤残留方面,FastGlioma的表现远超传统方法,有望给神经外科领域带来变革。研究成果发表在最新一期《自然》杂志上。


在脑瘤切除手术中,很少能切除完全。有些残留部分与健康脑组织十分相似,常常成为“漏网之鱼”,而目前医生用于定位肿瘤残留的方法,均有一定的局限性。


FastGlioma将显微光学成像与一种称为基础模型的AI相结合。研究人员使用超过11000份手术样本和400万个显微图像对视觉基础模型进行了预训练。这些肿瘤样本通过受激拉曼组织成像拍摄,这是一种由密歇根大学开发的快速、高分辨率光学成像方法。


经过训练,FastGlioma可以在缺乏大型标记数据集的情况下检测肿瘤残余组织。由FastGlioma预测指导的手术仅在3.8%的情况下遗漏了高风险肿瘤残余,而利用图像和荧光引导的手术遗漏率接近25%。使用受激拉曼组织成像获取全分辨率图像大约需要100秒;而“快速模式”下的低分辨率图像则仅需10秒。结果显示,FastGlioma以平均约92%的准确率检测并计算了肿瘤残余量。


FastGlioma还能减少对放射成像、对比增强或荧光标记等传统方法的依赖。这一突破性技术不仅能帮助外科医生在手术过程中快速决策,还可推广应用于其他类型的脑肿瘤诊断。


新闻拓展:

https://www.nature.com/articles/s41586-024-08169-3




10

光刻机巨头ASML看好芯片前景:到2030年约40%的芯片业务将围绕人工智能展开




投融资风向


当地时间11月14日,荷兰光刻机巨头ASML举办2024年投资者日会议,该公司表示将更新其长期战略以及全球市场和技术趋势分析,确认其到2030年的年收入将达到约440亿至600亿欧元,毛利率约为56%至 60%。


ASML总裁兼首席执行官傅恪礼(Christophe Fouquet)称:“我们预计,在下一个十年我们有能力将EUV技术推向更高水平,并扩展广泛适用的全景光刻产品组合,使ASML能够充分参与和抓住人工智能机遇,从而实现显著的营收和盈利增长。”


除了多个重要终端市场的增长潜力外,得益于人工智能可能成为推动社会生产力和创新的下一个重大驱动力,ASML认为,人工智能的崛起为半导体行业带来了显著机遇。预计这些发展趋势将有助于推动全球半导体销售额在2030年超过1万亿美元,这意味着2025至2030年间半导体市场的年增长率约为9%,其中来自AI芯片的占比将达到40%。


作为全球唯一的光刻机生产商,ASML在半导体供应链中占据着重要地位。其生产的光刻机是制造先进芯片的必备工具,为苹果、英伟达等公司的AI加速器提供支持。因此,ASML的业绩通常被视为整个半导体行业的风向标,其长期增长前景也反映了全球对先进芯片日益增长的需求。


新闻拓展:

https://mp.weixin.qq.com/s/B4SG5CbTFP_8vndkBrSASw



息来源:WAIC综合整理





点击阅读原文观看WAIC 2024精彩

世界人工智能大会
聚焦人工智能行业前沿,跟踪世界人工智能大会信息
 最新文章