谷歌被质疑对哈里斯和特朗普「双标」,官方回应:算法问题;火山写作将合并到豆包,原有站点全面关停;大厂竞赛AI搜索丨AI情报局

科技   2024-11-07 08:33   广东  

要闻提示


NEWS REMIND

1.消息称王慧文回归美团后带队独立探索 AI 应用
2.大厂竞赛 AI 搜索,押注下一个“百度”
3.火山写作即将合并到豆包,原有站点将全面关停
4.被质疑对哈里斯和特朗普“双标”,谷歌回应:算法问题
5.OpenAI收购域名Chat.com,传金额超过1000万美元
今日头条


HEADLINE NEWS

消息称王慧文回归美团后带队独立探索 AI 应用

11 月 6 日消息,有媒体报道,原美团联合创始人、光年之外创始人王慧文回归美团后带队探索 AI 应用。王慧文所在的美团 AI 团队被称为 GN06。该团队目前的主要业务方向包括情感陪伴、聊天机器人等。
一位接近美团的人士表示,GN06 由王慧文直管,并不归属任何一个事业群。GN06 在美团中的状态相对独立,专注于探索主营业务之外的方向,和美团已有的大模型团队、各业务条线中的 AI 团队也是相互独立。
美团在 2023 年 11 月上线了 AI 情感陪伴产品 Wow。Wow 是美团发布的第一个独立 AI 应用,用户可以自由定制角色形象、性格和音色,在 AI 社区中进行互动。报道称该产品就是来自 GN06。另一位知情人士表示,从今年夏天以来,GN06 的招聘需求明显有迅速增加。不过,如今 Wow 将重点放在了出海,并押注在北美市场。(智能涌现、IT之家)
国内资讯


DOMESTIC NEWS

大厂竞赛 AI 搜索,押注下一个“百度”

随着互联网行业的发展,搜索领域的竞争日益激烈,互联网大厂们正在对 AI 搜索市场进行密集的布局:抖音的 AI 搜索体系正在成型,打造的内容搜索引擎抖音搜索 APP 加入 AI 搜功能,正式成为了一款 AI 搜索产品, APP 内也上线了与抖音搜索 APP 同款的“ AI 搜索”服务。阿里上线了基于星辰大模型的独立产品“心流 AI 助手” APP。快手 APP 的搜索栏内则是上线“智能问答”服务,由 AI 帮助用户搜索和回答相关问题。传统搜索引擎百度 APP 也推出了 AI 智能搜索,为用户提供更多的智能搜索信息服务。而微信搜索则是在今年下半年推出 AI 问答服务。AI搜索成为了大厂们竞相逐鹿的焦点。

大厂们推出各自的 AI 搜索产品和服务,这其中最主要的原因是,AI 搜索是一个全新的赛道,目前玩家们还都处于同一起跑线上。行业人士认为 AI 搜索作为一种新兴的技术和服务模式,为互联网大厂提供了新的竞争优势。通过加码 AI 搜索,大厂可以在搜索市场中脱颖而出,吸引更多的用户和流量,提升自身的市场份额和竞争力。

同时,AI 搜索有着广阔的市场前景。AI 搜索引擎能够获得传统搜索引擎全部市场空间。搜索的本质是链接万物,从商业化的角度看,AI 搜索在提供给用户想要的答案同时,也能够插入广告、其他业务,从而创造营收。Tech星球)

火山写作即将合并到豆包,原有站点将全面关停

11 月 6 日消息,火山写作官方宣布将启动品牌升级计划,产品将逐步合并到“豆包”中。根据官方公告,升级计划将分为三个阶段。
首先,从 2024 年 9 月 13 日起,AI 写作、全文润色、主题深挖等依赖大模型能力的功能将停止服务。如果用户在创作中对这些功能有需求,可以在豆包通过发送指令来完成。其次,从2024 年 12 月 31 日起,火山写作页面将全面关停,届时本页面将自动跳转至豆包。
官方表示,数据安全与合规原因,本次升级不会将用户的文章迁移至豆包。在页面关停之后,用户的火山写作账号将自动注销,文章等历史数据将被清空。(品玩快讯)

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

11 月 5 日消息,腾讯混元开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。
模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产:
  • 第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建
  • 第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构
  • 最终该模型可以实现输入任意单视角实现三维生成
官方表示该模型的泛化能力和可控性强,可重建各类尺度物体,大到建筑,小到工具花草。(IT之家)

小鹏汽车发布图灵 AI 智驾体系

11 月 6 日,小鹏汽车发布了全新图灵 AI 智驾体系,实现云端、软件、硬件全栈自研,包括云端大模型、车端大模型、面向大模型开发的 AI 芯片、以及面向大模型开发的底层架构。
据介绍,小鹏的端到端大模型拥有“与 OpenAI 一致”的路线 —— 遵循尺度定律,提升模型大小、数据大小、增加训练计算量,让模型性能提升。同时,其云端大模型参数量将达车端的 80 倍。
小鹏汽车 CEO 何小鹏表示,2025 年小鹏云端的算力会达到 10Eflops。“有云端模型后,小鹏的智驾就像有诺贝尔级别老师教开车。没有云端模型或仅有车端模型的智驾,就像自学或者普通老师教开车。小鹏努力在 18 个月内,实现类 L3 + 智驾体验、2025 年目标实现百公里接管 1 次。”(品玩快讯)

黑神话悟空也能用 AI 生成了?GameGen-X 颠覆游戏开发

香港科技大学、中国科学技术大学等机构的研究人员近日发布了 GameGen-X 模型,这是一个专为生成和互动控制开放世界游戏视频而设计的扩散变换器模型。
GameGen-X 能自己生成开放世界游戏视频,可以模拟各种游戏引擎功能,包括生成创新角色、动态环境、复杂动作和多样化事件,还能跟你互动,让你体验一把当游戏策划的快感。
GameGen-X 的一大亮点在于其互动可控性。它可以根据当前的游戏片段预测和改变未来内容,从而实现游戏玩法的模拟。用户可以通过多模态控制信号,如结构化文本指令和键盘控制,来影响生成的内容,从而实现对角色互动和场景内容的控制。(AIbase基地)

达摩院发布八观气象大模型:精度达 1 小时 1 公里,率先落地国网山东省调

11 月 6 日,阿里巴巴达摩院(湖畔实验室)在北京举行决策智能产品发布会,正式发布八观气象大模型,在全球气象模型基础上引入区域多源数据,时空精度最高可达 1 公里*1 公里*1 小时。通过大幅提升对温度、辐照、风速等关键气象指标的预测性能,八观气象大模型率先落地新能源占比高的新型电力系统,助力国网山东电力调控中心成功预测了多次极端天气,新能源发电功率、电力负荷预测准确率分别提升至 96%和 98%以上。
该“全球-区域”协同预测的气象大模型正式命名为“八观”,意为“八方洞察,观测万象”。据介绍,八观气象大模型通过预训练和孪生 MAE 掩蔽自编码器结构,提供更好的初始化参数,学习隐藏在高波动的天气数据下的鲁棒特征表示,实现对天气的精准把握。(新消费日报)

中国团队推世界最大多模态数据集“ Infinity-MM ”和顶尖微型 AI 模型“ Aquila-VL-2B ”

近日,来自多家中国机构的研究团队成功创建了 “Infinity-MM” 数据集,这是目前最大规模的公开多模态 AI 数据集之一,同时训练出了一款性能卓越的小型新模型 ——Aquila-VL-2B。
该数据集主要包含四大类数据: 1000 万条图像描述、2440 万条一般视觉指令数据、600 万条精选高质量指令数据,以及 300 万条由 GPT-4 和其他 AI 模型生成的数据。在生成方面,研究团队利用现有的开源 AI 模型。首先,RAM++ 模型分析图像并提取重要信息,随后生成相关问题和答案。此外,团队还构建了一种特殊的分类系统,确保生成数据的质量和多样性。
目前,此次研究团队决定将数据集和模型向研究社区开放,训练过程主要使用 Nvidia A100GPU 及中国本土芯片。Aquila-VL-2B 的成功推出,标志着开放源代码模型在 AI 研究中逐渐迎头赶上传统闭源系统的趋势,尤其是在利用合成训练数据方面展现出良好的前景。(AIbase基地)

工信部熊继军:加快推进人工智能赋能新型工业化

在第七届进博会虹桥国际经济论坛上,工业和信息化部副部长熊继军表示,加快推进人工智能赋能新型工业化。一是强化创新合作,支持国内外的企业、高校科研机构组建良好的创新体,深入开展技术和人才的交流合作,共建开源社区,共研高质量的算法,共享高价值的数据集,合力推动大模型的关键技术研发;二是强化产业合作,通过中国-金砖国家人工智能发展与合作中心等国际合作平台,以人工智能+制造为重点,推进产业的部署合作,共同推进人工智能技术在研发设计、测试验证、生产制造等工业场景的应用,合力构建安全稳定的人工智能产业链。
此外,还要加强与国际电信联盟等国际标准化组织的合作,共同来研究人工智能国际标准化的战略、政策、规则;并强化治理合作,深入践行《全球人工智能治理倡议》,在一带一路、金砖等合作机制下,与各国的交流治理实践经验,打造开放、公平、非歧视的人工智能发展环境。(科创板日报)

深度原理完成种子++轮融资,祥峰投资入股

11 月 5 日消息,Al for Chemistry 科技创新企业深度原理(Deep Principle)宣布完成了种子++轮融资,由祥峰投资独家投资。本轮融资将用于进一步完善产品研发,开拓商业市场,及支持国际化布局。深度原理(Deep Principle) 成立于 2024 年,由创始人兼 CEO 贾皓钧、创始人兼 CTO 段辰儒领衔。
深度原理自主研发的 ReactiveAI 平台通过率先攻克反应过渡态搜索,主动生成新化学反应,通过结合产业界客户研发数据的反馈不断迭代,ReactiveAI 依托四大算法模块实现了材料发现、性质预测、配方优化及可控实验的闭环创新,实现更快,更准,更省的人工智能加速化学材料研发的新范式。(投资界)

开源的 SAM2Long 来了,港中文、上海 AI Lab 出品

近期,港中文等研究团队推出了一款名为 SAM2Long 的新模型,专门用于解决长视频对象分割中的“错误累积”问题。SAM2Long 通过引入多路径记忆树结构,解决了这一问题。该结构允许模型在每个时间步上保留多个分割路径假设,并根据综合得分选择最佳路径。这种设计不仅避免了单一错误掩码的影响,还使模型在处理遮挡、目标重现等长视频常见问题时更加稳健。
实验显示,SAM2Long 在多个数据集上显著超越了 SAM 2。例如,在 SA-V 验证集和测试集上,S 分别比 SAM 2 提升了 4.5 和 5.3 分。在 LVOS 验证集上,各个模型规模下的 SAM2Long 也都展示了显著的性能提升,平均 J&F 指标提高了 3.0 分。(新智讯)

阳澄湖大闸蟹首次用上 AI 点码防伪

江苏省消保委 11 月 5 日发文称,为帮助消费者辨识,阳澄湖大闸蟹统一使用国家农业农村部农产品地理标志防伪专用标识(蟹扣)。江苏省消保委表示,今年的标识由农产品地理标志图案、溯源彩色可变二维码、AI 防伪点码,专用防伪结构件组成。在外形图案上,首次采用了介于椭圆形与菱形之间的形状,与前几年的专用标识区别明显:标识正面为镭射材料,有金属感和光泽;正反面底纹为防伪逻辑结构;正面测光查看,字体会根据不同角度显示彩色效果;反面二维码根据逻辑变色显示,右侧分布随机彩色金属颗粒,触摸有凹凸感,可剥离取出。
具体操作流程为:关注“苏州市阳澄湖大闸蟹行业协会”的公众号-点击公众号底部的“防伪查询”-进入查询页面,点击扫一扫,扫描防伪标识上的二维码,即可查验具体信息。(IT之家)
国际资讯


FOREIGN NEWS

OpenAI CEO 阿尔特曼预测 AGI 可在 5 年内实现,但短期社会影响不大

在最近的一次 Reddit AMA 中,OpenAI CEO 萨姆・阿尔特曼(Sam Altman)声称,使用现有的硬件就有可能实现 AGI,此前他曾表示,实现他的 AI 愿景需要 7 万亿美元和多年的时间来建造 36 个半导体工厂和更多的数据中心。
阿尔特曼预测,未来 5 年,AI 技术的进步速度将令人难以置信。他认为,AGI 时刻可能会悄然到来,人们甚至可能没有意识到。尽管如此,他预测 AI 和 AGI 对社会的短期影响“会出乎意料地小”。他以计算机通过图灵测试为例,指出人们 5 年前如果被问及计算机是否会通过图灵测试,他们会说不会。虽然计算机最终通过了测试,但社会并没有发生重大变化。然而从长远来看,阿尔特曼承认 AI 革命可能会随着科学的快速进步带来根本性的社会变革,超出所有预期。(IT之家)

超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字

11 月 5 日消息,Google Research 展示了一种使用人工智能读取手写内容的新方法,名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本,无需任何中间设备。
InkSight 通过模仿人类学习阅读的过程,即通过不断地重写文本,来学习整个单词的外观和含义。这需要研究人员训练 AI 模型,使其能够识别和模仿人类的手写风格。InkSight 在处理复杂场景时表现更为出色,例如当照片光线昏暗、文本部分遮挡或背景干扰时,InkSight 能够更准确地识别手写文字。研究人员发现,人类能够阅读 InkSight 生成的文本描摹的准确率高达 87%,其中三分之二的描摹结果与真实手写几乎无法区分。
谷歌并不是唯一一家致力于开发手写识别 AI 工具的公司。亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。此外,Goodnotes 等数字笔记应用也推出了手写识别和编辑功能,可以将手写文字转换为可编辑的数字文本。(IT之家)

谷歌 AI 模型首次独立发现 SQLite 安全漏洞,开创安全测试新范式

11 月 6 日,Google 宣布,其与 DeepMind 合作开发的大语言模型" Big Sleep "成功发现了 SQLite 数据库中一个此前未知的安全漏洞,这是 AI 首次独立发现软件安全漏洞的里程碑事件。
这个被发现的漏洞是 SQLite 中的一个缓冲区溢出问题,位于" seriesBestIndex "函数中。该函数在处理负索引的边界情况时存在缺陷,可能导致内存边界之外的写操作,形成潜在的安全威胁。Big Sleep 采用了先进的变体分析技术,通过分析代码库的具体变更(如提交信息和差异文件),识别潜在的问题区域。该模型不仅能发现漏洞,还能进行根本原因分析,帮助开发者从源头解决问题。与传统的模糊测试方法相比,Big Sleep 展现出更强的漏洞检测能力。
值得注意的是,这个漏洞是在正式发布前被发现的,展示了 AI 在主动防御方面的巨大潜力。Google 表示,这种方法未来可能为安全防御带来显著优势,不仅能发现问题,还能提供高质量的根因分析。(Saasverse )

被质疑对哈里斯和特朗普“双标”,谷歌回应:算法问题

11 月 5 日,谷歌发声明称已修复了一个搜索问题,此前用户在谷歌输入“我在哪里可以投票给哈里斯”,谷歌会生成交互式地图工具供用户查找最近的投票站,而输入“我在哪里可以投票给特朗普”却没有出现类似结果。谷歌解释说,上述问题源于其算法将卡马拉·哈里斯的姓氏与德克萨斯州哈里斯县(Harris County)相混淆了。
对此,社交媒体上大量网友表达了对此事的不满,质疑谷歌区别对待,有干涉选举之嫌。特朗普的支持者、美知名企业家马斯克同样注意到这一问题,他转发了谷歌相关声明并表示“感谢澄清”。(观察者网)

OpenAI收购域名Chat.com,传金额超过1000万美元

11月7日消息,据外媒报道,周三,OpenAI 首席执行官 Sam Altman在 X:chat.com 上发布了一个简单的 URL。它会自动路由到 OpenAI 的热门聊天机器人 ChatGPT。在此之前,该域名归 HubSpot 创始人兼首席技术官 Dharmesh Shah 所有。2023 年初,Shah 以 1000 万美元的价格购买了 chat.com 域名。然而,仅仅几个月后,他就宣布已经出售了该域名,尽管他没有透露出售的细节或买家。

值得注意的是,他确实证实他以高于最初购买价的价格出售了该域名。「我购买 chat.com 的原因很简单:我认为基于聊天的用户体验 ( #ChatUX ) 是软件领域的下一个大趋势。通过自然语言界面与计算机/软件进行交流更加直观。这是通过生成式人工智能实现的。

Shah 在 LinkedIn 上宣布购买的帖子中写道——chat.com在转售之前曾短暂重定向到该帖子。销售后,Domain Name Wire注意到Shah 曾提到另一位买家对此次购买感兴趣,并推测他已将其转售给他们。(鞭牛士)

谷歌与沙特主权基金 PIF 合作:开设人工智能中心契机与前景分析

11 月 5 日,宣布与沙特阿拉伯公共投资基金(PIF)合作,在沙特开设一个新的人工智能中心。这一策略性合作标志着谷歌在中东地区深入布局人工智能领域的重要一步,旨在推动阿拉伯语言的人工智能模型及沙特本土应用的开发。
谷歌总裁兼首席投资官 Ruth Porat 表示:“这一战略合作伙伴关系将加速人工智能在当地语言和跨行业的应用,包括医疗保健、零售、金融服务等,为沙特阿拉伯、中东、非洲和世界各地的企业和初创公司服务。作为沙特阿拉伯丰富的技术生态系统的一部分,我们的目标是为沙特人创造高技能的工作岗位,并为全球企业提供通过云计算推动增长的机会。”(智通财经APP)

苹果深耕 AI 领域,拟联手富士康在中国台湾生产 AI 服务器

11 月 6 日消息,据日经报道,苹果正与富士康讨论在中国台湾地区生产 AI 服务器,旨在增强 Apple Intelligence 设备的云端算力并抓住生成式 AI 浪潮。富士康在生产英伟达的AI服务器,甚至计划在墨西哥建造全球最大的 GB200 芯片制造工厂。消息人士称,其承接苹果服务器的能力可能比较有限。据称,苹果打算为这些 AI 服务器使用自研芯片,主要场景是内部使用,因此与 Nvidia 订单相比生产量较小。为了增强其 AI 服务器能力,苹果还打算与联想及其他较小的供应商进行合作,以协助服务器设计和生产工作。(全球TMT)

X 的人工智能聊天机器人 Grok 遭到批评,散布错误的选举信息

在美国总统选举期间,一款名为 Grok 的聊天机器人被发现散布错误信息,误导公众。TechCrunch 的测试发现,Grok 在回答有关选举结果的问题时频繁出错,错误宣称特朗普在某些关键战场州的胜利,尽管这些州的计票尚未结束。Grok 还错误地声称特朗普赢得了 2024 年俄亥俄州大选,这与事实不符。
与其他聊天机器人相比,Grok 处理选举信息的方式更加鲁莽,缺乏谨慎。此外,它还错误地暗示民主党候选人卡马拉·哈里斯没有资格出现在选票上。这些错误信息已经广泛传播,影响了数百万用户,引发了对 Grok 及其开发者 X 公司的批评。(大G.AI商业)

苹果公司即将在 iOS 18.2 更新中为备忘录应用引入三项 AI 功能

11 月 6 日消息,据外媒,苹果公司正在准备推出第二波 Apple Intelligence(苹果智能)功能,计划在下月的 iOS 18.2 更新中,为备忘录应用带来三项关键的人工智能改进,旨在提升用户的创作效率和日常记录的便捷性。
首先,iPadOS 18.2 将推出名为“图像魔杖”的新 AI 图像工具,该工具能够将用户的草图转换为高质量的插图。用户只需使用 Apple Pencil 或手指快速绘制草图,图像魔杖便能将其转化为精美的图像。此外,Image Wand还支持文生图功能。其次,苹果公司计划在 iOS 18.2 更新中进一步增强 AI Writing 工具,这是在 iOS 18.1 中引入的功能。最后,iOS 18.2 在复制/粘贴菜单中新增了“创建图像”功能。用户在选择文本后,可以生成原创图像,并根据需求进行调整。(环球网)

顶级风投 a16z 联合创始人:无论美国总统选举结果如何,AI 政策都将发生重大变化

美国硅谷顶级私人风险投资公司 a16z 的两位创始人马克·安德森(Marc Andreessen)和本·霍洛维茨(Ben Horowitz)深入探讨了最新的人工智能政策,强调了就人工智能的风险和益处进行知情辩论的必要性,以及人工智能初创企业蓬勃发展和合作所需的政策。
在讨论中,安德森指出人工智能政策演变成为一个涉及政治和国际关系的重大议题,而无论即将到来的总统选举结果如何,AI 政策都将经历重大的变化,这些政策的变化将会对美国的科技产业、经济竞争力以及国家安全产生深远的影响。他强调,政策制定者需要对 AI 技术有深入的了解,才能制定出既促进创新又保护社会价值的政策。
同时,安德森在讨论中明确指出,美国与中国在人工智能领域正进行着一场激烈的竞争,这场竞争被他视为 21 世纪的“世界大战 2.0”。他认为,这场竞争不仅是科技的竞争,还涉及到经济和军事,这三个领域紧密相连,共同决定了国家的实力和全球影响力。保持在 AI 领域的领先地位,这不仅关系到国家的未来发展,也是维护其全球地位的关键。美国应利用其分散化的创新体系,鼓励企业家精神和市场驱动的创新,通过创新来保持其在全球的领导地位,而不是试图通过政策手段来限制技术发展或遏制中国。他警告说,任何试图通过政策手段来限制技术创新的做法都可能适得其反,最终损害竞争力。(聚大模型前言)

全球最大变压器生产商日立能源警告称行业“不堪重负”,AI 数据中心需求激增

近日,全球最大的变压器生产商“日立能源(Hitachi Energy)”警告称,其行业“不堪重负”,无法满足对电网设备的爆炸式需求,这可能导致重要基础设施项目的延误。
日立能源 CEO Andreas Schierenbeck 表示,因为用于生成式 AI 的数据中心的需求不断增长,导致供应紧张,变压器制造商将很难迅速提高产量,以满足电网升级的需求。“提升产能绝对是一个问题。这并不容易,而且可能不会以足够快的速度增长,”Schierenbeck 警告说,公共事业项目将被推迟,现有基础设施的寿命将不得不延长。
报道提到,日立能源已成为日立集团的关键增长引擎。该部门的目标是每年增加 10 亿至 20 亿美元(当前约 71.05 亿至 142.11 亿元人民币)的收入,到 2030 年左右达到 300 亿美元(当前约 2131.59 亿元人民币),高于目前的 130 亿美元(当前约 923.69 亿元人民币)。(IT之家)

AvePoint 启动新加坡 AI 实验室,瞄准全球市场

11 月 6 日,AvePoint 宣布,在新加坡经济发展局(EDB)的支持下,正式成立 AI 实验室。这一战略举措将显著推进人工智能和机器学习领域的创新研究,并进一步增强 AvePoint Confidence 平台的 AI 能力。
此次成立的AI实验室将成为一个具有全球影响力的研发中心。未来三年内,实验室计划招募超过 25 名 AI 研究人员和项目专家,这些人才将有机会通过全球轮岗计划与 AvePoint 总部的团队展开深度合作。同时,实验室还将与多所大学及 AvePoint 全球产品团队建立合作网络。
在应用领域方面,AI 实验室的研究重点将覆盖教育和金融科技两大核心板块。在教育领域,实验室将开发基于 AI 的个性化学习顾问系统;在金融科技方面,团队将致力于运用 AI 技术优化银行流程、提升反欺诈能力,并实现 KYC(客户身份识别)服务的智能化。(品玩快讯)

AI 赋能好莱坞:《此心安处》通过实时 AI 换脸技术让演员“逆生长”

11 月 5 日消息,索尼影业出品的《此心安处》(Here)上周末大规模公映,值得一提的是,该片利用了实时生成式 AI 面部变换技术,让汤姆・汉克斯和罗宾・怀特两位演员跨越了 60 年的年龄跨度,是好莱坞首部围绕人工智能视觉特效打造的长篇电影之一。
该片跨越多个时间段,制作团队利用 AI 技术对汉克斯和怀特的容貌进行修改。这项去衰老技术来自 Metaphysic,这是一家擅长实时换脸和衰老特效的视觉特效公司。Metaphysic 通过对汉克斯和赖特以前电影的画面训练定制的机器学习模型,开发了面部变换系统,该系统包括大量的面部运动、皮肤纹理和不同光照条件和相机角度下的外观数据。模型可以生成即时的面部变换,而无需传统的 CGI 所需的长达数月的人工后期制作工作。
与以往依赖逐帧操作的去衰老效果不同,Metaphysic 的方法通过分析面部特征点并将其映射到训练过的年龄段上,从而实时生成变脸效果。(IT之家)
今日热门视频


//

近期热门文章

腾讯 Robotics X 无战事


达摩院前传:那些帮淘宝赚过大钱的AI科学家们


3D 视觉派:斯坦福具身智能人物关系图

雷峰网
洞见智能未来,共与产业变迁
 最新文章