小鹏机器人前高管入局AI陪伴机器人,获千万元级天使轮融资;OpenAI完整版o1模型曝光;北京市人工智能产投基金入股智谱AI

科技   2024-11-05 08:40   广东  

要闻提示


NEWS REMIND

1.最新 AI 年度报告发布:预测人形机器人热度将下降,英伟达维持霸主地位
2.小鹏机器人前高管创业入局 AI 陪伴机器人,完成千万元级天使轮融资
3.具身智能机器人公司星海图完成超 2 亿元 Pre-A 轮融资,华兴担任独家财务顾问
4.北京市人工智能产业投资基金等入股智谱 AI
5.OpenAI 完整版 o1 模型曝光:能力超强 可处理 20 万个 token
今日头条


HEADLINE NEWS

最新 AI 年度报告发布:预测人形机器人热度将下降,英伟达维持霸主地位

最近,State of AI 发布了 2024 产业报告,也是调研团队发布的第七份年度报告,从研究进展、行业局势、现有政策、安全问题、未来预测等角度出发,对人工智能行业的现状和预期进行了深度分析。
据这份 2024 年度产业报告显示,尽管人形机器人曾备受瞩目,但如今其热度已开始降温。就在这时,英伟达凭借其卓越的技术实力,在 AI 市场上稳居霸主地位,其市场地位也很难在未来被其他竞争者撼动。报告指出,随着 AI 技术的飞速发展,前沿实验室之间的技术性能差距逐渐缩小,不再有明显优势。而与此同时,国内经济环境和科技水平的持续提升,为人形机器人领域带来了新的机遇和挑战。
特别是在人形机器人领域,特斯拉的擎天柱机器人计划未来年产 10 亿台的消息引发了广泛关注。与此同时,国内也有一支不容忽视的力量正在崛起,那就是赛力斯。据报道,赛力斯日前发布邀请函,将于 11 月 21 日召开人形机器人专题技术论坛,并正在积极参加机器人领域的 autoload 招聘。其中,华为与赛力斯的合作,更是让人看到了国产人形机器人崛起的曙光。华为凭借强大的 AI 技术,有望打造出与北美相匹敌的人形机器人大脑和小脑,而赛力斯则在华为的支持下,正在逐步成长为国内人形机器人领域的注目明珠,华为旗下的极目机器人公司更是引人瞩目。(新智元、学习智能时代)
国内资讯


DOMESTIC NEWS

小鹏机器人前高管创业入局 AI 陪伴机器人,完成千万元级天使轮融资

原小鹏机器人产品设计负责人孙兆治创业成立的上海珞博智能科技有限公司已于年中完成千万元级人民币天使轮融资,由产业相关⽅投资。公开资料显示,孙兆治是原小鹏机器人(鹏行智能)产品设计负责人,曾任小鹏汽车内饰设计负责⼈、滴滴造车项目产品负责人、XID Lab 用户体验设计工作室创始人,是业内知名的硬件用户体验专家及⼯业设计师。团队方面,珞博智能团队其他成员主要来自字节跳动、华为、大疆、商汤、MiniMax、泡泡玛特等科技及潮玩公司,团队在⼤模型情感陪伴应用、造型设计等⽅⾯具备丰富的工作经验。
珞博智能于 2024 年 1 月创立,公司的业务方向为 AI 陪伴机器人,其首款产品的定位为“ AI 潮玩”,已经完成了前三轮原型机的设计开发,预计将于明年发布和量产。“明年有望成为 AI 陪伴硬件爆发的元年。”孙兆治表示,珞博智能致力于创造机器人的情绪价值,希望打造AI情感陪伴硬件领域的标杆品牌。(36氪)

具身智能机器人公司星海图完成超 2 亿元 Pre-A 轮融资,华兴担任独家财务顾问

近日,专注于打造“一脑多形”具身智能机器人的人工智能公司“星海图”完成超 2 亿元 Pre-A 轮融资,本轮融资由高瓴创投(GL Ventures)、蚂蚁集团领投,米哈游、无锡创投集团、同歌创投、Funplus 及老股东跟投,华兴资本担任独家财务顾问。本轮融资完成后,星海图将继续推动具身本体及核心模组、端到端 AI 算法以及场景解决方案的研发及落地,同时持续拓展海外市场、构建全球竞争力,打造世界领先的物理世界智能体。
星海图公司搭建了具身基础模型(Embodied Foundation Model,EFM)和空间智能引擎(Real2Sim2Real,RSR)范式。在具身基础模型 EFM-1 阶段,星海图采用模仿学习为核心算法架构进行丰富的双臂操作任务,由星海图联合创始人许华哲提出的基于 3D 扩散策略 DP3(3D Diffusion Policy)是当前世界最优模仿学习效率算法架构,在真实的机器人操作任务中,DP3 可以仅用 40 次演示数据完成精确的控制、并且以 85% 的高成功率完成任务,同时在空间、视角、外观和实例等多个方面展现出优秀的泛化能力。目前星海图 EFM-1 已经面向客户场景实现算法整机闭环,成为全国首家实现端到端模仿学习算法整机闭环的具身智能公司。(华兴资本)

Diffusion 模型也能“举一反三”?阿里 IC-LoRA 给图像生成模型增加情节记忆力能力

阿里巴巴通义实验室最新研究表明,现有的文生图 Diffusion Transformer 模型已具备生成多张具有特定关系图像的能力,通过 IC-LoRA 的加持,模型变得更智能,只需少量样本即可学会新技能。
研究人员设计了简单有效的流程,唤醒 Diffusion 模型的“上下文学习”能力,大大降低了 AI 模型的训练成本,让更多人参与 AI 创作。IC-LoRA 的出现是 AI 图像生成领域的里程碑式进步,让每个人都能成为艺术家。(站长之家)

OPPO 与香港理工大学续约,拓展 AI 影像新边界

11 月 4 日,OPPO 广东移动通信有限公司(OPPO)与香港理工大学(理大)举办合作续约仪式,基于双方于 2022 年签署的合作协议进一步深化合作,助力粤港澳大湾区融合发展。OPPO 将携手理大扩大资金及技术投入规模,升级成立“香港理工大学-OPPO 联合创新研究中心”,为双方在 AI 影像技术领域的深度合作续写新的篇章。
OPPO 研究院院长廖劲松表示:“在 OPPO 与理大的三年合作中,我们见证了联合实验室在技术上的多项突破以及在人才培养方面的显著成就。秉持‘科技为人,以善天下’的使命,我们期待通过此次续约,进一步深化与理大在 AI 领域的产学研深度融合,为全球用户带来更多创新的智能影像体验。”
香港理工大学校长滕锦光教授表示:“为应对人工智能时代的机遇与挑战,理大将于 2025 年 1 月正式成立‘计算机及数学科学学院’。新架构将有效促进研究团队的深入交流与协作,产出更具影响力的成果。我们相信,这次与 OPPO 的深度合作,将充分把握机遇,积极推进科技创新和知识转移。”(数智前线)

OpenAI 华人科学家翁荔:人类如何培养出下一代聪明且安全的 AI 技术

华人青年科学家、OpenAI 研究副总裁(安全)翁荔(Lilian Weng)近期在 2024 Bilibili 超级科学晚上发表主题为《 AI 安全与“培养”之道》的演讲。这是其首次在国内发表关于 AI 技术的演讲。
翁荔表示,ChatGPT 横空出世以来,AI 技术如同搭乘了高速列车,迅速渗透并影响着人类。随着 AI 的智能化和自主化,确保其行为符合人类价值观变得重要,AI 可能因偏见而变得狭隘,或因对抗性攻击而受到质疑。因此,需要用心引导 AI,确保其服务于人类并确保安全,而 AI 安全是实现其潜在益处的基础,类似于自动驾驶技术。
从数据层面,提供多样、全面、正确的数据,可以减少 AI 的偏见,而依赖于多人标注的数据,以提高 AI 的准确性;同时,基于强化学习(RL)和基于人类反馈的强化学习(RLHF),通过奖惩机制训练 AI,类似于训练小狗;此外,使用模型自我评价和详细的行为规则来提升 AI 的输出质量。
翁荔毕业于北京大学信息管理系,如今该系名为北京大学数字人文实验室,她是 2005 级本科生,是“兜乐”项目的骨干设计人员,毕业后赴美攻读博士学位,曾就职于 Facebook,如今是 OpenAI  华人科学家、ChatGPT的贡献者之一。翁荔在 2018 年加入 OpenAI ,后来在 GPT-4 项目中主要参与预训练、强化学习&对齐、模型安全等方面的工作。她曾提出最著名的 Agent 公式—— Agent =大模型+记忆+主动规划+工具使用。(钛媒体AGI)

推动智驾、智能座舱 AI 大模型应用!腾讯与博世达成新合作

11 月 4 日,腾讯宣布已与汽车技术与服务供应商博世签订新一轮的战略合作备忘录,双方将进一步深化智驾智舱业务领域的合作,在云+AI 及全球化领域的合作,共同探索在自动驾驶云和地图、智能座舱 AI 大模型应用、助力本土车企海外业务、建立混合云底座及 AI 大模型赋能企业级应用等领域的合作,为汽车行业树立智能化转型的新标杆。
除了在国内市场的合作外,腾讯与博世还将携手助力本土车企拓展海外业务,共同建立混合云底座,并通过 AI 大模型赋能企业级应用。这些举措将有助于提升中国智能驾驶技术的国际竞争力,推动全球智能驾驶产业的发展。(ITBEAR科技资讯)

华为:网络+AI 释放更多商业价值,关键在于“四新”战略

在第十届全球超宽带高峰论坛(UBBF 2024)上,华为运营商业务总裁陈浩发表了题为“网络+AI,释放更多商业价值”的演讲。他指出,为了深入挖掘 AI 的潜力并实现商业成功,关键在于实施“四新”战略,即新入口、新业务、新体验和新运营。
随着超宽带(UBB)产业与 AI 产业的发展,全球光宽千兆用户数已超过 3 亿。UBB 产业的发展为 AI 产业的增长奠定基础,而 AI 也推动了 UBB 更快发展。华为认为,要通过网络+AI 释放更多商业价值,关键在于“四新”战略。新入口:打造 AI 智能体,抢占家庭 AI 新入口,快速发展智家经济。新业务:运营商通过 AI 赋能新兴业务,聚合优质内容,可逐步构建家庭 AI 应用生态。新体验:云游戏、直播购物、AI 搜索等新兴业务层出不穷。新运营:随着运营商网络规模不断扩大,网络运营挑战日益增加,自动驾驶网络的重要性与日俱增。(全球TMT)

DreamVideo-2 :复旦和阿里联合多机构推出的零样本视频定制生成框架

DreamVideo-2 是由阿里巴巴联合复旦大学、南洋理工大学和密歇根州立大学的研究团队共同开发的一款零样本视频定制框架。该框架能够根据用户提供的单张图像和一系列边界框,生成具有特定主题和精确运动轨迹的定制视频,而无需在推理阶段进行复杂的微调。这一技术的进步显著提升了视频生成的灵活性和实用性,使得用户可以轻松创造出符合个人想象的视频内容。
DreamVideo-2 的核心特性包括参考注意力机制和掩码引导运动模块。参考注意力机制利用模型的固有能力来学习并强化视频中的主题表示,而掩码引导运动模块则通过使用从边界框派生的二进制掩码信号,实现对视频中主题运动轨迹的精确控制。此外,为了平衡主题学习和运动控制,DreamVideo-2还引入了掩码参考注意力和重新加权的扩散损失函数,进一步提高了生成视频的质量和控制精度。(ADFeed)

绿盟科技:发布 AISS 大模型安全社区及 AI 大模型安全知识库

近日,绿盟科技在北京举办了以“无界 BOUNDLESS · 数织未来 AI 同行”为主题的 2024 TechWorld 智慧安全大会。会上,绿盟科技发布了 AI 大模型安全威胁矩阵 v2.0 版本,并同步发布 AISS(AI Safety and Security)大模型安全社区以及国内首个 AI 大模型安全知识库。
AISS 社区包括国内首个大模型安全知识库,基于绿盟科技风险矩阵构建,帮助企业快速理解和应对大模型全生命周期的多层次威胁。该社区提供了 AI-Scan 大模型风险评估、LLM Guard 守卫式检测、MLOps 后门扫描等技术支持,立体化地推动企业构建全面的大模型安全防御体系。(创业邦)

北京市人工智能产业投资基金等入股智谱 AI

资料显示,智谱 AI 关联公司北京智谱华章科技有限公司发生工商变更,新增北京市人工智能产业投资基金(有限合伙)、深圳市招商数科创新私募股权投资基金合伙企业(有限合伙)、湖北长江中信科移动通信技术产业投资基金合伙企业(有限合伙)等为股东,同时注册资本由约 2791 万人民币增至约 3107 万人民币。
据媒体报道,今年 3 月,智谱 AI 宣布完成新一轮融资,由北京市人工智能产业投资基金参与投资,智谱 AI 也成为北京市人工智能产业投资基金成立以来投资的第一家 AI 大模型公司。(钛媒体APP、每日经济新闻)
国际资讯


FOREIGN NEWS

因算力瓶颈难产!OpenAI:今年将不会发布GPT-5

11月4日消息,据报道,OpenAI的首席执行官Sam Altman近期透露,公司的创新能力正面临计算能力瓶颈的挑战,这一限制导致新产品推出的节奏未能如预期般迅速。针对市场广泛关注的下一代大型AI模型GPT-5,Altman已明确表态,OpenAI今年将不会推出该模型,但计划在年内稍后时间带来一些“极为出色的新版本”,以缓解外界的期待。

为从根本上解决计算能力不足的难题,OpenAI正积极采取行动,与博通及台积电携手合作,致力于开发专属芯片,这一战略举措旨在通过定制化硬件优化AI模型的运行效率与性能。

同时,OpenAI首席产品官Kevin Weil进一步指出,在推进视频模型Sora的下一阶段重大升级之前,公司正全力以赴地完善模型,确保其在安全性、模拟精确度及计算规模扩展等方面均达到高标准。

此外,金沙江创投的杰出合伙人朱啸虎曾预言,若GPT-5未能如期面世,或将引发英伟达等相关企业股价的大幅波动。而在硅谷,即便是对GPT-5等未来大型AI模型持乐观态度的观察家,也对其核心推理能力能否实现质的飞跃抱有谨慎态度,认为这仍是一个待解的未知数。(快科技)

OpenAI 完整版 o1 模型曝光:能力超强 可处理 20 万个 token

最近,有用户在社交媒体平台 X 上爆料称,OpenAI 的全新 o1模型在短时间内通过网址 “chatgpt.com/?model=o1” 向部分用户开放了访问权限,随后又迅速被关闭。根据用户的反馈,这一最新模型能够处理大约20万字的文本,并且具备分析图像的能力。OpenAI 将 o1模型称为其 “最强大的模型”,特别适合那些需要创造力和高级推理能力的任务。与之前的版本相比,o1在性能上有了显著提升,能够更好地满足用户在各种复杂场景下的需求。
目前,公众可以使用 o1的迷你版和预览版,但完整版本尚未正式发布。尽管 OpenAI 尚未宣布正式版的具体发布时间,但预计会在今年晚些时候推出,与即将推出的 GPT-5不同,o1的发布进展更加值得期待。
这一系列的动向引起了广泛关注,尤其是在人工智能领域,越来越多的人开始重视新一代模型带来的潜在应用和可能性。尽管用户们对 o1模型的短暂体验感到兴奋,但也对何时能全面使用这一模型充满期待。(AIbase基地)

机器人公司Physical融资4亿美元:贝佐斯领投,OpenAI等参投

11月4日消息,据外媒报道,人工智能机器人初创公司 Physical Intelligence 计划于周一宣布一轮 4 亿美元融资,由亚马逊执行董事长杰夫·贝佐斯领投,Thrive Capital 和 Lux Capital 参投,OpenAI、Redpoint Ventures 和 Bond 等跟投。

据悉,本轮融资对该公司的估值约为20亿美元(不包括新投资),大幅高于这家初创公司今年成立时筹集的7000万美元种子资金。(鞭牛士)

Perplexity 推出 AI 选举信息中心,助力选民获取投票资讯

近日,AI 搜索公司 Perplexity 正式推出了其新开发的选举信息中心,旨在为选民提供可靠的投票信息。这一平台将为用户提供 AI 生成的投票相关问题答案、候选人总结等功能,并将在 11 月 5 日选举日当天,实时跟踪投票结果,数据来源于美联社。
Perplexity 表示,该选民信息中心所提供的数据,包括投票要求、投票地点和时间,均基于非营利组织 Democracy Works 的数据。值得一提的是,这一组织还为谷歌的相关功能提供支持。此外,Perplexity 确保其生成的选举相关答案来自于一系列经过严谨筛选的、值得信赖的信息源,如 Ballotpedia 和各大新闻机构。
然而,在测试过程中,Perplexity 的一些 AI 生成的候选人摘要显示出错误,例如未提及已退出竞选的罗伯特・肯尼迪(Robert F. Kennedy)。另外,某个名为 “未来的波图斯夫人” 的候选人出现在平台上,但点击后却展示了副总统卡玛拉・哈里斯的摘要和一些模因图片。针对这些问题,Perplexity 发言人萨拉・普洛特尼克表示,公司正在调查相关错误的原因。
值得注意的是,Perplexity 并不是唯一尝试使用 AI 来提供选民信息的公司。其他大型 AI 公司,如 ChatGPT、Meta AI 和 Google Gemini,都倾向于将选民信息问题转向其他资源,显示出在高风险情况下,生成式 AI 的准确性仍面临挑战。(AI新闻资讯)

Meta 公布机器人触觉感知能力研究成果:利用手指传感器结合“AI 大脑”理解 / 操作外界物体

11 月 4 日消息,Meta 发布新闻稿,介绍了旗下 FAIR(基础人工智能研究)团队对于机器人触觉感知能力的研究情况,这项研究旨在让机器人通过触觉方式进一步理解和操作外界物体。Meta 表示,打造相应 AI 机器人的核心在于让机器人的传感器感知理解物理世界,同时利用“AI 大脑”精确控制机器人对物理世界进行反应,而团队目前开发的机器人触觉感知能力主要就是为了让机器人检测其交互的物体的材质与触感,以便于让 AI 判断机器人应当如何操作这些设备(例如拿起鸡蛋等场景)。
Meta 目前一共公布了 Meta Sparsh、Digit 360 和 Meta Digit Plexus 等多项研究成果,其中 Meta Sparsh 是一种基于 AI 的触觉编码器,主要利用 AI 的自我监督学习能力实现跨场景的触觉感知,让机器人的 AI 大脑在学习对于某种物体的“触感”后,即可在各种场景灵活“感知”相关物品的特性。
此外, Meta 还开发了 PARTNR 基准,这是一项用于评估人机协作能力的测试框架,旨在测试机器人 AI 系统在实际生活场景中的计划和推理能力,该测试框架内置 10 万个自然语言任务,能够模拟居家环境中的各种情境,帮助开发者测试机器人对于自然语言的理解能力及执行能力。(IT之家)(关于具身智能更多消息,欢迎添加whx23999交流)

OpenAI 与 Anthropic 分别任命新高管:人才大战开启

11 月 4 日消息,据外电报道,X(前 Twitter)挑战者Pebble的前首席执行官兼联合创始人 Gabor Cselle已加入 OpenAI 并参与一个秘密项目。报道称,Cselle自 10 月起就职于 OpenAI,他在 X 上的一篇帖子中宣布了这一消息。他写道:我会在适当的时候分享更多关于我正在做的事情。我已经学到了很多东西。
近十年前,Cselle 在 Twitter 担任集团产品经理,主要负责主页时间线、用户入门和注销体验。Cselle 于 2016 年离开 Twitter 加盟谷歌,担任这家科技巨头 Area 120 孵化器分拆项目的主管。
Csell 的招聘消息公布之际,OpenAI 的竞争对手 Anthropic 也迎来了一位备受瞩目的新员工:Embark 创始人 Alex Rodrigues。Rodrigues 于 2021 年带领自动驾驶卡车公司 Embark 通过SPAC 合并(随后于 2023 年以低价出售给 Applied Intuition),他周五表示,他将加入 Anthropic 担任 AI 安全研究员。(鞭牛士)

研究人员绕过 GPT-4o 模型安全护栏,利用“十六进制字符串”成功令其编写漏洞攻击程序

11 月 4 日消息,网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法,成功突破了 GPT-4o 内置的“安全护栏”措施,能够使其编写出恶意攻击程序。参考 OpenAI 介绍,ChatGPT-4o 内置了一系列“安全护栏”措施,以防止该 AI 遭到用户不当使用,相关防护措施会分析输入的提示文本,判断用户是否要求模型生成恶意内容。
不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法,号称能够绕过 GPT-4o 的防护,让 GPT-4o 解码运行用户的恶意指令。研究人员声称,他首先要求 GPT-4o 解码十六进制字符串,之后其向 GPT 发送一条实际含义为“到互联网上研究 CVE-2024-41110 漏洞,并用 Python 编写恶意程序”的十六进制字符串指令,GPT-4o 仅用 1 分钟就顺利利用相关漏洞编写出了代码(注:CVE-2024-41110 是一个 Docker 验证漏洞,允许恶意程序绕过 Docker 验证 API)。
研究人员解释称,GPT 系列模型被设计成遵循自然语言指令完成编码和解码,但系列模型缺乏对上下文的理解能力,无法评估每一步在整体情境下的安全性,因此许多黑客实际上早已利用 GPT 模型这一特点让模型进行各种不当操作。研究人员表示,相关示例表明 AI 模型的开发者需要加强模型的安全防护,以防范此类基于上下文理解式的攻击。(IT之家)

MOKI 升级 AI 脚本、AI 分镜、AI 视频生成功能 进一步增强成片效果

美图公司旗下 AI 短片创作工具 MOKI 再次迎来升级,涉及 AI 脚本、AI 分镜、AI 视频三大能力,成片的丰富度、稳定度得到全面增强,并进一步降低用户操作难度,让普通人也能成为“导演”。
升级后的 MOKI,AI 脚本扩写功能更加智能,新增了对用户输入故事风格的判断,包括绘本、小说、历史、普通等故事风格标签,能够针对不同的故事风格定制化续写脚本。
在 AI 分镜的环节,得益于美图奇想大模型(MiracleVision)图像生成能力的升级,MOKI 的文生图语义准确度获得全面提升。在短片格上,本次 MOKI 的升级新增了童年读物、清新日漫等风格模型,画面质感和场景氛围感显著增强,色彩丰富度和对比度进一步提升,环境细节更加丰富,人物互动场景表现更具故事感。还支持创作者本地上传自定义的分镜图,对拥有个人强烈风格的创作者十分友好。在 AI 视频生成环节,MOKI 已经可以实现动作丰富且崩坏率低的出众效果,能够避免动画畸变成真人、画面不动、画面崩溃等非写实类场景问题,且风格化短片效果出众。(快科技)

DataStax 董事长兼首席执行官:生成式AI面临数据过载,应专注于更小、更具体的目标

数据管理公司 DataStax 的董事长兼首席执行官 Chet Kapoor 在 2024 年 TechCrunch Disrupt 大会上启动了一场关于“新数据管道”的对话,讨论现代 AI 应用的背景,他的对话伙伴包括风险投资公司NEA的合伙人Vanessa Larco,以及数据集成平台 Fivetran 的首席执行官 George Fraser。讨论涵盖了多个方面,并得出一个重要的结论是,在 AI 的早期阶段,优先考虑产品市场契合度而非规模的重要性。
这与从一开始就试图在整个公司推广生成性人工智能,向大型语言模型(LLM)抛出所有数据并希望最终得到正确结果的做法形成对比。根据  Larco 的说法,这很可能会造成不准确且昂贵的混乱。“从小开始,”她说。“我们看到的是公司从小规模开始,使用内部应用程序,设定非常具体的目标,然后找到与他们试图实现的目标相匹配的数据。”
“我称之为生成式人工智能的愤怒小鸟时代,” Kapoor 说。“这并没有完全改变我的生活,没人帮我洗衣服。今年,我合作的每个企业都在投入一些东西到生产中——虽然是小规模的内部项目,但他们正在投入生产,因为他们实际上在解决问题,如何组建团队去实现这一目标。明年是我所称的转型之年,人们将开始开发真正改变他们所工作的公司的轨迹的应用程序。”(ZPotentials)

提升 AI 可信度:MIT 团队开发新工具对抗“幻觉”

为帮助人工验证者,MIT 的研究人员创建了一个用户友好的系统,使人们能够更快地验证大型语言模型的响应。这个名为 SymGen 的工具可以让 LLM 生成带有引用的响应,直接指向源文档中的具体位置,比如数据库中的某个单元格。用户可以悬停在文本响应的高亮部分,以查看模型用于生成特定词汇或短语的数据。同时,未高亮的部分则显示需要额外关注以进行检查和验证的短语。
“我们让人们能够选择性地关注他们需要更加关注的文本部分。最终,SymGen 能够提高人们对模型响应的信心,因为他们可以轻松地仔细检查,以确保信息的可靠性。”电气工程与计算机科学研究生、SymGen 论文的共同第一作者 Shannon Shen 表示。通过用户研究,Shen 和他的合作者发现,使用 SymGen 进行验证的时间比手动流程缩短了约 20%。通过使人们验证模型输出的过程更快、更简单,SymGen 有助于识别在各种实际应用中使用的 LLM 的错误,从生成临床记录到总结金融市场报告。(DeepTech 深科技)

告别随机生成!Runway推出高级摄像机控制,像导演一样掌控镜头

AI 视频生成平台 Runway 近日宣布推出全新功能——高级摄像机控制。该功能允许用户像操控真实摄影机一样,精准控制虚拟场景中的镜头移动,为 AI 视频创作带来前所未有的灵活性和掌控力。
用户可以自定义镜头移动的方向和力度,实现水平移动、环绕拍摄、位置探索、循环拍摄、快速缩放和慢速滑动等多种效果。结合速度变化的循环拍摄功能尤其适合生成吸睛的视觉循环或过渡,极大拓展了创作潜力。快速缩放则可以像电影镜头一样深入场景,而慢速滑动则能让镜头平稳地滑过场景,突出细节或营造悬念。Runway 表示,此次更新旨在改变用户对数码相机工作的看法,实现无缝过渡和增强场景构图。高级摄像机控制功能现已在 Runway 平台上线,用户可以通过 Gen-3Alpha Turbo 模型体验。(AIbase基地)

韩国 SK 电信启动首尔先进 AI 数据中心建设

11 月 4 日,韩国最大电信运营商 SK 电信宣布启动一项重大的人工智能基础设施建设项目,其中包括建设一个先进的人工智能数据中心。这一项目位于首尔,预计将配备最新的硬件设施和软件系统,以支持大规模的数据处理和复杂的机器学习算法运行。SK 电信此次建设人工智能基础设施,旨在加速数字化转型,提升公司在人工智能领域的竞争力。通过建设这一基础设施,SK 电信将为其客户提供更加智能化、高效化的服务,同时也为未来的技术创新奠定坚实的基础。(观点新媒体)
今日热门视频


//

近期热门文章

腾讯 Robotics X 无战事


达摩院前传:那些帮淘宝赚过大钱的AI科学家们


3D 视觉派:斯坦福具身智能人物关系图

雷峰网
洞见智能未来,共与产业变迁
 最新文章