曝字节开启豆包内测，正式杀入AI视频生成领域；川普回归，或将利好AI发展；淘宝升级AI产品「生意管家」，助力双十一丨AI情报局

科技 2024-11-08 08:49 广东

要闻提示

NEWS REMIND

1.特朗普胜利利好人工智能监管：AI 将获得自由奔放资格

2.字节跳动 AI 助手豆包被曝开启视频生成内测

3.阿里测试 AI 创作工具 Animode，参与动漫制作

4.淘宝升级 AI 产品“生意管家”，双 11 期间服务 400 万商家

5.微软申请专利以应对 AI “幻觉” 问题

今日头条

HEADLINE NEWS

特朗普胜利利好人工智能监管：AI 将获得自由奔放资格

11 月 7 日消息，特朗普战胜对手哈里斯，成为美国第 47 任总统。此前，特朗普曾多次表示，他计划在任职第一天废除拜登政府的《人工智能行政命令》，并与那些严厉批评除最宽松的监管之外的所有监管者的势力结盟，转而推行宽松的 AI 监管政策，减少对企业的报告要求，避免披露商业机密。

共和党人希望新政策侧重于 AI 的物理安全风险。由于联邦层面监管可能放松，加利福尼亚等州正在采取独立措施，通过相关立法填补空白。同时，特朗普政府可能加强对中国的 AI 技术出口管控。专家警告全球应加强 AI 治理，避免 AI 问题成为党派争端，以应对全球性的技术和伦理风险。

业内人士呼吁则监管者，无论其政治立场如何，都不要忽视人工智能带来的机遇和危险，牛津互联网研究所数据伦理学教授桑德拉·沃赫特表示“（人工智能带来的）这些危害不分地域，也不关心党派界限。我只能希望人工智能治理不会沦为党派问题——这是一个影响我们所有人、所有地方的问题。我们都必须共同努力，找到良好的全球解决方案。"（大G.AI商业、鞭牛士）

国内资讯

DOMESTIC NEWS

字节跳动 AI 助手豆包被曝开启视频生成内测

11 月 7 日消息，字节跳动旗下大模型 AI 助手豆包正式推出视频生成内测，支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。

据火山引擎总裁谭待介绍，豆包视频生成大模型支持多风格多比例的一致性多镜头生成，可应用在电商营销、动画教育、城市文旅、微剧本等领域。他表示，无论是语义理解能力，多个主体运动的复杂交互画面，还是多镜头切换的内容一致性，豆包视频生成大模型均达到业界先进水平。

此前视频生成模型大多只能完成简单指令，豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现，其生成的视频不仅能够遵循复杂指令，让不同人物完成多个动作指令的互动，人物样貌、服装细节甚至头饰在不同运镜下也保持一致，接近实拍效果。豆包视频生成模型基于 DiT 架构，通过高效的 DiT 融合计算单元，让视频在大动态与运镜中自由切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。豆包视频生成模型具备专业级光影布局和色彩调和，画面视觉极具美感和真实感。（IT之家）

字节推出单图视频驱动模型 X-Portrait 2：一键生成相同表情神态，简化创作流程

11 月 6 日消息，字节推出单图视频驱动模型 X-Portrait 2，不同于以往依赖人脸关键点检测的单图驱动方法，X-Portrait 2 构建了一个表情编码器模型，通过一种端到端自监督训练框架，能够从大量人像视频中自学习 ID 无关的运动隐式表征。

同时，该模型不仅能保留原图的 ID，还能捕捉并迁移从细微到夸张的表情和情绪，简化了现有动作捕捉、角色动画和内容创作流程。进一步将这个编码器与强大的生成式扩散模型相结合，即可生成流畅且富有表现力的视频。经过在大规模高质量表情视频上的训练，X-Portrait 2 在运动表现力和 ID 保持性方面显著优于先前技术。（IT之家）

阿里测试 AI 创作工具 Animode，参与动漫制作

11 月 7 日讯，据报道，阿里巴巴正在测试 AI 视频创作工具 Animode，该工具可以帮助用户制作动画风格的视频。Animode 是一款视频一键动漫化的 AI 工具，可以通过视频转换视频的功能将诗篇转换成二次元风格。Animode 内置有多种样式，包括 3D 场景、动画场景，以及 VR 现实融合模式等，可快速创建复杂的场景。此外，Animode 能够捕捉真人动作，用于创建动作实时同步的二次元角色上，为此，内置有动作库、视频转运动、一键创建语音等功能。（品玩快讯）

淘宝升级 AI 产品“生意管家”，双 11 期间服务 400 万商家

11 月 6 日消息，媒体获悉，今年天猫双 11，电商 AI 全方位服务商家经营。数据显示，淘宝面向所有商家上线的 AI 产品生意管家，双 11 期间已累计服务 400 万商家，帮助中小商家生成超过 1 亿件商品及营销素材，帮助超 80 万商家进行了超 200 万次的数据流量分析。

据悉，淘宝在过去一年多次升级商家侧 AI 产品，并于十月初正式上线“生意管家”，整合了素材生成、数据服务、经营代理等多项 AI 工具及能力，为所有淘宝天猫商家备战双 11 提供高效生产力。

数据显示，天猫双 11 期间，全站推广助力商家好货更快打爆，近 29 万商家、超 160 万商品实现生意增长，活跃客户成交日同比增长超 6 倍。爱步、乐卡克、无印良品 MUJI 等品牌使用 AIGC 图片生成能力，素材点击转化率至高提升 97%；妮维雅采用 AIGC 视频生成能力，素材点击转化率至高提升 300%。（飞象网）

视觉中国：子公司拟参设基金，投资北京智谱华章公司股权

11 月 6 日，视觉中国公告，公司全资子公司华夏视觉拟与海南智桥私募基金管理合伙企业业（有限合伙）共同投资盐城智华创业投资基金合伙企业（有限合伙），担任有限合伙人。盐城智华认缴出资总额为 1.3 亿元，华夏视觉认缴 3000 万元，占比 23.075%。

盐城智华将直接或间接投资于北京智谱华章科技有限公司股权。此次投资基金主要目的在于借助专业投资机构的优势，拓宽公司在 AIGC 等领域的投资和布局。公司将在此次投资的基础上，与北京智谱华章签署战略合作协议，共建基于版权合规数据的“视觉大模型”，开发满足行业应用场景的 AI 产品。（钛媒体App）

小鹏发布 AI 人形机器人 Iron：1:1 复刻真人、已下工厂拧螺丝

11 月 6 日，小鹏汽车发布全新的 AI 人形机器人 Iron。这款机器人采用了和真人 1:1 打造，身高 178 cm、体重 70 kg、全身主动自由度 62 个、手部可动自由度 15 个。作为对比，特斯拉 Optimus 机器人身高 172cm、体重 73 kg（第一代数据，第二代减重 10kg ）、全身主动自由度 200+ 个、手部可动自由度 27 个。其他方面，小鹏 AI 人形机器人”大脑“采用最新自研图灵 AI 芯片，拥有 3000T 的算力，能够像人一样思考记忆，同时也让手脚自主活动。并与智驾体系同源，采用了 AI 汽车上的鹰眼视觉系统，可以 720° 无死角看世界，还运用了端到端大模型和强化学习算法，让机器人行走有像驾驶般的能力。

小鹏天玑 AIOS，给机器人流畅自由对话的能力，有记忆、能推理，真正像人一样活动。目前该款机器人已经在小鹏广州工厂进行小鹏 P7+车型生产实训，小鹏 Iron 未来将会聚焦在工厂和门店等场景。（快科技）

美图再度携手三星，AI 创新功能助力用户创意实现

11 月 7 日消息，三星宣布了与美图的最新合作，这已经是双方今年的第三次联手。根据合作协议，三星手机将首次预装上美图秀秀 App，为用户带来更为丰富的图像编辑体验。此次合作中，美图奇想大模型（MiracleVision）技术将深度集成到三星 W25 和 W25 Flip6 系列手机中。用户将能够享受到包括“ AI 无痕消除”、“白板涂鸦”、“图像风格化”以及“壁纸生成”等一系列先进的 AI 图像生成与编辑功能。

据悉，此次合作是基于美图奇想大模型开放平台进行的。该平台是美图公司推出的重要 AI 技术服务平台，专注于为企业提供专业的 AI 算法服务和定制化解决方案。自 2019 年上线至今，已成功服务了智能设备、智能汽车、金融、传媒、消费等多个行业的众多头部企业客户。业内分析人士认为，美图与三星的此次合作进一步展现了美图在人工智能影像与设计领域的领先地位，同时也助力了行业客户在品牌力和生产力方面的多维度提升。（电动新物种）

首台“重庆造”国产服务器下线：搭载华为鲲鹏 920+昇腾 AI 处理器

11 月 7 日消息，首台“重庆造”国产服务器下线仪式在重庆科学城芯鸿数智科技有限公司举行。芯鸿数智是由拓维信息系统股份有限公司与重庆高新开发集团下属重庆科学城科技产业发展有限公司共同出资设立。

通过此次合作，芯鸿数智将持续加大研发投入，打造基于“鸿蒙+AI ”的软硬一体化产品和人工智能行业标杆应用。兆瀚 RA2300-A 系列服务器是一款基于鲲鹏 920 处理器+昇腾 AI 处理器的 2U 机架式推理服务器，支持 Atlas300I Pro 推理卡、Atlas 300V Pro 视频解析卡，能够为用户提供强大的实时推理能力。作为 AI 推理专用服务器，该系列服务器可广泛应用于中心侧 AI 推理场景，具有超强计算性能、低能耗、易于部署维护和支持云边协同等特点，满足多种多样的人工智能应用场景的算力需求。

芯鸿数智智能计算制造基地已在西部（重庆）科学城正式投产运行，可实现年产服务器 6 万台、台式电脑 10 万台，未来将进一步吸引上下游配套企业聚集。（快科技）

北京首座大模型“超级工厂”落户京西

11 月 7 日消息，由中关村科技园区石景山园管理委员会、北京市石景山区科学技术委员会主办的人工智能大模型产业创新发展大会上，百度智能云千帆大模型产业（北京）创新基地服务平台启动上线。目前创新基地已集聚十余家具备行业大模型训练和垂直领域应用开发能力的企业，入驻企业已累计完成 120 余次模型训练，模型训练和推理消耗 token（数据或文本的基本单元）数超过 6 亿。（钛媒体APP）

晶泰科技与金光集团建立全面合作，AI 赋能共创营收爆发点

近日，晶泰科技宣布与印尼第一财团金光集团宣布通过其旗下支柱企业——金光金融集团，正式签署战略合作。双方将通过建立合资公司，在多个工业领域展开全面合作，共同推进亚太地区人工智能（AI）产业的未来革新。

金光集团(Sinar Mas Group)作为印尼最具影响力和多元化的企业集团之一，在医疗保健、矿业、可再生能源、物流、消费品、化工和金融服务等领域占据主导地位。晶泰科技是全 AI+机器人新药及新材料研发平台，已累积服务超 300 家来自全球的顶尖企业及科研机构。晶泰科技与金光集团的深度合作，或将解锁强大的专业协同效应，以前沿科技在多个领域催生具有开创性和巨大商业潜力的解决方案，显著推动双方的收入增长，并进一步促进区域经济扩张。两家公司表示期待此次携手，共同抓住东南亚地区蓬勃发展的 AI 市场所带来的机遇，树立集创新力、竞争力与经济影响力于一体的商业合作典范。（格隆汇）

平均招聘月薪 24000 元，却预计将有 3 亿个工作岗位被生成式 AI 取代

北京大学国家发展研究院近期与智联招聘联合发布的《 AI 大模型对我国劳动力市场潜在影响研究》报告显示，2024 年上半年招聘的 AI 相关职业当中，大语言模型方面的自然语言处理职位数同比增速 111%，深度学习岗位增 61%，机器人算法岗位增 76%，自动驾驶的智能驾驶系统工程师增 49%，导航算法增 47%。

值得注意的是，报告中提到，2024 年上半年，自然语言处理岗位的平均招聘月薪达到 24007 元，深度学习岗位月薪则达到 26279 元，位列 AI 相关岗位前列。AI 技术一面在提高人类生活生产效率，企业加大 AI 相关人才招聘和薪资力度，另一面不断用“智能化”取代人类部分模式化工作，失业（被 AI 取代）成为了无数打工人心中的阴霾，高盛曾预计，全球预计将有 3 亿个工作岗位被生成式 AI 取代，包括律师、行政人员等重要岗位。

北京大学国家发展研究院助理教授胡佳胤在解读中表示，在 AI 时代，原地踏步的人将感受到更大的“威胁”，软件/硬件研发、运维/测试两大影响指数较高的职业，他强调，职场人在关注就业市场变化趋势的同时，尽早学习使用 AI 工具，并强化大模型无法替代的软技能，如创造力、沟通能力、组织协调能力等，驱使 AI，才能拥抱 AI 。

智联招聘执行副总裁李强表示，AI 技术发展，在短期内造成某些行业的人才供给不足，但持续拥抱技术，AI 和自动化技术会提高工作效率推动企业向更加灵活的用工模式，如项目制或合同制转型，也会带来更多的高质量岗位。在互联网时代来临之时，大家也曾经面临类似挑战，但最后新技术带来整个社会效率的提升，创造了很多互联网产业链上的相关岗位，如跨境电商已经替代了大部分的传统贸易。（钛媒体AGI）

中兴通讯 7 亿元在北京成立技术公司含多项 AI 业务

近日，北京兴云数科技术有限公司成立，法定代表人为王喜瑜，注册资本 7 亿元人民币，经营范围含信息系统集成服务、物联网技术服务、数据处理和存储支持服务、人工智能基础软件开发、人工智能应用软件开发、大数据服务、信息咨询服务等。股东信息显示，该公司由中兴通讯全资持股。（每日经济新闻）

国际资讯

FOREIGN NEWS

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

11 月 7 日消息，微软本月发布 Magentic-One 系统，通过协调多个专用 AI 智能体，高效处理复杂工作流程。

Magentic-One 系统隶属于 AutoGen 开源平台，在不同环境中无缝编排任务，进一步巩固了微软在 AI 任务自动化中的地位。Magnetic-One 的核心是协调器代理（Orchestrator），它负责管理框架内的多个子智能体，该协调器不仅是任务调度器，更是高效完成任务的蓝图设计者。

该协调器通过构建“任务账本”（task ledger）来启动操作，并在项目进展中维护“进度账本”（progress ledger），确保每个阶段的任务都能按时完成。Magnetic-One 通过协调器指挥四个主要代理：WebSurfer 智能体、FileSurfer 智能体、编码智能体、计算机终端智能体，四个代理各自承担不同的角色，共同实现任务的无缝执行。协调器的自适应特性使其能够监控项目的每个阶段，及时调整计划以应对障碍。如果某个代理在特定步骤上遇到困难，协调器会重新分配任务或更新策略，确保项目持续推进。这种灵活性使 Magnetic-One 在任务执行中展现出人类般的适应能力。（IT之家）

GPT-4o 加钱能变快，新功能“预测输出” 7 秒完成原先 23 秒的任务

OpenAI 发布了一项名为“预测输出”（Predicted Outputs）的新功能，使得 GPT-4o 的响应速度提升至原先的 5 倍，适合文档更新、代码重写等无需从头生成的任务。此功能通过跳过不变内容，使模型在处理编程、迭代任务时显著提速。例如，某些编程任务原需 70 秒，现在仅需 20 秒。

尽管速度更快，但“预测输出”功能存在一定限制，例如仅支持 GPT-4o 系列，且不兼容多项 API 参数。此外，预测不使用的 tokens 仍按完成费率收费，使得新功能在速度提升的同时成本有所增加。（大G.AI商业）

微软申请专利以应对 AI “幻觉” 问题

近日，微软提交了一项专利申请，旨在通过一种技术方法减少或消除人工智能生成的虚假信息。该专利的名称为 “利用外部知识和反馈与语言模型互动”，这一提案的核心是为 AI 模型提供一种 “响应增强系统”（RAS），使其能够根据用户的查询自动提取更多信息，并检查其回答的 “有效性”。

响应增强系统能够识别是否有来自 “外部来源” 的信息能够更好地回答用户的问题，如果 AI 的回答没有包含这些信息，该系统会将其判定为不够有用。此外，RAS 还可以向用户提示其回答是否存在不足之处，用户也可以对此进行反馈。这一方案的优点在于，不需要开发者或公司对现有模型进行细致的调整。

该工具为企业 AI 聊天机器人提供了 AI 驱动的验证，能够在后台进行事实核查，判断 AI 的回答是否 “无根基” 或 “有根基”，在向用户提供答案之前，只提供有实际数据支持的回答。（AIBase基地）

消息称 Perplexity AI 搜索公司正融资 5 亿美元，市值将破 90 亿美元

媒体报道称搜索初创公司 Perplexity AI 即将完成 5 亿美元融资，预估完成后公司市值达到 90 亿美元（当前约 646.66 亿元人民币）。消息称本轮融资由风险投资公司 Institutional Venture Partners（IVP）领投，此外 IVP 会派遣一位高层入驻 Perplexity 董事会。

此前，Perplexity 公司在 1 月份完成了 7360 万美元的 B 轮融资，当时的估值约为 5.2 亿美元。Perplexity AI 的估值在几个月内增长了三倍，这表明其在市场中的快速发展和潜力。这种快速的增长吸引了更多投资者的目光，并进一步推动了其估值的提升。Perplexity 作为一家信息搜索公司，致力于挑战由 Alphabet 旗下的谷歌主导的搜索引擎市场。该公司不仅获得了 IVP 的支持，还得到了亚马逊创始人杰夫・贝索斯和芯片设计公司英伟达的投资。（IT之家）

微软 Win11 画图应用大变身！AI 填充、擦除一应俱全

11 月 7 日消息，Windows 11 新版画图应用已向 Canary 和 Dev 频道的 Windows Insider 项目成员推出测试，具体版本号为 11.2410.28.0。本次更新最主要的是引入了 AI 技术，包括生成填充和生成擦除两大功能，为用户的艺术创作带来全新体验。

生成填充功能让用户通过自然语言编辑和添加内容，同时保持项目的现有艺术风格。用户可以使用选择工具在画图工具栏中创建矩形或自由形状的选择区域，然后通过弹出的小菜单选择生成填充选项，输入想要添加的内容描述，并点击创建。如果用户对生成的结果不满意，可以简单地点击“重试”按钮，或者通过调整选择区域或文本提示来获得不同的生成结果。

生成擦除工具则允许用户从画布上移除不必要的物体，并填补空白，使其看起来像是物体从未存在过。用户在使用橡皮擦工具时选择生成擦除，手动涂抹画布上的一个或多个区域来选择要删除的内容，然后点击应用以移除物体。此外，用户还可以使用矩形或自由形状的选择工具来指定要使用生成擦除命令的区域。Cocreator 的底层扩散模型也得到了改进，以更快地提供更好的结果，并内置审核功能，确保用户有一个值得信赖的创意体验。（快科技）

Instagram 将借助 AI 技术识别青少年谎报年龄行为：朋友祝贺生日的帖子也能推测真实年龄

11 月 6 日消息，Meta 青年与社会影响产品管理总监 Allison Hartnett 表示，Meta 将使用名为“成人分类器”的专有软件工具，将 Instagram 用户分为 18 岁以上和 18 岁以下两个年龄组。该软件会从用户的账户数据中分析个人信息，查看关注者列表、互动内容，甚至朋友向自己发送的“生日快乐”祝贺帖子，以此推测用户的年龄。

系统会自动将疑似未满 18 岁的用户转为青少年账户，不论其档案上显示的年龄如何。Meta 试图让 Instagram 上谎报年龄的行为变得更加艰难，例如标记使用相同邮箱但生日不同的新账户可能无法绕过检查。此外，Meta 还可通过手机的设备 ID 来推测新账户的使用者身份。

Meta 公司发言人称，未来被误分类为青少年的用户可向公司申诉解除青少年账户限制，但该流程仍在开发中。目前，被误判为“青少年”的用户可自行关闭严格设置，无需家长许可。（IT之家）

三星计划通过自研知识图谱技术，提升 Galaxy AI 个性化体验

11 月 6 日消息，三星电子全球 AI 中心总监 Kim Dae-hyun 在社论中透露，公司计划通过自研知识图谱技术来提升 Galaxy AI 的个性化体验，同时确保用户数据的安全。

三星计划通过更好的个性化，提升 Galaxy AI 的功能和易用性，知识图谱技术被认为是实现这一目标的关键技术之一。三星计划将自研的知识图谱技术与生成式 AI 相结合，以提供更好的用户体验、安全性以及易用性。此外，三星还计划在所有设备中使用混合 AI 模型。混合 AI 模型结合了设备端 AI 和云端 AI，根据用户需求动态调整。当数据安全和速度至关重要时，设备端 AI 将发挥作用；而当需要处理大量数据时，云端 AI 则更为合适。

三星强调，AI 技术的发展应以道德、安全和普惠为原则。为此，该公司呼吁全球各国政府制定相关的法律和道德框架，以规范 AI 的开发和使用。三星已经与韩国国家 AI 委员会合作，汇集了学术界、企业界和政府的专业知识，共同推动 AI 领域的健康发展。（IT之家）

AI 颠覆服装设计！FLUX.1-dev LoRA 服装生成器来了设计小白也能秒出服装效果图

TryOn Labs 最新开发的 FLUX.1-dev LoRA 服装生成器，利用先进的人工智能技术，为用户带来前所未有的时尚设计体验。只需输入对服装的文字描述，如颜色、图案、材质、风格等细节，就能快速生成相应的服装设计图。FLUX.1-dev LoRA 模型的强大之处在于其灵活的输入格式和丰富的时尚知识库。用户可以尽情发挥创意，描述心目中的理想服装。

凭借丰富的训练数据，FLUX.1-dev LoRA 能够准确理解用户的需求，生成符合流行趋势和消费者偏好的服装设计。

为了方便用户使用和进一步开发，FLUX.1-dev LoRA 的模型权重以 Safetensors 格式提供下载。用户可以通过 Hugging Face 平台获取模型文件，进行本地部署或进行二次开发。

FLUX.1-dev LoRA 服装生成器的出现，无疑为时尚设计领域带来了新的可能性。它不仅可以帮助设计师快速捕捉灵感，进行创意探索，还能让普通用户轻松体验服装设计的乐趣，定制个性化的时尚风格。（AIbase基地）

SK 电信发布人工智能驱动的个人助理 Aster

SK 电信(SK Telecom)在 SK AI 峰会 2024 上发布了为全球用户量身定制的人工智能（AI）驱动个人助理“ Aster ”。Aster 展示了日常生活中“指导伴侣(Guiding Companion)”的含义。该服务计划于今年晚些时候在北美进行封闭测试，并计划于明年全面推出市场。

Aster 被设计为“代理人工智能”，超越了简单的问答或搜索功能，通过理解用户的意图来设定目标、制定计划和完成任务。SK 电信正致力于优化其大型语言模型（LLM）和 Agent 平台。这将使个性化信息的传递，以及基于已识别的客户意图的任务计划和执行成为可能。（全球TMT）

AI 语音实时转录：Bola AI 与 Open Dental 合作简化牙科工作流程

近日，人工智能语音技术提供商 Bola Technologies, Inc.与牙科管理软件提供商 Open Dental Software 宣布达成合作。此次合作将 Bola AI 的 Voice Perio 软件集成到 Open Dental 的牙科诊所管理软件中，旨在简化牙科诊所的临床工作流程，减轻员工负担。

本次合作推出的新软件的主要特点包括：实时语音录入、智能过滤功能、多口音兼容、无缝集成、提升数据准确性、改善患者沟通。Open Dental 的开发副总裁对这次合作表示认可："我们很高兴能将 Bola AI 的 AI 语音解决方案引入 Open Dental 生态系统。这次合作契合我们围绕 Open Dental 平台构建社区驱动创新的愿景。"（格隆汇）

今日热门视频

近期热门文章

腾讯 Robotics X 无战事

达摩院前传：那些帮淘宝赚过大钱的AI科学家们

3D 视觉派：斯坦福具身智能人物关系图

http://mp.weixin.qq.com/s?__biz=MTM2ODM0ODYyMQ==&mid=2651717226&idx=3&sn=ba9a36e8bce2cd1ee19ccbb2b5d29d8f

雷峰网

洞见智能未来，共与产业变迁