1、字节跳动:视频生成模型在豆包电脑版开启内测
2、全球广告收入预计将首破1万亿美元
3、YouTube自动配音功能推广至更多频道 可自动生成多语言翻译音轨
字节跳动
视频生成模型在豆包电脑版开启内测
字节跳动视频生成模型 PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
PixelDance视频生成模型于9月底首次发布,最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测,外部对其多镜头组合、运镜切换及人物运动能力评价较好。
早期内测创作者介绍,当PixelDance生成10秒视频时,切换镜头3-5次的效果最佳,场景和角色能保持很好的一致性。通过小幅度、渐进式的提示词描述,PixelDance能生成魔术般的特效。此外,用户还可使用时序提示词、长镜头等技巧,增强视频的复杂度和表现力,对剧情创作非常友好。
目前,基于该模型的视频生成能力已在豆包电脑版陆续开放。豆包相关负责人表示,未来仍将持续开放和优化该功能,更好地帮助普通用户创作和表达。
全球广告收入
预计将首破1万亿美元
据金融时报报道,今年,全球的广告业收入将首次突破 1 万亿美元大关,而 Google、Meta、字节跳动、亚马逊和阿里巴巴预计将在这个由科技行业主导的市场中获得超过一半的收入。
WPP 旗下的群邑集团发布报告称,尽管美国和英国等大型发达市场的经济形势严峻,但 2024 年全球广告收入将增长 9.5%,高于该公司在年中时的预期。
报道指出,在中国,预计 2024 年广告总收入将增长 13.5%,达到 2045 亿美元。而作为欧洲最大的广告市场,英国的广告总收入到 2024 年将达到 532 亿美元,今年的增长估计为 8.3%。
YouTube自动配音功能推广至更多频道
可自动生成多语言翻译音轨
YouTube 宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。
去年,YouTube 在 Vidcon 大会上首次推出了这一 AI 驱动的自动配音工具,旨在帮助全球用户更容易地理解平台上的内容。据介绍,官方已经将自动配音功能推广至 YouTube 合作伙伴计划中的数十万个知识类和信息类频道,未来还将扩展到更多内容类型。
创作者只需按照常规上传视频,YouTube 会自动识别语言并生成多语种配音版本。目前,该工具支持英语、法语、德语、印地语、印尼语、意大利语、日语、葡萄牙语和西班牙语。
YouTube 的自动配音功能采用了谷歌的 Gemini 技术模拟人类语音。不过该公司提醒,技术仍在初期阶段,可能并不完美,某些翻译或配音效果可能存在问题。
此外,YouTube 还提醒创作者,另一个名为“表现性语音”的功能即将上线,旨在更好地模拟创作者的语气、情感,甚至是周围环境的氛围。YouTube 宣布将继续与 Google DeepMind 和 Google Translate 团队合作,推出尖端技术,使配音更加准确、生动和自然。
谷歌量子芯片5分钟完成
目前超算需「10 的 25 次方」年运算
谷歌宣布其最新量子芯片 Willow 在基准测试中表现惊人,Willow 在不到 5 分钟的时间内完成了一个标准的基准计算,而当今最快的超级计算机需要耗时 10^25 年(即 10,000,000,000,000,000,000,000,000 年),这个数字远远超过了宇宙年龄。
传统计算机每个晶体管只能处于 0 或 1 两种状态,但作为量子计算机中的计算单位,一个量子比特可存在多种状态,这可以加速某些类型的计算应用。量子计算在人工智能、物流规划、化学模拟和加密等应用领域有望改变「游戏规则」。
OpenAI开放Canvas效率神器
让ChatGPT AI更懂你 可执行代码、风格化写作
OpenAI 宣布将面向所有 ChatGPT 用户,开放 Canvas 功能,重点提升用户写作和编码项目的效率。OpenAI 表示,目前用户可以在网页版和 Windows 10、Windows 11 版 ChatGPT 应用中体验该功能,并即将推出 Mac 版和移动平台版本(iOS、Android、移动网页版)
OpenAI Canvas 是 ChatGPT 的一个新界面,用于处理需要编辑和修改的写作和编码项目。该功能最早于 2024 年 10 月推出,现在向所有 ChatGPT 用户开放。
Canvas 入口位于 ChatGPT 聊天机器人的旁边,点击按钮进入;用户也可以在提示词中加入「使用 Canvas……」,或在网页版 ChatGPT 中输入「打开 Canvas」或「打开代码 Canvas」来打开一个空白 Canvas。
Canvas 提供了丰富的快捷键,例如建议编辑、调整长度、更新阅读水平、添加表情符号等;用户可以直接在浏览器中执行 Python 代码,输出结果会显示在控制台,ChatGPT 还会提供错误建议并尝试修复错误。
特斯拉Optimus机器人公布新进展
在崎岖的地形上行走时更自然
昨日,特斯拉 Optimus 在 X 平台发布了这款机器人在斜坡上「散步」的视频。
工程师 Milan Kovac 提到,在进行「散步」时,Optimus 实际上是没有调用到视觉摄像头的。不过进行这样的挑战也并不意味着 Optimus 将放弃视觉功能。此外,他还公布了 Optimus 后续的工作内容:
添加视觉功能,以便更好地提前规划;让 Optimus 步态在崎岖的地形上行走时,看起来更自然;使其对速度/方向命令更敏感;学习如何摔倒以最小化不可避免的伤害(并重新站起来)。