AI日报：腾讯发布混元视频生成大模型；阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字

科技科技 2024-12-03 16:26 福建

关注我，记得标星⭐️不迷路

AI日报

12月3日•AIbase

1、阶跃星辰视频生成大模型Step-Video开启内测可在跃问视频申请

2、Luma发布全新图像生成模型Luma Photon，速度更快，成本更低！

3、可灵AI导演共创计划作品12月6日上线将发布9部电影级AI视频

4、字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了！

5、秘塔AI搜索：「学术搜索」数据增加7倍新增”解释“功能

6、李飞飞创业首秀：一张图生成交互式 3D 世界，AIGC 进入全新时代！

7、告别语音克隆侵权！Hume AI推出语音控制功能，可创建个性化AI语音

8、Cohere推新的搜索模型 Rerank 3.5：可处理100多种语言精准查询

9、OpenAI CFO 回应广告传闻：当前不考虑引入广告模式

10、提到 “David Mayer”一词ChatGPT就崩溃，这是什么神秘力量？

11.腾讯发布混元视频生成大模型：130 亿参数全面开源

1. 阶跃星辰视频生成大模型Step-Video开启内测可在跃问视频申请

阶跃星辰的Step-Video模型正式开启内测，该模型支持从文本生成高达1080P分辨率、最长10秒的视频，展现出在自动优化提示词、美学风格和运动控制方面的显著优势。尤其在中国风题材的生成上，Step-Video能够精准理解古诗意境，展现出优秀的运动控制性能，处理复杂的空间和物体关系。

亮点提要：

🎬 Step-Video模型支持从文本生成高清视频，分辨率高达1080P，最长可达10秒。

🌟 在美学风格上，Step-Video对中国风题材的理解和生成尤为精准，符合古诗意境。

⚙️ 该模型在运动控制方面表现优异，能够生成符合物理规律的视频，处理复杂的空间关系。

详情入口：

🔗 https://top.aibase.com/tool/yuewenshipin

2. Luma发布全新图像生成模型Luma Photon，速度更快，成本更低！

Luma Labs推出的Luma Photon和Photon Flash是两款革命性的图像生成模型，具有超高的生成速度和低成本优势。Luma Photon在多项测试中表现出色，能够生成高质量的图像，适用于广告、影视、艺术等多个领域。

亮点提要：

🚀 Luma Photon生成图像速度是市场上其他模型的10倍，成本低至0.2美分每张1080p图片。

🎨 支持多轮自然语言指令，用户可逐步优化生成内容，适合复杂创意任务。

📈 在质量、创造力和理解力方面，Luma Photon在双盲评估中超越市场上所有模型。

详情入口：

🔗 https://lumalabs.ai/photon

3. 可灵AI导演共创计划作品12月6日上线将发布9部电影级AI视频

快手科技宣布将于12月6日正式上线中国首个AIGC导演共创计划——“可灵AI导演共创计划”。此计划由快手自研的视频生成大模型“可灵AI”联合多位知名导演共同发起，旨在通过AI技术拓宽影视创作的边界。九部实验性质的短片将全部使用可灵AI生成，标志着中国影视行业在电影级内容创作上的新尝试。自发布以来，可灵AI已服务超500万用户，生成了大量视频和图片，展现了其强大的创作潜力。

亮点提要：

🎥 计划由快手科技与9位知名导演共同发起，涵盖多元题材。

🤖 所有短片将使用可灵AI进行视频生成，推动AI技术在影视创作中的应用。

📈 可灵AI自发布以来已服务超500万用户，生成5100万个视频和1.5亿张图片。

4. 字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了！

字节跳动旗下的即梦AI最近推出了图片2.1模型，用户只需简单输入文字描述，便可快速生成个性化海报，极大提高了设计师的工作效率。新模型的应用场景广泛，包括海报制作、书籍封面设计和社交媒体配图等，尽管仍在灰度测试中，但其潜力和可玩性已经显现，值得期待。

亮点提要：

🎨 新模型支持中文字体生成，提升海报设计效率。

📚 用户可通过文字描述创建个性化海报和封面。

🌌 模型应用场景广泛，适用于社交媒体、故事创作等。

详情入口：

🔗 https://top.aibase.com/tool/jimeng

5. 秘塔AI搜索：「学术搜索」数据增加7倍新增”解释“功能

上海秘塔网络科技有限公司最近对其AI秘塔学术搜索功能进行了重大升级，数据量增加了7倍，用户现在可以更全面地检索到数千万篇Open Access论文，包括40%的SCI论文及顶级期刊如《Nature》和《Science》。

亮点提要：

📈 数据量增加7倍，覆盖数千万篇Open Access论文，提升检索能力。

📝 新增“解释”功能，帮助用户理解文献中复杂的句子。

🌍 支持44种语言的翻译模型，消除小语种论文的阅读障碍。

6. 李飞飞创业首秀：一张图生成交互式 3D 世界，AIGC 进入全新时代！

李飞飞的最新创业项目World Labs，带来了颠覆性的3D生成技术。用户只需提供一张图片或一句话，就能创造出互动的3D场景，标志着AIGC进入全新的沉浸式时代。这项技术不仅能精准还原细节，还能模拟各种相机效果，赋予用户导演般的控制感。

亮点提要：

🖼️ 只需一张图片或一句话，即可生成栩栩如生的3D场景，开启全新交互体验。

🎥 该技术支持模拟多种相机效果，让用户在3D世界中自由掌控镜头。

🚀 World Labs计划持续提升3D世界的规模和精度，探索更多用户互动方式。

详情入口：

🔗 https://www.worldlabs.ai/blog

7. 告别语音克隆侵权！Hume AI推出语音控制功能，可创建个性化AI语音

Hume AI最近推出了一项名为“语音控制”的实验性功能，使用户能够轻松创建个性化的AI声音，无需任何编码技能。该功能允许用户通过滑块调整声音特征，提供多种维度的定制选项，旨在满足多样化的应用需求。

亮点提要：

🔊 Hume AI推出“语音控制”功能，用户可轻松创建个性化AI声音。

🛠️ 该功能无须编码技能，用户可以通过滑块调整声音特征。

🌐 Hume旨在通过个性化和情感智能的语音AI来满足多样化的应用需求。

详情入口：

🔗 https://www.hume.ai/blog/introducing-voice-control

8. Cohere推新的搜索模型 Rerank 3.5：可处理100多种语言精准查询

Cohere最近推出的Rerank3.5搜索模型，该模型支持超过100种语言的查询，尤其在阿拉伯语、日语和韩语等主要商业语言中表现出色，帮助跨国公司打破语言障碍。内部测试显示，Rerank3.5在金融服务领域的表现显著提升，能够节省成本并降低风险。

亮点提要：

📊 Rerank3.5能够处理100多种语言的查询，帮助全球企业打破语言障碍。

💡 内部测试显示，该模型在金融服务领域的搜索表现大幅提升，能节省成本和降低风险。

🚀 Cohere 通过主流云平台的部署，力求成为企业搜索的行业标准，同时企业需随时适应快速变化的 AI 环境。

详情入口：

🔗 https://cohere.com/blog/rerank-3pt5

9. OpenAI CFO 回应广告传闻：当前不考虑引入广告模式

OpenAI的首席财务官Sarah Friar在接受采访时表示，当前公司并无计划引入广告，尽管广告收入对盈利公司来说是一个诱人的选择。Friar提到，OpenAI正在快速增长，并在现有商业模式中发现了机会，未来可能会探索其他收入来源。

亮点提要：

🌟 OpenAI CFO Sarah Friar 表示当前无意引入广告，未来有可能探索其他收入来源。

💼 OpenAI 招聘了多位广告和市场营销领域的专家，表明未来或将考虑广告模式。

🚪 公司高管频繁变动，创始人 Sam Altman 依然在努力推动公司愿景。

10. 提到 “David Mayer”一词ChatGPT就崩溃，这是什么神秘力量？

最近，社交媒体上出现了一个让人困惑的现象：OpenAI的聊天机器人ChatGPT在提到“David Mayer”时无法正常回应，并强制结束对话。这一现象引发了网友们的广泛讨论与猜测，许多人尝试询问ChatGPT有关“David Mayer”的信息，却都遭遇了同样的结局。

亮点提要：

🌐 ChatGPT在提到“David Mayer”时无法回应，并强制结束对话。

🔍 “David Mayer”可能与法律问题有关，涉及GDPR被遗忘权。

🤔 其他姓名同样会导致ChatGPT出现故障，凸显AI模型的复杂性。

11. 提到 “David Mayer”一词ChatGPT就崩溃，这是什么神秘力量？

WPS Office 近期发布了 AI 语音速记功能，增强了语音转文字的体验，支持实时录音和多语言互译。该功能通过声纹识别和 AI 自动总结提升准确性，并与 WPS 云文档深度整合，确保用户在录音过程中能顺利继续录音。

亮点提要：

🗣️ 语音速记功能实现实时录音与音频转文字。

🌐 支持中英等多种语言的互译功能。

🔒 提供安全的文档协作体验，提升用户便利性。

12. 腾讯发布混元视频生成大模型：130 亿参数全面开源

腾讯推出了混元视频生成模型，拥有 130 亿参数，是当前最大开源视频生成模型。该模型支持高清、真实感视频生成，适用于广告和创意视频等商业应用。用户可通过腾讯元宝 APP 和腾讯云接口进行试用或对接，降低了视频生成的技术门槛，促进了 AI 技术的普及。

亮点提要：

🌐 ChatGPT在提到“David Mayer”时无法回应，并强制结束对话。

🔍 “David Mayer”可能与法律问题有关，涉及GDPR被遗忘权。

🤔 其他姓名同样会导致ChatGPT出现故障，凸显AI模型的复杂性。

详情入口：

官网：https://aivideo.hunyuan.tencent.com

模型：https://huggingface.co/tencent/HunyuanVideo

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

AIbase基地

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

Firefox 浏览器推出 Orbit AI 助手：告别信息过载，迎接高效网络体验！

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;功能;嫌犯用ChatGPT策划酒店爆炸案

AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

AI日报：昆仑万维天工版o1、4o同时上线；罗永浩新项目发布AI助理 “J1 Assistant” ;爱奇艺起诉海螺AI版权侵权

Kimi、豆包之外新选择！理想同学 App 有问必答带你看世界

AI日报：阿里入局AI眼镜；套壳AI产品TypingMind赚百万美元；DeepMind天才科学家去世

AI日报：百度Web端首页上线“AI搜”入口；字节跳动否认开发AI手机传闻；李彦宏：AI应用将在2025年井喷

Cline 解锁 VSCode 编程新体验：Claude 3.5 Sonnet、DeepSeek V3 随意用！

AI日报：可灵AI API对口型能力全面开放；百度2024年度AI提示词“答案”;通义千问视觉理解模型全线降价超80%

AI日报：5秒一个视频！PixVerse V3.5上线；雷军千万年薪挖角AI天才少女；比亚迪启动人形机器人项目

小红书新产品「小绿书」？免费 AI 搜索神器：美食旅行购物全搞定！

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；抖音引入音频审核大模型;ChatGPT本月第二次大规模宕机

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源

马斯克 xAI 再发力！Grok app 上线：免费 AI 助手+图像生成，OpenAI、Claude 强劲新对手

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米

全新免费版 GitHub Copilot 上线！微软大善人，1.5 亿开发者白嫖 Claude 3.5 Sonnet！

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧

AI日报：苹果或与腾讯、字节洽谈AI合作；可灵1.6版本上线；ChatGPT新增电话功能支持老年机

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

Whisk 施展魔法！Google 全新 AI 图像生成工具，以图生图无需提示词！

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

AI日报：张文宏被AI假冒直播带货；Kimi视觉思考版上线；Pika2.0可操控视频内容元素；微信打击AI仿冒知名人士行为

比 ChatGPT Pro 还贵！Devin AI 编程凭啥敢收 500 美元订阅费？

AI日报：OpenAI全量上线视频聊天功能；xAI与OpenAI薪资对比曝光；Anthropic最快模型全面开放

AI日报：苹果全家桶接入ChatGPT；谷歌Gemini 2.0版来袭；ChatGPT全球宕机已修复；百度文库上线专业PPT生成

Midjourney上新！Patchwork一句话就能生成生动世界，无限画布支持100人共同协作，小说作者、游戏开发者狂喜

AI日报：OpenAI全面开放Canvas功能；豆包电脑版视频生成功能内测；全球首个AI程序员Devin开放使用

AI日报：OpenAI重磅上线Sora；智谱AI免费多模态模型GLM-4V-Flash；腾讯云打造AI代码助手

宅男福音！VR角色扮演AI来了，南洋理工“造人”新突破，唱跳互动还能陪你聊！

AI日报：广电总局整治AI“魔改”视频乱象；Hailuo AI上线AI语音克隆功能；百川智能商业化负责人洪涛离职

Runway Act one又更新了！支持克隆视频人物表演，一键get同款表情、动作、声音

Mozilla Firefox 打造 Deep Fake Detector：多模型一键精准识别 AI 内容

疯感kitty走红小红书 3分钟教会你用Recraft做“怪诞美学”头像

AI日报：OpenAI推出每月200美元ChatGPT Pro;ComfyUI插件被植入挖矿病毒;京东发布10大AI营销工具

AI日报：iPhone国行版或接入文心4.0模型；ChatGPT周活跃用户数突破3亿；Genie 2一键生成无限3D世界

开口跪！超自然声音克隆工具Fish Speech 1.5上线，新增5种语言，很快将支持实时无缝对话

AI日报：字节AI助手豆包上线图片理解功能；亚马逊推Nova系列AI生成模型；文心一言上线“深度写作”专业版功能

Hailuo AI推I2V-01-Live模型，以后人人都可以轻松制作高质量动画视频了

即梦灰测2.1模型，AI生图终于可以出中文字体了！一句话做海报成真！

AI日报：腾讯发布混元视频生成大模型；阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字

AI日报：微信公众号支持AI配图；阿里云通义万相全新图像编辑模型ACE；快手可灵AI推「AI试衣」功能

虚拟主播带货太僵硬？中科院联手腾讯打造“AI带货王”AnchorCrafter，动作表情自然到位

超自然的 AI 人声！对标 NotebookLM，ElevenLabs 推出 GenFM 功能

AI日报：Kimi灰测AI视频生成功能；复旦明确毕业论文AI使用规范；ChatGPT诞生两周年;智谱AI发布AutoGLM升级版

智谱AI推出AutoGLM升级版：一句话操控全网APP 不但会点外卖还会发红包

360偷偷搞了个大的？纳米搜索颠覆传统，支持一键生成脱口秀视频！

AI日报：字节诉攻击模型训练实习生索赔800万；阿里发布推理模型QwQ-32B-Preview；ComfyUI桌面版发布

AI日报：惊艳！Sora遭恶意泄露；昆仑万维Skywork o1启动邀测；阿里开源图像生成模型Qwen2vl-Flux

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉