1、阶跃星辰视频生成大模型Step-Video开启内测 可在跃问视频申请
2、Luma发布全新图像生成模型Luma Photon,速度更快,成本更低!
3、可灵AI导演共创计划作品12月6日上线 将发布9部电影级AI视频
4、字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了!
5、秘塔AI搜索:「学术搜索」数据增加7倍 新增”解释“功能
6、李飞飞创业首秀:一张图生成交互式 3D 世界,AIGC 进入全新时代!
7、告别语音克隆侵权!Hume AI推出语音控制功能,可创建个性化AI语音
8、Cohere推新的搜索模型 Rerank 3.5:可处理100多种语言精准查询
9、OpenAI CFO 回应广告传闻:当前不考虑引入广告模式
10、提到 “David Mayer”一词ChatGPT就崩溃,这是什么神秘力量?
11.腾讯发布混元视频生成大模型:130 亿参数全面开源
1. 阶跃星辰视频生成大模型Step-Video开启内测 可在跃问视频申请
阶跃星辰的Step-Video模型正式开启内测,该模型支持从文本生成高达1080P分辨率、最长10秒的视频,展现出在自动优化提示词、美学风格和运动控制方面的显著优势。尤其在中国风题材的生成上,Step-Video能够精准理解古诗意境,展现出优秀的运动控制性能,处理复杂的空间和物体关系。
亮点提要:
🎬 Step-Video模型支持从文本生成高清视频,分辨率高达1080P,最长可达10秒。
🌟 在美学风格上,Step-Video对中国风题材的理解和生成尤为精准,符合古诗意境。
⚙️ 该模型在运动控制方面表现优异,能够生成符合物理规律的视频,处理复杂的空间关系。
详情入口:
🔗 https://top.aibase.com/tool/yuewenshipin
2. Luma发布全新图像生成模型Luma Photon,速度更快,成本更低!
Luma Labs推出的Luma Photon和Photon Flash是两款革命性的图像生成模型,具有超高的生成速度和低成本优势。Luma Photon在多项测试中表现出色,能够生成高质量的图像,适用于广告、影视、艺术等多个领域。
亮点提要:
🚀 Luma Photon生成图像速度是市场上其他模型的10倍,成本低至0.2美分每张1080p图片。
🎨 支持多轮自然语言指令,用户可逐步优化生成内容,适合复杂创意任务。
📈 在质量、创造力和理解力方面,Luma Photon在双盲评估中超越市场上所有模型。
详情入口:
🔗 https://lumalabs.ai/photon
3. 可灵AI导演共创计划作品12月6日上线 将发布9部电影级AI视频
快手科技宣布将于12月6日正式上线中国首个AIGC导演共创计划——“可灵AI导演共创计划”。此计划由快手自研的视频生成大模型“可灵AI”联合多位知名导演共同发起,旨在通过AI技术拓宽影视创作的边界。九部实验性质的短片将全部使用可灵AI生成,标志着中国影视行业在电影级内容创作上的新尝试。自发布以来,可灵AI已服务超500万用户,生成了大量视频和图片,展现了其强大的创作潜力。
亮点提要:
🎥 计划由快手科技与9位知名导演共同发起,涵盖多元题材。
🤖 所有短片将使用可灵AI进行视频生成,推动AI技术在影视创作中的应用。
📈 可灵AI自发布以来已服务超500万用户,生成5100万个视频和1.5亿张图片。
4. 字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了!
字节跳动旗下的即梦AI最近推出了图片2.1模型,用户只需简单输入文字描述,便可快速生成个性化海报,极大提高了设计师的工作效率。新模型的应用场景广泛,包括海报制作、书籍封面设计和社交媒体配图等,尽管仍在灰度测试中,但其潜力和可玩性已经显现,值得期待。
亮点提要:
🎨 新模型支持中文字体生成,提升海报设计效率。
📚 用户可通过文字描述创建个性化海报和封面。
🌌 模型应用场景广泛,适用于社交媒体、故事创作等。
详情入口:
🔗 https://top.aibase.com/tool/jimeng
5. 秘塔AI搜索:「学术搜索」数据增加7倍 新增”解释“功能
上海秘塔网络科技有限公司最近对其AI秘塔学术搜索功能进行了重大升级,数据量增加了7倍,用户现在可以更全面地检索到数千万篇Open Access论文,包括40%的SCI论文及顶级期刊如《Nature》和《Science》。
亮点提要:
📈 数据量增加7倍,覆盖数千万篇Open Access论文,提升检索能力。
📝 新增“解释”功能,帮助用户理解文献中复杂的句子。
🌍 支持44种语言的翻译模型,消除小语种论文的阅读障碍。
6. 李飞飞创业首秀:一张图生成交互式 3D 世界,AIGC 进入全新时代!
李飞飞的最新创业项目World Labs,带来了颠覆性的3D生成技术。用户只需提供一张图片或一句话,就能创造出互动的3D场景,标志着AIGC进入全新的沉浸式时代。这项技术不仅能精准还原细节,还能模拟各种相机效果,赋予用户导演般的控制感。
亮点提要:
🖼️ 只需一张图片或一句话,即可生成栩栩如生的3D场景,开启全新交互体验。
🎥 该技术支持模拟多种相机效果,让用户在3D世界中自由掌控镜头。
🚀 World Labs计划持续提升3D世界的规模和精度,探索更多用户互动方式。
详情入口:
🔗 https://www.worldlabs.ai/blog
7. 告别语音克隆侵权!Hume AI推出语音控制功能,可创建个性化AI语音
Hume AI最近推出了一项名为“语音控制”的实验性功能,使用户能够轻松创建个性化的AI声音,无需任何编码技能。该功能允许用户通过滑块调整声音特征,提供多种维度的定制选项,旨在满足多样化的应用需求。
亮点提要:
🔊 Hume AI推出“语音控制”功能,用户可轻松创建个性化AI声音。
🛠️ 该功能无须编码技能,用户可以通过滑块调整声音特征。
🌐 Hume旨在通过个性化和情感智能的语音AI来满足多样化的应用需求。
详情入口:
🔗 https://www.hume.ai/blog/introducing-voice-control
8. Cohere推新的搜索模型 Rerank 3.5:可处理100多种语言精准查询
Cohere最近推出的Rerank3.5搜索模型,该模型支持超过100种语言的查询,尤其在阿拉伯语、日语和韩语等主要商业语言中表现出色,帮助跨国公司打破语言障碍。内部测试显示,Rerank3.5在金融服务领域的表现显著提升,能够节省成本并降低风险。
亮点提要:
📊 Rerank3.5能够处理100多种语言的查询,帮助全球企业打破语言障碍。
💡 内部测试显示,该模型在金融服务领域的搜索表现大幅提升,能节省成本和降低风险。
🚀 Cohere 通过主流云平台的部署,力求成为企业搜索的行业标准,同时企业需随时适应快速变化的 AI 环境。
详情入口:
🔗 https://cohere.com/blog/rerank-3pt5
9. OpenAI CFO 回应广告传闻:当前不考虑引入广告模式
OpenAI的首席财务官Sarah Friar在接受采访时表示,当前公司并无计划引入广告,尽管广告收入对盈利公司来说是一个诱人的选择。Friar提到,OpenAI正在快速增长,并在现有商业模式中发现了机会,未来可能会探索其他收入来源。
亮点提要:
🌟 OpenAI CFO Sarah Friar 表示当前无意引入广告,未来有可能探索其他收入来源。
💼 OpenAI 招聘了多位广告和市场营销领域的专家,表明未来或将考虑广告模式。
🚪 公司高管频繁变动,创始人 Sam Altman 依然在努力推动公司愿景。
10. 提到 “David Mayer”一词ChatGPT就崩溃,这是什么神秘力量?
最近,社交媒体上出现了一个让人困惑的现象:OpenAI的聊天机器人ChatGPT在提到“David Mayer”时无法正常回应,并强制结束对话。这一现象引发了网友们的广泛讨论与猜测,许多人尝试询问ChatGPT有关“David Mayer”的信息,却都遭遇了同样的结局。
亮点提要:
🌐 ChatGPT在提到“David Mayer”时无法回应,并强制结束对话。
🔍 “David Mayer”可能与法律问题有关,涉及GDPR被遗忘权。
🤔 其他姓名同样会导致ChatGPT出现故障,凸显AI模型的复杂性。
11. 提到 “David Mayer”一词ChatGPT就崩溃,这是什么神秘力量?
亮点提要:
12. 腾讯发布混元视频生成大模型:130 亿参数全面开源
腾讯推出了混元视频生成模型,拥有 130 亿参数,是当前最大开源视频生成模型。该模型支持高清、真实感视频生成,适用于广告和创意视频等商业应用。用户可通过腾讯元宝 APP 和腾讯云接口进行试用或对接,降低了视频生成的技术门槛,促进了 AI 技术的普及。
亮点提要:
🌐 ChatGPT在提到“David Mayer”时无法回应,并强制结束对话。
🔍 “David Mayer”可能与法律问题有关,涉及GDPR被遗忘权。
🤔 其他姓名同样会导致ChatGPT出现故障,凸显AI模型的复杂性。
详情入口:
一个致力于让更多人了解并参与未来AI发展的平台
这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程
更多AI硬核内容直接访问AiBase官网,一键开启你的AGI之旅!
官网:https://www.aibase.com/zh/tools/
↓点击阅读原文,进AIbase官网.