首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧

科技科技 2024-12-20 15:54 福建

关注我，记得标星⭐️不迷路

AI日报

12月20日•AIbase

1、谷歌发布王炸推理模型Gemini2.0 Flash Thinking，挑战 OpenAI o1

2、支付宝面向商家营销推出AI创意生成平台，已累计生成8700万张AI素材

3、Runway更新重磅功能：支持插入中间帧控制视频生成

4、电商产品试穿神器！Krea AI新功能：几秒钟将真实产品添加到任何图像中

5、跳过o2！OpenAI 或计划推出新一代 “o3” 推理模型

6、闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟支持32种语言

7、ChatGPT桌面端新增应用协作功能

8、AI编程助手Cursor再获融资1亿美元，估值飙升至26亿美元

9、GPT之父离职震动AI圈:OpenAI传奇研究员Radford转向独立研究

10、闪极推出国内首款999元AI眼镜：30g重量挑战可穿戴新赛道

11、Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

12、14万亿token训练量加持:Falcon3挑战主流开源AI模型

1. 谷歌发布王炸推理模型Gemini2.0 Flash Thinking，挑战 OpenAI o1

谷歌近期推出的Gemini2.0 Flash Thinking模型在多模态推理领域展现出强大的能力，支持32,000个输入标记和8,000个输出标记，极大提升了处理复杂问题的效率。该模型通过透明的逐步推理方式解决了AI“黑箱”问题，增强了用户对模型决策过程的理解。

亮点提要：

🌟 Gemini2.0 Flash Thinking模型具备强大的推理能力，支持32,000个输入标记和8,000个输出标记。

💡 该模型通过下拉菜单提供逐步推理，增强透明性，解决AI“黑箱”问题。

🖼️ 具备原生图像上传与分析能力，扩展了多模态应用场景。

详情入口：

🔗 https://ai.google.dev/gemini-api/docs/thinking-mode?hl=zh-cn

2. 支付宝面向商家营销推出AI创意生成平台，已累计生成8700万张AI素材

支付宝最近推出了名为“蚂上有创意”的AI创意生成平台，专为商家和设计师提供快速生成创意素材和智能分析的服务。该平台不仅免费开放了大量营销图片素材，还通过AI技术支持快速生成海报、视频等内容，并提供创意洞察服务，帮助商家提升营销效果。

亮点提要：

🖼️ 支持快速生成海报、Banner、视频等多种内容，简化创意制作流程。

📊 提供AI创意洞察服务，帮助商家分析和优化营销物料，提高转化率。

🚀 自去年以来，支付宝已生成8700万张AI素材，推动商家营销的智能化发展。

3. Runway更新重磅功能：支持插入中间帧控制视频生成

Runway平台最近推出了一项重要更新，允许用户在视频生成过程中插入中间帧。这一功能的推出满足了许多用户的期待，使得视频制作的创作自由度和灵活性大大增强。用户不仅可以上传首尾帧，还可以通过添加中间帧来丰富视频内容，提升画面的协调性和流畅度。

亮点提要：

🎨 用户现在可以在视频生成中选择首尾帧并插入中间帧，增加创作灵活性。

🚀 新增的关键帧功能使得视频画面更丰富，提升了整体质量和流畅度。

✨ 用户体验反馈积极，展示了该功能在实际应用中的效果。

4. 电商产品试穿神器！Krea AI新功能：几秒钟将真实产品添加到任何图像中

Krea AI最近推出了令人兴奋的新功能——自定义训练，允许用户在几秒钟内将真实产品添加到任何图像中。该功能通过简单的涂抹和选择商品图，实现了产品与图像的无缝融合，极大提升了设计和创作的效率。用户可以轻松替换模特的配件和服装，甚至进行logo的替换，展现出强大的创作能力，成为电商创作的得力助手。

亮点提要：

✨ 用户可以在几秒钟内将真实产品添加到图像中，提升设计效率。

🖌️ 通过简单的涂抹和选择，AI实现产品与图像的完美融合。

👗 支持多种替换操作，包括配件、服装和logo，操作流畅。

5. 跳过o2！OpenAI 或计划推出新一代 “o3” 推理模型

OpenAI 正在研发新一代推理模型“o3”，旨在提升用户提问时的回应质量，使其更加深思熟虑和逻辑严谨。由于与英国电信公司O2的商标冲突，OpenAI选择跳过“o2”直接命名为“o3”。

亮点提要：

🌟 OpenAI 正在开发新的推理模型 “o3”，旨在提升思考能力和用户互动体验。

⚖️ 由于与英国电信公司 O2的潜在商标冲突，OpenAI 决定跳过 “o2” 直接命名为 “o3”。

📈 新模型的推出是 OpenAI 应对产品更新放缓的一项战略举措，期望在各行业实现更广泛的应用。

6. 闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟支持32种语言

ElevenLabs近期推出了其最新的人声合成模型Flash，声称这是迄今为止最快的文本转语音解决方案，生成语音的延迟仅为75毫秒，特别适合低延迟的对话式语音助手。Flash模型分为两个版本，其中Flash v2仅支持英语，而Flash v2.5则支持32种语言。

亮点提要：

🌟 Flash模型生成语音的延迟仅为75毫秒，适合低延迟的对话式语音助手。

🌍 Flash v2.5支持32种语言，用户生成每两个字符消耗1个积分。

🚀 在盲测中，Flash模型表现优于其他同类产品，成为速度最快的文本转语音解决方案。

7. ChatGPT桌面端新增应用协作功能

OpenAI最近推出了ChatGPT桌面应用程序的重要更新，其中新增的“与应用协作”功能使得ChatGPT能够直接读取多种应用程序的内容，如终端、IDE和文本编辑器。这一更新极大地提升了开发者和创作者的工作效率，支持的应用程序包括Apple Notes、Notion、VS Code等。

亮点提要：

🌟 ChatGPT新增“与应用协作”功能，支持直接读取多个应用内容。

💻 支持的应用包括Apple Notes、Xcode、VS Code等，覆盖广泛。

🗣️ 更新后，用户可使用高级语音模式与应用进行互动，提供更直观的使用体验。

8. AI编程助手Cursor再获融资1亿美元，估值飙升至26亿美元

这一轮融资由 Thrive Capital 领投，Andreessen Horowitz 参与但未主导。Cursor 的市场竞争虽激烈，但其受欢迎程度明显高于竞争对手，年收入在短时间内从400万美元增长至4800万美元，显示出强劲的增长势头。

亮点提要：

🌟 Cursor 成功融资1亿美元，估值达26亿美元!

🚀 仅四个月时间，公司估值暴涨6.5倍，投资者热情高涨。

💰 公司的年收入从400万美元迅速增长至4800万美元，业绩亮眼。

9. GPT之父离职震动AI圈:OpenAI传奇研究员Radford转向独立研究

OpenAI的核心研究员Alec Radford宣布离职，转向独立研究，引发AI领域的广泛关注。他是GPT系列的首席设计师，曾在AI领域做出重要贡献，包括提出基于Transformer的语言模型生成预训练方法。

亮点提要：

🚀 Radford在2016年加入OpenAI，推动了GPT系列模型的研发，奠定了现代AI的基础。

📈 他的离职发生在OpenAI高层频繁变动的背景下，可能影响公司的未来发展方向。

🤝 尽管选择独立研究，Radford计划与OpenAI及其他AI开发者保持合作，探索新的创新模式。

10. 闪极推出国内首款999元AI眼镜：30g重量挑战可穿戴新赛道

闪极科技于12月19日发布了国内首款量产AI眼镜——闪极AI「拍拍镜」，起售价999元，这款眼镜以经典黑框设计为主，重量仅50g，实际佩戴感受约30g。搭载索尼1600万像素摄像头及瑞声科技Hi-Fi扬声器，支持多种AI功能，未来还将通过在线升级增加更多功能。

亮点提要：

🕶️ 闪极AI「拍拍镜」是国内首款量产AI眼镜，起售价999元，预计2025年1月15日发货。

📸 眼镜搭载索尼1600万像素摄像头和瑞声科技Hi-Fi扬声器，重量控制在50g，佩戴感受仅30g。

🚀 通过自研Loomo OS系统，支持语音识别、实时翻译等AI功能，未来可在线升级更多功能。

11. Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

Stable Diffusion 3.5 Large（SD3.5Large）正式在亚马逊Bedrock平台上线，旨在为开发者提供一个安全、便捷的生成式人工智能应用开发环境。该模型在文本到图像生成方面表现卓越，支持多样化的视觉风格，并能准确响应用户的输入。

亮点提要：

🌟 SD3.5Large模型已在亚马逊Bedrock平台上线，支持便捷安全的AI应用开发。

🎨 该模型具备多样风格生成、优异的文本提示遵循性和多元化图像输出能力。

🔧 新升级的图像服务包括稳定图像超级版和核心版，提供更高质量和性价比的生成解决方案。

详情入口：

🔗 https://stability.ai/news/stable-diffusion-35-large-is-now-available-on-amazon-bedrock?utm_source=futuretools.io&utm_medium=newspage

12. 14万亿token训练量加持:Falcon3挑战主流开源AI模型

阿布扎比技术创新研究院（TII）发布的新一代开源AI模型Falcon3，凭借14万亿token的训练量和优化的架构设计，在消费级硬件上表现出色，创下新纪录。与前代产品相比，Falcon3的训练规模翻倍，展现出强劲的竞争力，尤其是在与其他主流开源模型的基准测试中表现优异。

亮点提要：

🚀 Falcon3系列推出四种规格，满足不同用户需求，支持多种语言处理。

🏆 在Hugging Face的评测中，Falcon3超越了多款主流开源模型，展现出强大的性能。

💡 TII计划在2025年推出多模态模型，进一步扩展Falcon3的应用场景。

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

最新文章

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

Firefox 浏览器推出 Orbit AI 助手：告别信息过载，迎接高效网络体验！

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;功能;嫌犯用ChatGPT策划酒店爆炸案

AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

AI日报：昆仑万维天工版o1、4o同时上线；罗永浩新项目发布AI助理 “J1 Assistant” ;爱奇艺起诉海螺AI版权侵权

Kimi、豆包之外新选择！理想同学 App 有问必答带你看世界

AI日报：阿里入局AI眼镜；套壳AI产品TypingMind赚百万美元；DeepMind天才科学家去世

AI日报：百度Web端首页上线“AI搜”入口；字节跳动否认开发AI手机传闻；李彦宏：AI应用将在2025年井喷

Cline 解锁 VSCode 编程新体验：Claude 3.5 Sonnet、DeepSeek V3 随意用！

AI日报：可灵AI API对口型能力全面开放；百度2024年度AI提示词“答案”;通义千问视觉理解模型全线降价超80%

AI日报：5秒一个视频！PixVerse V3.5上线；雷军千万年薪挖角AI天才少女；比亚迪启动人形机器人项目

小红书新产品「小绿书」？免费 AI 搜索神器：美食旅行购物全搞定！

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；抖音引入音频审核大模型;ChatGPT本月第二次大规模宕机

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源

马斯克 xAI 再发力！Grok app 上线：免费 AI 助手+图像生成，OpenAI、Claude 强劲新对手

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米

全新免费版 GitHub Copilot 上线！微软大善人，1.5 亿开发者白嫖 Claude 3.5 Sonnet！

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧

AI日报：苹果或与腾讯、字节洽谈AI合作；可灵1.6版本上线；ChatGPT新增电话功能支持老年机

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

Whisk 施展魔法！Google 全新 AI 图像生成工具，以图生图无需提示词！

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

AI日报：张文宏被AI假冒直播带货；Kimi视觉思考版上线；Pika2.0可操控视频内容元素；微信打击AI仿冒知名人士行为

比 ChatGPT Pro 还贵！Devin AI 编程凭啥敢收 500 美元订阅费？

AI日报：OpenAI全量上线视频聊天功能；xAI与OpenAI薪资对比曝光；Anthropic最快模型全面开放

AI日报：苹果全家桶接入ChatGPT；谷歌Gemini 2.0版来袭；ChatGPT全球宕机已修复；百度文库上线专业PPT生成

Midjourney上新！Patchwork一句话就能生成生动世界，无限画布支持100人共同协作，小说作者、游戏开发者狂喜

AI日报：OpenAI全面开放Canvas功能；豆包电脑版视频生成功能内测；全球首个AI程序员Devin开放使用

AI日报：OpenAI重磅上线Sora；智谱AI免费多模态模型GLM-4V-Flash；腾讯云打造AI代码助手

宅男福音！VR角色扮演AI来了，南洋理工“造人”新突破，唱跳互动还能陪你聊！

AI日报：广电总局整治AI“魔改”视频乱象；Hailuo AI上线AI语音克隆功能；百川智能商业化负责人洪涛离职

Runway Act one又更新了！支持克隆视频人物表演，一键get同款表情、动作、声音

Mozilla Firefox 打造 Deep Fake Detector：多模型一键精准识别 AI 内容

疯感kitty走红小红书 3分钟教会你用Recraft做“怪诞美学”头像

AI日报：OpenAI推出每月200美元ChatGPT Pro;ComfyUI插件被植入挖矿病毒;京东发布10大AI营销工具

AI日报：iPhone国行版或接入文心4.0模型；ChatGPT周活跃用户数突破3亿；Genie 2一键生成无限3D世界

开口跪！超自然声音克隆工具Fish Speech 1.5上线，新增5种语言，很快将支持实时无缝对话

AI日报：字节AI助手豆包上线图片理解功能；亚马逊推Nova系列AI生成模型；文心一言上线“深度写作”专业版功能

Hailuo AI推I2V-01-Live模型，以后人人都可以轻松制作高质量动画视频了

即梦灰测2.1模型，AI生图终于可以出中文字体了！一句话做海报成真！

AI日报：腾讯发布混元视频生成大模型；阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字

AI日报：微信公众号支持AI配图；阿里云通义万相全新图像编辑模型ACE；快手可灵AI推「AI试衣」功能

虚拟主播带货太僵硬？中科院联手腾讯打造“AI带货王”AnchorCrafter，动作表情自然到位

超自然的 AI 人声！对标 NotebookLM，ElevenLabs 推出 GenFM 功能

AI日报：Kimi灰测AI视频生成功能；复旦明确毕业论文AI使用规范；ChatGPT诞生两周年;智谱AI发布AutoGLM升级版

智谱AI推出AutoGLM升级版：一句话操控全网APP 不但会点外卖还会发红包

360偷偷搞了个大的？纳米搜索颠覆传统，支持一键生成脱口秀视频！

AI日报：字节诉攻击模型训练实习生索赔800万；阿里发布推理模型QwQ-32B-Preview；ComfyUI桌面版发布

AI日报：惊艳！Sora遭恶意泄露；昆仑万维Skywork o1启动邀测；阿里开源图像生成模型Qwen2vl-Flux

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉