首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

科技科技 2025-01-09 16:23 福建

关注我，记得标星⭐️不迷路

AI日报

1月9日•AIbase

1、巨量引擎旗下AIGC工具“即创”正式版上线

2、通义万相推2.1视频模型大幅提升复杂运动能力

3、微软正式开源超强小模型Phi-4

4、全新视频修复技术 SeedVR：模糊变高清，可处理任意长度视频

5、Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景

6、字节联合高校出品！STAR 模型：提升视频清晰度和分辨率

7、Stability AI 推出 SPAR3D：单图像生成 3D 对象一秒钟搞定

8、2024 年 238 款生成式人工智能服务在国家网信办完成备案

9、2024胡润中国人工智能企业50强榜单：科大讯飞第二、商汤科技第三

10、你绝对想不到！重复这个简单指令让AI生成代码快100倍

11、英伟达发布Groot Teleop 技术允许通过Apple Vision Pro来训练机器人

12、惊悚发明！工程师用 ChatGPT 制作机器人步枪，OpenAI 立刻出手

13、因用户投诉，微软回滚Bing AI图像生成器升级、重返旧版DALL-E

1. 巨量引擎旗下AIGC工具“即创”正式版上线

巨量引擎的AIGC工具“即创”正式上线，提供多种内容生成方式，包括AI脚本生成、智能成片和数字人等。该平台通过深度学习和自然语言处理，用户只需输入主题即可生成高质量文本和视频内容。

亮点提要：

🌟 即创支持多种内容生成，提升创作效率。

📊 新增爆款裂变和一键过审功能，帮助创作者快速响应市场。

🎨 AI 技术引领内容创作革命，鼓励创作者探索新工具。

详情入口：

🔗 https://top.aibase.com/tool/douyinjichuang

2. 通义万相推2.1视频模型大幅提升复杂运动能力

阿里旗下的通义万相视频生成模型在最新2.1版本中实现了重磅升级，。这一版本在处理复杂运动和还原真实物理规律方面取得了显著进步，提升了视频的电影质感和指令遵循能力。通义万相能够生成连贯且细致的视频，解决了以往AI视频生成中的常见问题，并在复杂人物运动和运镜方面展现了强大能力。

亮点提要：

🚀 新版本分为极速版与专业版，分别提升高效性能与表现力。

🐱 生成的视频细节丰富，成功解决了“鬼画符”问题，实现精准中英文文字生成。

🎬 运镜效果如同电影大师，能够自动调整镜头，提升视频艺术性。

详情入口：

🔗 https://tongyi.aliyun.com/wanxiang/videoCreation

3. 微软正式开源超强小模型Phi-4

微软在Hugging Face平台上发布了小型语言模型Phi-4，参数量为140亿，表现优异，超越了多款知名模型如GPT-4o和Llama-3.1。Phi-4在数学竞赛AMC中获得91.8分，并在MMLU测试中取得84.8分，展现了强大的推理能力。

亮点提要：

🧩 微软推出的Phi-4模型参数仅140亿，却在性能测试中超越了GPT-4o和Llama-3.1等多个知名模型。

📈 Phi-4在数学与推理能力方面表现突出，特别是在AMC和MMLU测试中取得了高分。

🌍 该模型已开源并支持商业用途，吸引了大量开发者和AI爱好者的关注。

详情入口：

🔗 https://huggingface.co/microsoft/phi-4

4. 全新视频修复技术 SeedVR：模糊变高清，可处理任意长度视频

南洋理工大学与字节跳动的研究团队推出的SeedVR技术，利用创新的移动窗口注意力机制，显著改善了视频恢复效果，特别是在处理AI生成视频时表现突出。该技术不仅能够处理任意长度的视频，还能有效修复画面细节，为用户带来更真实的视觉体验。

亮点提要：

🌟 SeedVR利用移动窗口注意力机制，成功提升对长视频序列的处理能力。

🎥 该技术采用较大的窗口尺寸，显著提高了高分辨率视频的恢复质量。

🚀 结合多种现代技术手段，SeedVR在多个基准测试中表现卓越，尤其适用于AI生成的视频。

详情入口：

🔗 https://iceclear.github.io/projects/seedvr/

5. Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景

Adobe Research与香港科技大学联合开发的TransPixar系统，革新了视觉特效制作，尤其是在处理透明元素方面。该技术通过生成包含Alpha通道的视觉效果，显著提高了制作效率，降低了成本。

亮点提要：

🌟 TransPixar通过创新的AI技术，能够在有限的训练数据下生成高质量的透明效果，简化特效制作流程。

💡 该系统不仅提升了大型制作团队的工作效率，还为小型工作室降低了制作成本，使其能够实现复杂特效。

🚀 TransPixar在实时应用领域展现出巨大潜力，能够快速生成透明效果，适用于视频游戏和增强现实等场景。

6. 字节联合高校出品！STAR 模型：提升视频清晰度和分辨率

南京大学研究团队与字节跳动、西南大学联合推出的STAR技术，通过文本到视频模型实现视频超分辨率处理，显著提升低分辨率视频质量。该技术结合时空增强方法，适用于视频分享平台上下载的低清晰度视频。

亮点提要：

🌟 新技术 STAR 结合文本到视频模型，实现视频超分辨率，提升视频质量。

🛠️ 研究团队已发布预训练模型和推理代码，使用过程简单明了。

📩 提供联系方式，鼓励用户与研究团队进行交流与探讨。

详情入口：

🔗 https://github.com/NJU-PCALab/STAR

7. Stability AI 推出 SPAR3D：单图像生成 3D 对象一秒钟搞定

在CES展会上，Stability AI推出了SPAR3D，这是一种创新的两阶段3D生成技术，能够在不到一秒的时间内从单个图像中生成精确的3D对象。SPAR3D不仅提供了高效的3D原型设计方式，还允许用户实时编辑生成的3D对象，提升了创作灵活性。

亮点提要：

⚡ 实时生成能力：SPAR3D能在一秒内从单张图像生成完整的3D对象，并支持快速编辑。

🔍 精确的结构预测：提供准确的几何形状和360度视图，包括隐藏区域，确保高分辨率输出。

🚀 开放的使用政策：支持商业和非商业用途，用户可通过多种方式获取和使用该模型。

详情入口：

🔗 https://stability.ai/news/stable-point-aware-3d

8. 2024 年 238 款生成式人工智能服务在国家网信办完成备案

国家互联网信息办公室于1月8日发布公告，强调生成式人工智能服务备案的重要性，促进创新与规范应用。截止2024年12月31日，已有302款服务完成备案，其中238款为2024年新增。这表明该领域快速发展，更多新服务获得官方认可。

亮点提要：

🌟 2024年，共302款生成式人工智能服务在国家网信办完成备案，新增238款。

🔍 提供舆论属性服务的企业可通过属地网信部门进行备案，确保合规性。

📝 已上线应用需公示所使用的已备案服务信息，提升透明度。

9. 2024胡润中国人工智能企业50强榜单：科大讯飞第二、商汤科技第三

2024胡润中国人工智能企业50强榜单正式发布，寒武纪以2380亿人民币估值位居榜首，展现出其在AI领域的强大实力。科大讯飞和商汤科技分别以1160亿和500亿的估值紧随其后。榜单显示，北京、上海和深圳是主要的AI企业集聚地，合计占据80%的上榜企业。

亮点提要：

🌟 寒武纪以2380亿元估值位居榜首，科大讯飞和商汤科技分别排第二和第三。

🏙️ 北京、上海、深圳成为人工智能企业的主要集聚地，合计占据80%的上榜企业。

📊 该榜单侧重非具身智能企业，评选范围不包括机器人和智能家居等领域的公司。

10. 你绝对想不到！重复这个简单指令让AI生成代码快100倍

BuzzFeed的高级数据科学家麦克斯・伍尔夫进行了一项实验，使用Claude3.5语言模型，通过反复请求AI改进代码，成功将原本657毫秒的运行时间缩短至6毫秒，提升了100倍的性能。实验中AI展现出其对“更好代码”的独特理解，自动添加企业特性。

亮点提要：

🌟 AI通过反复指令提升代码性能，原代码运行时间从657毫秒降至6毫秒。

💡 AI在代码中自动添加企业特性，展现出其对“更好代码”的独特理解。

🛠️ 提示工程依然重要，精确的请求可以加速结果生成，但仍需人工开发者进行验证和修复。

11. 英伟达发布Groot Teleop 技术允许通过Apple Vision Pro来训练机器人

英伟达在CES展会上推出了一系列创新技术，通过Isaac GR00T蓝图，开发者可以利用模仿学习生成大量合成运动数据，从而训练人形机器人。这一技术不仅降低了数据收集的时间和成本，还通过Cosmos平台生成物理意识视频，推动物理人工智能的发展。

亮点提要：

🚀 英伟达推出Isaac GR00T蓝图，利用模仿学习生成合成运动数据，加速人形机器人开发。

📊 Cosmos平台经过18万亿数据训练，生成物理意识视频，促进物理人工智能发展。

🤝 多家机器人公司已采用Isaac GR00T技术，展现出良好的应用效果。

12. 惊悚发明！工程师用 ChatGPT 制作机器人步枪，OpenAI 立刻出手

近期，工程师STS3D创造了一款机器人步枪，能够通过ChatGPT指令进行瞄准和射击，展现出令人惊叹的反应速度和准确性。OpenAI迅速回应，指出该行为违反了公司政策，禁止利用其服务开发武器。尽管OpenAI去年修改了政策以允许军事应用，但仍然禁止任何形式的伤害行为。

亮点提要：

🌐 OpenAI迅速切断与开发机器人步枪工程师的关系，因其违反使用政策。

🤖 STS3D的机器人步枪可以根据ChatGPT的指令进行瞄准和射击，展现出高准确性。

⚔️ 尽管OpenAI去年修改了政策，但仍禁止使用其服务开发任何形式的武器。

13. 因用户投诉，微软回滚Bing AI图像生成器升级、重返旧版DALL-E

微软近期因用户对Bing图像生成器新版本的不满，决定回滚至旧版DALL-E模型。用户反馈新版本在图像质量和细节处理上显著下降，导致微软搜索部门负责人Jordi Ribas承认并采取措施恢复旧版。

亮点提要：

🌟 微软因用户投诉决定回滚 Bing 图像生成器的新版本，旨在改善用户体验。

🎨 升级后的图像生成效果不如预期，用户反映细节和质量明显下降。

🔧 Jordi Ribas 表示将重返旧版 DALL-E 模型，预计需几周时间完成这一调整。

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

最新文章

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

Firefox 浏览器推出 Orbit AI 助手：告别信息过载，迎接高效网络体验！

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;功能;嫌犯用ChatGPT策划酒店爆炸案

AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

AI日报：昆仑万维天工版o1、4o同时上线；罗永浩新项目发布AI助理 “J1 Assistant” ;爱奇艺起诉海螺AI版权侵权

Kimi、豆包之外新选择！理想同学 App 有问必答带你看世界

AI日报：阿里入局AI眼镜；套壳AI产品TypingMind赚百万美元；DeepMind天才科学家去世

AI日报：百度Web端首页上线“AI搜”入口；字节跳动否认开发AI手机传闻；李彦宏：AI应用将在2025年井喷

Cline 解锁 VSCode 编程新体验：Claude 3.5 Sonnet、DeepSeek V3 随意用！

AI日报：可灵AI API对口型能力全面开放；百度2024年度AI提示词“答案”;通义千问视觉理解模型全线降价超80%

AI日报：5秒一个视频！PixVerse V3.5上线；雷军千万年薪挖角AI天才少女；比亚迪启动人形机器人项目

小红书新产品「小绿书」？免费 AI 搜索神器：美食旅行购物全搞定！

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；抖音引入音频审核大模型;ChatGPT本月第二次大规模宕机

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源

马斯克 xAI 再发力！Grok app 上线：免费 AI 助手+图像生成，OpenAI、Claude 强劲新对手

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米

全新免费版 GitHub Copilot 上线！微软大善人，1.5 亿开发者白嫖 Claude 3.5 Sonnet！

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧

AI日报：苹果或与腾讯、字节洽谈AI合作；可灵1.6版本上线；ChatGPT新增电话功能支持老年机

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

Whisk 施展魔法！Google 全新 AI 图像生成工具，以图生图无需提示词！

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

AI日报：张文宏被AI假冒直播带货；Kimi视觉思考版上线；Pika2.0可操控视频内容元素；微信打击AI仿冒知名人士行为

比 ChatGPT Pro 还贵！Devin AI 编程凭啥敢收 500 美元订阅费？

AI日报：OpenAI全量上线视频聊天功能；xAI与OpenAI薪资对比曝光；Anthropic最快模型全面开放

AI日报：苹果全家桶接入ChatGPT；谷歌Gemini 2.0版来袭；ChatGPT全球宕机已修复；百度文库上线专业PPT生成

Midjourney上新！Patchwork一句话就能生成生动世界，无限画布支持100人共同协作，小说作者、游戏开发者狂喜

AI日报：OpenAI全面开放Canvas功能；豆包电脑版视频生成功能内测；全球首个AI程序员Devin开放使用

AI日报：OpenAI重磅上线Sora；智谱AI免费多模态模型GLM-4V-Flash；腾讯云打造AI代码助手

宅男福音！VR角色扮演AI来了，南洋理工“造人”新突破，唱跳互动还能陪你聊！

AI日报：广电总局整治AI“魔改”视频乱象；Hailuo AI上线AI语音克隆功能；百川智能商业化负责人洪涛离职

Runway Act one又更新了！支持克隆视频人物表演，一键get同款表情、动作、声音

Mozilla Firefox 打造 Deep Fake Detector：多模型一键精准识别 AI 内容

疯感kitty走红小红书 3分钟教会你用Recraft做“怪诞美学”头像

AI日报：OpenAI推出每月200美元ChatGPT Pro;ComfyUI插件被植入挖矿病毒;京东发布10大AI营销工具

AI日报：iPhone国行版或接入文心4.0模型；ChatGPT周活跃用户数突破3亿；Genie 2一键生成无限3D世界

开口跪！超自然声音克隆工具Fish Speech 1.5上线，新增5种语言，很快将支持实时无缝对话

AI日报：字节AI助手豆包上线图片理解功能；亚马逊推Nova系列AI生成模型；文心一言上线“深度写作”专业版功能

Hailuo AI推I2V-01-Live模型，以后人人都可以轻松制作高质量动画视频了

即梦灰测2.1模型，AI生图终于可以出中文字体了！一句话做海报成真！

AI日报：腾讯发布混元视频生成大模型；阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字

AI日报：微信公众号支持AI配图；阿里云通义万相全新图像编辑模型ACE；快手可灵AI推「AI试衣」功能

虚拟主播带货太僵硬？中科院联手腾讯打造“AI带货王”AnchorCrafter，动作表情自然到位

超自然的 AI 人声！对标 NotebookLM，ElevenLabs 推出 GenFM 功能

AI日报：Kimi灰测AI视频生成功能；复旦明确毕业论文AI使用规范；ChatGPT诞生两周年;智谱AI发布AutoGLM升级版

智谱AI推出AutoGLM升级版：一句话操控全网APP 不但会点外卖还会发红包

360偷偷搞了个大的？纳米搜索颠覆传统，支持一键生成脱口秀视频！

AI日报：字节诉攻击模型训练实习生索赔800万；阿里发布推理模型QwQ-32B-Preview；ComfyUI桌面版发布

AI日报：惊艳！Sora遭恶意泄露；昆仑万维Skywork o1启动邀测；阿里开源图像生成模型Qwen2vl-Flux

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉