AI日报:可灵AI API对口型能力全面开放;百度2024年度AI提示词“答案”;通义千问视觉理解模型全线降价超80%

科技   科技   2024-12-31 16:32   福建  
关注我,记得标星⭐️不迷路
AI日报

12月31日•AIbase

1、可灵AI API对口型能力全面开放、虚拟试穿升级至V1.5模型

2、豆包大模型宣称已追平GPT-4,首次披露 300 万长文本能力

3、智谱深度推理模型 GLM-Zero 预览版上线

4、百度发布2024年度AI提示词——“答案”

5、通义发布2024年轻人AI使用趋势报告:85、90后关注AI比例更高

6、OpenAI CEO公布2025年新技术产品,AGI 、成人模式引发热议

7、智元机器人开源全球首个百万真机数据集AgiBot World

8、Hugging Face 推出 SmolAgents:三行代码打造智能代理,简化AI开发

9、上海市新增9款已完成登记的生成式人工智能服务

10、超贵!OpenAI o3 模型单次查询竟高达 1000 美元!

11、Nvidia 成功收购 Run:ai 并决定开源其 GPU 管理软件


1. 可灵AI API对口型能力全面开放、虚拟试穿升级至V1.5模型


宣布可灵AI(Kling)API完成新一轮升级,主要在虚拟试穿和对口型功能上取得显著进展。升级后的V1.5模型支持“上装+下装”组合服装,提升了试穿体验的真实感。同时,对口型能力的全面开放,使得生成的视频内容更加生动,带来了全新的创作可能性。



亮点提要:

👗 可灵AI的V1.5模型支持组合服装,提升虚拟试穿的真实感与实用性。

🎤 对口型能力全面开放,实现视频人物口型与配音的完美同步。

🚀 升级将助力企业用户在业务增长上迈出新的步伐,推动视觉内容创新。




2. 豆包大模型宣称已追平GPT-4,首次披露 300 万长文本能力


字节跳动旗下的豆包大模型在2024年度技术进展报告中宣布,其最新版本Doubao-pro-1215在综合性能上已与GPT-4全面对齐,并在某些专业领域表现更为出色。


亮点提要:

🚀 豆包大模型在综合性能上已与GPT-4全面对齐,并在部分专业领域表现更强。

💡 通过优化数据处理和创新模型架构,豆包在理解精度和生成质量上取得显著进步。

📚 首次公开300万字的超长文本处理能力,处理延迟控制在15秒以内。




3. 智谱深度推理模型 GLM-Zero 预览版上线


智谱华章科技有限公司在年度收官时发布了其首个基于扩展强化学习技术的推理模型GLM-Zero的初代版本GLM-Zero-Preview。该模型专注于提升AI在数理逻辑、代码编写等领域的推理能力,表现出色。尽管与OpenAI的模型仍有差距,但公司计划持续优化,扩展其应用领域。


亮点提要:

🚀 GLM-Zero-Preview专注于提升AI的推理能力,尤其在数理逻辑和代码编写方面表现出色。

🛠️ 用户可在智谱清言平台免费体验GLM-Zero-Preview,支持文字和图片上传,输出完整推理过程。

📈 随着训练量增加,GLM-Zero-Preview在深度推理方面的效果稳步提升,展现了强化学习的重要性。

详情入口:

🔗 https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh




4. 百度发布2024年度AI提示词——“答案”


在2024年的尾声,百度发布了年度AI提示词“答案”,反映了人们对AI的依赖与期待。随着人们频繁向AI寻求解答,诸如“答案”、“为什么”等词汇揭示了社会情绪与个人困惑。百度通过分析高频提示词,展示了AI如何融入人们的日常生活,成为思考与情感的寄托。




亮点提要:

🤖 AI成为人们生活中寻求答案的重要工具,反映了社会的情感与迷茫。

🔍 高频提示词揭示了人们在生活、工作与情感方面的普遍问题与渴望。

🌟 百度强调AI将继续作为人类的伙伴,共同探索未来的可能性与未知领域。




5. 通义发布2024年轻人AI使用趋势报告:85、90后关注AI比例更高


根据《2024年轻人AI使用趋势报告》,AI的应用已广泛渗透到生活的各个层面,尤其在工作、学习和创意表达中备受关注。95后、女性及企业管理者对AI的关注度最高。超过80%的受访者表示对AI工具保持高度关注,近一半的受访者每天使用AI,显示出AI已成为生活中不可或缺的一部分。人们对AI生成内容的评价普遍正面,AI不仅提供实用性,还在情感支持和娱乐方面发挥作用。



亮点提要:

🧑‍🎓 95后、女性和企业管理者对AI的关注度显著上升,超过80%的受访者高度关注AI工具。

🎨 AI被广泛应用于创意表达和娱乐活动,年轻人乐于尝试AI生成内容。

🔍 尽管对AI的期待增加,但人们对数据隐私的关注也在上升,需保持警觉。

详情入口:

🔗 https://www.chinaz.com/ainews/14384.shtml




6. OpenAI CEO公布2025年新技术产品,AGI 、成人模式引发热议


OpenAI首席执行官Sam Altman宣布将在2025年推出多项新技术产品,尤其是通用人工智能(AGI)和智能体功能,吸引了广泛关注。新产品的发布体现了OpenAI在人工智能领域的持续创新,尤其是针对用户反馈的响应,显示出公司对市场需求的敏感度。


亮点提要:

🌟 OpenAI计划于2025年推出AGI、智能体等新产品,展示其在人工智能领域的持续创新。

💬 成人模式引起网友关注,期待提供更开放的内容生成体验。

📈 Altman的技术发布源于用户反馈,反映出OpenAI在产品开发中对用户需求的重视。




7. 智元机器人开源全球首个百万真机数据集AgiBot World


智元机器人联合多方机构开源了AgiBot World数据集,这是全球首个基于真实场景的百万真机数据集,旨在推动人形机器人技术的发展。该数据集的规模和质量均超越了现有的同类产品,将极大促进机器人大模型的训练和应用。


亮点提要:

🌍 AgiBot World是全球首个基于全域真实场景的百万真机数据集,支持泛化和通用的机器人大模型训练。

📦 数据集涵盖家居、餐饮、工业等五大核心场景,包含3000多种真实物品和80多种技能视频。

📈 智元机器人计划未来开源千万仿真数据,推动人形机器人技术的广泛应用。

详情入口:

🔗 https://github.com/OpenDriveLab/agibot-world




8. Hugging Face 推出 SmolAgents:三行代码打造智能代理,简化AI开发


Hugging Face的SmolAgents工具包为AI开发带来了革命性的变化,通过仅仅三行代码,开发者可以利用预训练模型快速构建功能强大的智能代理,极大地降低了开发门槛。SmolAgents的轻量级设计和直观API使得各个技能水平的开发者都能轻松上手,快速完成任务。


亮点提要:

🚀 SmolAgents通过三行代码简化智能代理的创建,降低了开发门槛。

📊 该工具包利用预训练模型,支持语言理解、智能搜索和动态代码执行等功能。

💻 SmolAgents适用于各种开发场景,快速完成任务,适合个人开发者和小型团队。

详情入口:

🔗 https://github.com/huggingface/smolagents




9. 上海市新增9款已完成登记的生成式人工智能服务


上海市网信办近期发布公告,新增9款生成式人工智能服务的登记,旨在推动本市生成式人工智能的创新与规范应用。此次登记工作使总登记数量达63款,强调所有上线服务需标明上线编号,以提升透明度和用户信任。


亮点提要:

📈 上海市新增9款生成式人工智能服务,登记总数达到63款,促进行业健康发展。

🔍 所有上线的生成式人工智能应用必须标明上线编号,提升服务透明度。

💡 新增服务包括无忧智面、AI同步口语练等,旨在为用户提供安全、可靠的使用体验。




10. 超贵!OpenAI o3 模型单次查询竟高达 1000 美元!


OpenAI最近推出的o3AI模型被认为是其最强大的人工智能产品,但运行成本令人咋舌,单次任务费用超过1000美元。o3在ARC-AGI基准测试中表现优异,得分达到87.5%,几乎是前一代o1模型的三倍。


亮点提要:

💸 o3AI模型的单次查询成本超过1000美元,显示出其运行的高昂费用。

📊 在ARC-AGI基准测试中,o3得分达到87.5%,几乎是前一代o1模型的三倍。

🔍 目前o3尚未向公众发布,预计“迷你版”将于明年1月推出。




11. Nvidia 成功收购 Run:ai 并决定开源其 GPU 管理软件


Nvidia 最近完成了对以色列软件公司 Run:ai 的收购,旨在提升 AI 云计算的管理效率。虽然具体收购金额未披露,但该交易价值约为7亿美元。Nvidia 宣布将开源 Run:ai 的软件,以支持更广泛的 AI 生态系统。Run:ai 的软件能够高效调度 Nvidia GPU 资源,优化 AI 运算性能。此举被认为是应对反垄断审查压力的策略,同时也为 AI 技术的发展提供了新的动力。



亮点提要:

🌟 Nvidia 完成对 Run:ai 的收购,并宣布将开源其软件,以促进 AI 技术的发展。

💻 Run:ai 的软件能有效调度 Nvidia GPU 资源,提升 AI 运算效率。

🤝 Run:ai 将继续为客户提供支持,致力于最大化 AI 基础设施的使用效率。



12. 阿里云再度降价:Qwen-VL 大模型全面降价 1 元可处理 600 张图片


阿里云再次降低大模型 Qwen-VL 的价格,降幅超过 80%。此次降价后,用户只需 1 元即可处理 600 张 720P 图片或 1700 张 480P 图片。Qwen-VL 系列模型因其强大的视觉理解能力而广受欢迎,适用于多种终端设备。阿里云的降价主要得益于基础设施优化和模型调用量增长。


亮点提要:

🌟 阿里云 Qwen-VL 系列模型降价超过 80%,性价比显著提升。
🚀 1 元可处理 600 张 720P 图片,极大降低用户成本。
💡 新的 KV Cache 计费模式进一步减少 API 使用费用。



关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台


这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程


更多AI硬核内容直接访问AiBase官网,一键开启你的AGI之旅!


官网:https://www.aibase.com/zh/tools/


点击阅读原文,进AIbase官网.

AIbase基地
每日AI新闻聚合阅读,掌握AI前沿资讯、AI新品、政策动向,洞察AI行业趋势,深思未来。
 最新文章