AI 小报第 4 期：Qwen2.5 全系列开源、可灵 1.5 模型、ChatGPT 新增指令等

文摘 2024-09-23 21:41 福建

往期 AI 小报：
第 3 期：OpenAI o1 模型、语雀 AI 上线、Felo AI 搜索等
第 2 期：智谱 AI、夸克 AI、可灵 API、海螺 AI 生成音乐和视频
第 1 期：微信输入法 iOS 版上线「问 AI」，Claude 支持分享代码

离国庆长假还有 7 天，哈哈，今天一起回顾下上周在知识星球上分享的主要内容，包括以下内容：

🔥 Qwen2.5 系列正式开源！
🔥 可灵 1.5 模型发布，新增运动笔刷能力！
🔥 通义万相 AI 生视频正式上线
🌈 阿里通义上线“智能生成 PPT”，完全免费
🍭 重磅升级！OpenAI o1 使用权限大提升！
🍭 腾讯元器智能体支持发布到微信公众号
📚 GOT-OCR2.0：阶跃星辰推出的端到端通用 OCR 模型
📚 ChatGPT 新增“/picture”和“/search”指令
📚Suno 推出 Covers 功能，一键翻唱任意风格歌曲

接下来详细了解下：

1. 🔥 Qwen2.5 系列正式开源！

上周 Qwen 在云栖大会上，正式宣布 Qwen2.5 系列大模型开源！包括通用模型 Qwen2.5、编程模型 Qwen2.5-Coder和数学模型 Qwen2.5-Math。

其中模型尺寸从 0.5B 到 72B，覆盖终端设备到企业级，非常完整！

2. 🔥 可灵 1.5 模型发布，新增运动笔刷能力！

上周可灵又迎来全新版本，此次发布的 1.5 版本，主要内容包括：

基座模型升级：可灵 1.5 模型支持生成 1080P 高清视频，清晰度大幅提升，画面美感及运动合理度、文本响应度均有明显提升！
新增“运动笔刷”功能：可灵 1.0 模型图生视频新增“运动笔刷”功能，为图片中的人物/物体等各种元素指定运动轨迹，从而实现更好的运动控制和运动表现！

近期其他更新内容包括：

支持一次性生成最多 4 条视频，方便快速多次抽卡；
“图生视频功能”新增支持 10 秒时长，标准模式下支持增加尾帧；
“AI 图片”生成支持“画质增强”；
上线“AI 图片”，帮助大家更好地使用可灵 AI

官方介绍：https://mp.weixin.qq.com/s/-PemOoM0y47JT2idf_rSBQ

3. 🔥 通义万相 AI 生视频正式上线

就在上周，通义万相 AI 生视频正式上线，效率非常高！目前通义万相完全免费不限量，并且支持 APP 端和网页端。

官方网址：https://tongyi.aliyun.com/wanxiang/
官方介绍：https://mp.weixin.qq.com/s/mFaT7NVPe_yi_dPeq8NCCg

目前通义万相支持“文生视频”和“图生视频”，可以生成多种风格视频，支持中国风、灵感扩写、超现实主义等。支持 2 个核心功能：

灵感扩写：通过简单提示词，生成丰富细致的描述，帮用户生成更好的视频内容；
音频生成：生成的视频自带音频，直接省去单独创作音效的环境，一步到位。

4. 🌈 阿里通义上线“智能生成 PPT”，完全免费

Chris 最近在通义网页版上，发现通义上线了“智能生成 PPT”功能了！经过简单体验一番，简直太香了～

🔍 详细介绍：https://mp.weixin.qq.com/s/hOayOHDSMDm8pvlgbrC3SQ
🔗 官方地址：https://tongyi.aliyun.com/qianwen/

其核心功能包括：

上传文件生成 PPT：支持上传文档、音视频文件和网页链接，直接生成 PPT；
长文本生成 PPT：支持输入长文本进行生成 PPT；
免费下载 PPT：导出功能完全免费，支持导出为 PPT、PDF、图片和长图；
随时更换 PPT 模板：支持对生成好的 PPT 直接更换模板，用户使用时，就不用特地重新再生成一遍 PPT 了，很方便。

5. 🍭 重磅升级！OpenAI o1 使用权限大提升！

为感谢大家对 OpenAI o1 的热情支持，OpenAI 特别为 Plus 和 Team 用户带来了超大福利：

o1-mini：每周 50 条消息直接提升到每天 50 条！畅享 7 倍升级，用更多，玩更多！
o1-preview：消息限额从每周 30 条提升至每周 50 条！虽然成本更高，但我们仍希望大家能多体验这款强大工具！

官方介绍：https://x.com/openai/status/1835857163765637607?s=46

6. 🍭 腾讯元器智能体支持发布到微信公众号

腾讯元器智能体终于支持发布到微信公众号啦，算是闭环起来了。可以用来作为数字分身，7*24 小时客服，粉丝互动等场景。

🌟“AI 工具派”公众号已经第一时间接入，效果不错，大家可以在后台与“AI 工具派”公众号对话试试～

使用教程：https://docs.qq.com/aio/p/scxmsn78nzsuj64?p=UaURIMeI5yybhR1GbWJuaLw
官方介绍：https://mp.weixin.qq.com/s/4J_wwjqtdS-YEhn-GzXYEw

7. 📚 GOT-OCR2.0：阶跃星辰推出的端到端通用 OCR 模型

GOT-OCR2.0 是阶跃星辰推出的一款端到端通用 OCR 模型，支持多语言、多模态，采用端到端架构，可直接从图像中识别并提取文本，无需进行复杂预处理。

其特点如下：

不仅能识别文本，还可识别数学公式、分子式、图表、乐谱、几何图形等。
支持多种输入格式，如照片、文档、切片等，也支持多种输出格式，除纯文本外，还能生成 Markdown、TikZ、SMILES、Kern 等。
解码器支持 8K 最大长度的 token，能够处理长文本场景。
具备交互式 OCR 功能、动态分辨率策略以及多页 OCR 技术支持。

详细可以查看：
Github 仓库地址：https://github.com/Ucas-HaoranWei/GOT-OCR2.0
模型地址：https://huggingface.co/ucaslcl/GOT-OCR2_0

8. 📚 ChatGPT 新增“/picture”和“/search”指令

OpenAI 进一步改善 ChatGPT 的用户体验，新增了两个快捷指令功能：

/picture指令：调用 OpenAI 的 DALL-E 文生图模型，即使用户没有提供明确提示，只需选择/picture，系统便可自动生成图像。
/search指令：开启搜索模式，用户输入的任何内容都会被视为搜索查询。即使没有输入新内容，ChatGPT 也能根据与用户上次讨论的内容，自动提取相关信息。

9. 📚Suno 推出 Covers 功能，一键翻唱任意风格歌曲

Suno 推出 Covers 翻唱功能，支持一键翻唱任意风格歌曲，可以将任何音频、歌曲转化为另一种全新的风格且保留原有的旋律。

功能介绍：

支持从器乐到人声，通过给器乐曲目添加歌词，制作出多层次的音乐作品；
支持转换上传的音频，上传一段唱歌、哼唱或演奏乐器的片段，使用翻唱功能进行重新演绎；
该功能现已向所有 Pro/Premier 订阅用户开放，并赠送 100 次免费翻唱机会。

工具地址：https://suno.com/
工具介绍：https://mp.weixin.qq.com/s/e4bLgllZe3_bsvff9L1Buw

下期见～！

http://mp.weixin.qq.com/s?__biz=MzA5MjU0NzQ3Ng==&mid=2651425358&idx=1&sn=f768833f990da9a861433c9fea325179

AI工具派

探索最新AI工具，发现AI带来的无限可能性！

最新文章

可灵 AI 免费额度调整！每个月都可以免费体验部分会员功能

Vidu AI：国产优秀 AI 视频生成工具，简单易用，支持多主体一致性，最高 1080P

吹爆这个AI神器！手慢无！

堆友：阿里巴巴推出的设计师服务平台，支持AI绘画、AI工具箱、3D素材等

必备神器！这款 AI 网页翻译插件超好用

就在刚刚，马斯克 xAI 正式公测 xAI API，每天赠送 25 美元免费积分！

使用 PixVerseAI 一键将图片生成酷炫毒液动画！

Freeflo：免费的AI绘画提示词灵感库，适用于Midjourney、SD等多个平台

刚刚！ChatGPT 搜索功能正式上线，免费可用

AI 月刊・10 月必看 36 条 AI 资讯，不能错过！

清言浏览器插件：智谱 AI 新产品，完全免费，支持 AI Agent、量子速读、写作助手等

AutoGLM：智谱AI的王炸功能，让手机成为你的贾维斯！

就在刚刚，Midjourney 上线全新图片编辑器和 AI 审核系统

豆包 AI 新功能：图片一键擦除、局部重绘、拓展图片、一键翻译文档、全新写作技能

自用分享：一款更聪明的 AI 阅读神器，谁用谁夸！

飞连：火山引擎推出的首个行业大模型IT赋能平台，IT+安全+豆包大模型，助力企业办公智能化

DeepTranslate：免费 AI 翻译插件，免费使用 Google/ChatGPT4o/微软翻译服务

“酷酷的海南”MV-AIGC创意大赛

Batch Tool：免费在线 AI 图片处理神器，批量去水印/去背景/WebGPU加速/免费无限次数

PDF2Audio：超强开源 AI 工具，打开了阅读 PDF 的新方式！

Bolt：非常棒的 AI 全栈 Web 开发工具，5 分钟从零到上线新网站

MOKI：美图推出的 AI 短片创作工具，全面开放、4K 分辨率、图生视频、AI 配音

太赞了！豆包大模型发布 3 个全新模型，视频、音乐、同声翻译不在话下

AI 小报第 4 期：Qwen2.5 全系列开源、可灵 1.5 模型、ChatGPT 新增指令等

阿里通义上线“智能生成PPT”，完全免费，一键下载

AI 小报第 3 期：OpenAI o1 系列模型、语雀 AI 上线、Felo AI 搜索、CueMe 写作神器等

CueMe：夸克最新 AI 写作神器，轻松生成上千种体裁长文

AI 神器太牛逼了！

Felo：免费 AI 智能搜索引擎，支持全网搜索、GPT-4o 搜索、多语言

支小宝：支付宝送给小年轻们的 AI 生活管家

GPT4.0 + AI 终身激活！不限量使用！我上车了！！

超强 AI 背景移除：在线批量处理，支持 WebGPU 加速，无需登录，可无限次免费使用！

AI 小报｜智谱 AI 大更新、夸克 AI、可灵 API、海螺 AI 生成音乐和视频

智谱 AI 免费赠送 1000 万 Tokens，大家别错过啦！附带使用教程

就在刚刚，Claude 面向所有用户开放 Artifacts 功能

智谱 AI 宣布 GLM-4-Flash 模型全面免费，太良心了！赶紧白嫖起来～

WPS 灵犀：WPS 推出的 AI 智能助手，支持搜全网、读文档、写作、PPT生成等

猴急！送《黑神话：悟空》啦

百度文库智能PPT：80%市场份额的 AI 生产力工具，一站式创作服务

FluxImg：一键使用 Flux.1 Pro 生成图片，完全免费

微信藏了个 AI 任意门！一键使用秘塔AI、智谱清言、腾讯元宝、讯飞星火等 40+ AI 应用

360 AI 助手：一站式体验国内领先大模型，包括豆包、Kimi、通义、智谱 AI 等

豆包 AI 上线新功能：截图识文字，一键 OCR、答疑解惑、翻译等

Chris 对“AI 工具派”的一些思考：知识星球和 AI PPT 社群

Aide：强大的 AI 编程插件，一键注释、转换、UI 图生成代码、AI 批量处理文件！

OpenAI 最新发布：在API中引入结构化输出、OpenAI 开发者大会

灵办AI：多功能学习办公 AI 助手，支持翻译、对话、写作、AI搜索、文案改写等

豆包 AI 新功能，一键收藏任何网页和内容，简直是收藏党的神器！

KimiChat 上线新功能，一键生成 PPT 太香了！

11 个 AI 领域的优质飞书知识库，完全免费，赶紧收藏起来！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉