AI 小报第 4 期:Qwen2.5 全系列开源、可灵 1.5 模型、ChatGPT 新增指令等

文摘   2024-09-23 21:41   福建  

往期 AI 小报:

离国庆长假还有 7 天,哈哈,今天一起回顾下上周在知识星球上分享的主要内容,包括以下内容:

  1. 🔥 Qwen2.5 系列正式开源!
  2. 🔥 可灵 1.5 模型发布,新增运动笔刷能力!
  3. 🔥 通义万相 AI 生视频正式上线
  4. 🌈 阿里通义上线“智能生成 PPT”,完全免费
  5. 🍭 重磅升级!OpenAI o1 使用权限大提升!
  6. 🍭 腾讯元器智能体支持发布到微信公众号
  7. 📚 GOT-OCR2.0:阶跃星辰推出的端到端通用 OCR 模型
  8. 📚 ChatGPT 新增“/picture”和“/search”指令
  9. 📚Suno 推出 Covers 功能,一键翻唱任意风格歌曲

接下来详细了解下:

1. 🔥 Qwen2.5 系列正式开源!

上周 Qwen 在云栖大会上,正式宣布 Qwen2.5 系列大模型开源!包括通用模型 Qwen2.5编程模型 Qwen2.5-Coder数学模型 Qwen2.5-Math

其中模型尺寸从 0.5B 到 72B,覆盖终端设备到企业级,非常完整!

相关链接:

  1. 开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
  2. Github 仓库:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
  3. 在线 demo:https://huggingface.co/spaces/Qwen/Qwen2.5
  4. API 地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm
  5. 文档地址:https://qwen.readthedocs.io/zh-cn/latest/#

详细可以看下面大图:

2. 🔥 可灵 1.5 模型发布,新增运动笔刷能力!

上周可灵又迎来全新版本,此次发布的 1.5 版本,主要内容包括:

  1. 基座模型升级:可灵 1.5 模型支持生成 1080P 高清视频,清晰度大幅提升,画面美感运动合理度文本响应度均有明显提升!
  2. 新增“运动笔刷”功能:可灵 1.0 模型图生视频新增“运动笔刷”功能,为图片中的人物/物体等各种元素指定运动轨迹,从而实现更好的运动控制和运动表现!

近期其他更新内容包括:

  1. 支持一次性生成最多 4 条视频,方便快速多次抽卡;
  2. “图生视频功能”新增支持 10 秒时长,标准模式下支持增加尾帧;
  3. “AI 图片”生成支持“画质增强”;
  4. 上线“AI 图片”,帮助大家更好地使用可灵 AI

官方介绍:https://mp.weixin.qq.com/s/-PemOoM0y47JT2idf_rSBQ

3. 🔥 通义万相 AI 生视频正式上线

就在上周,通义万相 AI 生视频正式上线,效率非常高!目前通义万相完全免费不限量,并且支持 APP 端网页端

官方网址:https://tongyi.aliyun.com/wanxiang/
官方介绍:https://mp.weixin.qq.com/s/mFaT7NVPe_yi_dPeq8NCCg

目前通义万相支持“文生视频”和“图生视频”,可以生成多种风格视频,支持中国风灵感扩写超现实主义等。支持 2 个核心功能:

  1. 灵感扩写:通过简单提示词,生成丰富细致的描述,帮用户生成更好的视频内容;
  2. 音频生成:生成的视频自带音频,直接省去单独创作音效的环境,一步到位。

4. 🌈 阿里通义上线“智能生成 PPT”,完全免费

Chris 最近在通义网页版上,发现通义上线了“智能生成 PPT”功能了!经过简单体验一番,简直太香了~

🔍 详细介绍:https://mp.weixin.qq.com/s/hOayOHDSMDm8pvlgbrC3SQ
🔗 官方地址:https://tongyi.aliyun.com/qianwen/

其核心功能包括:

  1. 上传文件生成 PPT:支持上传文档音视频文件网页链接,直接生成 PPT;
  2. 长文本生成 PPT:支持输入长文本进行生成 PPT;
  3. 免费下载 PPT:导出功能完全免费,支持导出为 PPT、PDF、图片和长图;
  4. 随时更换 PPT 模板:支持对生成好的 PPT 直接更换模板,用户使用时,就不用特地重新再生成一遍 PPT 了,很方便。

5. 🍭 重磅升级!OpenAI o1 使用权限大提升!

为感谢大家对 OpenAI o1 的热情支持,OpenAI 特别为 Plus 和 Team 用户带来了超大福利:

  • o1-mini:每周 50 条消息直接提升到每天 50 条!畅享 7 倍升级,用更多,玩更多!
  • o1-preview:消息限额从每周 30 条提升至每周 50 条!虽然成本更高,但我们仍希望大家能多体验这款强大工具!

官方介绍:https://x.com/openai/status/1835857163765637607?s=46

6. 🍭 腾讯元器智能体支持发布到微信公众号

腾讯元器智能体终于支持发布到微信公众号啦,算是闭环起来了。可以用来作为数字分身,7*24 小时客服,粉丝互动等场景。

🌟“AI 工具派”公众号已经第一时间接入,效果不错,大家可以在后台与“AI 工具派”公众号对话试试~

使用教程:https://docs.qq.com/aio/p/scxmsn78nzsuj64?p=UaURIMeI5yybhR1GbWJuaLw
官方介绍:https://mp.weixin.qq.com/s/4J_wwjqtdS-YEhn-GzXYEw

7. 📚 GOT-OCR2.0:阶跃星辰推出的端到端通用 OCR 模型

GOT-OCR2.0 是阶跃星辰推出的一款端到端通用 OCR 模型,支持多语言多模态,采用端到端架构,可直接从图像中识别并提取文本,无需进行复杂预处理。

其特点如下:

  1. 不仅能识别文本,还可识别数学公式、分子式、图表、乐谱、几何图形等。
  2. 支持多种输入格式,如照片、文档、切片等,也支持多种输出格式,除纯文本外,还能生成 Markdown、TikZ、SMILES、Kern 等。
  3. 解码器支持 8K 最大长度的 token,能够处理长文本场景。
  4. 具备交互式 OCR 功能、动态分辨率策略以及多页 OCR 技术支持。

详细可以查看:

  • Github 仓库地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
  • 模型地址:https://huggingface.co/ucaslcl/GOT-OCR2_0

8. 📚 ChatGPT 新增“/picture”和“/search”指令

OpenAI 进一步改善 ChatGPT 的用户体验,新增了两个快捷指令功能:

  1. /picture指令:调用 OpenAI 的 DALL-E 文生图模型,即使用户没有提供明确提示,只需选择/picture,系统便可自动生成图像。
  2. /search指令:开启搜索模式,用户输入的任何内容都会被视为搜索查询。即使没有输入新内容,ChatGPT 也能根据与用户上次讨论的内容,自动提取相关信息。

9. 📚Suno 推出 Covers 功能,一键翻唱任意风格歌曲

Suno 推出 Covers 翻唱功能,支持一键翻唱任意风格歌曲,可以将任何音频、歌曲转化为另一种全新的风格且保留原有的旋律。

功能介绍:

  1. 支持从器乐到人声,通过给器乐曲目添加歌词,制作出多层次的音乐作品;
  2. 支持转换上传的音频,上传一段唱歌、哼唱或演奏乐器的片段,使用翻唱功能进行重新演绎;
  3. 该功能现已向所有 Pro/Premier 订阅用户开放,并赠送 100 次免费翻唱机会。

工具地址:https://suno.com/
工具介绍:https://mp.weixin.qq.com/s/e4bLgllZe3_bsvff9L1Buw

下期见~!

AI工具派
探索最新AI工具,发现AI带来的无限可能性!
 最新文章