Runway AI 删除开源模型引关注 | ChatGPT 周活用户破 2 亿 | 阿里重磅开源多模态模型 Qwen2-VL

科技   2024-08-31 13:31   上海  

💥 Runway AI 删除开源模型引关注

🥂 ChatGPT 周活用户破 2 亿

💭 Character. AI 上演 5% 裁员风波

💫 智谱 AI 发布新一代基座模型

🌏 阿里重磅开源多模态模型 Qwen2-VL

👁️ 通义网页版上线 PPT 创作功能

🦿 众擎机器人完成天使轮融资,商汤领投

✍️ Codeium 完成 1.5 亿美元 C 轮融资

👀 谷歌 Gemini 公布 5 种 Study Smarter 新方案

Runway AI 删除开源模型引关注

知名AI视频创新企业Runway在未提前通知的情况下,突然删除了其在 Hugging Face 和 GitHub 两大开源社区上的开源模型,引发业界广泛关注。此次删除行为涉及 Stable Diffusion v1.5 模型,该模型由 Runway、Stability AI 和慕尼黑大学共同研发。目前,Runway 官方尚未对此次删除行为作出任何公开回应,其社交平台上一切如常。

业界对Runway此举的原因有多种猜测,主要指向两个可能:一是与 Stability AI 之间的利益纠纷,二是涉及侵权问题,Runway可能在销毁证据。此前,Runway和Stability AI 在 Stable Diffusion 模型的开源发布上存在分歧,双方各执一词。此外,Runway、Stability AI 和其他几家AI公司曾因使用艺术家作品进行模型训练而面临集体诉讼。美国地区法院近期驳回了这些公司的上诉,允许艺术家进入列举证据的环节。Stable Diffusion 模型可能是这场诉讼的关键证据之一。

ChatGPT 全球周活用户破 2 亿

OpenAI 的 AI 聊天机器人目前周活跃用户数量已经超过 2 亿,短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中,92% 正在使用其产品;自 7 月份发布 GPT-4o mini 以来,其自动 API 的使用量已翻了一番。

首席执行官山姆・阿尔特曼(Sam Altman)在给该媒体的一份声明中表示:

人们正在使用我们的工具,将其融入到日常生活中,在医疗保健和教育等领域发挥着真正的作用,可以帮助完成日常任务、解决棘手问题,还是释放创造力。

Character.AI 上演 5% 裁员风波

据 The Information 报道,与谷歌达成重大交易不久后,美国人工智能创业公司 Character.AI 进行了至少 5% 的裁员,主要涉及营销和招聘岗位。在裁员前,Character.AI拥有约120名员工。

目前,Character.AI将由总法律顾问 Dom Perella 临时领导。Character.AI 的剩余领导层必须说服 100名左右的普通员工,在他们的原 CEO 以及不少加入谷歌的同事已经发财致富的情况下,跟着新的领导和新的任务继续坚持下去。这样 Character.AI 才有希望获得新的风险投资。

Character.AI 曾大谈特谈其闭环策略,即训练自己的大模型,将该模型用于聊天机器人,然后将用户使用数据用于训练中。而现在,Character.AI 将开始使用其他公司开发的开源模型,并转向后期训练。

智谱 AI 发布新一代基座模型

在 KDD2024 大会上,智谱 AI 发布了新一代基座模型,包括语言模型 GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型 GLM-4V-Plus、视频生成模型 CogVideoX 等,这些模型在相应领域均达到了国际第一梯队的水平。智谱AI还在「清言APP」上线了视频通话功能,并在 MaaS 平台上开放了 GLM-4-Flash API 的免费使用。

阿里重磅开源多模态模型 Qwen2-VL

阿里巴巴开源了最新视觉多模态模型 Qwen2-VL[1],根据测试数据显示,其 72B 模型在大部分指标超过了 OpenAI 的 GPT-c4o,Anthropic 的 Claude3.5-Sonnet 等著名闭源模型,成为目前最强多模态模型之一。Qwen2-VL 支持中文、英文、日文、韩文等众多语言,可以在 Apache 2.0 协议下进行商业化使用。同时阿里发布了 Qwen2-VL-72B 的 API,帮助开发者增强或开发多模态功能的生成式 AI 应用。

通义网页版上线 PPT 创作功能

通义网页版上线「PPT创作」功能,具备言之有物、设计精美、智能编排三大核心特点。PPT创作功能完全免费,基于通义大模型打造。在通义网页版,音视频转文字产品「通义听悟」升级为「实时记录」,长文档阅读助手「通义智文」升级为「阅读助手」,与「PPT创作」功能共同合并为通义效率,实现从信息搜集整理、内容理解再到内容创作的完整工作学习流。

众擎机器人完成天使轮融资,商汤领投

具身智能通用机器人研发商深圳市众擎机器人科技有限公司,完成天使轮及天使+轮共计近亿元的融资。两轮融资分别由商汤国香资本、弘晖基金领投,其他跟投方包括合肥滨湖金投和浔商资本等。

对于接下来公司的发展计划和动向,众擎机器人计划在今年第四季度推出多款全尺寸人形机器人,内部称为「SE系列」和「PM系列」,身高范围为 1.65 m-1.80 m。这些机器人将应用于工业和家庭场景,特别是在高危作业、生产制造和智能装配领域,涵盖汽车、电池、半导体等多个行业。

Codeium 完成 1.5 亿美元 C 轮融资

美国AI编程初创公司 Codeium 宣布,其已完成了 1.5 亿美元的 C 轮融资,本次融资由知名风投公司General Catalyst 领投。融资后,这家AI初创公司估值达到 12.5 亿美元,现已成功步入行业独角兽行列。

据悉,Codeium 由莫汉和他的儿时好友兼麻省理工学院校友道格拉斯·陈(Douglas Chen)创立于2021 年。Codeium 平台主要依托于在公共代码库中训练的生成式 AI 模型而运行。该平台支持约 70 种编程语言,并集成了许多流行的开发环境,其中包括 Microsoft Visual Studio 和 IDE。目前公司有 80 名员工,为在竞争激烈的市场中取得更大成功,他们打算在 2025 年前再招 40人。

谷歌 Gemini 公布 5 种 Study Smarter 新方案

随着新学年的开始,谷歌推出了一系列新功能,旨在通过其智能助手 Gemini 帮助学生更智慧地学习。无论你是刚步入大学校园的新生,还是准备迎接新挑战的返校生,Gemini 都准备好了帮助你更高效地学习。这五种方案包括:

利用权威教科书的提取知识:Gemini 可以从Rice 大学的教育非营利项目 OpenStax 提供的学术教科书中提取信息;

通过互动测验测试你的知识:Gemini 会逐个问题引导你,如果你在途中遇到困难,还会提供反馈和提示。

支持上传学习材料,像专业人士一样助力分析:使用 Gemini Advanced,可以一次上传多达10份文件——比如课程大纲或你的笔记——并要求 Gemini 解释内容或创建定制的学习指南。Gemini 将深入研究你的材料,分解关键概念,根据你的课程材料提供练习题等。

使用学习教练Gem获取个性化学习指导:Gemini Advanced 的订阅者可以访问 Gems,它们是任何主题的定制 AI 专家。预制的 Gem 学习教练可以帮助创建学习计划——包括进度检查,以确保你保持在正确的轨道上。

对任何主题推荐多媒体信息讲解:Gemini 可以以易于理解的方式分解信息。从视频到图像到针对你正在学习的内容量身定制的真实生活示例。

如果做好心理准备,一切准备都已经准备好了。

——威廉· 莎士比亚

编辑团队

编辑:Yuki

设计:Ivan

商务合作请加微信:Rwkfbcianvd

参考资料

[1]

Qwen2-VL: https://qwenlm.github.io/zh/blog/qwen2-vl/


十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
 最新文章