AI Weekly『11月11-17日』:Kimi发布新一代数学推理模型,腾讯推出AI工作台ima!

文摘   2024-11-17 07:01   美国  

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”

AI Weekly回来了!

AI Weekly”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。

省流版摘要

省流版摘要

  1. 月之暗面发布k0-math数学模型:月之暗面发布数学推理模型k0-math,在多项数学基准测试中表现超越OpenAI的o1-minio1-preview。模型将在几周内上线Kimi网页版和App端。

  2. 腾讯上线AI工作台ima:腾讯推出AI智能工作台ima,打通微信公众号生态,支持问答、创作、图片生成、内容总结、思维导图和多语言翻译,现已上线Mac和Windows版本。

  3. 阿里开源Qwen2.5-Coder模型:阿里巴巴开源Qwen2.5-Coder系列模型,包括六种尺寸,旗舰模型32B-Instruct在代码测试中表现媲美GPT-4o。

  4. X平台免费开放Grok聊天机器人:X平台测试免费开放AI机器人Grok,用户每天有查询次数限制,此举旨在扩大用户基础,与其他AI模型竞争。

  5. 谷歌发布教育AI工具Learn About:谷歌推出专注教育的AI工具“Learn About”,采用教科书式呈现,帮助用户深入理解问题,提供词汇构建和学习上下文功能。

  6. 谷歌推出iOS版Gemini应用:谷歌为iPhone用户发布独立Gemini AI应用,支持灵动岛和语音聊天功能,并新增实时显示的Gemini Live。

  7. OpenAI推出ChatGPT桌面版:OpenAI面向Windows 10/11用户发布桌面版ChatGPT应用,支持快捷键和高级语音功能,用户可通过微软应用商店免费下载。

  8. OpenAI模型Orion进展放缓:OpenAI下一代模型Orion进步有限,尤其在编码任务上表现不及前代模型,公司正在探索合成数据训练和性能优化策略。

1. 月之暗面发布k0-math数学推理模型,对标OpenAI o1模型

2024年11月16日,月之暗面旗下的Kimi团队正式发布数学推理模型k0-math。基准测试显示,k0-math的数学能力可与OpenAI的o1系列模型(包括o1-minio1-preview)相媲美(备注:真实体验有待确认)。

月之暗面创始人杨植麟表示,数学是最适合锻炼AI思考能力的场景。在中考、高考、考研以及入门竞赛题等四个数学基准测试中,k0-math初代模型的成绩均超过了o1-minio1-preview。在更高难度的竞赛级别数学题库OMNI-MATH和AIME的基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

k0-math模型将在未来几周分批上线Kimi网页版和Kimi智能助手App端,供用户体验。

2. 腾讯推出AI智能工作台ima,打通微信公众号生态

2024年11月15日,腾讯官方公众号宣布,旗下AI智能工作台ima正式上线。除了具备大模型AI问答、文字创作、图片生成等功能外,ima还打通了微信公众号文章生态,用户可利用公众号内的知识资源。

用户可通过ima获取从入门到精通的行业问题优质答案。ima的模型会根据用户查询,综合检索包括公众号在内的全网信源,结合匹配度、时效性等因素筛选最佳内容,提供高质量回答。

此外,ima支持边问边看、边搜边记,本地资料也可总结内容、提炼要点、生成思维导图,并支持多国语言翻译。目前,ima已上线Mac和Windows版本。

3. 阿里开源Qwen2.5-Coder系列模型,代码能力媲美GPT-4o

2024年11月12日,阿里旗下的通义千问团队正式开源了Qwen2.5-Coder全系列模型。其中,旗舰模型Qwen2.5-Coder-32B-Instruct在多个代码生成基准测试(如EvalPlus、LiveCodeBench、BigCodeBench)中表现出色,官方声称其代码能力可与GPT-4o相媲美。

此次开源的模型涵盖0.5B、1.5B、3B、7B、14B和32B六个尺寸,满足不同开发者的需求。除3B模型采用Research Only许可外,其余模型均采用Apache 2.0许可证,进一步促进了开源社区的发展。

4. X平台测试免费开放AI聊天机器人Grok

马斯克旗下的社交媒体平台X(原Twitter)正在测试将此前仅限付费用户使用的AI聊天机器人Grok免费开放给更多用户。目前,新西兰的部分用户已可免费使用Grok,但免费版存在一定限制:Grok-2模型每天限查询10次,Grok-2 mini模型每天限查询20次,图像分析每天限查询3次。此外,用户账户需注册至少7天并绑定手机号才能使用免费版Grok。xAI于今年8月推出了具备图像生成能力的Grok-2模型,并于上月为其添加了图像理解功能。通过免费开放Grok,xAI可能旨在扩大用户基础,加快产品反馈循环,以更好地与市场上的其他AI模型如ChatGPT、Claude和Gemini竞争。

但各大媒体报道中没有提到的是,其实xAI已默默开通网页端,地址及使用方法可以看我这篇文章:《马斯克的xAI已开通网页版!目前免费!附详细教程和初体验》。

5. 谷歌推出教育专用AI工具“Learn About”

2024年11月11日,谷歌发布了一款名为“Learn About”的实验性AI工具,专注于教育领域。该工具基于谷歌今年春季发布的LearnLM模型,旨在根据用户的学习方式量身定制内容。

与传统聊天机器人如Gemini和ChatGPT不同,Learn About提供的答案更具视觉性和交互性,采用教科书式的格式呈现。例如,在回答“宇宙有多大?”这一问题时,Learn About不仅提供了文字解释,还引用了教育网站Physics Forums的图片,并添加了相关学习内容,帮助用户深入理解。

此外,Learn About会为用户提供额外的上下文信息,如“为什么它很重要”以及词汇定义,帮助用户构建词汇量。侧边栏中还提供了额外的主题,供用户进一步探索。

6. 谷歌推出iOS版Gemini应用,集成灵动岛并支持AI语音聊天

2024年11月14日,谷歌为iPhone用户发布了独立的Gemini AI应用,而此前Gemini在iOS端仅存在于谷歌主应用中。该独立应用不仅增强了功能,还特别针对iOS系统集成了灵动岛功能。

新引入的Gemini Live功能是一大亮点,用户在对话时可以在灵动岛和锁屏上看到Gemini Live,无需切换回主应用即可轻松管理AI互动。需要注意的是,目前还没有上线国区App Store,所以需要切换至其他地区的账户下载该应用。

详细使用方法可以看我这篇文章:《谷歌Gemini发布iOS版App,live语音聊天免费用!》。

7. OpenAI面向Windows用户发布桌面版ChatGPT应用

2024年11月15日,OpenAI宣布正式推出适用于Windows 10和Windows 11的ChatGPT桌面应用。此前,该应用仅对付费用户开放,现已向所有用户免费开放。

该应用支持自定义快捷键,允许用户快速调用ChatGPT的辅助窗口,提供更便捷的使用体验。此外,Windows版ChatGPT还具备高级语音模式功能,进一步提升了用户交互的多样性。用户可通过微软应用商店免费下载并安装该应用。

更为详细的教程可以看我这篇文章:《ChatGPT Windows客户端已全面开放!附详细教程!

8. OpenAI下一代模型Orion进展放缓,探索新策略应对挑战

据《The Information》报道,OpenAI的下一代旗舰模型Orion在内部测试中显示,尽管其性能有所提升,但与GPT-3GPT-4的巨大飞跃相比,提升幅度相对较小。尤其是在编码任务中,Orion的表现甚至可能不及前代模型GPT-4o

为应对这一挑战,OpenAI组建了一个基础团队,专门研究在训练数据逐渐减少的情况下如何持续提升模型性能。新策略包括利用AI模型生成合成数据来训练Orion,以及在模型训练后进行更多优化。OpenAI官方并未对此报道作出回应。



精选推荐

  1. 国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程!
  2. 『AI保姆级教程』无需手机号!三分钟注册ChatGPT账号!2024年最新教程!
  3. 『AI保姆级教程』手把手教你注册Claude账号!建议收藏!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

AI信息Gap
AI信息差,让一部分人先AI起来。
 最新文章