国产开源模型扛把子QianWen再遇变故:千问技术负责人周畅被曝离职创业,剑指AI应用!

文摘   2024-07-19 12:58   美国  

TLDR;

  • • 在Qwen2技术报告发布后,阿里通义千问(QianWen)大模型技术负责人周畅被曝即将离职创业,目标是AI应用领域。

  • • 周畅是阿里巴巴的7年资深算法专家,拥有丰富的AI经验,曾参与多个重要AI项目的研发。

  • • 业内人士分析,大模型创业公司或将迎来发展机遇,AI应用将成为下一个竞争焦点。

Qwen2技术报告发布,深度解读模型细节

就在昨天,阿里巴巴发布了Qwen2系列大语言模型的技术报告:Qwen2 技术报告:阿里巴巴开源全新一代大语言模型,性能超越 Llama-3! 详细解读了其架构、训练数据、性能表现等关键细节。Qwen2包含高达720亿参数的密集模型和专家混合模型(MoE),此前在多个基准测试中超越了Llama-3等开源模型,甚至部分超越了闭源模型。

Qwen2支持30多种语言,拥有强大的长文本处理能力,最高可支持 128K Tokens 的上下文长度,足以理解和生成超长文本。此外,Qwen2系列还包含多种规模的模型,包括专为便携设备设计的轻量级模型。

此次技术报告的发布,标志着阿里巴巴对Qwen2模型的研发和开源工作进入了新的阶段,也为AI社区理解和应用Qwen2提供了更为详细的参考。

前脚技术透明,后脚核心成员离职

然而,就在Qwen2技术报告发布的同一天,阿里巴巴却传出一个令人震惊的消息:通义千问(QianWen)大模型技术负责人周畅即将离职创业!

前脚技术更透明,后脚核心成员离职,这不禁让人对QianWen的未来产生了一丝担忧。

周畅:从 QianWen 的见证者到 AI 应用的探索者

周畅是谁?他 2012 年毕业于复旦大学计算机科学与技术系,2017 年获得北京大学计算机软件与理论博士学位。同年,他加入阿里巴巴,开启了与 AI 的不解之缘。在阿里巴巴的七年,他从达摩院到通义千问团队,始终站在技术最前沿,是阿里大模型从无到有、从弱到强的亲历者和见证者。

周畅不仅参与了多个重要项目的研发,还带领团队取得了突破性的成果。例如,他带领团队设计并实现了超大规模的多模态预训练模型 M6,在参数数量和低碳训练模式上取得了突破。该模型也成为了阿里巴巴通义千问大模型的重要技术基础。

除此之外,周畅还曾研发了超大规模商品图表征算法 APP、用户表征框架 ATRank、基于自监督对比学习的向量召回算法 CLRec 系列等,这些技术都已成功落地应用,并在手淘多个个性化推荐场景下取得了显著效果。

周畅在 AI 领域的学术成就也十分亮眼。他在机器学习、数据挖掘、数据库领域国际顶级会议上发表过 30 余篇文章,谷歌学术被引超过 8000 次,并担任 NeurIPS/ICML/KDD/WWW 等学术会议的审稿人。

如今,周畅选择离开阿里,创办一家专注于AI应用的公司。他希望能够将自己在阿里积累的丰富经验和技术优势,应用到更广阔的领域,为用户创造更大的价值。

AI 应用:大模型竞争的下半场?

周畅选择在此时离开阿里,创办一家 AI 应用公司,或许正是看到了 AI 应用领域的巨大潜力。

当前,大模型的研发已经取得了阶段性成果,但距离真正落地应用还有很长的路要走。谁能率先将大模型技术与实际应用场景结合起来,谁就能在未来的竞争中占据先机。

周畅的创业选择,或许预示着大模型的竞争已经进入了下半场:从技术竞赛转向应用落地

大模型创业公司:未来可期?

周畅的离开,也给大模型创业公司带来了更多想象空间。

近年来,AI 领域创业浪潮持续升温,越来越多的创业公司涌现。这些创业公司虽然在资金、资源等方面与大厂存在差距,但他们在创新能力、市场反应速度等方面却更具优势。

随着像周畅这样拥有丰富经验的技术人才的加入,大模型创业公司将会获得更大的发展动力,未来有望在 AI 应用领域创造出更多价值,甚至有可能挑战大厂的行业地位。

子非AI
子非AI,焉知AI之乐:分享AI的有趣应用和创新案例,让你了解AI的乐趣。
 最新文章