说实话,心情有点激动,刚刚看了 2024 年阿里云栖大会上关于通义大模型的全面更新,已经开始期待可以用更强悍的通义大模型,来给自己捣鼓的一些小应用升级下内核大脑了。
我常年在公众号和B站上更新自媒体内容,时间忙不过来,大模型就成了提效最好的助手,一些重复度高的工作,就很容梳理出对应的提示词,让大模型来帮忙解决,例如视频脚本创作、稿件语法纠错、素材查找梳理,在这个过程中,在对比了多款大模型之后,不知不觉的,我就成为了通义大模型的忠实拥趸了。而且,公开打榜的排名足以证明,它的确值得我的偏爱。自从今年 6 月 7 日通义的 Qwen2-72B 开源后,就登上了全球性能最强开源大模型的宝座,超过先前的最强开源模型 Llama3-70B,在多种权威数据集上霸气屠榜。6 月 14 日,Qwen2-72B在图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBench AI中,在开源大模型中排名世界第一,也是十榜单中唯一的开源大模型、唯一的中国大模型。6 月 20 日,Qwen-2在斯坦福大学的大模型测评榜单 HELM MMLU 中,成为开源模型第一。MMLU(Massive Multitask Language Understanding,大规模多任务语言理解)是业界最有影响力的大模型测评基准之一,涵盖了基础数学、计算机科学、法律、历史等57项任务,用以测试大模型的世界知识和问题解决能力。就连今年的高考,这种非常考验大模型的「短板」之推理能力的测试中,通义Qwen2模型排名第一,超越GPT-4o。开源这条路并不好走,目前还在持续卷开源、而且不断搞出爆炸大新闻的,通义绝对算得上佼佼者了,在这次 2024 阿里云栖大会上,距离上次发布仅 3 个月之后,通义大模型又迎来了一次全面的升级了,它变得更为全能、更为强悍。为了方便大家阅读,我梳理了这次发布会上的重要信息点:1、丰富开源生态:推出 Qwen 2.5 系列大模型,数量多、尺寸丰富今年 6 月份时,通义发布了 Qwen2版本的系列模型,在刷榜的同时好评如潮。而这一次,Qwen 2.5 版本来了,除了性能的升级之外,这次的模型数量和尺寸规模非常全面。数量方面,涵盖LLM、多模态、专项能力模型;尺寸方面,从 0.5B 到 72B 参数规模的版本都具有:0.5B、1.5B、2B、14B、32B、72B,比之前的系列全面,能够更好的满足模型市场上,在不同的场景上的需求。使用者可以根据自身的情况,选择参数小的 0.5B 模型植入到小巧的终端设备上,甚至小到蓝牙耳机、鼠标都可以使用,很适合这一类低功耗场景。而 3B 是很适合手机等端侧设备的黄金尺寸;32B是最受开发者期待的“性价比之王”,可在性能和功耗之间获得最佳平衡;72B是开源旗舰版本,适配企业级和科研级的应用场景。这样一来,开发者就很容易根据自己的实际需求,去选择对应的模型参数版本,通义这是切切实实的考虑到开发者需求了,点个赞。先前的 Qwen2 代模型全网的下载量是超过 4000 万的,这一次更为性能更为强大、尺寸更为丰富的 2.5 代模型出来,估计累积下载量可以奔着亿级去了。2、这次通义花了很多心思在多模态上,打通大模型应用的最后一公里实际应用中,多模态能力决定了一款大模型能不能真正有用。这一次通义开源了多款模型,做到能听、能看、能做数学题、能写代码,而且为了方便开发者部署,每个模型都有对应的 Base、Instruct、I量化版本。如果你是通义大模型的老用户,对于 Qwen-Max 应该会比较熟悉。它是通义家族里最强的模型,也是一直免费提供使用的,这次它在整体性能上有了非常大的迭代,尤其是实在数学能力上有了长足的提升。数学能力一直以来,都是都很大模型的痛点,因为大模型本质上是基于概率去进行预估的,而数学需要严格的逻辑推理,两者是存在分歧的。这次通义将转向的数学模型,融合到了 Qwen-Max 大模型当中,使其拥有了优秀的数学推理能力。通用模型与专项模型的巧妙结合,是人工智能与各种领域深入结合的一种大势所趋。模态:能听、能看、能做数学题、能写代码的各类SOTA模型都开源了。为了便于开发者部署使用,每个模型都开出了Base、Instruct、l量化等多种版本。3、在行业覆盖度会持续发力,成为AI时代的智能基建作为国内互联网巨头,通义的基础太好了,阿里能够提供强悍的算力支撑以及各种丰富的应用场景,目前通义大模型通过阿里云服务企业超过数十万,重点覆盖了互联网、金融,汽车、科研、医疗、教育、政务、工业制造和零售等领域,在国产大模型中,是行业覆盖度最广的。小红书基于阿里云的云+AI能力,加速大模型布局,使得搜推广业务与社区业务快速发展。完美世界游戏已接入阿里云通义大模型。云+AI的能力在完美世界游戏开发的多个领域产生了积极的效果,包括剧情、对话和音频、动画生成,以及多种提效工具。后续双方将在AI NPC、实时内容生成等游戏玩法中展开更多合作,共同探索AI in GamePlay。新东方接入阿里云通义大模型用于改造线上课堂,提升在线学习效率。去年年底新东方引入通义大模型后,对在学生体验、教师的教学质量、教研内容研发等场景都有不同程度的改进,学员满度提高3%。众安保险基于和阿里云通义大模型的深度合作,在智能还款提醒、智能客服等场景,全面升级智能化水准,提升服务效率和客户满意度。徐汇区政务服务大模型基于通义大模型和徐汇区智能算力平台而研发。在政务服务中涉企服务场景,能实现10轮以上的自然语言咨询能力,对于高频事项的咨询准确率超过90%。未来的开源生态,将随着技术的不断进步和开源社区的壮大迎来全新的繁荣期。在过去几年里,我们见证了全球开源大模型的迅猛发展,从早期的模型在性能、应用场景和通用性上的不足,到如今如通义大模型这样强大的开源平台接连登场,证明了开源生态的无穷潜力。可以预见的,开源大模型的持续迭代将推动更广泛的创新和合作。不同规模和功能的大模型将被开发出来,以满足各行各业的个性化需求。未来可能不仅仅是科技巨头主导的开源项目,更多中小型企业、科研机构和个人开发者也将有机会参与其中,推动技术的民主化。开源模型提供的灵活性和透明性,不仅能帮助企业优化成本和提升创新能力,更重要的是,它促进了知识的共享,推动了技术的普及与开放。开源生态的另一个关键趋势是,人工智能的应用场景将更加多样化。从现有的金融、医疗、教育、零售等传统行业,AI技术将进一步渗透到更多新兴领域,如虚拟现实、元宇宙、智能制造和个性化娱乐体验等。这不仅仅是技术上的进步,还是开源精神在各个行业中的全面渗透。通过持续的技术创新和协作,开源模型将帮助企业和开发者解决更复杂的实际问题,提升运营效率和用户体验,甚至可能催生出全新的商业模式。从乐观角度看,开源大模型的发展将有力推动全球AI技术的进程,尤其是在公平竞争和知识共享的前提下,更多地区和国家将通过开源模型获取先进的AI能力,从而缩小技术鸿沟。开源生态的多样性和活力也将激励更多的技术人才参与其中,带动技术创新和经济效益的双重增长。