国产大模型到底哪个好用？

科技 2024-09-07 10:34 中国

设为“星标”，和你一起掌握更多数据库知识

接下来，国内AI大模型必然是百模大战，“神仙打架”的局面。目前，我又发现了一款非常好用的大模型GLM-4-Plus，别看它刚刚问世，却是我用到众多模型中最好用的一个——智谱「超大杯」模型全家桶大模型。

智谱「超大杯」模型全家桶大模型到底是什么？

智谱团队这一次放大招，共发布了3个版本，语言基座模型GLM-4-Plus、图像/视频理解模型GLM-4V-Plus、文生图模型CogView-3-Plus、这三个已经上线智谱AI BigModel开放平台，在此之前，BigModel开放平台另外还开源了一个视频生成模型 CogVideoX。

语言基座模型GLM-4-Plus

全面的语言理解能力：GLM-4-Plus在语言理解方面进行了深入研究和优化

指令遵循：模型能够更好地遵循用户的指令，提供更加精准和符合预期的输出。

长文本处理：通过长短文本数据混合策略，GLM-4-Plus显著增强了在长文本推理方面的表现

实时推理能力：这个实施推理能力最为强大。为进一步提升推理能力，GLM-4-Plus采用了近端策略优化（PPO）算法，使模型在数学、编程等复杂推理任务中表现更加优异。

文生图模型 CogView-3-Plus

具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。其效果接近目前最佳的 MJ-V6 及 FLUX 等模型，并支持图片编辑功能。效果如下：

图像/视频理解模型 GLM-4V-Plus

具备卓越的图像理解能力，并具备基于时间感知的视频理解能力。该模型已经上线智谱大模型开放平台（bigmodel.cn），，成为国内首个通用图像&视频理解模型 API。

「超大杯」模型有什么优势？

对于GLM-4-Plus来说，它是智谱 GLM 团队全自研 GLM 大模型的最新版本，采用了10TB的高质量多语言训练数据和FP8技术加速模型训练，海量数据、高效训练加之小体量赋予GLM-4-Flash功能强大，在日常科研中，可以进行数据生成、数据评测、结构化数据抽取等办公场景，都简直不在话下。

而GLM-4-Plus模型使用了大量模型辅助构造高质量合成数据以提升性能，还利用近端策略优化算法，有效提升了模型推理，指令遵循、长文本处理能力，媲美GPT-4o

对于GLM-4V-Plus来讲，理解图像真的很强大，识别图片中的人物画像，并且能指定某一风景的来源，视频理解能力，比较复杂的都可以进行理解，直接可以对视频进行解说了。

CogView-3-Plus是新的绘图模型，说是有了大幅进化。智谱的这个AI绘图模型是比以前进化很多了。CogView3 在文生图多个评测指标上，相比 DALLE3 约在 91.4% ~99.3%的水平之间。

出图质量和目前主流的MidJourney有得一拼。

GLM-4-Plus模型VS 其他厂家模型

该模型使用了大量模型辅助构造高质量合成数据以提升性能，还利用PPO（近端策略优化）算法有效提升了模型推理（数学、代码算法题等）表现。其中在语言文本能力方面，GLM-4-Plus可与GPT-4o、Llama3.1 405B相当，并通过更精准的长短文本数据混合策略，取得了更强的长文本推理效果。

先看官方给出的指标。从结果来看，在与 OpenAI 最强旗舰模型 GPT-4o 的全面较量中，GLM-4-Plus 已经可以在大多数任务上做到逼近甚至在某些任务上实现了超越。

再来看一下 GLM-4-Plus 模型在语言类经典benchmark的评测结果：

可以看到，GLM-4-Plus在经典的语言理解、数学、代码等经典测试基准上已经与GPT-4o的表现非常接近了。

而在长文本测试基准上，同样是名列前茅的

尤其是在InfiniteBench数据集上，表现超越了Claude Sonnet 3.5、Llama 405B等一众海外明星模型。

而我觉得在这一轮的升级中，更亮眼的还是智谱的多模态能力升级，说是炸了一脸也不为过。

在很多人眼里GPT-4o是多模态战场上永远的神，但如果我贴这样一张表呢：

如果你也想体验一下智谱AI的多模态究竟有多强大，解锁AI新知，与技术大咖并肩！

扫描下列二维码加入「ZHIPUer技术社区」，分享最新案例，交流技术心得，还有更多社区活动奖励、内测福利、企业内推等机会等你解锁。

三个大模型到底怎么应用？

GLM-4-Plus的⽂本推理应用

当我们给出一个数学逻辑问题的时候：求解一元二次方程 ax^2 + bx + c = 0 的根

在这道题中，因为a,b,c不确定，GLM-4-Plus模型会让你提出自己的具体值，从而进一步分情况进行讨论，得出了我们想要的结果。

觉得不过瘾的话，我们给 GLM-4-Plus 增加难度，看它能不能搞定经典的「和尚挑水」问题:

在一个寺庙里，有多个小和尚负责从井里打水，然后将水倒入水缸中供老和尚饮用。水缸有一定的容量限制，同时水井每次只能容纳一个水桶取水。此外，水桶的数量也是有限的。问题是如何设计一个系统，使得小和尚和老和尚之间能够正确地同步他们的活动，避免资源竞争和死锁。

看到模型给出的答案后，我只能说说比人聪明多了！

文生图模型CogView-3-Plus应用

我作为自媒体人，利用它AI设计自己想要的图片，比如咒语：请画一幅蓝色系的水粉画。

设计一张少女与狼的优雅图片

我们还可以设置不同promt，不断进行尝试，设计我们想要的风格

然后可以发布一些设计平台和媒体平台进行赚钱了

GLM-4V-Plus应用实战

举个例子，我们给GLM-4一张带有蓝天白云的图片，进行图片情景识别。

我们给GLM-4V-Plus进行提问，这张图片里面有什么

我们可以从result中看到，模型给出了包括但不限于蓝天、白云、海面、树木这些较为明显的事物，就连云朵的形状，海面泛着光都能够准确识别出来！

GLM-4V-Plus 还能根据截图生成代码。我自己亲自尝试了一下，截取了某博客网站的一张截图，让GLM-4V-Plus帮我们生成类似网站的代码

上传截图：

生成效果：

从代码功能来看，它能够正确识别模块的内容大概是什么（比如是导航栏、菜单栏，博客内容），并且语义化给出 class 命名并进行分类。

到这里别惊奇，我们在来看看他的视频理解能力，我么们一段视频

然后分别从视频总结、推理、时间问答等几个角度考验 GLM-4V-Plus。

Q1: 整个视频都做什么的，对是人工操作的还是机器去操作的？

A1: 在整个视频中，是一位厨师在做一道美食，像是熬制了一锅营养粥，食材有大枣，枸杞，生姜，鸡蛋，以及红糖。

Q2: 这个视频的精彩时刻是什么？一共发生了几个过程？

A2: 这个视频整个分为8步，特别是最后一步，熬制10分钟之后，打开的那一瞬间感觉很美滋滋。

值得一提的是，三个“-Plus”模型现已在智谱AI BigModel开放平台部署了，开发人员可通过调用API的方式体验。

从官方 demo 来看，这个功能可以用在陪伴、教学、办公、生活等多种场景。

我之所以看好智谱「超大杯」全家桶，因为它可以个性化定制我们的服务，根据⽤⼾需求⽣成个性化产品图⽚，满⾜电商、运营等领域的个性化需求，作为开发者，我还可以直接继承到自己的项目中去。

这3个模型前几天刚发布我就开始体验和学习了，其强大的模型能力，让我更加的爱不释手。我利用其官网提供的API集成到了自己的运营端项目中去，并且给公司打造了一个AI电商客服的智能系统。

我的这个AI电商客服系统，基本不需要人工的参与，并且准确识别客户的意图和需求，还能够根据上下文信息进行智能推理和判断。更重要的是24小时在线为客户提供售前咨询、订单跟踪、售后维权等全方位的服务。它能够快速响应客户的疑问和需求，提高购物体验，促进交易达成。毕竟原始的客服系统受限于人力成本和服务效率，难以满足大规模、高并发的客户需求。有了这个AI客服系统，就能够快速响应客户的疑问和需求，提高购物体验，最近的成交量也高了不少。

我是怎么做的？

第一步：准备数据集，因为我做的电商客服系统，展示了部分准备的数据集。该数据集是我们客服以往记录的实际用户的问题，然后我为训练数据还增加了不同的应用场景

第二步：创建微调任务

这一点智谱做的非常的人性化，因为公司要在多个地方进行接入，我根据需要只当了模型的名称并指定模型编码的后缀，然后参考API 接口文档进行操作就行

我创建的数据集文档将近1个G，训练的时候也花了几个小时才完成的

第三步：部署私有微调模型

由于我们客户量还是满多的，还有国外的一些用户，这里我部署了3个示例，用于防止系统的压力过载

第四步：接入调用

这一步就很简单了，在平台上常见apiKey之后，按照官方提供的API集成项目依赖和接口调用，文档很详细，基本上小白都能看懂。

经过一段时间的训练和调试，终于完全符合我们运营的需求,效果图如下：

自从做了这个智能系统，因此受到了领导的一致好评，给公司节省了不少的运营成本，同时也升职，薪资也翻了一倍，太爽歪歪了！

所以现在整个市场包括国外的AI大模型发展，各家的模型各有特色，智谱AI大模型可谓是面面俱全，从基础大模型到小模型，从语言到多模态，从技术到产品，智谱在各个方向全面发展，且全方位对标 OpenAI，是国内外大模型厂家强有力的竞争者。

计算机专业必读书籍：

2024年必读高质量计算机编程书籍

最后说一句（别白嫖，求关注）

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

重磅！OpenAI正研发ChatGPT文本水印技术，其他大模型将何去何从？

2024年必读高质量计算机编程书籍

一条 SQL 引发的事故，同事直接被开除！！

太扎心！排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui，有点秀（附开源地址）

首位 AI 科学家问世

相信自己，没有做不到的，只有想不到的

在这里获得的不仅仅是技术！

喜欢就给个“在看”

http://mp.weixin.qq.com/s?__biz=MzI3OTU0MzI4MQ==&mid=2247534277&idx=1&sn=c48ce274e39eefdea582de0725d2ec2b

互联网科技小于哥

大家好，我是小于哥呀 1、在这里已经为1000+人，提供专业的求职/技术咨询。 2、每天持续干货输出，同时也做专业面试指AI相关的知识，多次受邀成为圆桌嘉宾； 3、每天持续分享互联网，科技，开发技术，毕设和AI相关的知识，同时也做专业面试指

最新文章

程序员挣够了钱，到中年失业真的很可怕吗？

超级全面的 MySQL 优化面试解析

为什么四角星逐渐成为了代表 AI 的标志？

媒体曝台积电向中国大陆 AI/GPU 客户暂停 7nm 及以下芯片供应，将会产生什么影响？

计算机书籍推荐

阿里一面：MySQL 单表数据最大不要超过多少行？为什么？

好的软件测试人员简历是什么样子的？

强烈建议尽快搞个软考证！（重大利好）

重磅！俄罗斯对谷歌罚款35位数，远超全球GDP总和

AI 编程工具，这些很不错！

AI 大模型加持，新年不容错过的效率神器

亚马逊被曝将裁员 1.4 万管理人员！

手把手教你写一份好的技术简历

重磅！亚马逊被曝明年或将将裁减约1.4万名管理人员！

600个常用Linux命令大全，可珍藏使用！

最近大热的 Cursor 与其他 AI 编程工具相比，有哪些显著的区别？

公司要裁员，自知自己的能力不足，要辞职吗？

大模型拜师学艺！422位专家、学者加入百度“文心导师”计划

工作7年被裁员，该不该或者敢不敢要补偿?

重磅！阿里发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B