国产大模型到底哪个好用?

科技   2024-09-07 10:34   中国  

击上方关注 “终端研发部

设为“星标”,和你一起掌握更多数据库知识 

接下来,国内AI大模型必然是百模大战,“神仙打架”的局面。目前,我又发现了一款非常好用的大模型GLM-4-Plus,别看它刚刚问世,却是我用到众多模型中最好用的一个——智谱「超大杯」模型全家桶大模型。

智谱「超大杯」模型全家桶大模型到底是什么?

智谱团队这一次放大招,共发布了3个版本,语言基座模型GLM-4-Plus、图像/视频理解模型GLM-4V-Plus、文生图模型CogView-3-Plus、这三个已经上线智谱AI BigModel开放平台,在此之前,BigModel开放平台另外还开源了一个视频生成模型 CogVideoX。


语言基座模型GLM-4-Plus

全面的语言理解能力:GLM-4-Plus在语言理解方面进行了深入研究和优化

指令遵循:模型能够更好地遵循用户的指令,提供更加精准和符合预期的输出。

长文本处理:通过长短文本数据混合策略,GLM-4-Plus显著增强了在长文本推理方面的表现

实时推理能力:这个实施推理能力最为强大。为进一步提升推理能力,GLM-4-Plus采用了近端策略优化(PPO)算法,使模型在数学、编程等复杂推理任务中表现更加优异。

文生图模型 CogView-3-Plus

具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。其效果接近目前最佳的 MJ-V6 及 FLUX 等模型,并支持图片编辑功能。效果如下:


图像/视频理解模型 GLM-4V-Plus

具备卓越的图像理解能力,并具备基于时间感知的视频理解能力。该模型已经上线智谱大模型开放平台(bigmodel.cn),,成为国内首个通用图像&视频理解模型 API。

「超大杯」模型有什么优势?

对于GLM-4-Plus来说,它是智谱 GLM 团队全自研 GLM 大模型的最新版本,采用了10TB的高质量多语言训练数据和FP8技术加速模型训练,海量数据、高效训练加之小体量赋予GLM-4-Flash功能强大,在日常科研中,可以进行数据生成、数据评测、结构化数据抽取等办公场景,都简直不在话下。

而GLM-4-Plus模型使用了大量模型辅助构造高质量合成数据以提升性能,还利用近端策略优化算法,有效提升了模型推理,指令遵循、长文本处理能力,媲美GPT-4o

对于GLM-4V-Plus来讲,理解图像真的很强大,识别图片中的人物画像,并且能指定某一风景的来源,视频理解能力,比较复杂的都可以进行理解,直接可以对视频进行解说了。

CogView-3-Plus是新的绘图模型,说是有了大幅进化。智谱的这个AI绘图模型是比以前进化很多了。CogView3 在文生图多个评测指标上,相比 DALLE3 约在 91.4% ~99.3%的水平之间。


出图质量和目前主流的MidJourney有得一拼。

GLM-4-Plus模型VS 其他厂家模型

该模型使用了大量模型辅助构造高质量合成数据以提升性能,还利用PPO(近端策略优化)算法有效提升了模型推理(数学、代码算法题等)表现。其中在语言文本能力方面,GLM-4-Plus可与GPT-4o、Llama3.1 405B相当,并通过更精准的长短文本数据混合策略,取得了更强的长文本推理效果。

先看官方给出的指标。从结果来看,在与 OpenAI 最强旗舰模型 GPT-4o 的全面较量中,GLM-4-Plus 已经可以在大多数任务上做到逼近甚至在某些任务上实现了超越。

再来看一下 GLM-4-Plus 模型在语言类经典benchmark的评测结果:


可以看到,GLM-4-Plus在经典的语言理解、数学、代码等经典测试基准上已经与GPT-4o的表现非常接近了。

而在长文本测试基准上,同样是名列前茅的

尤其是在InfiniteBench数据集上,表现超越了Claude Sonnet 3.5、Llama 405B等一众海外明星模型。

而我觉得在这一轮的升级中,更亮眼的还是智谱的多模态能力升级,说是炸了一脸也不为过。

在很多人眼里GPT-4o是多模态战场上永远的神,但如果我贴这样一张表呢:

如果你也想体验一下智谱AI的多模态究竟有多强大,解锁AI新知,与技术大咖并肩!

扫描下列二维码加入「ZHIPUer技术社区」,分享最新案例,交流技术心得,还有更多社区活动奖励、内测福利、企业内推等机会等你解锁。

三个大模型到底怎么应用?

GLM-4-Plus的⽂本推理应用

当我们给出一个数学逻辑问题的时候:求解一元二次方程 ax^2 + bx + c = 0 的根


在这道题中,因为a,b,c不确定,GLM-4-Plus模型会让你提出自己的具体值,从而进一步分情况进行讨论,得出了我们想要的结果。

觉得不过瘾的话,我们给 GLM-4-Plus 增加难度,看它能不能搞定经典的「和尚挑水」问题:

在一个寺庙里,有多个小和尚负责从井里打水,然后将水倒入水缸中供老和尚饮用。水缸有一定的容量限制,同时水井每次只能容纳一个水桶取水。此外,水桶的数量也是有限的。问题是如何设计一个系统,使得小和尚和老和尚之间能够正确地同步他们的活动,避免资源竞争和死锁。

看到模型给出的答案后,我只能说说比人聪明多了!

文生图模型CogView-3-Plus应用

我作为自媒体人,利用它AI设计自己想要的图片,比如咒语:请画一幅蓝色系的水粉画。


设计一张少女与狼的优雅图片


我们还可以设置不同promt,不断进行尝试,设计我们想要的风格

然后可以发布一些设计平台和媒体平台进行赚钱了

GLM-4V-Plus应用实战

举个例子,我们给GLM-4一张带有蓝天白云的图片,进行图片情景识别。


我们给GLM-4V-Plus进行提问,这张图片里面有什么


我们 可以从result中看到,模型给出了包括但不限于蓝天、白云、海面、树木这些较为明显的事物,就连云朵的形状,海面泛着光都能够准确识别出来!

GLM-4V-Plus 还能根据截图生成代码。我自己亲自尝试了一下,截取了某博客网站的一张截图,让GLM-4V-Plus帮我们生成类似网站的代码

上传截图:



生成效果:

从代码功能来看,它能够正确识别模块的内容大概是什么(比如是导航栏、菜单栏,博客内容),并且语义化给出 class 命名并进行分类。

到这里别惊奇,我们在来看看他的视频理解能力,我么们一段视频


然后分别从视频总结、推理、时间问答等几个角度考验 GLM-4V-Plus。

Q1: 整个视频都做什么的,对是人工操作的还是机器去操作的?

A1: 在整个视频中,是一位厨师在做一道美食,像是熬制了一锅营养粥,食材有大枣,枸杞,生姜,鸡蛋,以及红糖。

Q2: 这个视频的精彩时刻是什么?一共发生了几个过程?

A2: 这个视频整个分为8步,特别是最后一步,熬制10分钟之后,打开的那一瞬间感觉很美滋滋。

值得一提的是,三个“-Plus”模型现已在智谱AI BigModel开放平台部署了,开发人员可通过调用API的方式体验。

从官方 demo 来看,这个功能可以用在陪伴、教学、办公、生活等多种场景。

我之所以看好智谱「超大杯」全家桶,因为它可以个性化定制我们 的服务,根据⽤⼾需求⽣成个性化产品图⽚,满⾜电商、运营等领域的个性化需求,作为开发者,我还可以直接继承到自己的项目中去。

这3个模型前几天刚发布我就开始体验和学习了,其强大的模型能力,让我更加的爱不释手。我利用其官网提供的API集成到了自己的运营端项目中去,并且给公司打造了一个AI电商客服的智能系统。

我的这个AI电商客服系统,基本不需要人工的参与,并且准确识别客户的意图和需求,还能够根据上下文信息进行智能推理和判断。更重要的是24小时在线为客户提供售前咨询、订单跟踪、售后维权等全方位的服务。它能够快速响应客户的疑问和需求,提高购物体验,促进交易达成。毕竟原始的客服系统受限于人力成本和服务效率,难以满足大规模、高并发的客户需求。有了这个AI客服系统,就能够快速响应客户的疑问和需求,提高购物体验,最近的成交量也高了不少。

我是怎么做的?

第一步:准备数据集,因为我做的电商客服系统,展示了部分准备的数据集。该数据集是我们客服以往记录的实际用户的问题,然后我为训练数据还增加了不同的应用场景


第二步:创建微调任务

这一点智谱做的非常的人性化,因为公司要在多个地方进行接入,我根据需要只当了模型的名称并指定模型编码的后缀,然后参考API 接口文档进行操作就行


我创建的数据集文档将近1个G,训练的时候也花了几个小时才完成的

第三步:部署私有微调模型

由于我们客户量还是满多的,还有国外的一些用户,这里我部署了3个示例,用于防止系统的压力过载


第四步:接入调用

这一步就很简单了,在平台上常见apiKey之后,按照官方提供的API集成项目依赖和接口调用,文档很详细,基本上小白都能看懂。


经过一段时间的训练和调试,终于完全符合我们运营的需求,效果图如下:

自从做了这个智能系统,因此受到了领导的一致好评,给公司节省了不少的运营成本,同时也升职,薪资也翻了一倍,太爽歪歪了!

所以现在整个市场包括国外的AI大模型发展,各家的模型各有特色,智谱AI大模型可谓是面面俱全,从基础大模型到小模型,从语言到多模态,从技术到产品,智谱在各个方向全面发展,且全方位对标 OpenAI,是国内外大模型厂家强有力的竞争者。

计算机专业必读书籍:

2024年必读高质量计算机编程书籍

最后说一句(别白嫖,求关注)


回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 SpringCloud获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

阅读更多

重磅!OpenAI正研发ChatGPT文本水印技术,其他大模型将何去何从?

2024年必读高质量计算机编程书籍

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

首位 AI 科学家问世

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!


喜欢就给个“在看

互联网科技小于哥
大家好,我是小于哥呀 1、在这里已经为1000+人,提供专业的求职/技术咨询。 2、每天持续干货输出,同时也做专业面试指AI相关的知识,多次受邀成为圆桌嘉宾; 3、每天持续分享互联网,科技,开发技术,毕设和AI相关的知识,同时也做专业面试指
 最新文章