现在市场上有哪些大模型?什么样的大模型适合国内企业?

科技   2024-08-30 09:47   北京  

点击上方关注 “终端研发部

设为“星标”,和你一起掌握更多数据库知识


这个回答基本上涵盖了大多数的大模型,首先这是国外的的大模型。自从openAI开源以后,大模型现在多不胜数,国内也龙飞凤舞

在国外,自从去年,open AI发布了以chat Gpt为代表的模型,今年有发布了文生视频大模型Sora。此外,公司还拥有自然语言转图片的应用DELL E2。

国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等大厂都演化了了生成式AI大招。目前GPT-4o模型实现端到端信息处理,人机交互体验大幅提升,Claude 3后起之秀,整体性能十分强劲,原生多模态大模型Gemini,多模态能力、跨模态能力取得突破。


接下来我总结一下,国外的大模型总结:

LLM

开发者

使用它的流行应用

参数数量

访问方式

GPT

OpenAI

Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT

1750亿+

API

Gemini

Google

Bard的一些查询

纳米: 18亿 & 32.5亿; 其他未知

API

PaLM 2

Google

Google Bard, Docs, Gmail, 和其他Google应用

3400亿

API

Llama 2

Meta

未公开

7亿, 13亿, 和 70亿

开源

Vicuna

LMSYS Org

Chatbot Arena

7亿, 13亿, 和 33亿

开源

Claude 2

Anthropic

Slack, Notion, Zoom

未知

API

Stable Beluga

Stability AI

未公开

7亿, 13亿, 和 70亿

开源

StableLM

Stability AI

未公开

7亿, 13亿, 和 70亿

开源

Coral

Cohere

HyperWrite, Jasper, Notion, LongShot

未知

API

Falcon

Technology Innovation Institute

未公开

1.3亿, 7.5亿, 40亿, 和 180亿

开源

MPT

Mosaic

未公开

7亿 和 30亿

开源

Mixtral 8x7B

Mistral AI

未公开

46.7亿

开源

XGen-7B

Salesforce

未公开

7亿

开源

Grok

xAI

Grok Chatbot

未知

聊天机器人

其中,chatGpt的模型是AI界的鼻祖,现有版本GPT-3.5-turbo和GPT-4,采用Transformer架构。

开源模型领域中,LLama2模型升级到了LLama3,其模型能力大幅提升

Mixtral 8x7B为开源领域引入专家混合技术,进一步演化。

如今open AI在前几天又发布了超越了智能模型的超级模型—草莓模型


国内的几个大模型国内大模型概览

国内大模型

开发者

流行应用

参数数量

访问方式

星火大模型

科大讯飞

绘画创作、编程辅助、PPT大纲生成等

-

-

智谱清言

智谱AI

多轮对话、内容创作、信息归纳总结

千亿参数

-

豆包

-

AI搜索、PDF问答、图像生成

-

-

Kimi

Moonshot AI

超长文本输入、处理长文本的复杂任务

-

-

Coze

-

个性化推荐、财经信息查询、绘图助手

-

-

万知

-

文档解析、PPT创作、长文速读

-

-

百川

百川智能

中英双语、搜索增强技术

超千亿参数

-

文心一言

百度

自然语言处理、多种智能应用场景

-

-

通义千问

阿里云

智能问答、语言理解服务

-

-

混元

腾讯

混元助手小程序、优化移动用户体验

-

-

商量

-

AI对话平台、智能对话服务

-

-

跃问

-

AI聊天服务、智能对话

-

-

Dify

-

AI驱动的服务、改善工作效率和生活质量

-

-

万知

-

一站式AI工作平台、全面的AI服务

-

-

以BAT等一下几家模型为代码,进行了垄断

  1. 百度:文心一言3.0和4.0系列,代表产品:文心一言、文心一格

  2. 阿里:通义大模型,代表产品:通义千问

  3. 百川:百川大模型

  4. 腾讯:混元大模型

  5. 字节:豆包大模型

目前国产大模型中,主要分为三类:

一是原创大模型

二是套壳国外的开源大模型

三是拼装大模型

我个人觉得原创大模型数量很少,大多是套壳,所以,我觉得,目前虽然有自己的大模型,但是垂直类的模型太少,虽然有一些,但是还要动不动就收费。

在国内,垂直模型是必然趋势

在美术领域,特定RGB值可对应特定语义,如沙滩、人物,山景


前两天给神话悟空现实,里面的笔画是否可以考虑用专有的AI?

通过大模型技术,将这些专业知识融合起来,专业人士可利用相应代号实现精确创作,无需费力手绘。

还有人说是通用模型,不管谁好谁坏,还需要人们在选择时,根据具体任务要求进行选择。以后不会在垂直的模型上更加通用呢?

可能在未来的十年以后,办公场景会是这样的:


现在垂直模型面临的问题也不少,如:数据集、计算资源、泛化能力等问题和挑战

所以对于大模型,革命尚未成功,同志们仍需努力!

计算机专业必读书籍:

2024年必读高质量计算机编程书籍

最后说一句(别白嫖,求关注)


回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 SpringCloud获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

阅读更多

重磅!OpenAI正研发ChatGPT文本水印技术,其他大模型将何去何从?

2024年必读高质量计算机编程书籍

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

首位 AI 科学家问世

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!


喜欢就给个“在看


互联网科技小于哥
大家好,我是小于哥呀 1、在这里已经为1000+人,提供专业的求职/技术咨询。 2、每天持续干货输出,同时也做专业面试指AI相关的知识,多次受邀成为圆桌嘉宾; 3、每天持续分享互联网,科技,开发技术,毕设和AI相关的知识,同时也做专业面试指
 最新文章