现在市场上有哪些大模型？什么样的大模型适合国内企业？

科技 2024-08-30 09:47 北京

设为“星标”，和你一起掌握更多数据库知识

这个回答基本上涵盖了大多数的大模型，首先这是国外的的大模型。自从openAI开源以后，大模型现在多不胜数，国内也龙飞凤舞

在国外，自从去年，open AI发布了以chat Gpt为代表的模型，今年有发布了文生视频大模型Sora。此外，公司还拥有自然语言转图片的应用DELL E2。

国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等大厂都演化了了生成式AI大招。目前GPT-4o模型实现端到端信息处理，人机交互体验大幅提升，Claude 3后起之秀，整体性能十分强劲，原生多模态大模型Gemini，多模态能力、跨模态能力取得突破。

接下来我总结一下，国外的大模型总结：

LLM	开发者	使用它的流行应用	参数数量	访问方式
GPT	OpenAI	Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT	1750亿+	API
Gemini	Google	Bard的一些查询	纳米: 18亿 & 32.5亿; 其他未知	API
PaLM 2	Google	Google Bard, Docs, Gmail, 和其他Google应用	3400亿	API
Llama 2	Meta	未公开	7亿, 13亿, 和 70亿	开源
Vicuna	LMSYS Org	Chatbot Arena	7亿, 13亿, 和 33亿	开源
Claude 2	Anthropic	Slack, Notion, Zoom	未知	API
Stable Beluga	Stability AI	未公开	7亿, 13亿, 和 70亿	开源
StableLM	Stability AI	未公开	7亿, 13亿, 和 70亿	开源
Coral	Cohere	HyperWrite, Jasper, Notion, LongShot	未知	API
Falcon	Technology Innovation Institute	未公开	1.3亿, 7.5亿, 40亿, 和 180亿	开源
MPT	Mosaic	未公开	7亿和 30亿	开源
Mixtral 8x7B	Mistral AI	未公开	46.7亿	开源
XGen-7B	Salesforce	未公开	7亿	开源
Grok	xAI	Grok Chatbot	未知	聊天机器人

其中，chatGpt的模型是AI界的鼻祖，现有版本GPT-3.5-turbo和GPT-4，采用Transformer架构。

开源模型领域中，LLama2模型升级到了LLama3，其模型能力大幅提升

Mixtral 8x7B为开源领域引入专家混合技术，进一步演化。

如今open AI在前几天又发布了超越了智能模型的超级模型—草莓模型

国内的几个大模型国内大模型概览

国内大模型	开发者	流行应用	参数数量	访问方式
星火大模型	科大讯飞	绘画创作、编程辅助、PPT大纲生成等	-	-
智谱清言	智谱AI	多轮对话、内容创作、信息归纳总结	千亿参数	-
豆包	-	AI搜索、PDF问答、图像生成	-	-
Kimi	Moonshot AI	超长文本输入、处理长文本的复杂任务	-	-
Coze	-	个性化推荐、财经信息查询、绘图助手	-	-
万知	-	文档解析、PPT创作、长文速读	-	-
百川	百川智能	中英双语、搜索增强技术	超千亿参数	-
文心一言	百度	自然语言处理、多种智能应用场景	-	-
通义千问	阿里云	智能问答、语言理解服务	-	-
混元	腾讯	混元助手小程序、优化移动用户体验	-	-
商量	-	AI对话平台、智能对话服务	-	-
跃问	-	AI聊天服务、智能对话	-	-
Dify	-	AI驱动的服务、改善工作效率和生活质量	-	-
万知	-	一站式AI工作平台、全面的AI服务	-	-

以BAT等一下几家模型为代码，进行了垄断

百度：文心一言3.0和4.0系列，代表产品：文心一言、文心一格
阿里：通义大模型，代表产品：通义千问
百川：百川大模型
腾讯：混元大模型
字节：豆包大模型

目前国产大模型中，主要分为三类：

一是原创大模型

二是套壳国外的开源大模型

三是拼装大模型

我个人觉得原创大模型数量很少，大多是套壳，所以，我觉得，目前虽然有自己的大模型，但是垂直类的模型太少，虽然有一些，但是还要动不动就收费。

在国内，垂直模型是必然趋势

在美术领域，特定RGB值可对应特定语义，如沙滩、人物，山景

前两天给神话悟空现实，里面的笔画是否可以考虑用专有的AI？

通过大模型技术，将这些专业知识融合起来，专业人士可利用相应代号实现精确创作，无需费力手绘。

还有人说是通用模型，不管谁好谁坏，还需要人们在选择时，根据具体任务要求进行选择。以后不会在垂直的模型上更加通用呢？

可能在未来的十年以后，办公场景会是这样的：

现在垂直模型面临的问题也不少，如：数据集、计算资源、泛化能力等问题和挑战

所以对于大模型，革命尚未成功，同志们仍需努力！

计算机专业必读书籍：

2024年必读高质量计算机编程书籍

最后说一句（别白嫖，求关注）

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

重磅！OpenAI正研发ChatGPT文本水印技术，其他大模型将何去何从？

2024年必读高质量计算机编程书籍

一条 SQL 引发的事故，同事直接被开除！！

太扎心！排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui，有点秀（附开源地址）

首位 AI 科学家问世

相信自己，没有做不到的，只有想不到的

在这里获得的不仅仅是技术！

喜欢就给个“在看”

http://mp.weixin.qq.com/s?__biz=MzI3OTU0MzI4MQ==&mid=2247534058&idx=2&sn=acac235c38bfdedcfd1a95561051fa09

互联网科技小于哥

大家好，我是小于哥呀 1、在这里已经为1000+人，提供专业的求职/技术咨询。 2、每天持续干货输出，同时也做专业面试指AI相关的知识，多次受邀成为圆桌嘉宾； 3、每天持续分享互联网，科技，开发技术，毕设和AI相关的知识，同时也做专业面试指

最新文章

程序员挣够了钱，到中年失业真的很可怕吗？

超级全面的 MySQL 优化面试解析

为什么四角星逐渐成为了代表 AI 的标志？

媒体曝台积电向中国大陆 AI/GPU 客户暂停 7nm 及以下芯片供应，将会产生什么影响？

计算机书籍推荐

阿里一面：MySQL 单表数据最大不要超过多少行？为什么？

好的软件测试人员简历是什么样子的？

强烈建议尽快搞个软考证！（重大利好）

重磅！俄罗斯对谷歌罚款35位数，远超全球GDP总和

AI 编程工具，这些很不错！

AI 大模型加持，新年不容错过的效率神器

亚马逊被曝将裁员 1.4 万管理人员！

手把手教你写一份好的技术简历

重磅！亚马逊被曝明年或将将裁减约1.4万名管理人员！

600个常用Linux命令大全，可珍藏使用！

最近大热的 Cursor 与其他 AI 编程工具相比，有哪些显著的区别？

公司要裁员，自知自己的能力不足，要辞职吗？

大模型拜师学艺！422位专家、学者加入百度“文心导师”计划

工作7年被裁员，该不该或者敢不敢要补偿?

重磅！阿里发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B

使用Spring AOP实现异步文件上传

iPhone16来了！熬夜总结的Apple 2024 秋季新品发布会，亮点在哪里？

创业不建议，十死九生！

重磅！奥特曼欲扬先抑，Open AI新模型订阅或将涨到2000美金

国产大模型到底哪个好用？

超级全面的 MySQL 优化面试解析

重磅！腾讯新一代大模型混元 Turbo 正式发布

国产GPU 独角兽大厂象帝先宣布解散！

听说百度要放弃基础通用大模型的研发了，真的假的？

米哈游域名反作弊,绝了！

网传 iPhone16 可能不支持微信

答主训练 AI 击败《黑神话·悟空》首个 BOSS，怎么做到的？

2024年，难，难，大家都难！