点击上方关注 “终端研发部”
设为“星标”,和你一起掌握更多数据库知识
这个回答基本上涵盖了大多数的大模型,首先这是国外的的大模型。自从openAI开源以后,大模型现在多不胜数,国内也龙飞凤舞
在国外,自从去年,open AI发布了以chat Gpt为代表的模型,今年有发布了文生视频大模型Sora。此外,公司还拥有自然语言转图片的应用DELL E2。
国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等大厂都演化了了生成式AI大招。目前GPT-4o模型实现端到端信息处理,人机交互体验大幅提升,Claude 3后起之秀,整体性能十分强劲,原生多模态大模型Gemini,多模态能力、跨模态能力取得突破。
接下来我总结一下,国外的大模型总结:
LLM | 开发者 | 使用它的流行应用 | 参数数量 | 访问方式 |
---|---|---|---|---|
GPT | OpenAI | Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT | 1750亿+ | API |
Gemini | Bard的一些查询 | 纳米: 18亿 & 32.5亿; 其他未知 | API | |
PaLM 2 | Google Bard, Docs, Gmail, 和其他Google应用 | 3400亿 | API | |
Llama 2 | Meta | 未公开 | 7亿, 13亿, 和 70亿 | 开源 |
Vicuna | LMSYS Org | Chatbot Arena | 7亿, 13亿, 和 33亿 | 开源 |
Claude 2 | Anthropic | Slack, Notion, Zoom | 未知 | API |
Stable Beluga | Stability AI | 未公开 | 7亿, 13亿, 和 70亿 | 开源 |
StableLM | Stability AI | 未公开 | 7亿, 13亿, 和 70亿 | 开源 |
Coral | Cohere | HyperWrite, Jasper, Notion, LongShot | 未知 | API |
Falcon | Technology Innovation Institute | 未公开 | 1.3亿, 7.5亿, 40亿, 和 180亿 | 开源 |
MPT | Mosaic | 未公开 | 7亿 和 30亿 | 开源 |
Mixtral 8x7B | Mistral AI | 未公开 | 46.7亿 | 开源 |
XGen-7B | Salesforce | 未公开 | 7亿 | 开源 |
Grok | xAI | Grok Chatbot | 未知 | 聊天机器人 |
其中,chatGpt的模型是AI界的鼻祖,现有版本GPT-3.5-turbo和GPT-4,采用Transformer架构。
开源模型领域中,LLama2模型升级到了LLama3,其模型能力大幅提升
Mixtral 8x7B为开源领域引入专家混合技术,进一步演化。
如今open AI在前几天又发布了超越了智能模型的超级模型—草莓模型
国内的几个大模型国内大模型概览
国内大模型 | 开发者 | 流行应用 | 参数数量 | 访问方式 |
---|---|---|---|---|
星火大模型 | 科大讯飞 | 绘画创作、编程辅助、PPT大纲生成等 | - | - |
智谱清言 | 智谱AI | 多轮对话、内容创作、信息归纳总结 | 千亿参数 | - |
豆包 | - | AI搜索、PDF问答、图像生成 | - | - |
Kimi | Moonshot AI | 超长文本输入、处理长文本的复杂任务 | - | - |
Coze | - | 个性化推荐、财经信息查询、绘图助手 | - | - |
万知 | - | 文档解析、PPT创作、长文速读 | - | - |
百川 | 百川智能 | 中英双语、搜索增强技术 | 超千亿参数 | - |
文心一言 | 百度 | 自然语言处理、多种智能应用场景 | - | - |
通义千问 | 阿里云 | 智能问答、语言理解服务 | - | - |
混元 | 腾讯 | 混元助手小程序、优化移动用户体验 | - | - |
商量 | - | AI对话平台、智能对话服务 | - | - |
跃问 | - | AI聊天服务、智能对话 | - | - |
Dify | - | AI驱动的服务、改善工作效率和生活质量 | - | - |
万知 | - | 一站式AI工作平台、全面的AI服务 | - | - |
以BAT等一下几家模型为代码,进行了垄断
百度:文心一言3.0和4.0系列,代表产品:文心一言、文心一格
阿里:通义大模型,代表产品:通义千问
百川:百川大模型
腾讯:混元大模型
字节:豆包大模型
目前国产大模型中,主要分为三类:
一是原创大模型
二是套壳国外的开源大模型
三是拼装大模型
我个人觉得原创大模型数量很少,大多是套壳,所以,我觉得,目前虽然有自己的大模型,但是垂直类的模型太少,虽然有一些,但是还要动不动就收费。
在国内,垂直模型是必然趋势
在美术领域,特定RGB值可对应特定语义,如沙滩、人物,山景
前两天给神话悟空现实,里面的笔画是否可以考虑用专有的AI?
通过大模型技术,将这些专业知识融合起来,专业人士可利用相应代号实现精确创作,无需费力手绘。
还有人说是通用模型,不管谁好谁坏,还需要人们在选择时,根据具体任务要求进行选择。以后不会在垂直的模型上更加通用呢?
可能在未来的十年以后,办公场景会是这样的:
现在垂直模型面临的问题也不少,如:数据集、计算资源、泛化能力等问题和挑战
所以对于大模型,革命尚未成功,同志们仍需努力!
计算机专业必读书籍:
最后说一句(别白嫖,求关注)
回复 【idea激活】即可获得idea的激活方式
回复 【Java】获取java相关的视频教程和资料
回复 【SpringCloud】获取SpringCloud相关多的学习资料
回复 【python】获取全套0基础Python知识手册
回复 【2020】获取2020java相关面试题教程
回复 【加群】即可加入终端研发部相关的技术交流群
阅读更多
重磅!OpenAI正研发ChatGPT文本水印技术,其他大模型将何去何从?
相信自己,没有做不到的,只有想不到的
在这里获得的不仅仅是技术!
喜欢就给个“在看”