我请问呢?构建AI大模型应用技术栈到底有哪些啊?!

企业   2024-09-09 18:30   北京  


AI大模型是指拥有超大规模参数(通常在十亿个以上)、复杂计算结构的深度学习模型,能够处理海量数据,完成各种复杂任务,如自然语言处理、图像识别等。


大模型包含如下一些技术:


Prompt

Prompt提示是模型接收以生成响应或完成任务的初始文本输入。


我们给AI一组Prompt输入,用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词,或任何其他形式的文本,用于引导模型产生特定内容的响应。


Transformer


Transformer是一种用于自然语言处理(NLP)和其他序列到序列(sequence-to-sequence)任务的深度学习模型架构,它在2017年由Vaswani等人首次提出。


Transformer架构引入了自注意力机制(self-attention mechanism),这是一个关键的创新,使其在处理序列数据时表现出色。


结构如下:




预训练


预训练(Pre-training)通常是指对模型进行无监督或自监督学习的过程,在大规模未标注数据上先训练模型,以便为后续任务提供一个高质量的初始权重。这个过程对于许多复杂模型尤其是 transformer 架构(比如BERT、GPT系列等)来说极其重要。


Function Calling


Function Calling是一个允许大型语言模型(如 GPT)在生成文本的过程中调用外部函数或服务的功能。


Function Calling允许我们以 JSON 格式向 LLM 模型描述函数,并使用模型的固有推理能力来决定在生成响应之前是否调用该函数。模型本身不执行函数,而是生成包含函数名称和执行函数所需的参数的JSON。


Rag


RAG(中文为检索增强生成)= 检索技术 + LLM 提示。


例如,我们向 LLM 提问一个问题(answer),RAG 从各种数据源检索相关的信息,并将检索到的信息和问题(answer)注入到 LLM 提示中,LLM 最后给出答案。


GPTs


GPTs其实就是一个模板,把你的需求告诉GPTs,它会按照你的想法去生成新的ChatGPT,相当于把你的想法写成了一个模板,供你个性化使用。


每次使用的时候直接输入你的话题或者部分内容,这时候的ChatGPT就会按照你设定的使用规则跟你对话,直接输出你需要的内容,而不需要你每次都输入一定的提示指令去引导。


LangChain


LangChain 就是一个 LLM 编程框架,你想开发一个基于 LLM 应用,需要什么组件它都有,直接使用就行;甚至针对常规的应用流程,它利用链(LangChain中Chain的由来)这个概念已经内置标准化方案了。


Agent


智能体的英文是 Agent,AI业界对智能体提出了各种定义。


个人理解,智能体是一种通用问题解决器。从软件工程的角度看来,智能体是一种基于大语言模型的,具备规划思考能力、记忆能力、使用工具函数的能力,能自主完成给定任务的计算机程序。


Fine-tuning


微调是指在预训练模型(Pre-trained model)的基础上,针对特定任务或数据领域,对部分或全部模型参数进行进一步的训练和调整(Fine Tune)。


预训练模型通常是在大规模数据集上训练得到的,具有一定的通用性和泛化能力。微调的目标是在较小的目标数据集上,通过有限的训练数据,使模型更好地适应特定任务,从而提高模型在该任务上的性能。


在AI大模型崛起的时代,人工智能备受关注。华清远见重磅推出【人工智能高端人才实战班】,课程内容覆盖超90%企业AI岗位技能!目前华清远见人工智能班级已有高薪就业学员:北京算法工程师,薪资16K*14薪。




如果目前你对人工智能还不太了解,或者想了解更多人工智能课程知识,欢迎咨询华妹哟!


▲扫码添加华妹微信

了解更多课程详情~





学嵌入式,掌握高薪秘籍


华清远见重磅革新【嵌入式工程师高薪就业护航班】,学习路线全新升级,让知识体系更完善、更明确、覆盖更广泛。全方位带你从零基础小白到技术大佬,理论实践并行发力。




▲扫码添加华妹微信

了解更多【嵌入式】课程详情~



关于华清远见



华清远见教育科技集团成立于2004年,是一家集产学研用于一体的科技驱动型新一代信息技术领域教育服务领导品牌。致力于让每位学子都能简单直接高效地获取紧跟科技时代前沿的IT教育服务,实现高端职业梦想。从线下到线上,从教学到研发,从理论到实践,从校园到职场,同时为企业、高校、个人提供全方位的人才培养解决方案。目前已在全国主要一二线城市成立13个学习中心,为企业输送30余万IT人才,并为1100余所高校20000余家企业赋能人才培养和人才支撑。


如果有任何问题
扫码联系华妹哟~


-END-

线下购课福利

👇👇👇




线上购课福利

👇👇👇



如果有任何问题
扫码联系华妹哟~


技术干货集锦:
超干货!五分钟带你了解WebSocket协议
超干货!嵌入式工程师必须懂fork与vfork~
超干货!STM32五大嵌入式操作系统的真相原来是这样!
超干货!究竟谁还不知道嵌入式系统“四个地址”?!
超干货!5步解决Linux内核内存泄漏~
超干货!HTML5的前沿特性有哪些?
超干货!谁能告诉我,硬件工程师到底还有没有前途啊?!
超干货!嵌入式应用开发和嵌入式驱动开发,究竟该如何选择?
超干货!ES数组中ES6的常用方法,你知道多少呢?
超干货!2000+字告诉你:嵌入式到底卷不卷?!
超干货!一文读懂:STM32究竟该如何配置HAL库!
超干货!淦!嵌入式最火的方向必须有这几个!
超干货!嵌入式C语言——断言函数assert()的应用,你又了解多少?
超干货!月薪8K和年薪40W的嵌入式工程师到底差在哪了?
超干货!嵌入式工程师都知道的行业真相!其开发中常用的三种架构竟然是......
......


华清远见
科技赋能 · 智引未来。专注于嵌入式/物联网/人工智能等IT人才培训。20年口碑积累,帮助30万+IT人高薪就业。现在关注送学科最新学习路径思维导图。
 最新文章