Hot Chips 2024 | 大型语言模型和检索增强生成技术介绍

文摘科技 2024-10-02 08:00 四川

引言

本文旨在帮助读者了解大型语言模型（LLMs）和检索增强生成（RAG）技术的基础知识。这些技术正在电子设计自动化（EDA）领域产生重大影响，正在改变芯片设计和验证的方式[1]。

什么是大型语言模型？

大型语言模型是设计用于理解和生成类人文本的先进神经网络。这些模型经过海量数据训练，能够执行从简单的文本补全到复杂推理和代码生成等各种语言任务。

图1：AI概念层次结构，显示了LLMs在人工智能广泛领域中的位置。

LLMs建立在复杂的神经网络架构之上，通常包含数十亿个参数。这些参数在训练过程中不断调整，模型需要接触大量文本数据。例如，Meta的Llama 3.1模型在训练过程中处理了超过10万亿个单词，需要约60天的训练时间和20,000多个Nvidia H100 GPU。

这些模型的规模差异很大，从约70亿参数到超过1万亿参数不等。开放和封闭模型的选择取决于架构和权重的公开可用性。通常使用量化技术来压缩权重，在模型大小和准确性之间取得平衡。

LLM架构和功能

现代LLMs的核心是Transformer架构，由Google DeepMind在2017年的论文"Attention is All You Need"中首次提出。这种架构通过引入自注意力机制彻底改变了该领域，使模型能够同时处理整个文本序列，而不是按顺序处理。

图2：原始Transformer架构，展示了编码器和解码器组件。

LLM的关键组件包括：

分词：将输入文本分解成可管理的单元（称为标记）。
嵌入：将标记转换为数值向量表示，捕捉语义含义和单词之间的关系。
注意力机制：从嵌入中计算上下文相关的权重，关注输入的相关部分。
Transformer层：通过多层自注意力和前馈神经网络处理嵌入。

LLM训练和局限性

训练LLM是复杂且资源密集的过程，通常包括三个阶段：

预训练：模型接触大量文本数据，学习一般语言模式和知识。
微调：预训练模型在特定任务数据上进行进一步训练，以专门化其能力。
人类反馈强化学习（RLHF）：可选阶段，根据人类偏好优化模型输出。

尽管LLMs具有令人印象深刻的能力，但也存在几个局限性：

在复杂的数学和逻辑推理方面存在困难
基于训练数据可能产生有偏见的输出
知识截止于训练时间
可能产生幻觉或自信地陈述错误信息
训练和推理需要高昂的计算和能源成本
关于数据使用和潜在滥用的伦理问题

检索增强生成（RAG）

为了解决一些限制，特别是知识截止问题，检索增强生成（RAG）技术应运而生。RAG使LLMs能够在生成过程中访问和整合外部信息。

图3：RAG架构，显示了从原始数据到LLM响应的流程。

RAG过程包括：

索引：将原始数据转换为嵌入并存储在向量数据库中。
检索：接收查询时，从向量数据库中检索相关信息。
增强：将检索到的信息与用户的提示结合。
生成：LLM处理增强后的提示以产生响应。

RAG允许LLMs利用专有信息、最新数据和已知事实，减少产生幻觉的可能性，并扩展模型的有效知识库。

在电子设计自动化（EDA）中的应用

LLMs和RAG技术在电子设计自动化领域找到了众多应用。关键用例包括：

架构设计和优化
代码生成和调试
IP集成和管理
设计验证和文档编写
入职支持和培训

图4：EDA工作流程的演变，显示随着AI技术的进步，人为干预需求的减少。

将LLMs和RAG集成到EDA工作流程中，有望减少许多任务中对人为干预的需求。例如，AI代理现在可以处理复杂的设计任务，如创建具有99%代码覆盖率的UART接收器和测试平台，并自动将文件提交到存储库。

图5：基于LLM的AI代理工作流程，演示如何自动化复杂的EDA任务。

未来方向和挑战

随着LLMs和RAG技术的不断发展，我们可以期待在其能力和应用方面出现几个进展：

使用网络信息进行自我事实检查
通过"慢思考"方法提高推理能力
更大的上下文窗口以处理更长的提示
多模态能力，包括语音和图像处理
与外部存储系统集成，增强长期记忆

然而，仍然存在一些挑战，包括：

确保在设计过程中合乎伦理地使用AI
管理大规模部署所需的计算资源
解决EDA行业潜在的劳动力变动
处理与训练数据相关的法律和版权问题

大型语言模型和检索增强生成技术的结合有望彻底改变电子设计自动化领域。通过减少许多任务中对人为干预的需求，这些技术有望加速创新并提高芯片设计和验证过程的效率。随着该领域的不断发展，EDA专业人员必须及时了解这些进展，并调整工作流程以利用AI辅助设计的力量。

参考文献

[1] H. Bouwmeester, "HotChips 2024 Tutorial: From LLM+RAG to EDA AI-Agent," PrimisAI, 2024.

- END -

软件申请

我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用，PIC Studio都可提升您的工作效能。

点击左下角"阅读原文"马上申请

欢迎转载

转载请注明出处，请勿修改内容和删除作者信息！

关注我们

关于我们：

深圳逍遥科技有限公司（Latitude Design Automation Inc.）是一家专注于半导体芯片设计自动化（EDA）的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件，提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio，分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务，广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作，推动特色工艺半导体产业链发展，致力于为客户提供前沿技术与服务。

http://www.latitudeda.com/

（点击上方名片关注我们，发现更多精彩内容）

逍遥设计自动化

分享特色工艺半导体（PIC/Power/MEMS）设计自动化解决方案及行业技术资讯，与广大业界朋友、专家共同交流！

最新文章

光电子集成芯片的光纤熔接封装技术介绍

MEMS导向梁式压电能量收集器的设计与分析

激光雷达数据处理及分析

氮化镓技术在电力电子领域的发展与市场动态

压电致动高速空间光调制器在可见光至近红外波段的应用

Scientific Reports | 深度学习在纳米光电子结构设计和优化中的应用

基于硅基光电子技术的零串扰亚波长光栅折射率传感器

系统级封装(SiP)技术

Chiplet技术革新與挑战

类脑计算：从材料到系统

光子智能变量优化工具(PIVOT）教程

Nature Communications | Floquet拓扑耗散Kerr孤子与非公度频率梳

现代半导体先进封装技术

Hot Interconnects 2024 | 人工智能系统互连技术的未来：挑战与解决方案

双偏振IMDD系统推进数据中心连接技术

激光雷达遥感技术的最新进展与未来展望

OCP2024 | 新一代人工智能服务器设计

重磅发布 | 逍遥科技推出PIVOT：基于pSim Plus的光子智能变量优化工具

IDTechEx | 光电子集成芯片和硅基光电子的演进

电子系统从2D到4D集成技术的发展

氮化镓技术：从制造到器件加工

光纤供电与射频光纤传输：新一代网络中的复合传输系统

GaN从衬底到器件技术的进展

NVIDIA自动驾驶汽车安全开发技术综述

人工智能时代传输网络的未来规划

Applied Sciences | 集成光电子技术的核心概念与未来展望

上海交大-平湖智能光电研究院携手逍遥科技助力光电子集成芯片产业发展

Optics Express | 使用角锥型横向转移反射器进行三孔径阵列主动相位锁定

无电感低功耗低电压交叉耦合调节式共源跨阻放大器设计

激光雷达数据获取系统

人工智能如何重塑数据中心基础设施

仿真技术推动光/微电子产业高质量发展——逍遥科技第六届仿真技术报道

激光雷达遥感技术原理与应用

通过制造感知反向设计来优化光电子集成芯片

Acacia | 未来光传输网络为人工智能时代做好准备

激光雷达遥感技术简介

Nature Photonics | 通过可控合成时间光子晶格的量子态处理

氮化镓技术：材料与生长工艺

Hot Chips 2024 | 人工智能普及之旅：现代计算中的挑战与解决方案

讯石专访逍遥科技：探索MEMS Studio创新方案，协同并进共创未来

硅基单片波长选择开关：利用阵列波导光栅和布拉格光栅滤波器

Chiplet架构的发展与设计

理解紧密耦合异构系统中的内存操作：Grace Hopper超级芯片指南

Optics Letters | 光学差分波前传感：利用深度学习提高灵敏度和动态范围

GaN技术在电力电子中的应用概述

基于强化学习的模拟线路设计优化

Meta | 人工智能集群光连接的挑战与机遇

Optics Express | 硅基光电子平台上高速外调制宽可调谐激光器

Lightmatter | 光子技术与人工超级智能的道路

基于波导介电网络的偏微分方程求解

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉