大模型芯片与系统专题出版 | 特邀编辑：尹首一、唐漾、涂锋斌

文摘科技 2024-11-01 12:01 北京

大模型给人工智能发展带来了历史性变革, 已经在机器翻译、人机交互、医学诊断、自动驾驶等智能任务中取得重大突破. 大模型巨大的计算量和参数量, 对芯片与系统的算力需求也急剧增加. 为了应对这一挑战, 学术界和工业界纷纷将目光投向大模型芯片与系统的研究, 以期突破传统计算架构的瓶颈, 实现更高性能解决方案以及更高效的设计方法. 大模型芯片与系统是推动人工智能技术进一步发展的关键技术之一, 被多个国家和地区列为未来科技发展的重要方向. SCIENCE CHINA Information Sciences 在2024年67卷第10期组织出版了“大模型芯片与系统专题” (Special Topic: AI Chips and Systems for Large Language Models).

Review of chiplet-based design: system architecture and interconnection
Liu, Yafei; Li, Xiangyu; Yin, Shouyi

Sci China Inf Sci, 2024, 67(10): 200401

基于芯粒的设计方法将系统芯片分解成多个较小的芯粒, 并通过先进封装重新组装成一个新的系统芯片, 是实现高算力大模型芯片与系统的重要技术. 这种方法在后摩尔定律时代备受关注, 其在成本、性能和敏捷设计方面具有明显的优势. 尽管芯粒设计作为一种新兴技术受到了广泛关注, 但仍然面临诸多挑战. 清华大学尹首一和李翔宇团队的综述论文“Review of chiplet-based design: system architecture and interconnection”从芯片设计者的角度全面综述了现有的芯粒设计, 对基于芯粒的系统架构设计问题的国际研究现状和最新进展归纳, 并给出关于发展趋势的分析. 该论文系统性地总结了芯粒设计的系统架构、互连拓扑和路由方案, 并对芯粒的发展趋势进行了展望, 如异构MPSoC设计将受益于芯粒设计方法、芯粒设计的平台化设计趋势, 以及封装—架构—互连的协同优化趋势等. 与以往专注于底层技术或某一单一领域的分析不同, 本综述采用了一种更全面、系统性的策略来研究这些方法, 旨在为设计人员提供系统性的、纵向比较的观点.

Large circuit models: opportunities and challenges
Chen, Lei; Chen, Yiqi; Chu, Zhufei; et al.

Sci China Inf Sci, 2024, 67(10): 200402

集成电路的EDA技术是全球范围内极具专业化和技术密集度的行业. 高性能芯片短生命周期和严格的性能、功耗、面积要求给EDA设计带来了挑战. 大模型技术的发展为解决这些挑战带来了新的机遇. 大模型能够分析大量设计案例, 在广阔的设计空间中进行预测和分析, 这有望对EDA工具产生革命性的影响. 尽管目前“AI for EDA”已经成为EDA领域的研究热点之一, 但这些方法大多专注于单一任务的优化, 未能充分考虑电路设计的整体连贯性和多阶段复杂性, 限制了“AI for EDA”对设计流程的整体提升. 香港中文大学徐强、北京大学、东南大学黄如院士团队与华为等合作的观点文章“Large circuit models: opportunities and challenges”本文提出构建一个专为电路设计与优化的大模型：大电路模型（Large Circuit Model, LCM）. 本文将EDA设计流程视为一个多模态转换过程: 从自然语言规格说明到模块化架构设计, 再到硬件描述语言编写的RTL代码, 直至最终的物理设计布局. 大电路模型将专注于解决EDA流程中最为重要的优化与验证问题, 推动EDA工具的能力向前迈进一大步.

TSCompiler: efficient compilation framework for dynamic-shape models
Luo, Xiang; Zhang, Chen; Geng, Chenbo; et al.

Sci China Inf Sci, 2024, 67(10): 200403

为更好地从海量数据中学习到特征分布, 神经网络的的计算开始呈现动态性, 即模型执行过程随输入数据变化而变化. 这种动态性为神经网络编译器的编译优化带来巨大挑战. 复旦大学尚笠、上海交通大学张宸团队的研究论文“TSCompiler: efficient compilation framework for dynamic-shape models”提出了面向动态神经网络的编译框架TSCompiler, 采用基于参数的张量形状表示, 并将算子拆解、规约为基本算子, 基于基本算子语义构建数据流分析框架进行参数形式张量形状传播. 同时, TSCompiler提出基于硬件架构约束构建的调度空间, 并采用基于信赖域的贝叶斯优化算法快速搜索高性能的调度组合生成张量程序. 相较于现有系统, TSCompiler在编译生成张量程序的执行效率上有显著提升, 同时在端到端时延方面也表现出较大优势.

Hardware-oriented algorithms for softmax and layer normalization of large language models
Li, Wenjie; Lyu, Dongxu; Wang, Gang; et al.

Sci China Inf Sci, 2024, 67(10): 200404

目前已经有大量关于神经网络中非线性模块硬件架构设计的研究, 但大多局限于卷积神经网络和小规模的Transformer,对于当前热门的大模型中最常见的softmax和层归一化模块仍缺乏充分的研究. 特别是关于层归一化的硬件架构设计, 因其同时需要计算平方根与除法, 且近似层归一化对模型性能的影响大于softmax,导致其高效通用硬件架构设计成为难题. 上海交通大学贺光辉和徐宁仪团队的研究论文“Hardware-oriented algorithms for softmax and layer normalization of large language models”提出了面向硬件的近似softmax和层归一化算法, 然后设计出相应的高效硬件架构. 相较于已有的同领域最优设计, 本文提出的架构在面积和功耗方面具有显著节省. 这些设计无需微调, 几乎不影响模型性能, 能够作为大模型芯片的即插即用非线性单元, 有助于加速整体硬件设计与部署.

CMN: a co-designed neural architecture search for efficient computing-in-memory-based mixture-of-experts
Han Shihao, Liu Sishuo, Du Shucheng, et al.

Sci China Inf Sci, 2024, 67(10): 200405

在边缘计算的快速发展中, 存内计算（Computing-In-Memory, CIM）技术以其卓越的能效比和计算并行性, 成为推动智能设备发展的关键力量. 然而, 面对边缘场景对运算精度、模型密度和能耗效率的不同需求, 如何实现在不同应用场景的神经网络架构定制化, 仍然是当前亟待解决的问题. 与此同时, 混合专家（Mixture of Experts, MoE）模型作为大模型算法的新兴研究方向, 其在边缘端部署仍待优化. 南方科技大学王中锐和中科院微电子所尚大山团队的研究论文“CMN: a co-designed neural architecture search for efficient computing-in-memory-based mixture-of-experts”提出了一种软硬件协同优化的神经网络架构搜索框架CMN. 该框架以实现高效计算存储为目标, 通过软件层面的MoE模型设计与硬件层面的CIM系统配置的紧密协同, 在软件层面针对MoE结构的专家位置、数量和维度进行优化搜索, 在硬件层面针对存算阵列大小、外围电路设计等进行优化搜索, 两者构成嵌套搜索以适应各边缘场景下的不同需求.

SpikingMiniLM: energy-efficient spiking transformer for natural language understanding

Zhang Jiayu, Shen Jiangrong, Wang Zeke, et al.

Sci China Inf Sci, 2024, 67(10): 200406

随着大规模预训练Transformer模型的迅速发展, 神经网络在自然语言处理领域取得了显著的进展. 然而, 这些模型的成功往往依赖巨大的计算资源和能源消耗, 因此, 开发低能耗、高效率的计算模型成为了研究者们关注的重点. 浙江大学唐华锦团队的研究论文“SpikingMiniLM: energy-efficient spiking transformer for natural language understanding”提出了一种适用于自然语言理解的脉冲Transformer模型—SpikingMiniLM. 该模型通过一系列创新性的方法, 包括多步脉冲编码、改进的注意力机制和残差连接、稳定脉冲发放速率的参数初始化, 以及人工神经网络到脉冲神经网络的知识蒸馏技术, 克服了训练脉冲神经网络语言模型的挑战, 展示了脉冲神经网络在自然语言理解任务上的可行性. SpikingMiniLM有效降低了自然语言理解任务所需的整体能源开销, 特别是在计算功耗上具有显著的优势.

专题特邀编辑：

清华大学尹首一教授

华东理工大学唐漾教授

香港科技大学涂锋斌教授

相关阅读

后摩尔时代新器件重大研究计划专题简介

集成电路未来发展与关键问题观点专题合辑

硅基二维半导体材料与器件重大项目专题

http://mp.weixin.qq.com/s?__biz=MzAxNjgwMjA5Ng==&mid=2651171900&idx=1&sn=e8ba26a8a55949dfce9ff40a0fe48554

中国科学信息科学

《中国科学：信息科学》及其英文版《Science China Information Sciences》的宣传平台。

最新文章

基于多奖励DQN框架的UAV-RIS辅助太赫兹通信系统波束赋形预测

2024年第11期目录 | SCIENCE CHINA Information Sciences

SCIS入选中国科技期刊卓越行动计划二期英文领军期刊！

司徒立文,鹿振宇,杨辰光 | 面向装配任务的宽度学习机器人遥操作系统

北京交通大学于永光团队 | 分数布朗运动驱动的多智能体系统的均方一致性控制

马亚静,李占杰,岳东等 | 基于非单调Lyapunov函数的切换事件触发控制

电子科大邹权团队 | SBSM-Pro：用于蛋白质序列分析的支持生物序列机

北京量子研究院龙桂鲁课题组 | 基于格密码的量子通信网络接入认证方案

SCIS会议 | 第55次《中国科学：信息科学》前沿学术沙龙

征稿启事 | 面向低空经济的低空网络技术创新与应用专题（中文版）

刘志卿,池荣虎,黄彪,侯忠生 | 非线性非仿射系统的有限时间PID控制

安徽大学何舒平团队 | 基于策略迭代的马尔可夫跳变系统自适应优化控制：不依赖转移概率的异步方法

张志鹏,夏承遗,齐国元,付俊 | 无歧义加权自动机的多步状态不透明性

抗后门攻击的标识加密| 国防科大陈荣茂团队&香港科大黄欣沂教授

电子科大王子南团队 | 拉曼光纤随机激光器的时-谱域相关度演变研究

上交大闵雄阔, 翟广涛等 | 视频感知质量评价综述

会议资讯 | 第三届智能超表面技术论坛

陈杰院士团队 | 联盟形成问题：以能力为中心的分析和通用模型

SCIS会议 | 第54次《中国科学：信息科学》前沿学术沙龙

李莉莉,马丹等 | 基于切换Q学习事件触发的DoS攻击下切换系统反异步输出调节

陈山枝博士及其团队力作《星地融合移动通信系统与关键技术》

大模型芯片与系统专题出版 | 特邀编辑：尹首一、唐漾、涂锋斌

《中国科学: 信息科学》2024年第10期目录

北京科技大学王婕等 | 高超声速滑翔飞行器预定时间碰撞规避编队控制

北京理工大学胡程团队 | 重轨星地双基地SAR层析成像

2024年第10期目录 | SCIENCE CHINA Information Sciences

高亚军,丛杨等 | 毫米级精度水下RGB-D成像系统（MOOP）

付林,彭世国,邓飞其,朱全新 | 无穷维随机积分微分方程的均方指数稳定性

南京邮电大学林舒影,邹玉龙,肖甫,李斌 | 抵御目标窃听的全向全连接RIS辅助感知与多用户安全通信

闫永义,李海涛,冯俊娥等 | STP视角下有限状态自动机的逻辑拥堵：描述、检测及搜索

东南大学许威教授课题组：通信网络泛在智能设计

西电朱樟明课题组 | 使用极点优化技术的精度可配置Zoom型模数转换器设计

杨勋,曾建明,汪萌等 | 基于跨模态对比表征学习的鲁棒视频问答

3GPP ISAC信道建模标准化的最新进展

面向6G的超低能耗移动通信技术 | 前沿学术沙龙(第53次)会议预告

欧洲科学院院士韩清龙教授团队 | 基于累计状态误差的事件触发机制

SCIS会议 | 第16次《中国科学》信息科学前沿研讨会—信息驱动新质生产力

基于多机制协同设计的低频超宽带波段吸波体

项阅权,项林英 | 基于Gramian度量的图积网络可控性

超大面阵CMOS传感器的自适应负反馈斜坡电路设计

英国杜伦大学 | 面向6G的通感一体化新策略

开放报名 | 第三届智能超表面技术论坛

SCIS会议 | 第52次《中国科学：信息科学》前沿学术沙龙

北航李伯虎院士团队 | 工业大模型：体系架构、关键技术与典型应用

山东大学王聪团队 | 基于确定学习的采样非线性系统的神经网络输出反馈控制

上海大学谢少荣团队 | 基于有限时间耦合滑模控制的多机器人复合编队

AI设计芯片是下一个诺奖吗？

大模型芯片与系统专题 | SpikingMiniLM：面向自然语言理解的脉冲Transformer模型—浙江大学脑机智能国重

RISTA前沿大讲堂|智能反射面辅助通信网络：端到端传输模型与系统优化-华南理工大学唐杰教授

东南大学柯文俊等 | 先检测后增强：利用强化学习和数据配比提升LLMs的事实准确性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉