Hot Chips 2024 | 设备端人工智能的优势、发展与热设计挑战

文摘科技 2024-11-06 08:00 四川

引言

随着人工智能（AI）不断革新我们的生活方方面面，AI处理的方式和地点正在发生显著变化。本文探讨设备端AI的概念、优势、发展历程以及所面临的热设计挑战[1]。

什么是设备端AI？

设备端AI指的是直接在边缘设备（如智能手机、笔记本电脑和汽车）上执行机器学习算法，而不完全依赖云端处理。这种方法利用片上处理器，如神经网络处理单元（NPU）、中央处理器（CPU）和图形处理器（GPU）在本地执行AI任务。

图1展示了设备端AI的概念，说明了智能如何向边缘设备转移，以及片上AI处理涉及的各种处理器。

设备端AI的兴起正在改变多个领域，使设备、机器和"物品"变得更加智能和响应迅速。虽然云计算对于大数据汇集和训练AI推理算法仍然必不可少，但设备端处理通过提供即时、本地化的AI功能补充了这些能力。

设备端AI的优势和重要性

与云端AI处理相比，设备端AI具有几个显著优势：

低延迟：通过本地处理数据，设备端AI大大减少了AI驱动任务所需的时间，这对实时应用很重要。
增强隐私：将数据保留在设备上，减少了向外部服务器传输敏感信息的需求，从而提高了数据隐私和安全性。
离线功能：设备端AI允许应用程序在没有互联网连接的情况下运行，确保在网络覆盖不佳或无网络覆盖的地区也能保持一致的性能。
减轻网络负载：通过本地处理数据，设备端AI有助于减轻网络基础设施的负担，降低带宽需求和相关成本。
降低功耗：在许多情况下，设备端处理比持续向云端传输数据消耗更少的电力。

图2展示了设备端推理的优势，突出了低延迟、隐私和可靠性等优点。

应用场景的演变

设备端AI的发展迅速且具有变革性。让我们探讨应用场景和硬件如何随时间推移而发展：

A. 2015年：早期设备端AI应用主要使用简单的卷积神经网络（CNN）进行基本任务。硬件仅限于标量和矢量处理单元。

B. 2016-2022年：这一时期引入了更复杂的模型，包括Transformer、长短期记忆（LSTM）网络、循环神经网络（RNN）和高级CNN。硬件能力扩展到包括张量处理单元。

C. 2023年：随着具有数十亿参数的大型语言模型（LLM）、大型视觉模型（LVM）和大型多模态模型（LMM）的出现，格局发生了巨大变化。硬件进步通过改进的张量处理和针对Transformer的优化支持这些复杂模型。

D. 2023年及以后：我们现在看到参数超过100亿的更大模型不断涌现，为复杂的AI助手、Stable Diffusion等图像生成工具和多模态生成式AI模型提供支持。硬件持续发展，引入微瓦片推理和增强对多模态AI任务的支持。

图3描绘了从2015年到2023年及以后设备端AI应用场景和硬件的演变，展示了模型复杂性和相应硬件进步的发展历程。

热设计影响

随着设备端AI能力的增长，在移动设备上运行复杂模型所带来的热设计挑战也随之增加。设备端AI的热设计影响受几个因素影响：

工作负载依赖性：不同的AI任务会产生不同数量的热量，这取决于任务的复杂性和持续时间。
设备散热解决方案：设备冷却系统的效果在管理AI处理产生的热量方面起着关键作用。
硬件配置：处理器的特定组合及其功率特性会影响热输出。

目前，许多移动设备和笔记本电脑可以在可接受的热限制内运行具有数十亿参数的LLM。然而，随着模型复杂性的持续增长，处理能力、内存和功耗方面的潜在限制可能会导致热设计挑战增加。

图4说明了从移动设备到云服务器不同设备类型的模型复杂性和热限制之间的关系。

潜在解决方案

为了应对设备端AI带来的热设计挑战，正在探索几种潜在解决方案：

1. 提高性能和降低功耗：提高AI处理单元的效率是管理热输出最有效的方法。最近的进展显示了显著的改进，一些处理器在更低的热量下实现了高达5倍的性能提升。

图5显示了Intel Core Ultra 7 155H处理器的性能改进，展示了一小时持续使用期间的NPU性能表现。

2. 热缓解技术：实施类似于CPU使用的热管理策略可以帮助控制热量产生。这可能包括动态频率缩放和工作负载分配。

3. 混合AI：这种方法根据任务复杂性和设备能力在云端和边缘设备之间分配AI工作负载。通过在必要时将复杂任务卸载到云端，混合AI可以帮助管理移动设备上的热输出，同时仍然利用设备端处理对适当任务的优势。

4. 封装创新：芯片封装技术的进步，如2.5D和3D集成技术，可以提高每瓦性能，潜在地减少热输出。

5. 持续AI研究：持续进行的AI架构和算法研究可能会导致更高效的模型，以较低的功耗和热量产生提供高性能。

结论

设备端AI代表了将智能功能直接带到边缘设备的重大进步。虽然提供了诸如低延迟、增强隐私和提高可靠性等众多优势，但在移动平台上运行复杂AI模型的热设计影响仍然是持续的挑战。

随着该领域的不断发展，硬件进步、高效模型设计和创新热管理技术的结合将是实现设备端AI全部潜力的关键。AI处理的未来在于在强大的本地计算和可持续的热管理之间取得平衡，为各个领域日益智能和响应迅速的设备创造条件。

图6总结了设备端AI的要点，包括其优势、当前状态以及克服热设计挑战的未来方向。

参考文献

[1] N. Nikfar, "On-device AI and its thermal implications," in Hot Chips 36 Symposium (HCS), Aug. 2024, pp. 1-25.

END

软件申请

我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用，PIC Studio都可提升您的工作效能。

点击左下角"阅读原文"马上申请

欢迎转载

转载请注明出处，请勿修改内容和删除作者信息！

关注我们

关于我们：

深圳逍遥科技有限公司（Latitude Design Automation Inc.）是一家专注于半导体芯片设计自动化（EDA）的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件，提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio，分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务，广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作，推动特色工艺半导体产业链发展，致力于为客户提供前沿技术与服务。

http://www.latitudeda.com/

（点击上方名片关注我们，发现更多精彩内容）

http://mp.weixin.qq.com/s?__biz=Mzg5MzY2NDAxMw==&mid=2247499753&idx=4&sn=c9a1ec89fc88d288dee68096dd6aeb7e

逍遥设计自动化

分享特色工艺半导体（PIC/Power/MEMS）设计自动化解决方案及行业技术资讯，与广大业界朋友、专家共同交流！

最新文章

双偏振IMDD系统推进数据中心连接技术

激光雷达遥感技术的最新进展与未来展望

OCP2024 | 新一代人工智能服务器设计

重磅发布 | 逍遥科技推出PIVOT：基于pSim Plus的光子智能变量优化工具

IDTechEx | 光电子集成芯片和硅基光电子的演进

电子系统从2D到4D集成技术的发展

氮化镓技术：从制造到器件加工

光纤供电与射频光纤传输：新一代网络中的复合传输系统

GaN从衬底到器件技术的进展

NVIDIA自动驾驶汽车安全开发技术综述

人工智能时代传输网络的未来规划

Applied Sciences | 集成光电子技术的核心概念与未来展望

上海交大-平湖智能光电研究院携手逍遥科技助力光电子集成芯片产业发展

Optics Express | 使用角锥型横向转移反射器进行三孔径阵列主动相位锁定

无电感低功耗低电压交叉耦合调节式共源跨阻放大器设计

激光雷达数据获取系统

人工智能如何重塑数据中心基础设施

仿真技术推动光/微电子产业高质量发展——逍遥科技第六届仿真技术报道

激光雷达遥感技术原理与应用

通过制造感知反向设计来优化光电子集成芯片

Acacia | 未来光传输网络为人工智能时代做好准备

激光雷达遥感技术简介

Nature Photonics | 通过可控合成时间光子晶格的量子态处理

氮化镓技术：材料与生长工艺

Hot Chips 2024 | 人工智能普及之旅：现代计算中的挑战与解决方案

讯石专访逍遥科技：探索MEMS Studio创新方案，协同并进共创未来

硅基单片波长选择开关：利用阵列波导光栅和布拉格光栅滤波器

Chiplet架构的发展与设计

理解紧密耦合异构系统中的内存操作：Grace Hopper超级芯片指南

Optics Letters | 光学差分波前传感：利用深度学习提高灵敏度和动态范围

GaN技术在电力电子中的应用概述

基于强化学习的模拟线路设计优化

Meta | 人工智能集群光连接的挑战与机遇

Optics Express | 硅基光电子平台上高速外调制宽可调谐激光器

Lightmatter | 光子技术与人工超级智能的道路

基于波导介电网络的偏微分方程求解

利用3D光电子技术实现超低能耗、高带宽密度的芯片数据链路

氮化镓功率器件技术的现状与展望

Hot Chips 2024 | 可持续计算在AI和云原生工作负载中的应用

案例分享 | 使用pSim Plus实现光学神经网络中的脉冲幅值调制技术仿真

Applied Physics Letters | 使用转印技术将铟磷激光器异质集成到硅基光电子波导平台上

面向自动驾驶的硅基光电子车载光网络(SiPhON)系统

IDTechEx | 先进半导体封装技术

APL Quantum | 基于锗硅单光子雪崩二极管的集成硅基光电子室温光量子计算

Nanophotonics | 基于生物启发的平面光学用于3D光检测和测距

现代计算中铜互连的演进

Hot Chips 2024 | 设备端人工智能的优势、发展与热设计挑战

案例分享 | 使用PhotoCAD实现基于马赫曾德干涉仪的光学卷积矩阵单元

异质集成光电子技术中绝热波导耦合器设计的系统方法

经济可持续的AI扩展：硬件挑战和光学解决方案分析

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉