大模型时代最火!年度AI芯片峰会下周举行,主会场完整嘉宾公布

科技   2024-08-29 11:28   广东  


进入大模型时代,算力需求高速增长。


从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的机遇和挑战。


AI大模型与各个赛道的结合,带来了新的体验革新,这些新体验的落地则离不开各类AI芯片的支撑。放眼全球,产业格局的激烈变动,也让更多中国AI芯片企业看到了新的发展机会。


与此同时,芯片设计的复杂度不断提升、产品快速量产上市的要求不断增加、新兴应用市场不断涌现,投资和成本的压力也水涨船高。


AI芯片作为AI产业发展的“基石”,是实现AI产业化落地的核心力量,对AI技术的进步和行业应用都起着决定性作用。


如今各路AI芯片创企可谓是百家争鸣,群雄逐鹿成为国内AI芯片产业的主基调。在这样的产业背景下,我们将全球顶级AI芯片产学研用及投融资领域专家们聚集起来,为他们提供思想交锋、观点碰撞的平台。


9月6-7日,2024全球AI芯片峰会(GACS 2024)将在北京辽宁大厦盛大举办。全球AI芯片峰会至今已成功举办六届,现已成为国内规模最大、规格最高、影响力最强的产业峰会之一。


本届峰会由芯东西与智猩猩共同主办,以「智算纪元 共筑芯路」为主题。峰会采用“主会议+技术论坛+展览展示”的全新形式。主会议由一场开幕式,以及数据中心AI芯片、AI芯片架构创新、边缘/端侧AI芯片三场专场会议组成,将在主会场进行;技术论坛分为Chiplet关键技术论坛(收费制)、智算集群技术论坛(收费制)和中国RISC-V计算芯片创新论坛,将在分会场进行。


峰会同期还将布设展区,展示AI芯片产业链优秀企业的最新技术、产品与方案。同时,峰会期间,还将重磅揭晓两大AIIP AI生产力创新先锋企业榜单,分别是2024年度中国智算集群解决方案企业TOP 20、2024年度中国AI芯片新锐企业TOP 10。


已经迫不及待报名的朋友,可以先扫描下方二维码添加小助手报名啦!



目前,近50家企业/嘉宾将参与主题演讲、高端对话和圆桌Panel。其中,参与主会场的嘉宾已经全部确定,接下来将一一介绍。此外,参与分会场的部分嘉宾,也会一并介绍。


 01、主会场嘉宾阵容


清华大学教授、集成电路学院副院长 尹首一



尹首一,清华大学教授,集成电路学院副院长,国家杰出青年科学基金获得者,中国高被引学者。研究方向为可重构计算、人工智能芯片设计。已发表学术论文200余篇,包括ISSCC、VLSI、ISCA、MICRO、HPCA、DAC和IEEE JSSC、TPDS、TCSVT、TVLSI、TCAS-I/II等集成电路和体系结构领域学术会议和权威期刊。出版《可重构计算》、《人工智能芯片设计》专著2部。曾获国家技术发明二等奖、中国电子学会技术发明一等奖、中国发明专利金奖、教育部技术发明一等奖、江西省科技进步二等奖、中国电子学会优秀科技工作者奖、中国电子信息领域优秀科技论文奖。现任集成电路领域国际会议ISCA、MICRO和A-SSCC的技术委员会委员,《中国科学:信息科学》编委,国际期刊《ACM Transactions on Reconfigurable Technology and Systems》及《Integration, the VLSI Journal》的Associate Editor。


北京超弦存储器研究院首席科学家 戴瑾



戴瑾博士,超弦存储器研究院首席科学家。戴瑾先生毕业于北京大学,通过李政道CUSPEA项目赴美国留学,加入奥斯汀德克萨斯大学诺贝尔奖金获得者温伯格的研究小组,获得物理学博士学位并对超弦理论做出过写入教科书的贡献。戴瑾博士拥有30年IT行业的工作经验,先后就职于美国Qualcomm,TCL通讯、中星微电子等中外企业。主持开发过从半导体芯片到无线通信终端等各类产品。近十年致力于各种存储介质以及近存计算、存内计算的研究,在MRAM、3D-DRAM新架构等领域有诸多创新,拥有近200项发明专利。现任北京超弦存储器研究院首席科学家。


报告主题:《对存内计算的思考》


内容概要:


随着半导体工艺的发展、摩尔定律的减速,存储墙越来越成为制约计算性能的瓶颈以及功耗的重要贡献者。AI计算对数据带宽极高的要求无疑让存储墙的难题雪上加霜。AI于是成为了存算一体(或称存内计算)最大的推动者。从高校等研究机构,到创业公司和科技巨头,进行了大量的研发投入。各种技术路线都得到了探索,可谓八仙过海各显神通。然而,获得的市场成功却远远不成比例。作为一家专注于存储介质的研究机构,超弦存储器研究院一直关注存内计算。


本次演讲,戴瑾博士将从存储介质的角度,对存内计算的各条技术路线进行点评,就每条技术路线的优劣、需要解决的问题、应该努力的方向,发表自己的看法,与业界共享。


AMD人工智能事业部高级总监 王宏强



王宏强(George Wang),现任AMD人工智能事业部高级总监,负责公司AI市场业务拓展及解决方案。


他毕业于中国电子科技大学,拥有数字信号处理硕士学历,在半导体行业有近20年工作经验,是资深的AI技术领域专家。


他自2005年加入了原Xilinx公司,担任系统架构师和业务拓展高级经理,负责数据中心事业部AI和Compute在中国区的市场工作。他还曾担任公司AI/VITIS高级产品经理、数据中心AI技术专家以及DSP专家/应用工程师等职位。


王宏强拥有多项美国技术专利,并发表过多篇论文。


演讲主题:《推进大模型从云到端部署,打造变革性未来》


内容概要:


我们正处在一个令人难以置信且激动的时刻,在过去短短几年中,以大模型、生成式A I为代表的人工智能技术出现了爆炸式增长。从云计算、企业数据中心、个人电脑、游戏,到自动驾驶、工业、医疗和机器人等,AI几乎改变了每一个行业,重塑了整个计算领域,也渗透到了人们生活的方方面面。


做为人工智能发展的领先者之一,AMD拥有独特的技术优势,致力于突破高性能和自适应计算的极限,以帮助企业解决业界最重要的挑战:我们有幸为 AI 计算时代的端到端基础设施提供硬件支持,为世界上多个最具影响力的企业提供云、边、端的解决方案,同时,AMD也是CPU、GPU及自适应计算软件开源生态的重要参与者,为企业和个人开发者提供完整且开放的技术服务。


为提供领先的人工智能解决方案,AMD专注于三个战略重点:


首先,AMD为人工智能训练和推理提供广泛的高性能、高能效计算引擎组合,包括以Zen 5架构为核心的CPU处理器、以CDNA 3架构为核心的GPU加速器,和以XDNA 2架构为核心的NPU神经处理单元。


其次,AMD大力推进开源开放、获得充分验证且对开发人员友好的AI软件平台,以确保先进的 AI 框架、库和模型完全支持 AMD云、边、端硬件平台。


第三,AMD致力于扩大与全球最大的云服务提供商、OEM厂商、软件和人工智能公司的合作,共同创新下一代解决方案,并加速大规模高性能人工智能解决方案的落地。


本次演讲,将结合AMD不同产品硬件、软件生态和AI应用来展示我们在数据中心、边缘端、个人电脑等领域赋能AI的成果


高通AI产品技术中国区负责人 万卫星



万卫星现任高通AI产品技术中国区负责人。他于2012年加入高通中国研发团队,领导团队参与了多个骁龙移动平台多媒体领域的项目研究工作。目前,在高通担任人工智能产品技术的中国区负责人,负责公司终端侧人工智能引擎软、硬件的规划以及相关生态系统的建设工作。


Habana中国区负责人 于明扬



于明扬,现任Habana中国区负责人,从事大模型算力和应用研究。于明扬毕业于清华大学电子工程系,北京大学MBA,曾担任北京比特大陆科技有限公司副总裁、人工智能和区块链业务负责人,Mellanox中国区总经理,参与了国内星云、天河、太湖之光等多个超算项目,专注于云计算、人工智能、半导体应用与研究。


云天励飞副总裁、芯片业务线总经理 李爱军



李爱军,云天励飞副总裁、芯片业务线总经理。研究员级正高职称,深圳国家级领军人才,作为课题负责人或课题核心人员承担芯片国家课题10多项,具有20年大规模数字系统芯片和终端芯片架构设计和大团队研发管理经验,云天励飞神经网络处理器和边缘AI系列芯片团队带头人和总架构师,累计完成10多颗芯片的流片并商用,芯片发货量累计近亿颗。


演讲主题:《面向大模型的国产边缘AI芯片架构创新与展望》


内容概要:


当前,大模型与生成式人工智能正在加速物理世界向智能化时代迈进,逐步从大模型的训练过渡到大模型应用落地阶段。其中,大模型在边缘场景的落地是未来人工智能发展的重要方向。传统的AI芯片架构已经无法满足大模型的新型计算范式、大算力、高带宽的计算要求以及边缘场景的多样化需求,边缘AI芯片架构需要全面的创新与技术攻关,尤其在国际竞争日益白热化以及国产工艺相对滞后的严峻形势下,如何通过可重构异构、分布式的算力技术方案,满足大模型在边缘场景的高效计算,不仅对我国AI芯片产业的健康发展具有重要意义,同时,也推动着我国人工智能产业在大模型时代下的健康、稳定、快速的发展。


本次演讲将围绕大模型边缘落地的灵活、高效的算力需求,阐述国产边缘AI芯片的“算力积木”创新架构,全面介绍云天励飞在边缘AI芯片上的技术创新与国产化战略布局。


亿铸科技创始人、董事长兼CEO 熊大鹏



熊大鹏博士,亿铸科技创始人、董事长兼CEO。熊大鹏博士在中美有近30年的芯片行业经验,涉及从研发、产品定义、产品销售,到企业的整体管理层面的多方面经历,对中国市场的客户需求与产品有着深刻的理解。


2015年熊博士开始用GPU支持AI算法的芯片规划和设计落地,他对于不同技术路径应用于AI大算力场景的优缺点以及该赛道用户面临的痛点有着深刻的技术洞察和企业经营实践。


熊大鹏博士于1983年于西安电子科技大学获计算机学士学位;1986年于华南理工大学获自动控制硕士学位;1998年于美国德州大学奥斯汀分校(The University of Texas at Austin)获博士学位,其间,同时获得:应用数学硕士、电气和计算机工程硕士学位。


演讲主题:《AI芯片架构创新开启大算力第二增长曲线》


内容概要:


人工智能正在为各个行业带来前所未有的变革, 然而这一切都离不开强大的算力。全球AI芯片市场规模正在迅速扩大,预计未来几年将保持高位增长。但随着数据量的激增,传统的计算架构已经无法满足我们对高性能、低功耗的需求。但要实现应用的落地,就需要更具性价比、更具能效比的AI大算力芯片。在此背景之下,如何解决算力需求和算力供给之间的矛盾,就成了制约产业发展的必然问题。为了解决这一问题,亿铸科技始终致力于通过基于新型存储的架构创新,为各种人工智能应用提供强大的算力支撑,开启大模型时代下的大算力第二增长曲线。


本次演讲,亿铸科技将从架构创新等多个角度解读大模型时代下的AI大算力芯片解决方案。


北极雄芯CTO 谭展宏



谭展宏,北极雄芯CTO、首席架构师。清华大学交叉信息研究院博士,计算机体系结构研究方向,导师为马恺声教授。


谭展宏先生的主要研究方向为面向专用计算的编译、架构与芯片设计,在ISCA,DAC,CICC,NIPS等国际顶级会议发表多篇论文。在2019年至2022年间,谭展宏先生促进了产业与学术共研,独立主导完成Qiming-910,和Qiming-920两款芯片的顺利流片,在此期间培养了十余名技术骨干掌握NPU设计流程,成功转化到Qiming-930和Qiming-940大规模工程项目的顺利研发。此外在学术圈的首个面向Chiplet的编译工具NN-Baton成功实现产业落地,成为公司产品工具链的核心构件。


谭展宏先生于2019年毕业于中山大学电子与信息工程学院(微电子专业)获工程学士学位,2019年至2024年在清华大学交叉信息研究院攻读博士学位。


演讲主题:《Chiplet迈向大芯片:计算、存储与互联》


内容概要:


本演讲将从大芯片需求出发,探讨大模型、自动驾驶、机器人等对芯片的需求,继而从计算、带宽供给和互联三个方向讨论Chiplet相关的解决方案。


珠海芯动力创始人兼CEO 李原



珠海市芯动力科技有限公司创始人李原,清华大学物理学本科,日本京都大学通信硕博,加拿大麦克马斯特大学博士后。曾任职于英特尔,现任珠海市芯动力科技有限公司CEO。


李原于英特尔任职期间,曾开发至强CPU服务器系统、负责Mindspeed双模微基站芯片项目,有从产品定义到量产到商用的全链条的经验;管理过中国、英国、美国三国等多个团队,负责系统、软件、芯片、射频等各项任务。留美期间曾代表德州仪器参与制定3,4G通讯标准,并与合伙人创立IPG Communications公司,承接了设计了休斯顿卫星GlobalStar系统的通讯芯片;李原对于WCDMA及LTE双模芯片具有深层次研究,并带领团队设计了WCDMA/LTE双模微基站芯片;IPG公司独创的Turbo译码器被英特尔公司应用至其至强处理器;其公司于2022年成功被MindSpeed公司收购,后又被英特尔收购。


李原发明过多项专利,具有丰富的团队管理经验,现带领芯动力研发团队设计出人工智能RPP-R8芯片产品,此款芯片真正做到了高性能和通用性的高度融合,产品应用场景已覆盖边缘大模型、工业自动化、智能驾驶、泛安防、物流检测、信号处理等领域。


演讲主题:《面向边缘端大语言模型的RPP架构芯片与落地实践》


内容概要:


AI PC作为未来的发展趋势,正引领着技术创新的潮流,而大语言模型在边缘端的部署更是这一趋势中的重要一环。


为了实现大语言模型在边缘端的稳定、高效运行,我们需要精心规划技术路径和部署策略。芯动力将深入剖析这一过程中的关键要素,分享其在硬件加速技术方面的独到见解。通过针对大语言模型的计算特性进行数据流的优化,以可重构并行处理器的方式,来高效灵活的处理边缘端大模型的流畅运行。


然而,在这个领域也面临着一些挑战。模型规模不足和功耗过高都可能影响边缘端设备的性能和用户体验。因此,寻找一种能够最好地支持大语言模型、适合其落地的芯片或架构显得尤为重要。


为此,芯动力分析了大语言模型在RPP架构中如何支持高效计算,与传统GPGPU架构相比,它同时实现了灵活的通用计算,并在低功耗与高效率方面显著提升。同时,针对大语言模型的稀疏化特性进行了优化,进一步提升了内存利用率和访存效率,降低了功耗,从而延长了边缘端设备的续航时间。这一创新方案为解决当前面临的挑战提供了新的思路和方向。


苹芯科技联合创始人兼CEO 杨越



杨越博士,苹芯科技联合创始人兼CEO,北京清华大学自动化本科,多伦多大学电子工程博士学位,曾工作于Altera(现为Intel)的机器学习组。参与SSD初创公司创建,作为软件团队负责人,带领团队从零写出商业可用SSD FTL软件,实现产品商业落地。后加入美光,成为3DXP项目的首席架构师,参与研发X100产品,产品性能指标远超市场同期竞品,为当时世界上最快的SSD产品。在存储芯片,人工智能及相关领域研究方向拥有深厚技术积累及丰富的行业经验。


演讲主题:《存算的进阶——从神经网络到大模型》


内容概要:


存算一体技术正在深度参与AI芯片的设计与落地。基于静态随机存储器SRAM的存算一体芯片已经在AI 1.0领域内开启了落地之旅,凭借突破性的高能效比,这类芯片给予了端侧电子产品前所未有的AI能力。另一方面,随着大模型技术的成熟与应用推广, 内存带宽瓶颈和计算能效问题显现。我们从存算一体技术视角分析大模型加速芯片的解决方法和架构设计特点,为降低推理延迟、提高能源效率、实现更高的并行计算能力提供一个新的思路。


此次演讲将深入分析如何以存算一体技术为基础,构建高效加速AI计算与大模型计算的芯片架构。以及如何通过这一技术突破,使存算一体芯片在大模型时代成为关键的推动力量,为未来AI应用的发展提供崭新的机遇和路径。


时识科技创始人兼CEO 乔宁



乔宁,时识科技创始人兼CEO,博士毕业于中科院半导体研究所,苏黎世大学博士后及高级研究员。担任IEEE TCDS副主编,在类脑芯片领域发表国际顶级期刊会议发表文章30余篇,其中SCI收录20余篇,引用量超2300次,相关专利110余项。


乔宁博士拥有10余年高性能亚阈值模拟电路、高速异步电路、类脑计算架构及类脑芯片设计经验。2012年加入苏黎世大学及苏黎世联邦理工神经信息研究所,带领课题组从事超大规模类脑处理器的研究与开发。曾作为负责人或核心人员主导10余项欧盟类脑研发项目,10余颗类脑芯片研发。


2017年在瑞士苏黎世创立类脑芯片公司时识科技(原名aiCTX),带领国际顶级专家团队从事类脑芯片及相关技术的开发。2020年将公司总部迁至中国,推进类脑智能技术的商业化,并成功带领公司步入量产阶段。


演讲主题:《超低功耗类脑动态视觉感算系统》


内容概要:


随着生成式AI技术的不断突破,大模型的应用范围也日渐拓宽。智能算力的飞速提升带来的能耗问题逐渐凸显,成为制约算力产品效能的关键瓶颈。传统计算机在信号与数据转换、高精度计算方面的能耗和时间成本不断攀升,训练成本居高不下。人脑能够运行非常复杂且庞大的神经网络,总功耗却仅为20W,远小于现有的AI。


类脑视觉感知及计算技术,一种受脑科学和神经科学启发的创新科技,采用神经形态计算,通过借鉴生物视觉及计算系统的结构和功能,旨在实现更高效、更智能的视觉信息处理。具有高动态范围、低功耗、低延时等显著优势,在手机、扩展现实(XR)、自动驾驶、智能安防、机器人等多个领域展现出了巨大市场潜力和应用价值。


本次演讲,将介绍类脑视觉感知及计算的技术优势及特点,分享SynSense时识科技类脑视觉传感器、类脑处理器芯片、类脑感算芯片等核心产品的主要技术路线布局,以及低功耗类脑动态视觉感算系统如何赋能商用场景及落地进展。


智芯科创始人兼CEO 顾渝骢



顾渝骢,智芯科创始人兼CEO,美国德州大学奥斯汀分校电子工程硕士学位,中国科学技术大学通信与电子系统专业学士和硕士学位。曾担任美国UTStarcom半导体事业部 副总经理,UTStarcom合肥研发中心 总经理,Marvell (美国)高级总监以及安徽芜湖太赫兹工程中心COO等,拥有近三十年的半导体行业经验。


演讲主题:《具身智能的大脑芯片》


内容概要:


具身智能作为人工智能的下一个浪潮,相比传统的工业机器人、协作机器人等,有着智能化程度高、工作场景限制小、能够自主规划复杂工作等特点,由此也对部署在底层的AI芯片的实时性、能效比、算力、集成度等提出了更高的需求。


存算一体芯片将计算和存储紧密结合,以通过底层的架构创新解决冯诺依曼架构的固有瓶颈。这种集成化设计的优势是打破存储墙,消除不必要的数据搬移延迟和功耗,并使用存储单元提升算力,成百上千倍地提高计算效率,从而带来高能效、高密度、低功耗、低成本的价值优势,助力人型机器人等具身智能的产业化。


本次演讲,顾渝骢先生将从上述提出的需求出发,详细讨论存内计算芯片给具身智能和大数据计算、感存算一体等应用方向带来的新的可能性。


壁仞科技副总裁兼AI软件首席架构师 丁云帆



丁云帆,现任壁仞科技副总裁兼AI软件首席架构师,主要负责AI软件架构和大模型千卡集群等相关工作。代表壁仞担任全国信息技术标准化技术委员会人工智能分委会智能计算工作组联合组长和中国人工智能产业发展联盟芯片工作组副组长。曾担任百度主任系统架构师,获得过百度技术最高奖和中国国家专利优秀奖。参与主导AI加速基础架构国际标准OAI & OAM。业界首创利用GPU架构解决广告推荐场景10TB级稀疏参数大模型训练挑战,相关成果发表在机器学习与系统领域顶会MLSys上,该工作引领了互联网广告推荐领域训练框架技术发展趋势。


演讲主题:《国产GPU如何系统性的解决大模型算力难题》


内容概要:


以ChatGPT为代表的大模型技术引发了新一轮的科技革命,国内外呈现了百模争艳的状态,并且已经开始了广泛的应用落地。大模型的训练和落地带来了巨大的算力需求,以LLaMA3 千亿参数为例,Meta建设了18000个H100的集群来满足训练需求。目前国内存在着较大的算力供应瓶颈,这也给国产AI芯片带来了巨大机遇,国产千卡集群在逐步落地应用。大模型训练是一个系统工程,需要软硬件协同,算法与工程协同,对计算机体系结构如计算、存储、通信都带来了巨大挑战,另外千卡集群对并行扩展、稳定可靠、弹性伸缩提出了更高的要求,同时不同异构GPU集群形成了算力孤岛,如何实现异构GPU协同训练通过算力聚合共同训练大模型非常关键。针对上述挑战,壁仞科技基于其高性能国产GPU打造了软硬一体、全栈优化、异构协同、开源开放的大模型整体解决方案。


本次演讲将从硬件集群算力、软件有效算力、异构聚合算力三个维度分享壁仞科技如何系统性的解决大模型算力难题。


凌川科技联合创始人、副总裁 刘理



刘理,凌川科技联合创始人、副总裁。刘理博士本科毕业于清华大学电子工程系,在美国密苏里大学获得了计算机科学博士学位。刘理博士先后在美满电子,快手美研等工作,在在AI、机器学习和视频/图像编码的设计制造方面拥有10年+的丰富产业经验。


智辰半导体联合创始人、副总裁 邱晔



邱晔,智辰半导体联合创始人、副总裁,本科和硕士分别毕业于中央财经大学和清华大学,先后在中金公司投行部和星界资本负责科技行业的IPO、并购交易和股权投资,拥有超过10年科技行业的资本运作和投资经验。


后摩智能联合创始人、产品副总裁 信晓旭



信晓旭,后摩智能联合创始人、产品副总裁,具有15年以上计算芯片产品、市场和销售经验,曾任海思计算芯片产品总监,负责海思昇腾系列多款AI芯片的产品定义和市场推广,涵盖自动驾驶、安防、数据中心等领域。在Cavium(被Marvell 60亿美金收购)作为中国区创始团队成员之一,带领团队将中国区业务从零做到数亿人民币。


异摩尔联合创始人、产品及解决方案副总裁 祝俊东



祝俊东先生,奇异摩尔联合创始人、产品及解决方案副总裁。祝俊东先生是上海交通大学微电子硕士,在通信/半导体领域具有近20年相关行业经验,具备技术研发、产品市场等综合能力和多年创业经验。祝先生曾担任Motorola高级研发工程师,O2 Micro 芯片研发负责人,带领团队成功研发国内第一代3G基站和GPS通信芯片。在担任恩智浦半导体智能识别事业部产品市场负责人期间,四年内实现业务年销售额6倍增长。


演讲主题:《互联定义计算,AI 网络两大核心技术:RDMA和Chiplet》


内容概要:


在人工智能飞速发展的今天,我们迎来了大模型时代。随着模型和计算规模的爆炸式增长,算力需求激增,对计算及数据中心架构提出了前所未有的挑战。传统的架构已无法满足需求,我们正从过去的小规模多用户模式,迈向大规模分布式架构。在这样的背景下,万卡乃至数十万卡集群成为了大模型训练的新基建。


在此趋势下,高性能互联技术成为了计算系统的核心。从超大规模的集群内互联,到高带宽的域内互联,再到高性能高密度的片内互联,不同层级的互联需求呼唤着最优的解决方案。


本主题报告演讲将深入探讨AI 高性能网络的互联趋势包括RDMA及Chiplet相关技术趋势,并详细介绍奇异摩尔Kiwi Fabric互联架构如何为AI计算平台提供量身定制的高性能互联解决方案,以满足其在计算效率、扩展性和可靠性方面的需求。


中昊芯英创始人、CEO 杨龚轶凡



杨龚轶凡,中昊芯英创始人及CEO。先后获得密歇根大学学士学位,斯坦福大学硕士学位,师从 Subhasish Mitra 院士。拥有23项中国专利、17项美国和欧洲专利,发表过3 篇(分别为 ASSCC、ISSCC、JSSCC)顶级国际论文。


杨龚轶凡深耕高端芯片研发设计领域10余年,曾在 Google 作为芯片研发核心团队深度参与 Google TPU 2/3/4 的设计与研发,在甲骨文公司参与、主导了 12 款包括 SPARC T8/M8 在内的顶级高性能 CPU 的设计与产出。产业生涯中已成功流片十余次,掌握从 28nm 到 7nm 各代制程工艺下大芯片设计与优化完整方法论,带领不同公司团队完成多次从芯片架构设计、流片生产到客户交付的全流程。


演讲主题:《从GPU到TPU,AI大模型基础设施的变迁与未来》


内容概要:


每一次历史性的科技浪潮中,底层基础设施的革新总是扮演着至关重要的角色。市场容量巨大的应用领域,其计算芯片硬件体系架构往往呈现出从通用型逐渐演变为专用型的历史规律。如今,随着大模型计算需求和复杂度的指数级增长,传统GPU在用于大模型训练时的成本高、算力利用率低、能耗大的瓶颈开始显现。全球科技巨头如微软、AWS、特斯拉和OpenAI,以及新兴的明星初创企业如Groq和Etched,都在探索研发AI专用芯片以替代英伟达GPU;7月底,苹果公司也宣布使用谷歌TPU(张量处理器)而非英伟达GPU来训练其AI模型。全球AI领域,正发生着使用非GPU架构来构建更高效的大模型基础设施的转向。


TPU是谷歌专为加速机器学习和深度学习任务而设计的专用芯片,专注于大模型训练和推理中常用的张量运算。在此次演讲中,曾在谷歌 TPU 核心研发团队深度参与过 TPU v2/3/4 的设计与研发工作的杨龚轶凡,将分享AI算力硬件的进化历史与趋势,TPU与GPU的关键差异及用于大模型训练时的优势,以及中昊芯英自研的国内首枚且唯一已量产的全国产自主可控TPU 架构AI芯片如何重塑AI大模型算力基础设施。


锋行致远创始人兼CEO 孙唐



孙唐,锋行致远创始人兼CEO,同济大学本科、硕士;复旦大学博士研究生在读。曾任忆芯科技合伙人、边缘计算部门负责人,中国(上海)自由贸易区临港新片区高新产业和科技创新专项项目:《存算一体化AI芯片的研发和应用》负责人。国际GPU、图像、数据存储芯片等公司15年工作经验,在忆芯科技承担芯片AI系统架构工作,重点研究方向为AI芯片超融合架构及分布式异构资源调度系统。对AI模型应用需要的数据嵌入结构化、向量相似度、KV索引存算一体流式加速的演进方向进行深入分析和架构推演。已授权存算架构硬件加速器发明专利16项,吴文俊2023人工智能芯片专项奖第一完成人。


演讲主题:《存算大模型加速系统》


内容概要:


存算一体技术能高效提升AI业务算效比,目前大模型底层架构技术演进迅速,国内芯片到软件技术都遇到挑战,目前存算一体技术对于大模型应用系统具有较好的加速协同能力。


本次演讲,将分享锋行致远存算一体芯片对相关场景加速应用能力和技术细节。


视海芯图创始人&董事长 许达文



许达文,视海芯图创始人&董事长,博士毕业于中国科学院计算技术研究所,曾任合肥工业大学微电子学院副教授;在国际顶级期刊和会议上发表 30 多篇论文,其中一篇IEEE Transactions on Computers年度最佳论文。


许达文博士先后两次创业,创办苏州神指微电子,获评昆山市创业领军人才;之后,创办成都视海芯图微电子有限公司,获中国创新创业大赛全国50强、中国电子学会科技进步二等奖、北京科技进步二等奖等荣誉,视觉AI芯片SH1210在2023年量产1KK颗,赋能多个机器人视觉模组;授权专利二十多项。


演讲主题:《迈向实时智能:边缘计算时代下的高性能机器人视觉芯片》


内容概要


机器人视觉是赋予机器人自主感知能力的核心技术,使其能够“看见”并理解周围的世界。这一技术在工业、医疗和服务等领域发挥着至关重要的作用。通过先进的图像处理和模式识别算法,机器人能够精确地感知环境变化并执行相应的任务。然而,随着应用场景的复杂化,机器人视觉面临的挑战也愈发严峻。动态环境下的稳定性、海量视觉数据的实时处理以及多传感器融合的精确性,都是制约机器人视觉进一步发展的关键问题。


视觉芯片作为机器人视觉系统的核心组件,在提升数据处理速度、降低功耗、增强环境适应性等方面展现出巨大潜力。未来,随着视觉芯片技术的不断成熟,机器人视觉将在更多领域发挥重要作用。


本次演讲,将探讨机器人视觉技术的当前发展现状、面临的主要挑战以及视觉芯片在实际应用中的实践与前景。


安谋科技产品总监 杨磊



杨磊先生现任安谋科技产品总监,负责“周易” NPU IP 产品,致力于满足多样化端侧硬件设备的不同AI计算需求。他在芯片设计领域拥有丰富经验,涵盖了从通信基带到AP SoC 架构设计等多个方面。加入安谋科技以来,杨磊先生负责NPU IP产品的定义、推广以及落地应用。


杨磊先生毕业于清华大学电子系,拥有清华大学电子系本科及硕士学位。


演讲主题:《端侧AI应用“芯”机遇,NPU加速终端算力升级》


内容概要:


随着AI大模型持续向边缘侧和端侧渗透,AI计算和推理工作正逐步由云端迁移至手机、PC、汽车等智能终端产品上运行,在这一过程中,NPU(神经网络处理器)能够以其更简单的控制流、更高的效率以及更低的功耗处理AI工作负载,特别是在视觉、语音及自动驾驶等高度依赖实时性的应用场景中表现出色。


本次演讲将分享端侧大模型应用的前沿趋势以及安谋科技自研NPU处理器的最新进展,共同探索如何为AI、物联网、智能汽车等新兴领域不断迭代的计算需求提供更为全面和高效的解决方案。


聆思科技副总裁 徐燕松



徐燕松,聆思科技副总裁,AIoT行业资深专家。作为智能家电智能交互技术联盟成员,智慧家庭标准工作组成员,曾多次牵头参与智慧家庭标准制定,对设备智能化有着丰富的经验与认知。基于AI大模型赋能端侧设备实现场景智能化,在算力算法一体化上聆思芯片持续演进,实现AIOT时代设备大模型入口级芯片的产品打造,推动行业智能化升级。


演讲主题:《大模型时代,算法算力一体化芯片的思考与布局》


内容概要:


在大模型时代,技术发展给各行各业带来了全新的产业机遇,甚至不亚于互联网、手机带来的行业变革。在这个时代的风口,算法算力一体化对于智能硬件的发展具有极其重要的意义。这种一体化不仅涉及芯片算力与算法资源的紧密结合,还包含了整个嵌入式开发生态的建设,以此减少终端设备在智能化开发过程中大量的重复造轮子的工作,大幅提高研发效率以及性价比。通过这种软硬件深度结合的方式,在性能和成本之间找到更优的平衡点,加速了技术的创新和应用普及,进一步推动了整个行业的前进步伐。


本次演讲将从大模型时代硬件需求特点、算法算力一体化芯片的技术与架构、以及行业实际应用案例分析,全面诠释聆思科技在算法算力一体化芯片领域的思考与布局。


浪潮信息开放加速计算产品负责人 Stephen Feng



冯少飞,浪潮信息开放加速计算产品总监,博士毕业于清华大学机械工程系,专注于NVLink和OAM服务器的产品设计和规划,致力于大模型时代AI系统平台的研发与创新。他成功推动了20多款高端人工智能芯片的产品化与商业化应用,为构建多元化AI算力生态提供了坚实的技术支撑,为推动数千亿规模的人工智能产业发展做出了有力贡献。


演讲主题:《多元开放系统激发生成式AI创新活力》


内容概要:


目前生成式AI的能力快速进化,大模型逐步向多模态、长序列、混合专家模型等转变,对训练和推理的模型架构、并行训练策略、算力需求等都提出了新的要求,更大的互联集群、更快的硬件迭代、更快速的故障定位、更高效的大模型业务工具等对于模型的迭代创新、应用的快速升级至关重要。


本次报告将分享如何以应用为导向,从系统架构、硬件设计、固件开放、多元工具等角度出发构建多元开放的AI系统,释放多元算力与多模算法的创新活力,为生成式AI的发展筑就坚实的底座。


芯和半导体技术市场总监 黄晓波



黄晓波博士,2011年获香港中文大学电子工程系博士学位,研究领域包括微波与电磁场技术、毫米波LTCC阵列天线、高频介质滤波器及半导体无源集成器件IPD等方向,发表多篇IEEE Transaction、IEEE Letters等期刊论文,拥有10年以上的ICT领域产品和管理经验。现任芯和半导体技术市场部总监,负责EDA应用推广及生态建设,助力加速下一代智能电子系统实现和EDA产业自主发展。


演讲主题:《EDA使能AGI时代大算力芯片Chiplet集成系统开发》


内容概要:


人工智能与算力设施等新质生产力重塑行业数字化转型,同时人工智能对算力的需求永无止境,高性能计算芯片采用Chiplet技术已成为后摩尔时代的行业共识,有力突破了半导体晶圆先进制程工艺带来的芯片PPA提升瓶颈。Chiplet集成系统面临架构探索、顶层规划、物理实现、多物理场分析、系统验证等一系列挑战,构建针对Chiplet集成系统的设计流程与EDA平台是Chiplet产品落地的首要考虑。


本次分享将聚焦当前大算力芯片Chiplet设计的典型应用,结合实际案例阐述Chiplet新的设计流程与多物理场仿真EDA方案,解决信号完整性、电源完整性、热及应力等方面的问题,助力用户加速Chiplet集成系统的开发与优化。


富瀚微资深市场总监 冯晓光



冯晓光,上海富瀚微电子的资深市场总监,肩负着公司芯片产品规划的重任。他拥有超过二十年的芯片设计行业经验,曾担任研发工程师、研发管理、项目管理及市场管理等关键职位。在冯晓光的引领下,公司多款芯片产品成功实现量产,累计产量突破一亿颗。此外,他在AI芯片领域的开发工作中也发挥了关键作用,对边缘AI芯片的技术发展和市场动态有着深刻的理解和洞察。


演讲主题:《边缘视频AI芯片复盘与展望》


内容概要:


边缘视频AI芯片,这种专为边缘设备如摄像头和录像机设计的智能芯片,正成为视频内容分析和处理领域的革命性力量。它们在智能安防、交通监控、工业自动化、医疗影像分析等多个领域发挥着至关重要的作用。随着技术的不断进步,边缘视频AI芯片已经经历了几代的迭代,每一次演进都带来了性能的飞跃和应用场景的拓展。


本演讲将深入探讨边缘视频AI芯片的发展历程,分析每一代芯片的关键技术和创新点,以及它们是如何推动相关行业的发展。同时,我们也将展望未来,探讨边缘视频AI芯片在技术、应用和市场方面的潜在发展趋势,以及它们如何继续引领智能化的浪潮,为各行各业带来更多的可能性和价值。通过这次演讲,我们希望能够为听众提供一个全面的视角,理解边缘视频AI芯片的重要性和它们在未来技术发展中的关键角色。


PhySim资深产品工程师 黄建伟



黄建伟,芯瑞微(上海)电子科技有限公司资深产品工程师。具有多年高速系统设计经验及SI&PI仿真经验,负责公司信号完整性、电源完整性等产品的技术支持。


演讲主题:《Chiplet先进封装中的多物理场仿真解决方案》


内容概要:


随摩尔定律逼近物理极限,后摩尔时代下的异构集成(Heterogeneous Integration)芯片技术——“芯粒”(Chiplet )应运而生,将一个功能丰富且面积较大的芯片拆分成多个芯粒,并将这些由不同工艺生产的芯粒通过MCM、2.5D、3D等先进封装技术组合形成一个系统芯片。通过Chiplet技术,可以显著提升芯片设计的灵活性及工艺良率,降低设计难度与制造成本。


但随着先进封装中芯片堆叠数量与互连密度的增加,芯片的发热问题变得愈加严重、散热也更加困难。如果不能较好地解决发热与散热问题,芯片内部累积的焦耳热则会对其性能造成影响,还可能会带来较高的热应力风险。


除此之外,由于信号速率的提升,信号通道对高速信号的影响也不容忽视,其中损耗、反射以及信号间的串扰等问题尤为突出。


PhySim自主研发的的多物理场仿真平台可以对先进封装中的多物理场问题进行高性能仿真,其中ACEM、TurboT-BCA、PhySim-ET分别可以解决三维全波电磁仿真、电子散热仿真、电热协同仿真问题,帮助用户在产品实体化前进行有效的仿真验证,规避潜在设计风险。


本次演讲将会分享以下几个关键点:


1.  异构集成芯片技术(Chiplet)的兴起:随着摩尔定律逼近物理极限,异构集成技术应运而生,将大芯片拆分为多个芯粒,并通过先进封装技术组合成系统芯片,提升设计灵活性和良率,降低制造成本。


2.  芯片发热与散热问题:随着芯片堆叠数量与互连密度的增加,发热问题加剧,散热困难,可能影响芯片性能和带来热应力风险。


3.  信号通道问题:信号速率的提升导致损耗、反射和信号间串扰等信号通道问题突出。


4.  仿真平台的意义:有效仿真验证可在产品实体化前规避潜在风险,提高产品设计效率和成功率。


5.  多物理场仿真平台的应用:PhySim自主研发的仿真平台可对先进封装中的多物理场问题进行高性能仿真,包括三维全波电磁仿真、电子散热仿真、电热协同仿真等,帮助规避潜在设计风险。


清程极智联合创始人 师天麾



师天麾,清程极智联合创始人,清华大学计算机专业博士。主要研究领域为为并行计算、异构计算、高性能图挖掘系统,发表CCF-A类会议论文数篇。曾获NOI2014金牌、国家奖学金、清华大学计算机系优秀毕业生等多项个人荣誉。


演讲主题:《高性能国产算力系统的挑战与解决方案》


内容概要:


随着大模型时代Scaling Law效应的持续验证,各大厂商追求构建参数量更大的模型以获得更佳的性能表现,这直接推动了对计算资源需求的急剧增长。因此,各地纷纷投入建设大规模智算中心,以满足日益增长的算力需求。然而,在国际环境变化和技术封锁加剧的背景下,尽管国产AI算力在数量上迅速增加,但国产算力平台仍面临着智能软件生态系统不完善的问题,这成为制约其高效利用的关键因素之一。从软件开发者的视角出发,如何构建兼容性强、性能优越且易于使用的国产算力软件栈,已成为亟待解决的重要课题。


本次演讲,清程极智的联合创始人师天麾博士将从AI核心基础软件的角度,分析目前国产AI算力在软件生态方面的不足之处,并介绍清程极智在核心基础软件各环节进行的探索,与业界分享。


乾瞻科技产品高级总监 曹泽豪



曹泽豪先生现任乾瞻科技产品高级总监,主要负责UCIe架构及产品的落地应用,同时负责车载IP产品线的推广与实施。


在高速SerDes及高速ADC领域拥有多年研发经验,涵盖了PCIe、UCIe、MIPI C/D/M-PHY及超高速time-interleaved ADC。曾担任海思手机高速接口产品总监,并负责Chiplet(Die-to-Die and Chip-to-Chip)架构及多款AI芯片高速接口架构规划。由他负责规划的麒麟980系列的LPDDR4X-4266被搭载于MATE20手机中,其性能和能耗表现远超当时同期产品。


曹泽豪先生毕业于台湾大学电机工程学系,拥有电机系学士及硕士学位。


演讲主题:《面向高算力AI芯片的量产验证UCIe/D2D Chiplet IP》

内容概要:

在此次2024全球AI芯片峰会上,我将向各位分享乾瞻科技在有关AI HPC芯片性能指针的关键IP—Die-to-Die (D2D/UCIe) 的研发成果。这项技术不仅已成功应用于全球领先的AI芯片制造商,并且通过台积电的5nm工艺及CoWoS®先进封装实现了大规模量产。乾瞻的D2D/UCIe PHY IP提供了卓越的超低延迟和超大带宽的连接能力,支持多种封装形式,并为未来的先进工艺节点提供了强大的技术储备。

在这次演讲中,我将深入剖析我们的技术优势,展示这项技术如何在市场应用中脱颖而出,并探讨未来的发展方向。这不仅仅是乾瞻科技在技术上的一项成就,更是我们在引领先进工艺IP领域所展现的强大领导力。希望通过此次分享,各位能够更深入了解我们如何在高速发展的AI芯片领域保持领先地位,并为未来的技术挑战做好准备。


极视角科技联合创始人&高级副总裁 刘若水



刘若水,极视角科技联合创始人&高级副总裁。杜克大学管理学硕士,香港中文大学环球经济与金融学士,上海浦江人才,入选2020年福布斯亚洲30Under30榜单。


Alphawave亚太地区高级业务总监 郭大玮



郭大玮是Alphawave亚太地区高级业务总监。他从事半导体行业已超过二十年。在加入Alphawave之前,他曾在Rambus、InsideSecure、QuickLogic、NXP/Philips、Logitech和IBM等多家跨国公司工作。


他将在演讲中分享Alphawave为满足高性能计算、人工智能、企业级高速网络应用的需求而提供的IP、Chiplet和ASIC设计解决方案。


 02、Chiplet关键技术论坛

部分嘉宾

清华大学交叉信息研究院、人工智能学院助理教授、北极雄芯创始人 马恺声



马恺声,现任清华大学交叉信息研究院、人工智能学院助理教授,特别研究员,博士生导师,美国宾夕法尼亚州立大学博士。北极雄芯创始人兼首席科学家。曾获得2024年国际高性能计算年会(HPCA)Distinguished Artifact Award 奖(全球410篇文章中仅1篇),2022年CCF集成电路Early Career奖(每年全国仅1位),2020年Springer Nature中国研究人员高影响力奖,欧洲设计自动化学会EDAA 2018年杰出博士论文奖(全球共4篇),017年亚洲南太平洋设计自动化(ASP-DAC)最佳论文2015年国际高性能计算年会(HPCA)最佳论文,2016年IEEE微计算机架构(Micro)Top Picks等奖项。他的研究兴趣包括后摩尔时代先进架构和芯片、Chiplet技术和相关工具、鲁棒高效的人工智能算法开发、人工智能算法-架构协同设计等。近五年在NeurIPS,ICLR,ICML,ICCV,ECCV, CVPR,ISCA,ASPLOS,MICRO,HPCA,DAC,ISSCC等计算机人工智能领域、体系结构、芯片领域的顶级会议发表论文50余篇。

演讲主题:《从2D走向3D,Chiplet进阶之路》

内容概要:

本次演讲,马恺声教授首先会分享Chipet的发展历程,并着重讲解北极雄芯在2D和3D方面的技术积累、D2D接口以及相应解决方案。


锐杰微董事长 方家恩



方家恩先生具备20多年的半导体与封装行业经验,先后帮助国内主要头部封测公司建立了先进封装设计能力及团队,协助国内众多研究所和企业,完成了具有标杆性的重大科研项目。在Sigirity、Cadence期间任职PackageDesignDervice部门高级经理,负责IP、封装及系统级整套解决方案。个人拥有近20项芯片、封装专利。


演讲主题:《Chiplet芯片技术在封装级的相关应用》


内容概要:


AI技术赋能千行百业智能化已经成为中国社会数字化转型的有力抓手,互联网+/5G+让位于AI+,持续的算力需求带动高性能芯片快速增长。高性能芯片的算力、内存带宽、功耗指标的全面提升因制程因素而面临挑战。半导体技术进入后摩尔时代,Chiplet芯粒和集成芯片技术成为寻求突破的重要研究方向之一。基于Chiplet技术的集成芯片是硅片级IP重构和复用的新架构,在缩短新产品研发周期、提升产品良率和降低成本方面具有独特优势和潜力。D2D高速互联技术、面向封装设计和组装工艺全流程的封装工艺平台成为推动Chiplet封装技术发展的关键技术。


锐杰微科技作为聚焦Chiplet&高端芯片的OSAT企业,本次演讲将阐述Chiplet产业观点,围绕chiplet主流标准和封装技术路线的应用场景、芯粒互联的封装设计和组装工艺平台的重要节点,分享锐杰微在高性能芯片封装级的应用实践。


芯动科技IP研发副总裁 高专



高专,芯动科技IP研发副总裁,2009年硕士毕业于华中科技大学微电子专业。在FinFet先进工艺和高性能芯片等领域有10多年设计经验,涉及HBM、Chiplet、GDDR6X、LPDDR5X、DDR5等行业高精尖技术,所开发的DDR系列IP全球最强、覆盖最全,已成功应用于数十亿颗高端SoC芯片,在全球六大主流Foundry累计上百次流片,多项指标突破行业纪录,还带领团队率先开发了全球唯一的HBM3/2E Combo IP、GDDR6X/6 Combo IP等国际前沿产品。


演讲主题:《经过量产验证的UCIe Chiplet IP赋能HPC芯片系统》


内容概要:


芯动 UCIe Chiplet IP 提供领先的 Chiplet 解决方案,经过量产验证并已经在多个先进工艺节点进行硅验证,并且大量国内外知名客户选择芯动的Chiplet方案。芯动Chiplet方案完全兼容UCIe标准,在physical layer,adapter layer,protocol layer均能满足UCIe协议。芯动的Chiplet方案布局早,PPA优异,硅验证的最高速度达到24Gbps,同时具备低延时和低功耗特性。芯动UCIe IP提供从物理层到协议层,到封装和集成仿真的全套解决方案,同时芯动提供定制化的Chiplet解决方案,比如扩展UCIe IP到基于PCB互联chip to chip领域,定制UCIe IP用于TSV通路的2.5D或者3D封装场景,为客户提供定制化的选择。


本次演讲,高专将介绍UCIe Chiple技术及其发展背景,并着重讲解芯动科技UCIe Chiplet解决方案的技术特点、优势和应用案例。之后,高专还将深入分析UCIe Chiplet市场的发展现状、面临的挑战和未来趋势。


硅芯科技总经理 赵毅



赵毅,硅芯科技创始人,博士毕业于英国南安普顿大学,师从英国皇家科学院院士Hashimi教授,从2008年开始研究2.5D/3D堆叠芯片设计方法,是当时世界最早期研究前沿芯片架构设计方法的研究团队之一,并与IMEC比利时微电子研究中心共同进行3D IC 成果验证。他在三维集成电路设计领域已有15年以上的研发经验,在堆叠芯片EDA后端布局、布线、可测试性设计及可靠性保障等方面取得了世界领先成果,并在国际顶尖期刊上发表多篇论文,论文成果曾荣获VLSI-SOC国际最佳论文。


目前,赵毅担任珠海硅芯科技有限公司的总经理兼技术总监,带领团队自主研发2.5D Chiplet/3D IC堆叠芯片设计的EDA软件产品,为我国芯片设计产品升级迭代、实现国产自主可控提供有力支持。


演讲主题:《针对先进封装的2.5D/3D IC协同设计仿真EDA工具探讨》


内容概要:


采用先进封装的2.5D Chiplet/3D IC堆叠芯片正在带来半导体行业的一次重大升级,有效解决了芯片内存墙、功耗墙、面积墙等设计制造瓶颈。然而,2.5D Chiplet和3D IC无论从物理设计,还是物理仿真验证方面都带来了巨大的挑战,对新一代的堆叠芯片EDA工具更是有全新的需求:无论是在设计环节中处理新的单元结构TSV等(相对传统工具产生EDA特性的质变),还是由于多芯片集成,TSV等带来的布局布线解空间急剧上升(相对传统工具计算复杂度上的巨大量变),甚至由于多Chiplet先进封装带来的超高密度异质异构集成,而导致的高难度热电力磁多物理场仿真。

本次演讲,将深入探讨上述挑战和需求,此外还将分享硅芯科技在Chiplet-Interposer-Package Co-design和Performance-Cost-Testability Co-optimization方面的研究,并介绍Chiplet物理设计(2.5D布局布线)、多物理场仿真(SI,PI,Thermal分析)及针对先进封装Chiplet Multi-die DFT测试等板块的2.5D/3D IC新一代EDA工具。


 03、智算集群技术论坛

部分嘉宾


智源人工智能研究院AI框架研发负责人 敖玉龙



敖玉龙,北京大学博士后,中国科学院博士,北京智源人工智能研究院AI框架研发负责人,负责FlagScale大模型训推框架研发工作。敖玉龙博士长期从事高性能计算、科学计算与人工智能等分布式系统与程序优化相关研究。曾任职于华为和百度,参与研制了相关大模型关键技术,有丰富的大模型分布式系统产业研发与实践经验。2016年获美国计算机学会“戈登•贝尔”奖,2017年支持“神威•太湖之光”超算取得HPCG世界排名第三和HPGMG世界排名第一的成绩。在SC、IPDPS、ICPP、TPDS、TACO、Cluster、JCST等国际顶级会议与期刊发表论文10多篇,参与制定IEEE 2941.1-2022国际算子接口标准,并获多项国内专利和国际专利授权。


演讲主题:《多元算力时代大模型并行训练框架技术创新与实践》


内容概要:


AIGC浪潮推动了算力需求的迅猛增长,促进了国内外多元算力生态的蓬勃发展。然而,这也为用户带来了在不同算力间的“资源墙”难题。


为了打破算力壁垒,实现多种算力资源的高效协同,秉持开源开放理念,智源与合作伙伴打造了大模型并行训练与推理框架FlagScale。


本演讲将分享FlagScale框架在解决多元算力挑战方面的最新进展和应用实践,具体内容包括:在不同芯片上实现异构混合训练的可落地完整技术方案;在新型芯片上算法与软硬件系统如何协同实现千卡千亿MoE模型的端到端高效训练;介绍在用户无感知的情况下实现在线跨芯片自动迁移训练和弹性训练;FlagScale最新的多芯片适配机制与多层次精度对齐标准等。希望通过此次演讲,为大家提供新的思路和启发,共同推动AIGC底层软硬件技术的进一步发展。


阿里云超高速互联负责人 孔阳



孔阳,博士,阿里云超高速互联负责人(Chief Ultra-Link Architect)、目前担任阿里云服务器互连架构设计及业务系统分析工作,负责数据中心通用计算及异构计算的互连方案设计并带领团队进行研发交付,以及计算系统的需求分析和架构定义。10多年数据中心及云计算领域的经验,专注于负责软硬件结合方案的设计。


演讲主题:《面向AI的GPU ScaleUP互连: ALink System》


内容概要:


随着生成式人工智能的蓬勃发展,尤其是大语言类模型,对AI基础设施提出了更高的要求,特别是AI系统 scale up互连技术。阿里云倡议并牵头成立了ALS(ALink System,加速器互连系统)开放生态系统,解决Scale Up互连系统的行业发展规范问题。ALS提供具备性能竞争力和统一标准的互连系统,包括ALS-D数据面和ALS-M管控面两个主要组成部分,为AI训练和推理场景提供丰富的能力和特性支持。


ALS-D将支持UALink国际标准,形成极具性能竞争力的数据面方案。当前以推理和训练场景为主的AI应用,在Scale Up网络上具有并行切分算法、大显存共享、GPU超多核内存语义编程等多种显著特点。ALS-D原生支持高性能内存语义访问、显存共享和在网计算加速,并支持Switch组网模式,性能上具备超高带宽、超低时延能力。


摩尔线程高级产品总监 付海良



付海良,现任摩尔线程高级产品总监,GPU芯片产品业务线负责人,硕士毕业于清华大学集成电路学院,在AI芯片和GPU芯片领域有着多年的产品和项目经验。从摩尔线程创立至今,全程参与所有GPU相关产品的规划、定义、研发、量产到项目交付。目前正在推进摩尔线程新一代万卡智算集群核心加速GPU相关工作。


中国移动研究院数据中心网络研究室项目经理 庄瑞



庄瑞,中国移动通信有限公司研究院数据中心网络研究室项目经理;主要从事数据中心网络和算力网络方面的技术与方案研究工作。


演讲主题:《面向智算的全调度以太网技术思考与实践》


内容概要:


智算中心是以GPU芯片为核心的计算基础设施和以高速以太网交换芯片为核心的网络基础设施的综合体。同等算力下,网络性能成为提升大模型训练效率的关键。


本报告将分享中国移动创新的全调度以太网(GSE)技术理念,重点阐述如何基于报文容器的转发与调度机制重塑数据传输效率。同时,DPU作为GPU与网络之间不可或缺的桥梁角色,在端网协同场景与GSE技术存在诸多的结合点,本报告还将探讨它是如何与GSE技术相辅相成,进而提升智算中心网络规模及性能的。


 04、中国RISC-V计算芯片创新论坛

嘉宾阵容


兆松科技联合创始人兼CTO 伍华林



伍华林,兆松科技联合创始人兼CTO,曾就职于Andes、S3、Imagination编译器部门,参与和负责CPU、GPU、GPGPU芯片的编译器等设计和研发,拥有十多年编译器行业从业经验。于2019年和前Andes软件部门VP王东华一起创办兆松科技。


演讲主题:《面向RISC-V异构AI芯片的“大编译器”设计和实现》


内容概要:


如何快速适配各类AI框架,支持各类模型高效的运行,以及让用户轻松编写高性能的算子库,成为一款AI芯片能否得到市场认可的必要条件。同时,进一步降低AI芯片的软件栈研发成本和算子库维护成本,提升硬件利用率,也成为AI芯片公司走向盈利的必经之路。


兆松科技为解决AI芯片软件栈和算子库的性能和维护等难题,提出了“大编译器”的概念。传统编译器只针对某一特定指令集的芯片产生单线程或者多线程的可执行文件,兆松科技基于MLIR框架设计的“大编译器”,支持PyTorch, Tensorflow, ONNX, JAX导入,结合Triton和Mojo(未来支持)等类Python语言编写的高层次算子库,在统一的MLIR多层中间方言实现全局的图优化以及更优的算子融合策略,从而进一步提升AI芯片的效率。同时,“大编译器”还对平台相关的runtime进行了平台无关的抽象,从而实现从控制器代码自动生成、AI加速器代码自动生成、控制器和AI加速器数据搬运代码自动生成的功能;并且因为只需要维护一套和平台无关的高层次算子库(平台相关的内容自动由编译器产生),让算子库的维护变得更加简单。


兆松科技设计的这套“大编译器”在第一阶段支持基于RISC-V架构的AI芯片(包括数据流芯片),未来会逐步扩展支持非RISC-V架构的AI芯片。


本次演讲主要分享兆松科技是如何通过“大编译器”来解决AI模型到异构系统端到端高效适配的问题


算能高级副总裁 高鹏



高鹏,北京算能科技有限公司高级副总裁,深耕IC设计19年,智算和中大规模处理器设计领域专家,持有10余项发明专利,是国内智算和RISC-V处理器领域最早期的探索者和践行者。


自加入算能以来,成功主导了智算处理器算能BM1684、BM1684X的研发与商用;目前负责算能新一代桌面级处理器产品定义和研发。


演讲主题:《开启算力新纪元—— 基于RISC-V的异构算力探索与展望》


内容概要:


人工智能正在逐步成为最重要的生产力要素,如何为高速增长的人工智能计算需求提供高性价比和高能效比的算力是当下研究热点,RISC-V因为自由开放和共识统一的特点使其有希望成为支持通用算力和包含人工智能在内的各种异构算力的统一架构平台。


本次演讲,将分享算能以人工智能应用为主要目标,基于RISC-V架构的处理器领域的技术探索路径,分享算能在服务器级通用处理器、面向大模型应用的边缘智能处理器、面向视觉应用的终端智能处理器方向的产品成果和生态进展,并展望面向智能个人电脑和边缘服务器的重要产品规划。


芯来科技CEO 彭剑英



彭剑英,芯来科技CEO,浙江大学博士,15年以上处理器设计和相关管理经验。曾任Synopsys ARC处理器高级研发经理并建立ARC处理器中国研发中心;曾任Marvell ARM处理器验证经理等。


作为芯来科技创始人之一,彭剑英结合自身的技术优势和管理经验,统筹芯来科技整体运营、市场营销、产品研发和产业生态构建,在其带领下,公司整体运营呈现飞速发展的良好态势。


同时担任RISC-V中国产业联盟秘书长、浙江大学微电子学院研究员、中国移动物联网联盟理事会理事,并荣获2023上海创业先锋前10强。


演讲主题:《RISC-V IP的商业化要素与2.0模式》


内容概要:


本次演讲,将对RISC-V生态发展的关键商业化要素进行分析,并深入探讨RISC-V CPU IP 的产业价值、发展趋势与协同创新。


澎峰科技创始人&CEO 张先轶



张先轶,澎峰科技创始人&CEO,本科和硕士毕业于北京理工大学,博士毕业于中国科学院大学,曾于中科院软件所工作,之后分别在UT Austin和MIT进行博士后研究工作。国际知名开源矩阵计算项目OpenBLAS发起人和主要维护者。中国计算机学会高性能计算专业委员会执行委员,ACM SIGHPC China执行委员。2016年,创办PerfXLab澎峰科技,提供异构计算软件栈与解决方案。2016年获得中国计算机学会科学技术二等奖,2017年获得中国科学院杰出科技成就奖,2020年 美国SIAM Activity Group on Supercomputing最佳论文奖,2023年北京市自然科学二等奖。


演讲主题:《面向RISC-V的大模型推理引擎PerfXLM》


内容概要:


本次演讲,将介绍澎峰自研的PerfXLM大模型推理引擎,以及PerfXCloud大模型开发与部署平台,并探讨GenAI算力需求急剧增长背景下,新兴的RISC-V ISA在此领域的移植与优化。


跃昉科技研发副总裁 袁博浒



袁博浒,广东跃昉科技有限公司研发副总裁,具有18年半导体研发及管理经验,专注于SOC、数通类芯片及系统应用技术。曾任赛昉科技高级总监、中国信科/烽火产品总监,熟悉从市场战略到销售管理的全流程产品周期,负责跃昉科技整体研发工作。


演讲主题:《基于RISC-V的边缘AI芯片在能源物联网的应用》


内容概要:


目前,RISC-V芯片的应用集中在在工业控制、物联网、智能家居等对算力要求不高的领域,AI实际应用落地较少。基于对能源互联网场景的深刻分析,跃昉科技推出业界首款基于RISC-V架构的高端边缘智能应用处理器NB2,并构建了从芯片到系统的整体解决方案,已成功在能源互联网场景实现商业化应用。


本报告将分享跃昉科技针对能源互联网应用场景的需求分析、解决方案和实践经验以及未来演进方向。


赛昉科技NoC首席架构师 葛治国



葛治国,赛昉科技NoC(Network On Chip) 首席架构师,新加坡国立大学博士,有着15年以上芯片设计经验。在知名学术会议发表多篇文章,并获多项美国和国际专利。


曾在华为作为核心成员参与自研一致性协议、NoC和可配置加速器等多个项目研发。加入赛昉科技以来,领导自研两代一致性NoC。


演讲主题:《国产高性能NoC IP助力RISC-V众核计算》


内容概要:


一致性片上网络(NoC)IP作为高性能计算领域的核心技术之一,广泛应用于数据中心、专用处理器(DPU)、人工智能(AI)芯片等场景。作为构建高效、安全、可持续AI生态系统的基础,NoC IP提升了系统的整体性能,降低整体能耗,进一步推动了人工智能技术的发展和应用。赛昉科技作为专注高性能RISC-V IP和软件解决方案厂商,始终致力于国产RISC-V CPU IP和一致性片上网络(NoC)IP的自主研发,其一致性NoC IP已成功研发至第二代——昉·星链-700(Starlink-700),专为支撑RISC-V众核的高性能计算而设计,为其提供强劲的内核动力。


本报告将深入探讨赛昉科技Starlink-700的架构和设计理念,包括其设计特性、多样化应用场景以及未来演进方向。


华兴新经济基金董事总经理 尹弘



尹弘博士现任华兴新经济基金董事总经理,主要负责科技板块创新企业的VC和成长阶段投资。


尹弘博士主导或参与了多家科创板、美股和港股上市公司的早期和成长期投资,包括:纳微半导体(NASDAQ:NVTS)、慧智微电子(KCB:688512)、Unity Software (NYSE:U)、经纬恒润(KCB:688326)、纳芯微(KCB:688052)、清陶能源、加特兰微电子、伏达半导体、追觅科技、肇观电子、PingCAP分布式数据库、比路电子、芯视界微电子等。


在加入华兴资本之前,尹弘博士曾任职于多家业内著名基金,也曾在多家美国知名半导体公司担任研发工作。尹弘博士拥有美国北卡罗来纳州立大学电子工程专业博士学位,和哥伦比亚大学商学院的MBA学位。


 05、峰会最终议程即将公布


2024全球AI芯片峰会主会场设有开幕式及三大专场。9月6日上午,开幕式拉开帷幕,下午将进行数据中心AI芯片专场;AI芯片架构创新专场、边缘/端侧AI芯片专场将在9月7日上午和下午分别进行。

在分会场,9月6日下午将进行Chiplet关键技术论坛;智算集群技术论坛和中国RISC-V计算芯片创新论坛将于9月7日上午和下午分别进行。其中,Chiplet关键技术论坛和智算集群技术论坛为收费制论坛,主要面向购票用户及定向邀请用户开放。

峰会完整议程也即将公布,大家可以通过文末左下角「阅读原文」,直达官网了解进展。


06、免费票开放申请

三类门票支持购票


大会设有四类电子门票,分别为免费票、免审票、通票和贵宾票。其中,对于免费票,在申请后需经主办方审核通过,方可参会;免审票、通票和贵宾票均需购买。


大家可以扫描下方二维码,添加小助手“雪梨”即可进行免费票申请,或购买电子门票。已添加过“雪梨”的老朋友,给“雪梨”私信,发送“GACS24”即可。


芯智讯
“芯智讯”——有料的科技新媒体!专注于半导体产业链、智能手机产业链、人工智能、AR/VR、智能硬件及汽车电子等相关领域。
 最新文章