Jim Keller,使用Risc-V构建AI

文摘   2024-08-21 09:22   上海  

分享者:Jim Keller, Tenstorrent公司CEO



摘要

    

    演讲中讨论了AI发展及挑战,介绍了Tenstorrent的AI解决方案,同时还分享了开源软件的重要性、软硬件协同发展等内容。

    Tenstorrent的AI解决方案涵盖了从软件到硬件的多个层面,并且强调了开源的重要性和针对问题设计清晰软硬件的重要性,以及在13个数量级以上的性能范围内提供优化。同时利用开源社区的力量来推动技术创新。



解决问题


  • AI的挑战:Jim Keller指出,AI不仅仅是让程序运行得更快,而是涉及到程序的深层变革。

  • 软硬件交互协议:强调了硬件和软件之间的交互协议关系,以及如何在AI领域重构这种关系。如内存、寄存器、指令集等。

  • 开源软件的价值:讨论了开源软件在AI发展中的重要性,以及它如何促进了技术的价值创造和共享。



Tenstorrent AI处理器解决方案


1、基于RISC-V的AI处理器构建

    • Tenstorrent AI处理器中采用RISC-V架构,提供了灵活性和定制性。

    • 设计了不同大小和功能的RISC-V CPU核心,以适应不同的计算需求。

    • 从人脑的计算方式中获得灵感,特别是大脑皮层柱的高效本地计算和长距离通信能力。设计允许跨芯片进行扩展,通过以太网等通信接口实现芯片间的高效通信。

    • 提供了RISC-V架构的自检测试工具,以确保处理器的可靠性和性能。

    • 传统的CPU硬件/软件交互协议涉及指令解码、执行、内存访问等,而Tenstorrent处理器针对上述交互协议设计了快速的数学运算和数据移动硬件等功能,以加速 AI 程序的执行。


2、将AI软件栈分为pytorch、Lib、kernel及数据移动层

    • 构建了一个多层级的操作速率金字塔,从模型管理到芯片调度,再到内核调度,每一层都经过优化以最大化操作速率。

    • 通过自底向上设计思路,验证并优化了kernel和编译器层。实现了编译器和运行时的清晰分离,以提高效率和灵活性。

    • 同时专注于一组核心操作,如Matrix Multiply、Convolution、softmax等,通过这些操作实现高效的AI计算。


3、利用开源生态系统,包括Linux、PyTorch、MLIR等,来构建其AI解决方案


4、软硬件发展方向

    • 软件层面,计划进行更多编译器转换、模型和操作的开发,并改进与PyTorch、Jax等的接口。

    • 在硬件方面,计划采用芯片封装技术、更快的内存和更高效的以太网连接,以提升AI处理器的性能。


视频地址:

https://www.bilibili.com/video/BV17r421K7oT/





土人观芯
AGM微电子运营,探讨关于半导体的一切,聊聊半导体公司的运营,半导体技术的科普,也给公司打打广告。
 最新文章