分享者:Jim Keller, Tenstorrent公司CEO
摘要
解决问题
AI的挑战:Jim Keller指出,AI不仅仅是让程序运行得更快,而是涉及到程序的深层变革。
软硬件交互协议:强调了硬件和软件之间的交互协议关系,以及如何在AI领域重构这种关系。如内存、寄存器、指令集等。
开源软件的价值:讨论了开源软件在AI发展中的重要性,以及它如何促进了技术的价值创造和共享。
Tenstorrent AI处理器解决方案
1、基于RISC-V的AI处理器构建
Tenstorrent AI处理器中采用RISC-V架构,提供了灵活性和定制性。
设计了不同大小和功能的RISC-V CPU核心,以适应不同的计算需求。
从人脑的计算方式中获得灵感,特别是大脑皮层柱的高效本地计算和长距离通信能力。设计允许跨芯片进行扩展,通过以太网等通信接口实现芯片间的高效通信。
提供了RISC-V架构的自检测试工具,以确保处理器的可靠性和性能。
传统的CPU硬件/软件交互协议涉及指令解码、执行、内存访问等,而Tenstorrent处理器针对上述交互协议设计了快速的数学运算和数据移动硬件等功能,以加速 AI 程序的执行。
2、将AI软件栈分为pytorch、Lib、kernel及数据移动层
构建了一个多层级的操作速率金字塔,从模型管理到芯片调度,再到内核调度,每一层都经过优化以最大化操作速率。
通过自底向上设计思路,验证并优化了kernel和编译器层。实现了编译器和运行时的清晰分离,以提高效率和灵活性。
同时专注于一组核心操作,如Matrix Multiply、Convolution、softmax等,通过这些操作实现高效的AI计算。
3、利用开源生态系统,包括Linux、PyTorch、MLIR等,来构建其AI解决方案
4、软硬件发展方向
软件层面,计划进行更多编译器转换、模型和操作的开发,并改进与PyTorch、Jax等的接口。
在硬件方面,计划采用芯片封装技术、更快的内存和更高效的以太网连接,以提升AI处理器的性能。
视频地址:
https://www.bilibili.com/video/BV17r421K7oT/