dkernel:高性能的定制化CUDA内核库

科技   2024-12-17 18:32   浙江  

dkernel:高性能的定制化CUDA内核库,专注于优化大规模语言模型的稀疏注意力计算,提升计算效率和降低资源消耗。

参考文献:
[1] http://github.com/linxihui/dkernel



欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。

NLP工程化知识星球

NLP工程化分享群

NLP工程化
专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。
 最新文章