【Rust日报】CubeCL 0.3版本发布,扩展了对AMD GPU的支持

科技   2024-11-01 15:00   加拿大  

just - 用于保存和运行特定于项目的命令的实用工具

just是一个用于保存和运行特定于项目的命令的实用工具。它的语法受到make的启发,但比make简单很多,避免了很多复杂性和特殊情况。just支持Linux、macOS和Windows,无需额外依赖。它提供了详细的错误信息、命令行参数支持、环境变量加载、命令补全脚本等有用的功能。just还支持用任意语言编写命令,可以从任意子目录调用。just可通过各种包管理器安装,也提供了预编译的二进制文件供下载。如果需要帮助,可随时提出问题或在Discord上ping作者。该项目欢迎新功能请求和bug报告。

https://github.com/casey/just

Iggy.rs 消息传递平台的最新进展

  1. Iggy.rs被著名技术咨询公司Thoughtworks列入了值得探索和评估的项目技术雷达,这对Iggy.rs来说是个重大成就,意味着获得了更多认可和信任。

  2. Iggy.rs的当前主要目标包括:

  • 复制(Replication):实现基于Viewstamped Replication的分布式共识算法,支持高吞吐的环形拓扑和链式复制模型。

  • S3存储:已支持将服务器状态日志和流数据归档到S3兼容的云存储。未来计划实现直接从S3读写实时数据,形成三级缓存层次结构(内存、磁盘、S3)。

  • OpenTelemetry:集成开放遥测框架,提高可观测性。

  • 优化:包括使用io_uring技术提升I/O性能等。

这反映了Iggy.rs不断增强分布式、存储、可观测性等关键能力,以满足高性能、高可用消息传递的需求。

https://blog.iggy.rs/posts/technology-radar-and-currrent-goals/

rust-analyzer 更新

这个更新日志总结了Rust分析器在2024年10月28日发布的版本0.3.2162的主要变化。新功能包括支持Option的包装/解包返回类型、范围运算符和模式上的"Go to definition"、不在初始化时启动服务器的选项、实现了混合站点卫生、诊断的拉模型、改进了文档渲染、错误诊断分割等。还修复了一些格式化、补全、解析等问题。内部改进包括切换到合并队列CI、合并重叠的行内提示、改进宏错误消息等。此外,Windows构建将不再包括.gz工件,改为使用.zip文件。

https://rust-analyzer.github.io/thisweek/2024/10/28/changelog-257.html

在Web客户端是使用Rust还是TypeScript编写更合适

该博文讨论了在Web客户端是使用Rust还是TypeScript编写更合适。作者认为UI层面应该用TypeScript和流行的Web框架编写,方便前端开发者贡献代码。但对于处理媒体体验的底层部分存在两种选择:

  1. 使用现有的TypeScript库moq-js,它涵盖了网络、媒体容器、编解码和捕获/渲染等功能。

  2. 使用WebAssembly技术,将Rust库moq-wasm编译为WASM,用于解码和渲染媒体。

作者列出了在Web Worker线程中使用WASM的一些优势和担忧。优势是代码可重用于原生应用,但担心性能开销,比如需要在JS和WASM间拷贝数据。

最后,作者没有明确表态,而是征求读者的意见,看是继续使用moq-js还是转向moq-wasm。这是一个需要权衡的决策,涉及到开发效率、性能和可重用性等多方面的考量。

https://quic.video/blog/to-wasm

CubeCL 0.3版本发布,扩展了对AMD GPU的支持

CubeCL 0.3版本发布了新的运行时和增强的编译器,扩展了对AMD GPU的支持。通过rocm运行时和HIP C++接口,可以利用针对CUDA优化的编译器,为AMD GPU带来性能提升。下一步将实现矩阵乘法累加(MMA),大幅提高内核性能。

之前AMD支持仅通过wgpu运行时,受WebGPU限制无法使用半精度和MMA。新版本可直接从CubeCL IR生成SPIR-V,通过wgpu运行时支持更多GPU上的低精度和MMA。

新版本还改进了宏系统,扩展了Rust语法支持,引入了更多编译期优化。只需设置环境变量即可简化内核分析。

此版本大幅增强了矩阵乘法内核性能,达到了cuBLAS水平,确保了CubeCL在任何GPU上都可以匹配手工优化的cuBLAS内核性能。开发者还将继续优化这些内核,适配各种GPU架构。

作者对社区的宝贵贡献表示特别感谢。CubeCL旨在结合卓越性能、灵活性和可移植性,提供统一实用的API,Rust持续显示出在高性能计算领域的潜力。

https://old.reddit.com/r/rust/comments/1geb3m2/cubecl_03_released_rocmhip_spirv_support_for/

--

From 日报小组 Mike

社区学习交流平台订阅:

  • Rustcc论坛: 支持rss
  • 微信公众号:Rust语言中文社区


Rust语言中文社区
Rust官方及社区最新信息搜集、文章推送,教程学习,技巧分享,社区交流。信息来源是整个全球Rust社区。
 最新文章