2024 年最适合生成 Rust 代码的大模型测评

文摘科技 2024-10-31 20:23 四川

大家好，今天给大家带来一篇关于大语言模型（LLM）在生成 Rust 代码方面的测评文章。随着 AI 的发展，越来越多的开发者开始使用 LLM 来辅助编程。那么，究竟哪个模型最适合生成 Rust 代码呢？让我们一起来看看。

引言

在人工智能快速发展的今天，我们测试了多个可以本地运行的大语言模型，以评估它们在生成 Rust 代码方面的能力。本文将为您详细介绍测评结果，并提供实用的参考建议。

需要注意的是：我们不推荐也不建议直接使用 LLM 生成的 Rust 代码投入生产环境。

测评环境

我们使用了 Ollama 作为测试平台，在标准的 HP Gen9 刀片服务器上以 CPU 模式运行测试。关于运行环境的内存要求：

7B 模型需要 8GB RAM
13B 模型需要 16GB RAM
33B 模型需要 32GB RAM

模型性能对比

根据 Stable Code 团队的测评数据，以下是各个模型在 Rust 代码生成方面的表现：

Code Llama（7B）：26.3%
Stable Code（3B）：23.0%
Replit Code V1.5（3B）：21.5%
Wizard Coder（3B）：20.4%
Deepseek Coder（1.3B）：18.5%
StarCoder（3B）：16.9%

实例展示

让我们看看 Llama3 8B 模型生成的一个 Trie 数据结构实现：

use std::collections::HashMap;

// Trie 节点结构
struct TrieNode {
    children: HashMap<char, TrieNode>,
    is_end_of_word: bool,
}

impl TrieNode {
    // 创建新的 Trie 节点
    fn new() -> TrieNode {                           
        TrieNode { 
            children: HashMap::new(), 
            is_end_of_word: false 
        }
    }
}

// Trie 树结构
pub struct Trie {
    root: TrieNode,
}

impl Trie {
    // 初始化 Trie 树
    pub fn new() -> Trie {
        Trie { root: TrieNode::new() }
    }

    // 插入单词
    pub fn insert(&mut self, word: &str) {
        let mut node = &mut self.root;
        for c in word.chars() {
            node = node.children.entry(c)
                .or_insert(TrieNode::new());
        }
        node.is_end_of_word = true;
    }
}

总结

Code Llama 7B 模型在 Rust 代码生成方面表现最好，准确率达到 26.3%。
较小的模型（如 3B）也能达到不错的效果，适合本地开发环境使用。
建议将 LLM 作为编程辅助工具，生成的代码仍需要经过仔细review和测试。

使用建议

选择适合自己硬件配置的模型大小
优先考虑 Code Llama 等专门针对代码优化的模型
结合实际项目需求，权衡模型大小与性能的平衡

参考文章

Which LLM model is best for generating Rust code?：https://blog.rust.careers/post/which_llm_is_best_at_rust/
Stable Code Model Description：https://huggingface.co/stabilityai/stable-code-3b#model-description
BigCode Evaluation Harness：https://github.com/bigcode-project/bigcode-evaluation-harness

http://mp.weixin.qq.com/s?__biz=Mzg4ODg2NDQ0NA==&mid=2247486468&idx=1&sn=a7bfd64b02edd11a981abd2bc1b21dbb

数据科学研习社

带你走进数据科学的世界🚀

最新文章

从 Python 到 Rust：为什么枚举（Enum）是一个必学特性？

Rust 进阶：Pin 是什么？为什么要用它？

从 Go 转 Rust，真香！这是我的学习心得

Rust 零依赖解析命令行参数实战教程

量化交易进阶：Walk Forward 优化策略详解

重磅：2024年10月 Rust 就业报告解读，Amazon 继续领跑！

快速入门：Python 股票市场预测实战指南

深入浅出 Rust 指针：从入门到实践

Python 量化交易入门：移动平均线策略详解

Rust 性能优化指南：避开这些常见陷阱，让你的代码更快更强！

Rust 语言进阶：十大隐藏特性助你写出更优雅的代码

Rust 迭代器：iter() 和 into_iter() 的使用区别详解

Rust 宏编程进阶：使用 Syn 实现自动化构建器模式

Rust 错误处理神器 thiserror 2.0 发布啦！

Rust 编程进阶：从青铜到钻石的代码进化之路

课程合集

一个开发者的 Rust 学习困惑：类型系统真的有那么难吗？

课程合集

Rust 在高频交易领域大放异彩：性能与安全的完美平衡

课程合集

2024 年 Rust 还是 Go？一文带你看透两者优劣

课程合集

深入理解 Rust 内存对齐：从入门到精通

Rust 新手必看：String vs &str，如何选择？

从一个PR看Rust编译器项目的贡献之道

2024 年最适合生成 Rust 代码的大模型测评

深入理解 Rust 异步 IO：从入门到实践

Rust 异步任务详解：从零开始实现 Task 系统

Rust 异步编程必知必会：Future 详解

Rust 异步编程入门：从线程到 async 和 await 的演进之路

【课程更新】- 模拟登录-《AKShare 源码解析》

课程合集

Rust 设计模式实战：用算法交易系统掌握三大经典模式

Rust vs Python：新手如何选择？深度对比两门流行语言

Rust 数据工程：构建高效可靠的数据处理系统

Tauri 2.0：用 Rust 开启跨平台应用开发新纪元

Rust 开发 GUI 应用的新选择：Dioxus 入门指南

Rust 1.82.0 来啦！快来看看有哪些新特性

Rust 异步运行时探秘：从零实现事件循环-02

Rust 全栈开发新秀：Leptos 框架初探

Rust 语言持续高歌猛进，突破 TIOBE 排行榜 TOP 13 名！

Rust 开发者必备工具：探索 diff.rs 的强大功能

Rust 前端开发利器：Yew 框架入门指南

Rust 异步运行时：从零开始的简单实现-01

Rust 项目的救星：cargo-msrv 轻松解决版本兼容难题

2024 年 Rust 学习指南：从入门到精通

Rust 助力 AI：LanceDB 为智能应用提供高性能向量数据库

跟随 Rust 大师 Jon Gjengset 的 "Decrusted" 系列，成为 Rust 编程高手

Python 3.13 震撼发布！这些新特性你一定要知道

Rust 并发编程利器：Crossbeam 让多线程开发更简单

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉