导读 本文将分享豆包 MarsCode 编程助手的落地实践。
1. 豆包 MarsCode 编程助手起源
2. 豆包 MarsCode 的现状与发展
3. 未来展望
4. 总结
5. 问答环节
分享嘉宾|李文超 字节跳动 开发工具技术专家
编辑整理|王红雨
内容校对|李瑶
出品社区|DataFun
豆包 MarsCode 编程助手起源
1. IDE 智能化探索
2. 开发者对 AI Coding 的诉求
代码生成:自动化补全、模板填充,大幅提升生产率。 理解与解读:即时解析代码含义,助于快速定位与修正问题。 自动修复:智能识别并解决 bug,如 Auto Debug,Link Fix 等功能,减轻调试负担。
3. 豆包 MarsCode 进化
豆包 MarsCode 的现状与发展
1. 代码补全
尝试率:每当用户在编辑器中进行操作,比如输入新字符或删除一些代码时,都是 AI 给出补全建议的机会。尝试率指标反映了 AI 实际为用户提供建议的频率。AI 不进行尝试可能是由于延迟(如 Debounce)或需要根据上下文情况来决定是否给出补全建议。 例如,用户敲击了 10 次按键,只有 6 次触发了请求,那么尝试率就是 6/10。 反馈率:AI 在给出补全建议时是存在延迟的,包括上下文检索到网络开销,再到实际模型推理,都会引入延迟。如果延迟太高,开发人员将继续在编辑器中执行新的操作,触发新的推荐机会,并使现有推荐机会变得无意义。此外,在推荐完成后,工具可能因各种原因决定不向开发人员显示建议,比如置信度不够高、触发了过滤器等。反馈率代表了有多少比例的建议最终被传递给开发人员以获得人类反馈。 例如,用户触发了 6 次补全请求,最后只有 3 次被展示,那么反馈率就是 3/6。 低值预警:尝试率和反馈率降低,会使用户体验下降,反馈缺失,需审视链路延迟与策略合理性。 采纳率:反映了展示出的建议中有多少被开发者采纳。 每次采纳平均 token 数:在其它条件相同的情况下,较长和较短的代码推荐所带来的价值有很大差异。大模型以 token 的形式处理输入,并生成输出,这些 token 通常是一小段字符,因此每个被采纳建议中平均 token 数反映了每条被采纳建议所传递出的实际价值。 Token 平均字符数:开发人员看到的是字符而不是 token,不同大语言模型可以有不同的分词器,因此,如果一个大模型的每个 token 生成了更多字符,实际上它会写出更多代码,而每个 token 的平均字符数正体现了这一点。
2. 代码补全 Pro
未来展望
1. 编程助手业界趋势观察
2. 产品形态展望
总结
问答环节
分享嘉宾
INTRODUCTION
李文超
字节跳动
开发工具技术专家
字节开发工具技术专家, 有多年开发工具领域的开发经验。
往期推荐
从 ETL 到 NoETL 的数据架构演进——Denodo 的创新解决方案
B站大数据任务基于Volcano的云原生调度实践
蚂蚁大模型推理之显存优化探索实践
斯坦福大学教授李飞飞团队:关于 2024 年人工智能发展报告总结
滴滴ChatBI技术实践:智能数据分析的前沿探索与应用
谷歌科学家万字长文:《改变你职业生涯的一篇文章,我如何运用人工智能完成工作》建议每个人都要读一遍
火山引擎基于大模型 ChatBI 的演进与实践
AI改变工作:一天内打造专属于你自己的RAG
多智能体系统(OpenAI Swarm)的可观测性研究实践
京东数据架构解析:供应链效率提升与决策优化策略
点个在看你最好看
SPRING HAS ARRIVED