RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时

科技 2024-11-03 10:16 辽宁

作者 | Eran Stiller

译者 | 王强

策划 | Tina

Uber 最近详细介绍了它构建 Genie 的经历，这是一款由 AI 驱动的随时待命的 Copilot，旨在提高随时待命的支持工程师的效率。Genie 利用检索增强生成（RAG）技术提供准确的实时响应，并显著提高事件响应的速度和效率。

自 2023 年 9 月推出以来，Genie 对 Uber 的支持团队产生了重大影响。它已在 154 个 Slack 频道中回答了超过 70,000 个问题，节省了大约 13,000 个工程小时，根据用户的评估，其回答有效率为 48.9%。

Uber 的待命工程师通常花费大量时间答复重复的查询或浏览零散的文档，使用户难以独立找到答案。这些情况导致了响应时间过长和生产力下降，这也是构建 Genie 的驱动力。

Uber 使用检索增强生成（RAG）来驱动 Genie。RAG 是一种创新方法，它将信息检索系统的优势与生成式 AI 模型相结合，以产生准确且相关的响应。它让 Uber 可以利用现有知识来源快速部署解决方案，这样就用不着 AI 模型微调所需的大量示例数据了。

Genie 从各种内部来源提取数据，例如 Uber 的 wiki、Stack Overflow 和工程文档。信息被抓取后，使用 OpenAI 模型转换为向量嵌入，并存储在 Uber 的内部向量数据库 Search In Action（SIA）中。Genie 仅从预先批准的数据源提取数据，且不包含敏感数据，以避免泄露敏感信息。

Genie 的整体架构（来源）

当用户在 Slack 中提出问题时，查询会被转换为嵌入，Genie 会使用该嵌入在向量数据库中获取上下文相似的数据。然后它将这些数据输入到大型语言模型中，以根据检索到的信息生成准确的响应。

Uber 实施了一个指标框架，通过持续的实时用户反馈来提高 Genie 的性能。在 Genie 回答问题后，用户可以通过选择“已解决”、“有帮助”或“不相关”等选项来提供反馈。

Genie 的用户反馈流程（来源）

这些反馈通过 Slack 插件收集，并使用 Uber 的内部数据流系统处理，将指标发送到 Hive 表中分析。反馈循环允许 Uber 的团队跟踪 Genie 的帮助有效率，并根据真实的用户体验改进其响应。

对于性能评估，Uber 设计了一个自定义评估管道，用于评估各种指标，例如幻觉率和响应的相关性。该管道处理的是历史数据，包括 Slack 元数据、用户反馈和 Genie 以前的响应。它通过由 LLM 提供支持的评分系统来处理这些数据，用这个系统充当评判者。

Uber 还采用了一套文档评估流程，以保障 Genie 在其响应中检索和使用的信息的质量。系统将抓取的知识库转换为结构化格式，其中一行代表一个文档。

文档评估应用程序的工作流程（来源）

Genie 将这些文档输入带有自定义评估提示的 LLM 来评估每个文档的清晰度、准确性和实用性。然后，LLM 返回分数并提供改进每个文档的可行建议。此过程有助于保持底层文档的高标准，确保 Genie 的响应保持可靠和有效。

原文链接：

RAG-Powered Copilot Saves Uber 13,000 Engineering Hours (https://www.infoq.com/news/2024/10/uber-genie-rag-copilot/)

声明：本文为 InfoQ 翻译，未经许可禁止转载。

受软件拖累，大众血亏155亿元：直接把奥迪、宾利、杜卡迪和兰博基尼等豪车利润抹平了

低级失误导致 Elasticsearch 仓库 404，7万多 star 一夜清空，网友：只是手滑了？！

Flutter 被分叉！团队缩水至 50 人，bug 堆积如山，前谷歌员工出手找出路

活动推荐

2024 年收官之作：12 月 13 日 -14 日，AICon 全球人工智能开发与应用大会将在北京举办。从 RAG、Agent、多模态模型、AI Native 开发、具身智能，到 AI 智驾、性能优化与资源统筹等大热的 AI 大模型话题，60+ 资深专家共聚一堂，深度剖析相关落地实践案例，共话前沿技术趋势。大会火热报名中，详情可联系票务经理 13269078023 咨询。

http://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651224148&idx=3&sn=570722655b9639eb6aaca67934ee9005

InfoQ

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者，前沿技术的传播者。

Mooncake 分离式推理架构创新与实践

Scaling Law，撞墙了吗？| 直播预告

共话 AI 与出海新趋势，技术领袖探讨未来发展之道

Apache Tomcat 11.0提供了对虚拟线程和Jakarta EE 11的支持

Chrome 被强制出售？谷歌或将抛弃 ChromeOS 全面转向 Android 系统

独家｜腾讯杰出科学家、混元大模型技术负责人之一刘威离职

StarRocks Summit 剧透 | 云原生与 AI 驱动，湖仓落地场景前瞻

ISO C++主席 Herb Sutter 离开微软，并宣布即将发布的 C++ 26 是自 C++11 以来最具影响力的版本

微软在 GitHub Universe 上为开发者推出 AI 增强工具

一朝成名，一夜破产！这家谷歌前高管创立的AI公司突然宣布倒闭，专家：这个行业不适合AI

OpenAI死对头、Claude掌舵人访谈：与Altman分道扬镳不是因为商业化、scaling law不会撞墙

QCon演讲实录 | 赵彦奇：HTTPDNS 边缘下沉，性能、成本和稳定性之间的取舍与思考

极客游学·乌镇互联网大会站启航：共话 AI 与出海新趋势

优步借助 MyRocks 差异备份显著节省了存储成本

一场泰森拳王比赛就能让上云鼻祖宕机，员工：周末不想加班修bug

腾讯发布财报，员工平均月薪超9万！Kimi的瓜太多！杨植麟惨遭前投资人提起仲裁；特朗普如何“拯救”TikTok？| Q资讯

续航超 4 小时、算力 550T，这款国产自研人形机器人让家务更轻松

Cloudflare 使用 OpenTelemetry 彻底检修日志记录管道

别慌，Scaling Laws 的末日还早！“革新版”迅速出现，多位大牛都在叫好

是否应在 Kubernetes上运行Redis？快手这样做！

Safe C++提案能复制Rust的内存安全性吗？

Grab 通过 GPT-4、Glean 和 Slack 实施了利用 LLM 的转换数据发现

“天价”ERP项目导致欧洲最大政府破产：预算涨了10倍，上线半年8000多个错误，一年税收没正常过

B 站轻量级容灾演练体系构建与业务实践

儿歌点点携手火山引擎，共创儿童成长AI伙伴

好未来：多云环境下基于 JuiceFS 建设低运维模型仓库

阿里国际推出全球首个 B2B AI 搜索引擎 Accio

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

RAG在企业落地的难点与创新 | AICon

适应性响应方法可弹性处理软件运维中的难题

Expedia 将大型 Cassandra 集群迁移至 ScyllaDB，实现了零停机目标

微软“甩锅”神操作？服务器“安全更新”成“系统大换血”，企业懵了

应用突破还是炫技噱头：大模型能否真正驱动行业升级？

考完软考，人麻了…… | 极客时间

百度沈抖：AI 应用在 B 端率先爆发

F5 全新报告：AI 时代 API 安全面临严峻挑战

李彦宏：大模型幻觉基本消除，这是只靠想法就能赚钱时代

我们为什么不遗余力地举办 AICon？

大模型“杀死”前端？开发者如何与AI共舞 | Q推荐

生成式AI项目，数据管理的“坑”和“诀窍” | 直播预告

一句话改图！字节豆包通用图像编辑模型 SeedEdit 上线测试

一个周末重写所有代码，性能提升10倍！没有这个1000 倍工程师，就没有现在的谷歌地图

Meta元宇宙梦碎：5年烧光465亿美元，硬件高管跳槽，资本圈集体唱衰

QCon演讲实录 | 徐广治：边缘云原生操作系统的设计与思考

3000+面试题，17小时专家课：程序员的求职加速包 | 极客时间

Pinterest大幅提升时序数据库Goku存储效率和资源使用

Linus 大佬展现恐怖业务实力：只改动 21 行代码，Linux 性能狂升 2.6%

对话Steve Klabnik和Herb Sutter：Rust和C++

海柔仿真系统存储实践：混合云架构下实现高可用与极简运维

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉