增强人工智能可靠性：关于引入大语言模型（LLM）可观察性和可信 API的简介

文摘 2024-08-06 15:22 广东

在迅速发展的人工智能 (AI) 领域中，无论是聊天机器人还是复杂的数据分析工具，大型语言模型 (LLM)都已成为许多应用程序不可或缺的组成部分。同时，LLM的快速普及带来了安全性、可观察性和信任方面的重大挑战。本文探讨了拟议的 LLM 可观察性和可信API 如何应对这些挑战，以确保能够负责任地使用人工智能。

大语言模型的主要关注点和需求包括

安全性

数据隐私与泄露：保护个人可识别信息（PII）和知识产权（IP）不被泄露

威胁检测：识别和缓解威胁，例如提示注入攻击

内容过滤：确保高风险内容得到有效过滤，以防止不当或有害的输出

可观察性

性能与成本监控：跟踪模型的性能指标和相关成本。

审计与合规：通过详细的日志记录和审计跟踪，来确保遵守PCI、HIPAA和GDPR等法规。

事件响应与取证：提供安全事件调查和响应的必要工具。

全面可见性的必要性

可见性是安全性和信任的基础。如果没有对大型语言模型（LLM）内部发生的事情的清晰理解，就无法有效地保护和优化它。全面的可见性能够使主动威胁检测、有效的响应策略以及建立安全可信的环境的建立成为可能。

可见性的关键领域

用户、设备和位置：跟踪与模型互动的用户、来源以及所使用的设备。
提示可见性：监控提示及其上下文，以理解和控制输入到模型中的内容。
输出可见性：观察模型生成的输出，以确保其符合预期标准且不包含有害内容。
工作负载/容器可见性：关注模型在云或本地环境中的工作负载管理情况。

多模态可见性

多模态可见性对于理解不同类型的数据输入和输出之间的互动至关重要，无论他们是文本、图像还是其他数据形式。这种整体方法可以构建一个完整的可观测性框架。

当前方法及其局限性

现有方法通常涉及内联控制，例如代理或防火墙（也称为入侵检测和防御系统 [IDPS] 和 API 网关），这可能会导致来自于运营方面的阻力和部署方面的挑战。这些方法可能在实时分析方面遇到困难，并且随着模型复杂性的增加，可能无法有效扩展。

一种新方法：LLM 可观察性与可信API

提议的方案

LLM 可观察性与可信API 提供了一种带外的方法，利用异步API在不干扰模型的性能前提下提供全面的可见性。主要特点包括：

OnPrompt（）和 OnOutput（）钩子：捕获带有可选上下文信息的提示和输出。

异步数据发布：确保对模型性能的影响最小，同时提供详细的日志，以便进行后续分析和审计

与现有安全框架的集成：支持更易采用和集成到当前的安全操作中的方案

优势

增强安全性：改进威胁检测和数据保护

更好的性能监控：提供对模型性能和成本的详细洞察

合规支持：具备强大的日志记录和审计能力，以满足监管要求

促进安全生态系统：鼓励围绕大型语言模型（LLMs）发展更广泛的安全和信任生态系统

实施策略

成功实施LLM（大型语言模型）可观察性与可信API，关键在于模型提供商、云基础设施提供商和企业用户之间的紧密协作，关键步骤包括：

开发与标准化 API：创建一个标准化的API，以便在不同的平台和模型之间使用
构建集成工具：提供工具和库，以便于与现有系统的轻松集成。
社区协作：鼓励开源社区的贡献，以增强和扩展 API 的功能。

结论

LLM 可观察性与可信API 代表了在管理现代 AI 系统复杂性方面的重大进展。通过提供全面的可见性和安全功能，该API能够确保大型语言模型（LLMs）被负责任和有效地使用，为更广泛的采用和创新铺平道路。

CSA 正在进一步研究和开发这一主题，后续计划后续白皮书，该白皮书将扩展本博客文章中提出的观点，并探讨潜在的解决方案。

文章来源：

https://cloudsecurityalliance.org/blog/2024/07/19/enhancing-ai-reliability-introducing-the-llm-observability-trust-api

本文翻译来自CSA翻译组：

翻译：Walmart Kevin Wang，CSA大中华区专家

审校：王玮，CSA翻译组轮席组长

会议预告

第八届云安全联盟大中华区大会（The 8^thCSA GCR Congress）

议题征集

CSA GCR Congress是CSA大中华区在中国举办的年度盛会，至今已连续举办七届，大会聚焦前沿技术，引领行业创新；权威发布前沿成果，引领行业风向，我们诚挚地邀请业内专家、学者们来分享经验或案例、交流技术或想法，欢迎申报。

征集方向包括但不限于：云+AI、数据安全、零信任、物联网安全、量子安全、云原生、超融合、金融安全、大模型安全、安全运营实践、网络安全人才培养等。

征集填报链接：https://csagcr2021.mikecrm.com/TJpoaAj

国际云安全联盟CSA

国际云安全联盟（CSA）是世界领先的中立权威的国际标准组织，创立于2009年，致力于定义和提高业界对云计算和下一代数字技术安全最佳实践的认识。CSA大中华区在中国注册备案，立足于中国，在全球范围与其他国际组织、政府、高校、企业等广泛合作。

最新文章

CDSP 2.0数据安全认证专家课程介绍

【丰厚奖金池】外滩大会：CSA大中华区携手学界与业界，以科技竞赛推动大模型安全发展

万象AI，安全新生！CSA大中华区参加国家网络安全宣传周活动

国家网络安全宣传周 | 首个AI安全产业图谱重磅发布

2024国家网安周| 大模型安全与产业应用创新研讨活动，诚邀你来！

CSA大中华区李雨航受聘为浙江大学国际联合商学院实践教授

全球AI治理大势所趋：外滩大会圆桌对话深度解析

CSA大中华区发布《AI可信度分析》报告，中国电信、广州大学、蚂蚁集团、西安电子科技大学等单位参编

CSA大中华区在外滩大会上发布AI标准报告，启动AI攻防赛事

CAISP认证 | AI算法与模型快速进阶研讨会，超1万人在线学习

首批CAISP持证人员名单揭晓，备考攻略一览

9月4日| CSA研讨会-AI算法与模型快速进阶

AI深度伪造的安全隐患

联合主办| 外滩大会：以AI守护AI，大模型时代的攻守之道

CSA发布 | 零信任与AI的碰撞：全面解析影子访问风险

CAISP人工智能安全认证专家首次公开课圆满收官：学员收获满满

报名启动| CSA大中华区将组织代表出席2024联合国未来峰会

增强人工智能可靠性：关于引入大语言模型（LLM）可观察性和可信 API的简介

首个AI安全认证课程引爆关注：600+学员上课，行业专家亲授

数据泄露：应该怪谁？

报名倒计时仅剩3天！AI安全首期公开课将于本周六开课！

AI的韧性与多样性

AI赋能金融，掘金未来科技新机遇

2024IEEE 未来科技峰会暨张江金融AI及CSA CXO summit@shanghai将在上海开幕

CAISP人工智能安全认证专家课程介绍

CSA大中华区出席中科大校友大会，探讨云安全到数字安全的国际实践

CSA大中华区出席世界人工智能大会

人工智能安全认证专家CAISP 8月正式上线！首期公开课开始报名!

被⽹络罪犯利⽤的5⼤ChatGPT越狱提⽰

云渗透实战手册：云API攻防之云服务端点侦查

全球视角下的AI安全挑战：面向未来的准备

《欧盟人工智能法案》引入独特的分级风险体系

成员动态 | 祝贺明焰安全、云科安信加入CSA大中华区

CSA云原生研讨会在北京成功举办，行业专家共话技术发展！

CSA大中华区一行走访理事单位天融信，共促网络安全新未来

以零信任守护AI原生应用：防范LLM攻击与数据投毒

CSA大中华区出席2024人工智能治理日和峰会

6月13日| CSA云原生研讨会，应对云原生安全新挑战

2024上海“随申码”应用大赛报名ing，附大赛报名常见问题答疑

未授权访问企业环境的风险和影响

CSA研讨会将在北京召开，聚焦云原生安全技术与发展

CSA研讨会| 探索宇宙边界：航天数据的法律挑战与机遇

C3安全大会云安全论坛，探索AI如何提升云安全防护的关键技术

5月24日| CSA研讨会-太空时代的数据法律

保护Azure资源的5项最佳实践

2024西湖论剑 | CSA赋能AI引领数字安全新浪潮

为什么业务风险应该是补救措施的北极星

CSA AI Summit@RSAC 2024成功举办，发布AI系列报告

谷歌Flank潜藏3年的Github Action供应链攻击

共庆CSA成立15周年，CSA AI Summit @RSAC 2024将在旧金山举办

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉