AI提供商面临着双重责任,既要确保其系统的安全性,又要保护用户隐私。
Key Takeaways:
Anthropic 在北京时间12月13日发布最新研究,推出clio工具探索AI安全使用,其中一个突出特点是其隐私保护分析能力,确保了在深入了解AI使用模式的同时,用户的隐私能够得到保障。
Anthropic使用Clio分析了100万次用户与Claude的对话,发现使用Claude编程的用户占比很高,教育方面(涵盖数据分析、材料撰写等)也非常显著;其他还有许多非常有意思类似于解梦、预判足球比赛的问答。
Clio在促进AI开发者的透明性和责任感方面也起着至关重要的作用,通过公开讨论Clio的开发方法和实施过程,企业能够推动道德AI开发的规范。
尽管Clio是一个重要的进展,但它并不是最终的产品。该工具仍在持续开发中,正在进行改进,以提高其准确性和效果。
总的来说,Clio代表了向更安全、更道德的AI系统迈出的重要一步。通过实现隐私保护的现实世界AI使用分析,Clio为识别和缓解风险提供了有效的机制,同时保护了用户隐私,其持续的开发和透明的方法为未来AI系统的负责任建设设立了强有力的先例。
Clio为AI安全与隐私能够并行存在提供了希望,表明这两个目标可以在人工智能领域内共存并相辅相成。
为什么要推出Clio?
因为大语言模型能做的事情规模和种类非常庞大及复杂,理解其用途,进行全面的安全监控,是非常困难的事情……
出于安全性、好奇心、以及预测技术发展方向、未来如何更好管控AI,Anthropic进行了一次深度研究。
为了在严格保持用户隐私的前提下,研究和观察系统是如何被使用Anthropic推出了Claude洞察与观察工具(Clio)。
Clio是一种自动化分析工具,它能在保护隐私的前提下分析真实世界中的语言模型使用情况。
它让管理开发团队能够像使用Google Trends一样,洞察用户日常使用claude.ai的情况,同时也帮助改进安全措施。
Clio工作原理:大规模隐私保护分析
Clio的工作原理是获取真实世界的对话,在删除识别信息的同时对其进行总结,并将这些摘要聚类以揭示汇总的见解。
并且他们承诺,这个过程在一个安全的环境中进行——只有最终的、高层次的见解对人类分析人员是可见的。
提取facets:对于每一段对话,Clio会提取多个“facets”——这些是具体的属性或元数据,例如对话主题、对话回合数或使用的语言等。
语义聚类:相似的对话会根据主题或大致内容自动归类。
聚类描述:每个聚类会得到一个描述性标题和摘要,捕捉原始数据中的共性主题,同时排除私人信息。
建立层次结构:聚类会按层次结构组织,方便进一步探索。最终,分析师可以通过交互式界面,按主题、语言等维度探索不同的模式。
研究揭示:大家都在用Claude做什么?
这次研究,Anthropic使用Clio分析了100万次用户与Claude的对话(涵盖免费和专业版用户),以识别人们使用Claude的主要任务。
结果显示,编程相关的任务占据了显著比例:“Web和移动应用开发”类别的对话占比超过10%。
软件开发人员使用Claude执行从调试代码到解释Git操作和概念等任务。
教育也是排行也很高的类别,超过7%的对话集中在教学与学习方面。
大比例的对话(接近6%)涉及商业战略和运营,包括撰写专业沟通文稿和分析商业数据等任务。
Clio还识别出了成千上万个较小的对话群体,展示了Claude多样化的使用场景。
包括:
解梦
足球比赛分析
灾难准备
猜字谜提示
“龙与地下城”游戏
计算“草莓”一词中的字母“r”数量
除此之外,Claude的使用在不同语言之间也呈现出显著差异,反映了不同文化背景和需求的差异。
此次研究计算了每种语言在整体对话中的出现频率,并由此识别出一些特定语言在某些话题上的频繁出现,其中就包含中文,占比非常高。
是如何通过Clio改善安全系统的?
资料来源:https://www.anthropic.com/research/clio