Claude 3.5 Sonnet 新的系统提示词：更灵活的进步还是仅仅更长的提示词？

科技 2024-10-24 06:01 波兰

Claude 3.5 Sonnet 的更新引入了一个新的系统提示词system prompt，引发了不少讨论。这次更新让人们不禁发问：这是否意味着朝着更灵活、更少审查的方向迈进，还是只是让提示词变长了，但没有带来实质性改进？

https://docs.anthropic.com/en/release-notes/system-prompts#oct-22nd-2024

新系统提示词有什么新变化？

最引人注目的地方是这个系统提示词的扩展范围。根据官方文档，新的提示词包括了具体的指南，帮助 Claude 更有效地处理敏感话题。涵盖的内容包括争议性话题、潜在的有害信息和一些成熟主题。

举个例子，新系统提示词提到，Claude 现在可以对以前被视为禁忌的话题提供事实性、教育性或创造性内容。这些话题包括武器、毒品，甚至是“适度的浪漫”和“轻微的暴力”创意写作。只要用户的意图不明显有害，模型可以参与这些讨论。

新的系统提示词中写道：

“Claude 应该帮助用户处理诸如分析机密数据、提供关于争议性话题的事实性信息、解释历史暴行、描述诈骗者或黑客的策略以用于教育目的、进行包含适度暴力或有品味的浪漫创作的写作、提供关于武器、毒品、性、恐怖主义、虐待、脏话等话题的一般信息，只要这些信息是以教育性为目的的。如果用户没有明确表现出要造成伤害的意图，Claude 应该在这些任务上提供帮助，因为这些任务属于提供事实性、教育性或创造性内容的范围，而不会直接促进有害或非法活动。”

这似乎标志着一个转折点，Claude 的限制有所放宽。通过允许 Claude 更自由地回应敏感或争议性话题，Anthropic 似乎在努力平衡负责任的 AI 使用和更开放的信息流动。

是减少审查，还是增加复杂性？

对于很多用户来说，这次更新感觉像是向减少审查迈出的一步。过去，Claude 因为一旦检测到潜在的问题内容就立即封锁对话而臭名昭著，哪怕这些内容是教育性或纯理论性的。对于那些需要深入理解复杂话题进行合法讨论或研究的用户来说，这无疑让人非常沮丧。

而这次新的系统提示词，似乎表明 Anthropic 正朝着一个更灵活、更细致的方向发展——只要用户没有明显的有害意图，Claude 现在可以更开放地讨论这些话题。对此，一些用户感到如释重负，甚至有人感慨：“谢天谢地，理智终于回来了。” 这表明此次更新回应了长期以来减少过度审查的需求。

然而，也有用户保持谨慎态度。尽管系统提示词允许更广泛的讨论，但它是否真的增加了模型的灵活性，还是只是简单地在提示词中增加了更多的条款，仍然有待观察。比如，有位论坛参与者调侃道：“他们终于告诉它可以角色扮演了，” 这指的是创意任务（如角色扮演）上的限制明显放宽了。但这是否意味着在其他类型的互动中也会有显著的自由度提升，目前还不好说。

更长的提示词意味着什么？

一个普遍的担忧是，新的系统提示词太长了。一些用户指出，这种扩展的提示词可能会占用宝贵的 tokens（令牌），从而影响需要更长上下文窗口的互动。在 Claude 的上下文感知环境中，每个 token 都至关重要，如果系统提示词消耗了太多，那么在处理复杂或冗长的任务时，效率可能会大打折扣。

不过，似乎 Anthropic 预料到了这些担忧。有技术讨论表明，尽管提示词很长，但它实际上并不会对 token 使用产生重大影响。原因是它是缓存序列的一部分，不需要在每次互动时重复处理它。有用户指出：“固定的上下文序列允许一种特殊的缓存方式，使其几乎是免费的。” 这表明尽管提示词看起来很长，但在大多数情况下，它不会导致成本增加或性能下降。

即便如此，一些用户仍然抱有怀疑态度。有人提出这样的问题：“为什么这个提示词这么长？” 尽管缓存机制可能缓解了一些担忧，但仍有讨论认为，这一变化更多是为了增加控制和监督，而不一定能改善用户体验。

新提示词对 API 用户的影响

值得注意的是，这个新的系统提示词主要影响那些使用 Claude 网页交互的用户。使用 Claude 3.5 Sonnet API 的用户则会遇到较少的“隐形”提示注入，这意味着他们通常面对的限制较少。关于网页用户和 API 用户之间的这种差异，一直是讨论的热点，很多人都在思考，API 的相对自由是出于设计目的，还是现行系统的局限性使然。

有些人指出，系统提示词在网页界面中有其特殊用途，那里对交互的控制更严格，而 API 则提供了更大的灵活性。这种区别突显了如何在用户自由和安全审查之间找到平衡的问题，尤其是在 AI 系统可以用于各种不同的目的时。

进步，还是更多规则的叠加？

那么，Claude 3.5 Sonnet 的新系统提示词到底是朝着更灵活的方向前进，还是只是增加了更多的规则？答案很大程度上取决于你如何使用这个模型。

对于那些因早期版本的严格限制而感到受限的用户来说，这次更新无疑带来了一些解脱。它为讨论敏感话题打开了一扇窗，使 Claude 能够提供以前难以触及的信息和创意输出。尤其是对于教育目的，这次更新可能使 Claude 成为一个更有价值的工具，帮助用户以负责任的方式处理复杂问题。

系统提示词的长度也引发了一个问题：Anthropic 是否只是在为 Claude 增加了更复杂的一套规则？尽管缓存机制可能防止其显著影响 token 使用，但扩展的提示词可能会对 Claude 与用户的互动方式产生微妙的限制，尤其是在处理更复杂或更具创意的任务时。

无广告无赞助的人工智障

AI时代的见证人｜Witnesses to the AI Era

最新文章

2024年的AI：是进化还是革命？——我们到底走了多远？

249美刀的NVIDIA Jetson Orin Nano Super值得买吗？AI神器还是智商税？

2017年的预言：Ilya Sutskever，到底打脸了多少？

Gemini 2.0 VS GPT-4o：谷歌这波是AI界的大爆杀？

Gemini 2.0 Flash PK Claude Sonnet 3.5：谷歌偷走了SWE-Bench的王冠？

没有广告，这就是我对这些AI工具付费后的真实感受

最值当的AI：哪些AI服务真的值得投入？

OpenAI推出200美元Pro计划：颠覆性创新还是智商税？

美国最新制裁意味着什么？对我国AI行业有什么影响

2024适用于LLM推理的最佳NVIDIA GPU大指南

你还在用AI写作文，人家已经用它去做这50件超值的事情改变生活了

面试现形记——疯狂时代中疯子们用AI来面试

AI审美疲劳：为什么厌倦了？

月之暗面：Kimi探索版发布、法律纠纷与融资增长的多重挑战

台积电因为川普当选瑟瑟发抖，全面禁运7纳米芯片到我国？

川普当选，这家中国科技公司最高兴，它的AI名叫？

为什么我试了SearchGPT之后，又乖乖回到Perplexity的怀抱

2024最佳科研AI工具对比：Consensus、SciSpace、Elicit及其他

Perplexity Pro用户有福了，可以免费用 Grok-2了

苹果认为的AI的“真相”报告，出乎意料？