Claude 3.5 Sonnet 的更新引入了一个新的系统提示词system prompt,引发了不少讨论。这次更新让人们不禁发问:这是否意味着朝着更灵活、更少审查的方向迈进,还是只是让提示词变长了,但没有带来实质性改进?
https://docs.anthropic.com/en/release-notes/system-prompts#oct-22nd-2024
新系统提示词有什么新变化?
最引人注目的地方是这个系统提示词的扩展范围。根据官方文档,新的提示词包括了具体的指南,帮助 Claude 更有效地处理敏感话题。涵盖的内容包括争议性话题、潜在的有害信息和一些成熟主题。
举个例子,新系统提示词提到,Claude 现在可以对以前被视为禁忌的话题提供事实性、教育性或创造性内容。这些话题包括武器、毒品,甚至是“适度的浪漫”和“轻微的暴力”创意写作。只要用户的意图不明显有害,模型可以参与这些讨论。
新的系统提示词中写道:
“Claude 应该帮助用户处理诸如分析机密数据、提供关于争议性话题的事实性信息、解释历史暴行、描述诈骗者或黑客的策略以用于教育目的、进行包含适度暴力或有品味的浪漫创作的写作、提供关于武器、毒品、性、恐怖主义、虐待、脏话等话题的一般信息,只要这些信息是以教育性为目的的。如果用户没有明确表现出要造成伤害的意图,Claude 应该在这些任务上提供帮助,因为这些任务属于提供事实性、教育性或创造性内容的范围,而不会直接促进有害或非法活动。”
这似乎标志着一个转折点,Claude 的限制有所放宽。通过允许 Claude 更自由地回应敏感或争议性话题,Anthropic 似乎在努力平衡负责任的 AI 使用和更开放的信息流动。
是减少审查,还是增加复杂性?
对于很多用户来说,这次更新感觉像是向减少审查迈出的一步。过去,Claude 因为一旦检测到潜在的问题内容就立即封锁对话而臭名昭著,哪怕这些内容是教育性或纯理论性的。对于那些需要深入理解复杂话题进行合法讨论或研究的用户来说,这无疑让人非常沮丧。
而这次新的系统提示词,似乎表明 Anthropic 正朝着一个更灵活、更细致的方向发展——只要用户没有明显的有害意图,Claude 现在可以更开放地讨论这些话题。对此,一些用户感到如释重负,甚至有人感慨:“谢天谢地,理智终于回来了。” 这表明此次更新回应了长期以来减少过度审查的需求。
然而,也有用户保持谨慎态度。尽管系统提示词允许更广泛的讨论,但它是否真的增加了模型的灵活性,还是只是简单地在提示词中增加了更多的条款,仍然有待观察。比如,有位论坛参与者调侃道:“他们终于告诉它可以角色扮演了,” 这指的是创意任务(如角色扮演)上的限制明显放宽了。但这是否意味着在其他类型的互动中也会有显著的自由度提升,目前还不好说。
更长的提示词意味着什么?
一个普遍的担忧是,新的系统提示词太长了。一些用户指出,这种扩展的提示词可能会占用宝贵的 tokens(令牌),从而影响需要更长上下文窗口的互动。在 Claude 的上下文感知环境中,每个 token 都至关重要,如果系统提示词消耗了太多,那么在处理复杂或冗长的任务时,效率可能会大打折扣。
不过,似乎 Anthropic 预料到了这些担忧。有技术讨论表明,尽管提示词很长,但它实际上并不会对 token 使用产生重大影响。原因是它是缓存序列的一部分,不需要在每次互动时重复处理它。有用户指出:“固定的上下文序列允许一种特殊的缓存方式,使其几乎是免费的。” 这表明尽管提示词看起来很长,但在大多数情况下,它不会导致成本增加或性能下降。
即便如此,一些用户仍然抱有怀疑态度。有人提出这样的问题:“为什么这个提示词这么长?” 尽管缓存机制可能缓解了一些担忧,但仍有讨论认为,这一变化更多是为了增加控制和监督,而不一定能改善用户体验。
新提示词对 API 用户的影响
值得注意的是,这个新的系统提示词主要影响那些使用 Claude 网页交互的用户。使用 Claude 3.5 Sonnet API 的用户则会遇到较少的“隐形”提示注入,这意味着他们通常面对的限制较少。关于网页用户和 API 用户之间的这种差异,一直是讨论的热点,很多人都在思考,API 的相对自由是出于设计目的,还是现行系统的局限性使然。
有些人指出,系统提示词在网页界面中有其特殊用途,那里对交互的控制更严格,而 API 则提供了更大的灵活性。这种区别突显了如何在用户自由和安全审查之间找到平衡的问题,尤其是在 AI 系统可以用于各种不同的目的时。
进步,还是更多规则的叠加?
那么,Claude 3.5 Sonnet 的新系统提示词到底是朝着更灵活的方向前进,还是只是增加了更多的规则?答案很大程度上取决于你如何使用这个模型。
对于那些因早期版本的严格限制而感到受限的用户来说,这次更新无疑带来了一些解脱。它为讨论敏感话题打开了一扇窗,使 Claude 能够提供以前难以触及的信息和创意输出。尤其是对于教育目的,这次更新可能使 Claude 成为一个更有价值的工具,帮助用户以负责任的方式处理复杂问题。
系统提示词的长度也引发了一个问题:Anthropic 是否只是在为 Claude 增加了更复杂的一套规则?尽管缓存机制可能防止其显著影响 token 使用,但扩展的提示词可能会对 Claude 与用户的互动方式产生微妙的限制,尤其是在处理更复杂或更具创意的任务时。