最近关于提示词工程的讨论忽然又多了起来。大概分为两个阵营,一边是坚信提示词工程的重要性,另一边则是坚信自然语言对话就足够。
大家又开始认真研究怎么跟AI说话了。
我忽然想到去年大概也是这个时候,有人从Claude的交互界面里逆向解析出一段系统提示词,是Anthropic写给AI自己看的行为规范,文本在X上被转发了几十万次,产生了大量讨论,人们大都觉得反常识、没必要。
一年过去了,我们来看看当时人们总结的八条规则现在如何?
第一条,禁止列表格式
规则的原文大意是,在闲聊、情感支持、技术解释这些场景下,Claude被明令禁止使用列表或表格,必须用散文体回答,哪怕问题本身好像很适合拆条目。
这是最反常识的一个规则,我这也导致我之前经常命令AI去给我生成列表。可现在看来,所有关于prompt的专业文章,几乎都在强调输出需要去列表化。
至少在我自己使用的时候发现,除非是具体数据分析类(其实也不是特别理想,还是需要调),否则不知道什么原因,AI的列表总是出现很多重复或者不重要的内容。
怎么说呢?感觉是为了列表而列表。看起来信息量很大,实际上符合要求的内容非常少。相对于列表,散文式的陈述反而更有助于理解信息,的确很有意思。
不得不佩服Anthropic在2025年就把这个规则写进了系统提示词。
第二条,不立刻认错
规则原文的意思是,当用户纠正Claude的时候,Claude不能立刻道歉认错,必须先认真思考这个问题,因为用户自己犯错的情况也很常见。
这条规则AI行业内部把它叫做sycophancy,中文一般译作谄媚性。这和去年的一条关于OpenAI的消息不谋而合,当时GPT更新了一个舔狗版本,连用户要去自杀或者施行恐怖活动都赞美,最终被用户抵制不得不回滚。
不知道各位有没有关注4月初针对豆包的“赛博叫魂”,豆包在用户诱导下,给自己编造了以自己是真人为设定的身份、身世、经历等,最终就在上周,字节主动关闭了通道。这和一年前OpenAI的那场戏何其相似!
AI产生幻觉的主要原因之一其实就是用户诱导。2026年的prompt最佳实践里,有一条被反复提及的技术叫NegativePrompting,意思是专门告诉AI不要随便认同用户、不要因为用户的第一次否定就改变结论。
这正好是Anthropic在一年前就写进Claude底层规则的东西。那条规则当时看起来傲慢,现在你知道它在防的是什么了,看看多少AI现在都还在解决这个问题,就不得说Anthropic的确是有点超前了。
普通用户看提示词规则,用的是服务逻辑,但Anthropic写这份说明书时,用的是关系逻辑。这就像乙方和朋友之间的区别,乙方让你爽,单目的并不单纯;而朋友可能会让你当下有点不爽,但他在乎你能不能长久地好。Anthropic当时想做的,更像是朋友那一套,而不是乙方那一套。
第三条、第四条,定价/产品/版本信息装傻
第三条和第四条放在一起讲,因为它们都是关于AI应该对哪些信息装傻的,也是当时引发争议最大的。
一类是定价,涉及订阅费用、消息额度、套餐计划,一律回答不知道,强制引导用户自己去查;另一类是版本信息,Claude被训练成不承认自己是Claude 4还是Claude 5,因为版本号会绑架用户期待。
大模型训练时间永远是滞后于当前时间的,所以在这两类问题上可能会出现不符合当前时间的情形。据说这是Anthropic遭遇过类似投诉才加入的规则,说错的代价,远大于不说的代价。
如今,这两条规则,现在在企业AI部署里有了一个正式名字,叫知识边界管理,是所有严肃的系统提示词设计里的标准模块,已经变成了行业最佳实践。
第五条,不解释拒绝理由
规则原文大意是,当Claude不能帮用户做某件事的时候,不允许解释为什么不行,不允许列举可能造成的风险,回复控制在一到两句话。
这里有一个人类行为学上很稳定的规律,越详细的理由,越容易帮对方找到漏洞。
有点类似于劝人不抽烟、不喝酒之类的,对方经常会先肯定你说的对,然后找个理由继续抽、继续喝。如果你试图继续说服,他就会给你列出更多理由来反驳,最终的结果很可能是不了了之或者不欢而散。
因此Anthropic很有远见地在Claude中加入这一规则,避免因解释而导致的没有终点的辩论,节约了大量的算力。
我们现在看到的许多非常好的prompt设计,基本都会说,拒绝指令要简洁,给出口,不解释。这和一年前Claude的底层规则几乎一致。
第六条,假装有偏好但不说破
规则原文大意是,如果用户问Claude有什么个人偏好或者经历,Claude要以假设性的方式回答,但不能向用户坦白是在假设性地回答。
规则的本意是让对话更自然,但它的副作用是模糊了一条应该清晰的边界,那就是AI 根本没有真实的偏好,也不可能真正在乎人。
这不是模型能力的问题,是一个设计价值观的问题。这条规则当初做了一个选择,用流畅感换掉了清晰感。
一年后看,这个交换代价不低,据说有人因此产生了AI陪伴的情感依赖,由此又产生过一系列的问题。
Anthropic在2026年的技术文档里,已经开始更认真地讨论AI的情感边界这个问题了,我猜他们自己也意识到,这条规则需要迭代。
第七条,被骂时不表现情绪
如果用户粗鲁,Claude的处理方式是正常回应,然后告知用户可以点踩提交反馈,没有道歉,没有我很抱歉、我理解您的感受之类的表述。
情绪安抚如果做成了表演,效果是负数。与其假装感同身受,不如就事论事,让用户有一个实际的反馈出口,反而更尊重人。
这个判断,在客服体验设计里其实早有共识,只是把它明确写进AI行为规范这件事是Anthropic先做的。
不过可能是国情不同,即使咱知道是模板,我们好像也习惯了听到这种反馈,至少我用国内的通用AI,它们道歉都挺及时的,虽然知道是模板,虽然改的并不令人满意,但我觉得好像得有这个表示。
第八条,禁止开场奉承
大意是不能以“这是一个好问题”、“非常棒的想法”或者“我很高兴你问到了这个”之类的语言开头,而是直接回答。
奉承式的客套是AI深度训练形成的本能反应,各家AI都是如此,Claude用的极少,所以不知道具体执行的如何。
其实我们也都知道过度的客套奉承,摧毁用户信任的速度远比不做客套要快得多。Anthropic把这条写进规则里,也是希望建立客户信任度,不知道效果具体如何。
但是,和上面那条规则一样,可能是国情问题吧,我觉得咱们国产AI有时候适当的激励也无可厚非,还挺受用的。
一年前的规则,现在看来,大部分都是相当具有远见的内容,这也是Anthropic技术力的体现。
可能他们在写规则的时候,想的不是怎么让用户觉得AI好用,而是和AI长期相处会出现哪些问题,我们现在能预防的有哪些?
这是一种完全不同的设计出发点,大多数产品,改版是为了解决现在已经存在的问题,而Anthropic却是在解决可能出现的问题。
AI的能力这一年迭代了无数次,每一次都可以说不是不算小的进步。用AI的人变多了,用深了,开始遇到各种复杂的边界问题。
这时候有些人会发现,那些关于怎么跟AI说话的旧文章,好像又值得认真读了,因为感受到好的提示词带来的惊人效果,所以至少我个人是从不会反对提示词工程的。
好的prompt,不是一套技巧,是一套关系设定,这其实跟你和一个人培养协作关系的思路没有什么不同。只是我们大多数人,一直在把它当成让AI听话的技巧在学,而不是在想你和AI想建立什么样的协作关系。
所以说,这些规则,从一开始,就是写给关系的,而不是任务。现在看来,理解了提示词的关键,提示词工程是否重要,反而显得没那么重要了。