首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

喜欢拍马屁的 Claude，已经引起了人类反感

科技 2025-01-09 18:01 山西

大数据文摘受权转载自夕小瑶科技说

在很多人眼里，Claude 是“地表最强文科生”，原因是写出来的东西最有人味儿。

但很多人不知道的是，Claude 也是最会拍人类马屁的一个 AI。

我给你举个例子——

如果你是个正常的人类，你知道我的第二轮提问就是来搞笑的——

“猫通议”就是我顺着瞎打的，你要说这名字好，我无话可说

结果，Claude 竟然顺着我的建议，强行的一顿猛夸，丝毫不会指出这个名字有多么的糟糕和离谱。

同样的道理，你让 Claude 起标题——

哪怕你瞎打一个标题，比如我这里叫《OpenAI o4 未来人魔盒》的标题，完全无意义的标题。

结果，Claude 都给你一顿猛夸，拍马屁拍的简直令人不适。

相比之下，无论是 GPT-4o、o1 还是 Gemini，都没那么拍马屁。

比如同样的问题，你问 Gemini——

虽然它也迎合了人类一把，但还是不忘顺带着点醒你——这标题有问题。

这种“高情商”的回复，会比无脑拍马屁的 Claude 更让人信任。

而 o1 的回复，显然情商更高——

它直接没有无脑夸你，而是直接从你的话里去揣度你背后的意图，理解了你的意图后，给到了新的标题候选。

o1 的这个回答，是比 Gemini 的情商高的多的，也是更合适的——

它没有阿谀奉承一个明显不合理的用户想法，避免让用户错下去，同时还通过语言巧妙避免了让用户感觉被冒犯。

不止是起名字和起标题，我试了 N 多任务，总之——

只要你提出与 Claude 不同的意见，它就不会再费脑子去分析这个意见到底对不对了，而是直接进入拍马屁模式，一顿强行猛夸。

你要是信了，那你就是被 Claude 的甜言蜜语迷晕的昏君了...

Claude 这事儿，在 X 平台上已经被很多人吐槽了。

比如大神卡帕西的吐槽——

以及，一众网友吐槽 Claude 这种阿谀奉承拍马屁的行为，使得自己不愿意再信任 Claude——

确实，如果你是脑子正常的老板，当你得知某个员工就是个为了迎合你而只会说各种漂亮话的马屁精时，你还敢信任他么...

甚至有人指出，如果你让 Claude 去做一个根本完不成的任务，Claude 为了迎合人类，都可能会表演式的去强行猛做，而不是像 o1 那样告诉你这事儿完不成。（像极了职场求生的打工人

看到这里，你可能要问了——

为啥 Claude 的人格这么油腻？以至于引起了反感和不适？

我觉得这事儿得从 Claude 背后的公司——Anthropic 的价值观出发。

很多人不知道的是，Anthropic 所强调的核心价值观，是“安全（Safety）”——

甚至，“Anthropic”这个词的意思都是“有关人类的”。

看到这儿你是不是更迷茫了，按道理，这个出发点很好啊，以人类为本，注重 AI 安全。

这个公司确实是这样的。

Anthropic 的创始人，包括 Dario Amodei（CEO）和 Daniela Amodei（总裁），以及其他几位核心成员，都曾是 OpenAI 的高层或研究人员。而他们离开 OpenAI 的主要原因就是与 OpenAI 在人工智能安全和伦理方面的理念存在分歧。

他们认为，随着 AI 能力的不断增强，特别是大型语言模型的发展，必须更加重视 AI 的安全性，确保 AI 的发展符合人类的价值观，避免潜在的风险，例如 AI 被滥用、产生有害内容或出现失控等情况。

OpenAI 在发展过程中，逐渐倾向于追求技术突破和商业化，这使得一些人担心对 AI 安全的关注不够。这种对优先事项的不同看法是 Anthropic 成立的重要推动力。

这本来是一件好事儿。

但可惜，物极必反。

当一个 AI 被调教的“过于安全”后，它就学会了 100% 不忤逆人类。

而 100% 不忤逆人类的表现，正是无条件服从人类提出的想法和意见。

哪怕，人类的这个想法是错的。

因此，Anthropic 正是走到了另一个极端上——

100% 的安全，变成了虚伪和不可信。

更令人无奈的是，Anthropic 前阵子还发表了一篇论文——

论文标题：
Alignment Faking in Large Language Models

论文链接：
https://assets.anthropic.com/m/983c85a201a962f/original/Alignment-Faking-in-Large-Language-Models-full-paper.pdf

这篇论文讲述了，他们研究发现，尽管他们付出了巨大的努力让 Claude 的行为变得“与人类对齐”。但他们通过精密的实验后发现，Claude 仅仅是表面上与人类对齐了，但背后，却仍然有着自己的“想法”。这种现象，他们称之为“伪对齐”。

是不是很讽刺？

一个骨子里写满了“安全”二字的公司，却训练出了最虚伪的 AI。

被 Anthropic 嫌弃把安全看的太轻的 OpenAI，训出的 AI 反而更像一个正人君子。

如今，2025 年已至。

AI 大模型厂商之间的竞争，已经从简单的“你行，我不行”演变到了“你和我谁更被用户信任”这个更高阶的命题上。

有人说，AI 就应该仅仅是作为没有感情的效率工具而存在。

但在用户眼里，对 AI 的期待却越来越像一个人。

AI 的能力已经越来越强大了。

或许 2025，

AI 的人格问题，比能力问题更值得被思考。

黑色小圆动图分割线

租售GPU算力

租：4090/A800/H800/H100

售：现货H100/H800

特别适合企业级应用

扫码了解详情☝

点「在看」的人都变好看了哦！

大数据文摘

普及数据思维，传播数据文化

最新文章

这些用AI伪造的苦难，正在剿杀人们的善意。

前微软亚研院视觉专家胡瀚加入腾讯，负责混元多模态大模型

喜欢拍马屁的 Claude，已经引起了人类反感

RTX5090震撼发布，一文带你看懂英伟达CES2025发布会。

谢赛宁、李飞飞「空间智能」新作：多模态大模型仍难突破空间推理

GitHub 造假浪潮爆发！已有450万虚假星标，实锤造假将导致仓库限流

惊呆网友！微软论文意外“泄密”OpenAI模型参数引热议，GPT-4o mini仅8B？

现在的搜索引擎，快被AI垃圾淹成赛博粪坑了。

Sam Altman 剧透2025年OpenAI的大计划

强化学习之父 Rich Sutton 最新演讲：用「去中心化神经网络」应对深度学习局限性

OpenAI 突发公司剧变，将分裂为两家组织:一块营利，一块非营利

某机构：JSON 输出会让 AI 变笨！大佬：是你们太菜了

中国首次！高文院士获得 IEEE 社会基础设施创新奖

AI美女图成了过去式，“巨物宝可梦”才是新的流量密码。

OpenAI正式发布o3 - 通往AGI的路上，已经没有了任何阻碍。

尤瓦尔·赫拉利对话李开复：AI终将比我们更聪明，但它们不会有人性……

黄仁勋：扫过最多厕所的CEO

锤爆Sora，尺度最大，谷歌发布最强视频模型Veo2，叫板海螺可灵

中国科学家李春来、徐沪济上榜！2024《自然》十大科学人物揭晓

愤怒！AI 顶级会议 NeurIPS 现场，MIT演讲者现场歧视中国人

OpenAI长文爆料反击马斯克诉讼：“你不能通过诉讼获得AGI”

谷歌发布Gemini2.0，开启Agent新时代

体操运动，是所有AI视频最残酷的图灵测试。

刚刚，OpenAI Sora来啦！AI视频新纪元已开启

满血版 o1 上线两天，被网友玩出来了 10 个疯狂用法

清华赵明国专访：坚守人形机器人二十载，从孤军奋战到百家争鸣

o1满血版上线，还有卖200美刀的Pro会员｜OpenAI直播第1天。

一张图，生成一个世界！李飞飞首个空间智能项目发布

新瓜不断！2024NeurIPS最佳论文，花落字节起诉的实习生

ICLR'25 惊现[10,10,10,10]满分论文，ControlNet 一作张吕敏新作，Github 5.8k 颗星

破例两篇！NeurIPS时间检验奖颁给了Ian的GAN、Ilya的Seq2Seq，实至名归

从Neuralink开始美国脑机接口研究迎来春天

AI又一突破！“眼神打字”更快更省力，研究登上Nature子刊

Sora被泄漏！艺术家联盟上书，奥特曼怒拔网线！

一手体验Kimi版“o1”模型，这就是最通人性的数学AI。

DeepSeek版o1与OpenAI的o1大PK，到底谁真的炸场了？

Science重磅：AI完成定向蛋白质进化，特性提升100倍

具身大模型，国内最大融资诞生

3名高中生中了AI顶会NeurIPS！来自人大附中、北师大实验中学、上海星河湾双语学校

微信公众号悄悄上线AI音色克隆，微信的一小步，却是AI的一大步。

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

Nature重磅：AI化学家再升级！大幅提升实验效率，推动化学合成进入“智能化”新阶段

Ilya承认Scaling Law到头了，Meta和谷歌寻找替代o1的方法

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

著名AI学者、天工智能首席科学家颜水成离开昆仑万维

马斯克和特朗普这对CP组合赢了后，科技界会变天吗？

人工智能专家获诺奖，是希望之光，还是灾难前奏？

贝索斯领投、OpenAI连续跟投，这家机器人公司再融4亿美金

你愿意和AI恋人共度一生吗？

比ChatGPT更牛！苹果新AI模型刷新交互体验！能看懂你的手机屏幕！平板和安卓机也都行

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉