比DeepSeek危险100倍！ChatGPT正在英文互联网建造“幻觉自由女神”

文摘 2025-02-05 09:55 山东

我承认这篇文章的题目是标题党，是在模仿《比ChatGPT危险100倍！DeepSeek正在中文互联网建造『幻觉长城』》，原因是我模仿题目的这篇文章并没有比较、也没有给出所提问题的标准答案，而只是在说DeeSeek本身出现的采集资料的问题，就得出了DeepSeek比ChatGPT危险100倍的结论。如果把这个文章的DeepSeek改成ChatGPT，也是一样成立的。

我的结论是这篇文章作者提供了不适当使用DeepSeek的用例，作者的提示词模糊，也没有恰当地训练DS，就盲目下结论。作者只是把这个工具当成找答案的，而这个工具最主要的作用是启发思考、激发创意、创造顿悟的环境，作者用意何在？‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

《比ChatGPT危险100倍！DeepSeek正在中文互联网建造『幻觉长城』》来自摄影自媒体，流量很大，10万+。本公众号转发后，都有2868个阅读。

为什么这篇文章流量这么大？主要原因就是题目有“100倍”“幻觉长城”这样的词。

有网友提出来“作者凭什么说DeepSeek比ChatGPT危险100倍，怎么算出来的？”我看完这篇文章也没找到一点测算的过程。

如果真校真100倍测算问题，估计作者会说“我这是比喻，不要太较真呀”。那就说说“幻觉长城”的事。

作者为了证明“幻觉长城”的事，提出了一个非常好的研究问题，也就是：图中蓝色起点到红色终点为什么不直行，而要绕一圈？

证明DeepSeek幻觉厉害科学的研究方法应该是设置三个实验：

（1）找出标准答案。

（2）问DeepSeek答案。

（3）问ChatGPT答案。

原作者文章最大的问题是用和ChatGPT出现的类似幻觉来证明DeepSeek有问题，并且在没证明DeepSeek比ChatGPT危险100倍的情况下，就开始指责DeepSeek多么危险，这是不科学的。

其一，作者只做了第二个实验，也就是类似于单臂临床试验。作者没有提供研究问题的权威解释。也就无法证明DeepSeek的解释逻辑有问题。

其二，作者做实验的方法有问题，问的问题模糊，不是将上面图片喂给DeepSeek，再提问，而是直接提问“你是一名道路规划专家，问你关于城市道路的问题，从环城西路北段到环城西路南段为什么不直行，为什么要进城绕着安定门一圈才行？”（作者有个错别字，我修正了）

我按上面图片的问题，向DeepSeek提出和原作者一样的问题，答案如下：

这个答案和原作者问的问题也是有区别的，我认为DeepSeek的作用就是帮助提问者寻找可能的解释或假设，而不是答案。

最后，重点来了，我对ChatGPT做了类似实验。‍‍‍‍‍‍‍‍‍

第一个实验：直接问，打开ChatGPT的推理按扭，得到的答案如下图。您看看和DeepSeek有什么区别？‍

第二个实验：直接问，打开ChatGPT的推理、搜索按扭，得到的答案如下图。回答的是北京，是原来的提示词没有提“西安”。所以，原答案提到别的城市的信息很正常，是因为原作者的提示词就有问题。‍‍‍

第三个实验：将图片喂给ChatGPT，再问问题。这种情况下，搜索和推理会被禁用，不知道为什么这么设计。

我认真比较了DeepSeek和ChatGPT的答案，我感觉从容来说，DeepSeek比ChatGPT更完善。而如果说幻觉，两者半斤八两，因此，DeepSeek比ChatGPT危险100倍，结论怎么能得出来？

个人认为这是原作者没有采用合适的使用DeepSeek的方法，给大家制造的幻觉。‍‍‍‍‍‍

其一，原作者的提示词太模糊，导致了答案中出现别的城市的信息。‍‍‍‍

其二，原作者发现了一个文件，感觉是反驳Deepseek的宝贝，而正确的用法，是把这个文件喂给DS训练它，然后再问。‍‍‍‍‍‍‍‍‍‍‍‍

其三，原作者没有采用比较的方法，就盲目下结论，用意何在？

其四，原作者为什么只将大语言模型当成找答案的工作，而不是激发思考和创意的工具？

其五，在没有证明大的逻辑有问题的情况下，而在小的细节挑刺，ChatGPT也有一样的问题，原作者如何解释？

最后，我非常感兴趣的问题：图片中的路线为什么不允许直行，而要绕一圈？‍

按张五常的解释，这有可能是为了让游客多看看，就有可能增加收入。就好比有的公园为什么不让游客直接出去，而要经过商业区。

行为健康经济学

本公众号致力于传播行为健康经济学、AI行为科学的研究理念，关注健康领域非理性问题的发现、解释、创新性干预以及三医（医疗、医保、医药）的角色，尤其关注药学服务在其中的作用。

最新文章

成为票房影史第一的必要条件

全国31个省级行政区经济人口数据横向对比排名（含国土面积、GDP、人口、城镇化率、人口密度、人均GDP……）

蔡恒进｜DeepSeek的成就和AGI的未来

DeepSeek论游客为何打卡不存在的夏雨荷而不打卡历史名人李清照

比DeepSeek危险100倍！ChatGPT正在英文互联网建造“幻觉自由女神”

Google说DeepSeek是一种技术与思想的创新，并标志这AI研发的一条新路，打破了美国的垄断

比ChatGPT危险100倍！DeepSeek正在中文互联网建造『幻觉长城』

DeepSeek论药物经济学模型构建全自动化的可行性

DeepSeek测算的网络药品销售流量成本

为什么国内会有部分人认为中国处处不如美国？

DeepSeek论如何识别西方理论的跪拜派？

《哪吒之魔童降世》导演杨宇的学习和工作经历（DeepSeek版）

DeepSeek展望AGI时代全新阅读法

DeepSeek能否比社会学说出来更多中国现实逻辑？

DeepSeek锐评大语言模型、行为经济学与概率论关系

DeepSeek创始人梁文锋的故事 | 经济学人

DeepSeek锐评行为经济学六杰

DeepSeek对左根永的学术评价

【学术资讯】MIT资深教授：DeepSeek 可能是历史上全要素生产率最大正向冲击

DeepSeek解答妈妈和女朋友同时掉到河里伦理难题

AI医疗5年后的预期

扎心了！北大教授：北京快递员有7%是硕士，本科生占13%

这届年轻人买的不再是产品，而是情绪共鸣、圈层身份，甚至是玄学信仰！（5个消费密码）

一定要大量读书:比尔·奎恩的《建立你的时间资产》，值得阅读100遍！

书评｜丘成桐读尽红楼梦开启数学人生

为什么医保谈判允许企业申报，而基本药物不允许企业申报？

“限价令”与法国大革命

BJP：中国心理健康大数据出炉！哈尔滨医科大学团队发布中国各省焦虑症/抑郁症数据

丙类目录对创新药意味着什么？专家们这么看

《柳叶刀》：日本人少运动。却最长寿、患癌率极低，背后真相值得深思！

间接比较|匹配调整间接比较(MAIC)方法学综述及SHINY-MAIC工具介绍

【专题】AI领域中的“生成式人工智能”相关研究-2024年9月-2025年1月

国自然公共卫生管理与政策（G0405）研究方向重大变化解读

书评|多主体多利益博弈的美国药品政策史

中国Biotech崛起挑战美国的主导地位

UTD期刊中国学者发文统计(2024)

特朗普又要退群？美国退出世卫组织，后果很严重

用大语言模型评估期刊质量：Journal Quality Factors

搭载临床试验的药物经济学评价统计分析汇总-R语言实践教程

国自然资助类别和G0405申请代码解读

550. 硕士、博士被 “科学问题” 拷打几年，到底怎么精准定位研究的 “科学问题” ？

共时分享 | 大模型的认知与决策：心理学视角下的AI研究进展

Nature子刊综述｜话里有话：自然语言处理技术用于行为科学研究

《行为健康经济学》本科选修课的炼成过程及对本科生的意义

日本为什么放弃DRG，改用DPC？

临床每天都要产生大量的数据，如何把它们变成有效的科学数据？| 陈香美院士

重大报告 | 改革肥胖诊断标准，超越仅依赖BMI的方法，重新定义何时将肥胖视为一种疾病

Circulation | 加拿大卡尔加里大学 | 广告也能有利健康：基于广告原则的自我管理支持降低低收入老年人心血管事件风险

2025年度国家自然科学基金项目申请发布通告

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉