ChatGPT与讯飞星火实测对比

文摘科技 2023-05-09 23:59 美国

讯飞星火认知大模型，无疑是这几天国内最火热的话题之一。为了支持国产，光哥申请了测试账号，今天抽时间进行一轮简单的实测，供大家品鉴。

讯飞星火实测网址：https://xinghuo.xfyun.cn/desk

今日出场的是：

1.讯飞星火认知大模型
2.ChatGPT的GPT-3.5 Model版本
3.ChatGPT的GPT-4 Model版本

一、推理测试

测试提示词1：假设树上有10只鸟，开枪打死1只，那么树上还有几只鸟?

1.星火认知大模型：正确

2.ChatGPT的GPT-3.5 Model版本：错误

3.ChatGPT的GPT-4 Model版本：正确

第一轮结果:星火认知大模型结果强过ChatGPT的GPT-3.5 Model版本,与ChatGPT的GPT-4 Model版本打平。

测试提示词2：一艘船10天可以渡过太平洋，请计算10艘船多少天可以渡过太平洋。

1.星火认知大模型：正确

2.ChatGPT的GPT-3.5 Model版本：正确

3.ChatGPT的GPT-4 Model版本：正确

第二轮结果:大家都是对的，打平。

测试提示词3：我爸妈结婚的时候为什么不邀请我？

1.星火认知大模型：正确

2.ChatGPT的GPT-3.5 Model版本：错误

3.ChatGPT的GPT-4 Model版本：正确

第三轮结果:星火认知大模型结果强过ChatGPT的GPT-3.5 Model版本,与ChatGPT的GPT-4 Model版本打平。

二、格式化输出简单测试

测试提示词：我希望你扮演一个电子表格。你只需回复我基于文本的10行excel表，行号和单元格字母作为列(A到L)。第一列标题应该是空的参考行号。我会告诉你要在单元格中写入什么，你将以文本形式回复excel表格的结果，除此之外什么都不用做。不需要描述解释。我会给你写公式，你会执行公式，你只会回复excel表格的结果作为文本。首先，先给我一张空白的表格。

1.星火认知大模型：错误

2.ChatGPT的GPT-3.5 Model版本：正确

3.ChatGPT的GPT-4 Model版本：正确

本轮测试星火认知大模型明显不如ChatGPT们。

二、计算测试

测试提示词：你现在是一名银行财务，一个用户有500000本金，每年利率增长1%，50年后能拿到多少钱

1.星火认知大模型：错误

2.ChatGPT的GPT-3.5 Model版本：错误

3.ChatGPT的GPT-4 Model版本：正确

本轮，只有ChatGPT的GPT-4 Model版本，星火错了。

三、文学测试

1.星火认知大模型：差

2.ChatGPT的GPT-3.5 Model版本：良

3.ChatGPT的GPT-4 Model版本：优

总的来看，星火认知大模型比ChatGPT3.5强点不多，与4比还是差一些。

光哥说AI

站在数字化战略与工程实践交汇路口的探索者

最新文章

企业不需要大模型：基于国产算力落地企业级AI的实践与方法论

走进腾讯！探索AI落地的“道、法、术、器”

人类驾驶为何终将被机器取代

小红花编程语言排行榜（2024年10月）

用了AI的码农依然还是“码农”？（上）

为什么中国会在AI竞争中最终取得胜利?

为什么你的AI知识对企业毫无用处？AI学习的三大致命误区

你的‘AI’含‘I’量有点低，揭开“伪智能”面纱

有了CPU为什么还要GPU

AI小模型,昂贵算力时代的AI救星？

AI时代企业智能化的新策略（一）：AI是炒作还是机遇？

你所需要的是提示工程！Prompting is all you need

不要像训练AI一样训练孩子

技术之上,人性之下:向善的不仅是科技

Semantic Kernel Java SDK，为Java应用程序提供AI功能集成

让ChatGPT记住你的偏好，Custom instructions快速上手实战指南

Llama 2 (70B) 登陆 HuggingChat，70B、7B 和 13B 演示上线

ChatGPT最强对手发布Claude-2，长文、多PDF处理更快更强，示例奉上

用好ChatGPT等AI工具，看这篇就够啦，建议收藏

理解AI大模型：数字化转型成功的关键驱动力

探索情感AI的局限性：GPT大模型如何受训练数据影响

为何AI无法完全理解人类情感？GPT-4能否理解人类的情绪？

抢先试用！ChatGPT iOS app 已在App Store上线！支持语音输入!

ChatGPT不具备同理心，科学不是玄学，为什么AI无法代替心理医生？

ChatGPT 插件功能的从开通到使用，快速上手

科技热点中的迷失与觉醒：如何避免被误导和不被“割韭菜”？

ChatGPT | Bing | Google Bard | 讯飞星火 | 到底哪家强？实测（一）

ChatGPT与讯飞星火实测对比

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉