话不多说,先上效果图:
AI一键生成简历(简历中信息为模拟生成)
一觉醒来,科技圈掀起巨浪。Sam早前释放的风声成真,OpenAI今日正式发布GPT-o1模型,在AI领域投下重磅炸弹。从各项指标来看,GPT-o1相较前代有显著提升(红色部分为o1的进步之处)。
尤其在推理、数学、编程等方面,GPT-o1的能力提升尤为明显。让我们用几个逻辑测试题来对比一下它的表现吧!
池塘取水问题
『假设有一个池塘,里面有无穷多的水。现有2个空水壶,容积分别为5升和6升。问题是如何只用这2个水壶从池塘里取得3升的水。』
GPT-4o 测试一下,回答扑街。
测试一下 GPT-o1,完美回答。
地图上色问题
地图的相邻区域不能使用同一种颜色。现在有三种颜色:红、绿、蓝。请问如何为上面这幅地图着色?
由于 GPT-o1 没法输入图片,我们用 prolog 逻辑语言描述这个「上色问题」:
以下定义了一个地图着色问题:
color(red).
color(green).
color(blue).
- :
color(B), color(C), color(D), color(E),
\+ A=B, \+ A=C, \+ A=D, \+ A=E,
\+ B=C, \+ C=D, \+ D=E.
give me solution A,B,C,D,E,给出所有可能的答案,用中文回答
答案是六组,可以用 prolog 求解。
GPT-4o 直接扑街,给出了12组,答案全错。
Claude3.5 也直接扑街,和 GPT-4o 一样,答案全错
只有 GPT-o1 能答对 4组,不过还是漏了两组答案,还需要加油呀。
一时间,AGI 降临的声音很多。但是,需要注意,这个 草莓模型只在推理,数学,编程等 GPT 传统弱项上提升比较大,对于非推理任务,还是用 GPT-4o 方便。
否则,你会得到一个又差又耗时的结果,实测让 o1 写几千字小说,效果有时候还不如 4o。
一键直出简历
再来看看编程,不要搞复杂,写个简历试试吧
GPT-4o 结果:还行,但是吧,有点丑。
o1 结果:比 4o 好看hh,审美确实提升了,但是,还是很丑。
于是,我开启了"爆肝优化模式":在群友建议下不断调整提示词生成简历。
不断调整细节,于是有了下面的简历。
群友看了反馈都不错。
提示词的复杂度不容小觑,我正在细心整理,争取尽快为大家提供一套稳定、美观、实用的提示词方案!
正如我常说:模型能力越强,提示词能发挥的潜力就越大!
大家可以先期待一波!
如果您也对这个项目感兴趣,欢迎点赞、转发、评论,让我看到大家的热情!
有需要这个的,点赞转发评论,让我看到大家的热情hh,热情越高,大家能用上的时间越短!