OpenAI o1出来以后,其训练方式和Reasoning推理方式受到到了很多人的关注。
我利用Prompt的方式,基于4o模拟Reasoning CoT。当然泛化能力和精确度一定不如o1,对大家了解Reasoning推理,也能有一些帮助。
本文涉及到的详细测试代码和测试步骤放置于:
https://github.com/xinyuwei-david/david-share.git下的:LLM/Reasoning-CoT,
本文中不再赘述代码实现。欢迎给repo点亮Star,您的点赞是作者持续创作的动力。
使用默认的AOAI 4o。连问了三次"How many 'r' letter are in the word strawberry?,答案都是错的。
我书写Reasoning CoT,并利用Streamlit发布UI,调用相同的AOAI 4o,也是问三遍问题。为了进行区分,句子稍有不同。