用GTP-4o实现Reasoning CoT

文摘   2024-09-29 20:31   北京  

OpenAI o1出来以后,其训练方式和Reasoning推理方式受到到了很多人的关注。

我利用Prompt的方式,基于4o模拟Reasoning CoT。当然泛化能力和精确度一定不如o1,对大家了解Reasoning推理,也能有一些帮助。

本文涉及到的详细测试代码和测试步骤放置于:

https://github.com/xinyuwei-david/david-share.git下的:LLM/Reasoning-CoT

本文中不再赘述代码实现。欢迎给repo点亮Star,您的点赞是作者持续创作的动力。

使用默认的AOAI 4o。连问了三次"How many 'r' letter are in the word strawberry?,答案都是错的。

我书写Reasoning CoT,并利用Streamlit发布UI,调用相同的AOAI 4o,也是问三遍问题。为了进行区分,句子稍有不同。


大魏分享
https://github.com/davidsajare/david-share.git
 最新文章