平替ChatGPT的基础大模型来了,遥遥领先的国货之光

文摘   2025-01-20 21:01   四川  

从2023年起,AI发展,进入了群雄争霸时代,开始是大漂亮国在人工智能领域的一骑绝尘,遥遥领先,一个ChatGPT,让其他对手找不到北,关键是其他对手也都是大漂亮国的人工智能产品。

2024年一开年,OpenAI更是放出了Sora这个号称世界模拟器的王炸,更是技惊四座。那时候的中国人工智能在哪儿?

是输入“请为我画出车水马龙景象”,结果就真的画出了汽车、水流、骏马和龙的“文心一言”?

是被OpenAI全球通报并被查封API接口,利用ChatGPT-4.0来训练自家大模型Coze(豆包大模型的前身)?

是顶着清华美院硕士,在网络上卖课卖得大红大紫,与山姆奥特曼齐名的“中国AI巨头”李一舟老师?

是在GitHub上扒取免费源代码,魔改换壳后充作自研AI工具的国内大大小小199包年、399包断的写作、绘图工具?

全世界都知道人工智能引领新一轮工业革命,掉队就意味着挨打,在人工智能核心算法以及与算力休戚相关的高端CUDA显卡上,漂亮国绝对是严防死守,国人都在为我们的将来捏一把汗。

老人家曾讲,世界上最怕就是“认真”二字,事实证明中国人的智慧绝对是不容小觑的,我们只要重视,只要认真起来,真的是“人的胆量决定地的产量”。经过2024年一年的努力,中国人工智能技术和产品奋起直追,大放异彩,像在AI视频生成领域,我们的可灵AI、海螺AI在国际上受到追捧,让2024年末正式推出的Sora黯淡无光;国内豆包、文小言(原文心一言)等AI工具也搞得风声水起,功能大家还没用熟练,升级版的又来了,这让我们中国玩家高兴坏了。只是大家心里有点小小的遗憾,在基础层面的大语言模型(LLM)上,我们始终没有能拿得出手的国货产品与ChatGPT、Claude、Gemini相抗衡。    

这一切在2024年年末,DeepSeek-V3横空出世后,有了根本性改变。

DeepSeek-V3在全网掀起巨大风暴,这个开源模型仅凭671B参数,37B 活跃 MoE就能与3.5 Sonnet 和 4o 相当!

DeepSeek-V3用最小的算力,达到了头部AI模型的推理效果。在生成速度方面相比V2.5提升了3倍,从 20TPS 提升至惊人的 60TPS。实测回复速度极快,根据幻方提供的介绍来看,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。

   

DeepSeek还是全球领先的前沿模型中,唯一一家没有庞大科技巨头资源的公司,甚至这个模型的背后不是什么专业的科技公司,而是一家叫做幻方的量化私募基金。DeepSeek在大多数基准测试中都比ChatGPT-4o表现更好,但价格却只有4o的10%,这就意味着新一轮的AI价格战再次产生,靠着烧钱AI企业必将消失一大波。

现在,大家也可以按照我的方式来体验一下这款国货之光AI基础模型的魅力。

打开DeepSeek官网,网址:https://www.deepseek.com/

我们如果只是免费使用选择开始对话即可,如果需要将DeepSeek接入自己的网页、公众号、小程序,则需要选择接入API,虽然收费,但相比ChatGPT-4o这些算是白菜价了。

注册DeepSeek。    

DeepSeek支持上传文档、图片、网址,用户可以通过联网查询和深度思考让AI解决复杂的逻辑推理问题。

当然我们也可以通过各大手机应用商城下载DeepSeek的APP。    

         

 

   

现在还有不少不会科学联网使用ChatGPT-4o、Claude3.5的朋友,他们也有使用高水平基础大模型的需求,DeepSeek-V3有效填补了这一空白,不但好,还免费,完全是ChatGPT的最佳替代品。    

         

 

最全AI工具,更多AI变现项目,请关注公众号:AI资本家    

AI资本家
他们说关注这个号的人,都在偷偷用AI创意创作、搞钱搞流量、上班摸鱼、写论文、降本增效…… 所以,切记:千万别向同行、同事、同学、老板推荐!
 最新文章