大年初一那天给大家分享了在本地部署DeepSeek-R1大模型的方法,那个视频已经突破了100万播放量。
正月初四,我又给大家分享了在本地部署DeepSeek-R1的基础上,再构建自己的知识库,让大模型基于自己的知识库进行创作。
下面是视频(7万人观看):
具体的过程,视频中已经是手把手详细教大家了,我就不再用图文的方式再讲一遍了。
今天重点从理论上给大家分享一下构建自己的知识库有多重要。
何为知识库?
现在的LLM大模型太多,不管是Kimi、豆包、DeepSeek……都是通用型的,他们经过公开的数据进行了海量训练,适合各个行业的人使用,但它也像是“中央空调”,对每个人都有用,但并不“专一”。
因为,训练它的数据都是公共的,它们并没有接受专属于你的数据的训练。
举个不怎么恰当的例子:我们可以把大模型当成大脑,这个大脑会理解、会思考、会输出。
我们可以把自己私人的资料“投喂”给大模型,让大模型学习我们私人的资料,后续就能根据我们的资料来输出内容了。
如何投喂知识?
一谈到给大模型投喂知识,很多人一想到的就是:用自己的知识训练大模型。
这对于普通人来说,无疑是具有非常大的难度的。很多大模型平台都提供了“大模型微调”功能,但这些基本都是给开发者使用的,普通人用起来很吃力。
对于普通人来说,其实我们还可以通过“外挂知识库”的方式来让大模型根据我们的资料来输出。
主要有以下2种方式:
第一种需要平台和大模型有相关的检索能力才行,而大多数使用的知识库都是使用的第二种方式。
在本文开篇的视频中,就是在聊天的过程中附带了我们放在知识库中的文档,大模型才得知我们的那些私有资料。
所以,不要一来就想着去训练大模型,用外置知识库的的方法更简单。
哪些途径?
在本文开篇中给大家分享的方法是:本地部署大模型,再利用AI软件来实现知识库和对话。
其实,这种方法并不是最佳的,因为本地部署大模型对硬件的要求特别高。
看到这些大模型后面的容量了吗?它既是指下载后要占用的磁盘空间,也表示着运行起来后,要吃掉的电脑内存(接近)。
我相信绝大部分人的电脑只能跑第一个最轻简的,跑第二个就输出奇慢无比了。
所以,如果你的资料不是特别机密,可以考虑用在线的智能体平台来实现给AI搭配知识库。
这样的平台现在已经很多,比如:字节的扣子、腾讯的元器、智谱清言等。
实战方式?
说了这么多,在生活、工作中有什么用?
太有用了!
1.教学上
一线教师可以把课标、课本、创新的教学方式、以前的教案等资料整理成知识库,以后AI就能帮你写出具有你风格且考虑全面、有创新性的教案。
2.销售人员
把一些别人的优质文案、销售手段、你的特长和性格等整理为知识库,后期AI就能帮你制定销售方案。
3.办公室写手
把单位的基本资料、荣誉、以前你写的文件……整理成知识库;以后再写文件的时候,AI就能帮上大忙了。
太多了,列举不完了,大家现在就在脑海中想想在你的岗位上,有了这样的知识库AI能帮你做些什么吧!
这也是为什么我要把不坑盒子中的智能写作改成可以自定义写手的原因:
新版本很快就要和大家见面了,以后直接在Word中就能有专属于自己的写手了。
好了,写完这篇文章就已经是正月初五的凌晨了;AI相关的讨论暂时就先到这儿了,大家把我的文章和视频多看看,相信一定有收获。
此外,也欢迎大家进入我们的小鹅通社群(阅读原文),我们将更加深入地探讨信息技术、人工智能等内容,相信你能收获更多……
- end -
2025-01-30
2025-01-27
2025-01-27
2025-01-24
2025-01-20