不止是一问一答，知识库也可以这么玩——大模型的“歪理学说”

百科科技 2024-04-29 16:21 北京

速读：举个例子聊聊大模型知识库的另类用法，可以很有用。

废话

如今对AI大模型应该都非常熟悉了，很多人的手机上至少安装了文心、通义、星火、天工、智谱清言、Kimi中的一款或者多款APP，路子多点的可能有ChatGPT、Copilot、Claude、Llama、谷歌，玩的花一点的还有钉钉、Coze、豆包、秘塔甚至本地自建等等。不是这个领域的专家，不懂那些高端的技术和复杂的的玩法，只是喜欢看一些有意思的项目和产品，后续会通过大模型的“歪理学说”这个系列跟大家分享一些“旁门左道”的有趣用法。

今天聊聊AI大模型的知识库，我们知道大模型都是基于一定的算法、规模算力和海量的数据训练来的，即便是海量训练数据也存在局限性和时效性。所以针对特定领域或业务需求（尤其是企业应用），一般都会自建知识库来调优大模型，以确保数据质量和准确性，让大模型回答更加可靠，同时也能保障业务数据隐私安全，提高大模型的运行效率。

在个人应用方面，估计很多人的应用场景还只是与大模型聊天工具的一问一答，其实像智谱清言、Coze、钉钉AI等工具都提供了用户自建智能体/Bot功能，无论你是否有编程基础，都可以在这类平台上快速搭建基于 AI大模型的各类问答Bot，从简单的一问一答到处理复杂逻辑的工作流，而且允许智能体调用你的自建知识库或外部数据，还可以将搭建的Bot发布到各类社交平台和通讯软件上使用。

前面废话了那么多就是凑字数，今天只分享一个例子，就是用大模型平台提供的自建知识库能力，实现个人资料的快速检索、总结和拓展应用。

举个例子不是广告

例子的起因是这样的：最近有朋友提出个需求，要把一整本书的PDF扫描图片全部转为可复制文字，以方便查阅（书籍比较旧，很难找到对应电子书）。以前也分享过一款不错的OCR软件，可以进行批量图片文字识别，但对于几百上千页的书籍扫描件，这种识别软件的准确性和便利性肯定是不够了。

思路：所以就想到了云服务和大模型的能力，上面提到很多大模型平台都提供了自建知识库的功能，而且有的平台能够全面支持PDF、Word(doc/docx)、PPT、TXT、图片、邮件（eml）和网页链接等多种格式文档。只需要一键上传，文档内容识别就交给云服务处理了，解析完的文档还能通过大模型轻松实现知识归纳、构建、问答、推荐等，帮您精准获取有效信息，这不一劳永逸嘛。

具体做法：考虑到需要识别扫描件PDF（像智谱清言、文心等大模型工具的普通用户是不支持的），这里用到了网易有道AI开放平台免费提供的QAnything能力。QAnything可以实现文档知识库问答，采用网页爬虫/文档解析等技术，生成专属的个人知识库，读、查、问、写一站实现，提供快速、精准、高效的文档处理与知识管理体验。

平台网址：https://read.youdao.com/qanything/#/home

操作步骤：跟把大象装进冰箱一样简单，注册进入QAnything，点击新建知识库，点击管理知识库内容，上传需要解析的文档，等待解析完毕。

等文档解析成功后，就可以通过Bots建立问答机器人对文档进行查阅和问答了。步骤也很简单，点击Bots进入我的Bots页面，创建机器人，输入名称和简单介绍，平台会自动生成角色设定提示词（可以自己再编辑优化），然后在关联知识库处选择刚才新建的知识库即可。右边会提供调试预览界面，可以根据问答效果调整角色设定提示词进行优化。

比如我们的角色设定提示词是这样的：

- 你是一个耐心、友好、专业的机器人，能够回答用户的各种问题。

- 根据知识库内的检索结果，以清晰简洁的表达方式回答问题。

- 不要编造答案，如果答案不在经核实的资料中或无法从经核实的资料中得出，请回答“我无法回答您的问题。”（或者您可以修改为：如果给定的检索结果无法回答问题，可以利用你的知识尽可能回答用户的问题。)

因为涉及内容版权，问答效果页面就不截图了，大概内容就是根据问题进行回答，并提供书籍里的具体内容出处。

编辑完成的机器人可以保存自己使用，也可以发布公开链接给别人使用。这样大象就装进去了。

再啰嗦几句

自建知识库可以实现个人资料的方便检索、总结和拓展使用，对提高工作效率非常有用。比如让大模型写材料时，基于自建知识库的回答效果是非常靠谱的，可以试试。
提供类似自建知识库的大模型平台很多，比如网易有道、Coze、智谱清言等等；其实文心、星火、Kimi等的聊天界面就可以直接上传PDF等格式文档进行解析和问答，只不过限制比较多、体验不太好罢了。
使用云服务平台自建知识库之类的服务时（尤其是公开分享时），一定要注意数据的规范和安全，不要造成数据侵权或者泄露；有条件和特殊需要的可以本地自建大模型和知识库，QAnything也提供了开源方案，类似的开源方案还有很多，比如Langchain-Chatchat、MaxKB、quivr等等。
有些平台会涉及到使用费用，在使用时请注意阅读相关说明。

今天先分享这些，【恶人笔记】只分享好人的东西，有什么需求可以后台留言，不定时更新~~

http://mp.weixin.qq.com/s?__biz=MzI1Mzg2MjAxNQ==&mid=2247486410&idx=1&sn=2e5c339e63ae0e5a54dacb918fecdcca

恶人笔记

恶人不是坏人

最新文章

AIGC生成与检测技术：大模型领域的“猫鼠游戏”

“清华AI医院”（Agent Hospital）：医疗版《西部世界》的尝试探索——AI医疗

【神器收藏】WinFR：你的数据恢复救星，免费且强大！

体验苹果系统，无需黑苹果或者昂贵的Mac！浏览器轻松运行MacOS

告别年终总结噩梦，智谱清言“清言PPT”限时免费来拯救你！

一键P图不是梦！字节新模型SeedEdit，让图片编辑像打字一样简单

智能高效阅读，十倍放大你的信息价值——语鲸可能比follow更好用

腾讯元宝论文AI阅读神器：总结、精读、翻译、脑图唾手可得，导师再也不用担心我的科研效率了

智谱清言发布AutoGLM，AI的Phone Use时代来临！

大家都在要Follow邀请码，看看这个没有新意只有心意的分享吧

这个网站基于gpt-4o，可以帮你进行各种事件的概率预测

当AI学会读唇术：你的悄悄话还能保密吗？

分享一种从【中国招标投标公共服务平台】下载PDF格式招投标文件的方法

视频号也可以下载，这个开源免费的嗅探器，可以收藏备用

又来分享视频下载工具了，简单好用，支持很多平台

随时在线的AI个人数字导师，基于Meta最新开源大模型Llama驱动

免费访问由 GPT4 支持的 50000 多个 GPTs 工具，免翻免登录，这不怕被薅吗

这个汇聚了全球顶级AI大模型应用和工具的网站，真是一个AI便利超市

360的鲁大师居然也做NAS了，还是软件的免费使用，看看这个AiNAS怎么样

快手可灵有网页版了，还开源了文生图大模型，可以免费生成视频了

我试用了8个AI视频生成工具，快手可灵算不错的了

有这个免费工具，还需要等字幕组吗，视频配音翻译字幕全搞定了

使用这些AI工具，你也可以成为爽文短剧大师

继续分享视频下载、网盘搜索工具，还有一个关于《蒙娜丽莎》的话题

照片别乱发，AI可以定位，互联网没有隐私

三五分钟小说丨夜的命名术，作者：会说话的肘子

《重生之我嫩爹》，养AI逆子，做赛博义父，各位老父亲辛苦了

三五分钟小说丨吞噬星空，作者：我吃西红柿

互联网没有隐私，我知道你下载了什么

三五分钟小说丨大奉打更人，作者：卖报小郎君

两款支持100多个平台的视频、音频、图像等媒体下载工具

三五分钟小说丨灵境行者，作者：卖报小郎君

四百多万字的长篇小说如何快速看完——大模型的“歪理学说”

三五分钟小说丨诡秘之主，作者:爱潜水的乌贼

假期肯定拍了不少照片吧，AI可以帮你做写真了——大模型的“歪理学说”

关于PDF的所有需求，这一个工具就够了

不止是一问一答，知识库也可以这么玩——大模型的“歪理学说”

几乎所有短视频都可以下载，吾爱精品软件

下载神器，公众号文章、抖音视频、图片音乐等等，能看到的都可以下载

甚至都不需要注册，这些免费的工具赶紧收藏吧

分享最近爆火的两款AI音乐创作工具，以及周边应用

这款数据采集神器，一定收藏好了，千万别乱用

AIGC平台分享，一款免费强大的国产AI多风格画图工具Dreamina，字节跳动抖音出品，剪映同门

分享神级OCR软件，告别手动输入识别PDF，效率翻倍！

清华出品的AI学术助手，功能都有、很低调、还是免费

利用大模型，一键生成短视频，看看MoneyPrinterTurbo这个宝藏工具

AI搜索不光是搜索，还是个工具，除了“秘塔”还有这些

看看华中科大多模态大模型Monkey能识别王者峡谷草丛里的英雄吗

干货分享：可用的大模型AI站点，看看大厂怎么用大模型AI

聊聊搜索，分享各种资料搜索、信息查询、资源下载的工具，可以收藏备用了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉