免费AI大模型，可用靠整合

文化历史 2024-06-19 23:03 广东

用程序读历史，以数据讲故事。

打从上月开始、国内大模型厂商纷纷开「卷」，像是百度、腾讯、讯飞，直接把基础模型调用费用给免了，一脚踹开开发者0成本接入AI大模型的门。总是有人担心黄皮衣家芯片禁售会让咱们错过AI工业革命的车，可是啊、引爆工业革命的是工具嘛？分明是无数创造者在一个庞大市场中激发出的巨大需求好嘛……

「免费」，但不「省心」

大模型的调用费虽然是给免了，可毕竟咱们还没进入共产主义，对免费的东西没法过于苛求。像是百度千帆的ERNIE-Speed-128K模型，只支持同步接口调用，一次调用大概要10多秒才能返回：

百度千帆 ▼

再看一下腾讯混元、只支持5个并发的请求：

腾讯混元 ▼

免费模型第一个不省心的地方：给的资源少，体现到使用上就是响应慢、并且是越多人用越慢。

当然，为提高并发数可以把免费大模型们给团一团，不同模型轮着用，这就带来了另一个问题，每家有每家的接口风格，比如百度家是直接HTTP接口、腾讯家给封装了个SDK、都是同步调用，讯飞这边则是来了个WebSocket异步返回：

讯飞星火 ▼

所以既然选择了免费、总归是省心不了的，要达到可用状态还是需要做一点点的二次封装。

对大模型的二次封装

第一步，统一接口：

百度、腾讯是同步接口、讯飞是异步接口，从技术上来说既可以选择把他们都封装为同步的、也可以都是异步的。考虑到这些免费模型可用计算资源有限、响应都比较慢，统一封装为异步接口会是一个比较合理的选择，这样可以避免在多人并发请求的情况下挂住大量服务器资源。

至于说怎么把同步接口封装为异步接口，可以参考一下WebSocket的调用代码：

WebSocketClient webSocketClient = new WebSocketClient(uri) {    @Override    public void onOpen(ServerHandshake serverHandshake) {       ...    }
    @Override    public void onMessage(String s) {      ...    }
    @Override    public void onClose(int i, String s, boolean b) {      ...    }
    @Override    public void onError(Exception e) {        ...    }};webSocketClient.connect();

像上面这些onXXX的方法就是对应WebSocket连接建立、有数据、

或是断开等情况下程序的处理逻辑。简单来说，异步就像是去吃饭拿号（webSocketClient.connect()），拿完号后可以该干嘛、干嘛去，等着叫号（onMessage）就行了。

所以这里就要统一这个拿号、叫号的过程，比如定义下面这样的一个回调接口：

public interface AiCallback {    public void onAnswered(String answer);}

原本大模型的调用还是该咋写咋写，只是在有结果了后通过该接口来通知回调用者：

异步回调 ▼

第二步，整合大模型

接口统一后，这样甭管使用哪个大模型，或者后续再添加新的大模型就都简单了，每次只需要随机选择一个来提问就好了：

随机选择大模型 ▼

第三步，完成整合

前面的第一步其实只是实现了叫号逻辑，并没有取号的部分，这里可以通过Redis的List结构实现一个轻量级的异步队列：

完整流程 ▼

先看向右侧、当用户发出提问的时候把提问的问题从右侧塞入List中（rpush），然后马上返回一个号码给到用户，说你可以用这个号来问，是不是轮到你了
再看List的左侧，有一个进程（ExecutorService）一直等着接单（blpop），接到后就传给处理的进程（ExecutorService）进行大模型提问
提问的处理进程对大模型来个抽卡，抽中了谁就向谁提问，拿到结果后存储到Redis里等待用户来查询
最后用户在某一次询问后终于得到了提问的结果

来看一下最终的集成效果（先忽略这粗糙的界面）：

也算是AI原生应用吧 ▼

让我知道你“在看”

陈勇

上下千年时空历史地图、生动有趣的博物馆导览、新奇好玩的历史书籍推荐，最后，无聊的时候还能刷刷历史剧、说一说历史游戏。

最新文章

《瓦尔特保卫萨拉热窝》：经典就是，今天你还时常能见到他的影子

多侧面了解奥斯曼历史文化，顺带提升英语听力

《奥斯曼帝国六百年》：找到了！现代欧洲与中世纪的接缝处

「切」线段

一周考古新闻（2024.07.28-2024.08.03）

《德国人》：喔，时间线版“神圣罗马帝国”史

刷完1600座哥特式教堂！没有「松驰感」……

《欧洲之心》：读史何必纠结于顺序

作正方形

一周考古新闻（2024.07.21-2024.07.27）

《十二猴子》：这，也是历史的一部分

「数字人文学科」学什么？现在历史系大学生都这么卷的嘛

《流行病与社会》：在不断地无序尝试中寻找一切可能

基于面积的作图（二）

一周考古新闻（2024.07.14-2024.07.20）

《勇敢的心》：为“阿布罗斯宣言”补个课

关于史料「数字化」，这里有一份不错的作业

《凯列班与女巫》：马克思说的也不全对

基于面积的作图（一）

一周考古新闻（2024.07.07-2024.07.13）

《年轻的维多利亚》：历史含量过低、风月严重超标

一步步完成「世界海洋气候数据库」可视化

《现代欧洲200年》：或许，这才是一切的开始

当把多边形放置在同样的底边上发现了什么

一周考古新闻（2024.06.30-2024.07.06）

《人民领袖毛泽东》：人民需要英雄

航海日志里的殖民史

《银、剑、石》：文明？或许并非人类发展的必经之路

平行线之间的研究

一周考古新闻（2024.06.23-2024.06.29）

《国家宝藏》：4年！终于等来了他的回归

要深入了解一个时代，那就去读他的报纸吧

《大清为何轰然倒塌》：包顿饺子就为这碟醋

从平行线到平行四边形

一周考古新闻（2024.06.16-2024.06.22）

《大宅门》：嗯，表情管理

免费AI大模型，可用靠整合

《采桑子》：落魄旗人的幸福生活

作平行线

一周考古新闻（2024.06.09-2024.06.15）

《茶馆》：没人比老舍更懂「底层」

晚清民国老照片哪儿找？

《月牙儿；断魂枪》：经典之所以为经典

平行线与角

一周考古新闻（2024.06.02-2024.06.08）

《精武英雄》：再读袁八爷的动作语言

叮！现在支持选择「生态区域」底图啦

《借势》：中华自古文武成一脉

终于，来到了三角形命题「完结篇」

一周考古新闻（2024.05.26-2024.06.01）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉