一个简单免费的问答系统，人人可学。。。

科技 2024-12-04 11:10 河南

点击“终码一生”，关注，置顶公众号

每日技术干货，第一时间送达！

背景

最近不是很忙，想着做一个简单的Ai问答系统，方便自己使用的同时，也能将自己平时常遇到的问题，做一个归纳整理，当然，这些我希望最后都交给Ai，让他帮我们处理，做干就干。。。

了解了一下国内当前主流的大模型，最后选择了智谱BigModel开发平台提供的大模型。

智谱目前作为国内自研大模型的领先者，现在已经非常成熟，其中GLM-4-Plus已经达到了GPT-4，一些方面甚至已经超越。

而Api调用收费，也非常低，并且还提供了GLM-4-Flash大模型免费调用Api。

新用户注册还享有福利，赠送大额Token额度，扫码可直达BigModel开发平台：

项目搭建

这里搭建了一个简单的web项目，主要是为了方便后面对问题进行归类和统计处理，满足自己的一些特殊需求。

开发环境：JDK17

主要技术：SpringMVC、Mybatis

调用GLM-4-Flash模型 Api

模型介绍：https://bigmodel.cn/dev/howuse/glm-4
Api文档：https://bigmodel.cn/dev/api/normal-model/glm-4

BigModel开放平台的官方文档，已经非常详细，包括代码Demo，SDK，和参数信息，大家可以参考开发文档，自己调试。本次开发问答系统，主要调用GLM-4-Flash免费大模型Api，个人在调用时，因为环境和包冲突问题，踩到一些坑，后面会放出来，供大家借鉴。

1、引入SDK

<dependency>
    <groupId>cn.bigmodel.openapi</groupId>
    <artifactId>oapi-java-sdk</artifactId>
    <version>release-V4-2.3.0</version>
</dependency>

2、鉴权

鉴权主要有2种形式：ApiKey和Token，我们这里通过Apikey。

ApiKey申请：https://bigmodel.cn/usercenter/proj-mgmt/apikeys

3、调用Api

下面是同步调用和流式输出调用的代码Demo，异步调用和自己场景不太符合，就没有测试。大家可以根据需要选择，流式输出相应相对较快，体验也更好，开发处理的东西相对更多一些。

同步调用代码

   /**
     * 同步调用
     */
    public static String invoke(String response) {
        List<ChatMessage> messages = new ArrayList<>();
        ChatMessage chatMessage = new ChatMessage(ChatMessageRole.USER.value(), response);
        messages.add(chatMessage);
        String requestId = String.format(requestIdTemplate, System.currentTimeMillis());

        ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder()
                .model(Constants.ModelChatGLM4)
             // .model("glm-4-flash")
             // .model("glm-4-plus")
                .stream(Boolean.FALSE)
                .invokeMethod(Constants.invokeMethod)
                .messages(messages)
                .requestId(requestId)
                .build();

        ModelApiResponse invokeModelApiResp = client.invokeModelApi(chatCompletionRequest);
        try {
            return mapper.writeValueAsString(invokeModelApiResp);
        } catch (JsonProcessingException e) {
            e.printStackTrace();
        }
        return "";
    }

处理效果

流式输出的代码

   /**
     * 流式
     */
    public static String sseInvoke(String msg) {
        List<ChatMessage> messages = new ArrayList<>();
        ChatMessage chatMessage = new ChatMessage(ChatMessageRole.USER.value(), msg);
        messages.add(chatMessage);
        String requestId = String.format(requestIdTemplate, System.currentTimeMillis());

        ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder()
                .model(Constants.ModelChatGLM4)
                .stream(Boolean.TRUE)
                .messages(messages)
                .requestId(requestId)
                .build();
        ModelApiResponse sseModelApiResp = client.invokeModelApi(chatCompletionRequest);
        if (sseModelApiResp.isSuccess()) {
            AtomicBoolean isFirst = new AtomicBoolean(true);
            ChatMessageAccumulator chatMessageAccumulator = mapStreamToAccumulator(sseModelApiResp.getFlowable(),chatMessage)
                    .doOnNext(accumulator -> {
                        {
                            if (isFirst.getAndSet(false)) {
                                System.out.print("Response: ");
                            }
                            if (accumulator.getDelta() != null && accumulator.getDelta().getTool_calls() != null) {
                                String jsonString = mapper.writeValueAsString(accumulator.getDelta().getTool_calls());
                                System.out.println("tool_calls: " + jsonString);
                            }
                            if (accumulator.getDelta() != null && accumulator.getDelta().getContent() != null) {
                                // 这句代码是返回的具体结果
                                System.out.print(accumulator.getDelta().getContent());
                            }
                        }
                    })
                    .doOnComplete(System.out::println)
                    .lastElement()
                    .blockingGet();

            Choice choice = new Choice();
            choice.setFinishReason(chatMessageAccumulator.getChoice().getFinishReason());
            choice.setIndex(0L);
            choice.setDelta(chatMessageAccumulator.getDelta());

            List<Choice> choices = new ArrayList<>();
            choices.add(choice);
            ModelData data = new ModelData();
            data.setChoices(choices);
            data.setUsage(chatMessageAccumulator.getUsage());
            data.setId(chatMessageAccumulator.getId());
            data.setCreated(chatMessageAccumulator.getCreated());
            data.setRequestId(chatCompletionRequest.getRequestId());
            sseModelApiResp.setFlowable(null);
            sseModelApiResp.setData(data);
        }
        return JSON.toJSONString(sseModelApiResp);
    }


    private static Flowable<ChatMessageAccumulator> mapStreamToAccumulator(Flowable<ModelData> flowable,ChatMessage chatMessage) {
        return flowable
                .map(modelData -> {
                    // 提取 ModelData 中的必要属性
                    Delta delta = modelData.getChoices().get(0).getDelta();
                    Choice choice = modelData.getChoices().get(0);
                    Usage usage = modelData.getUsage();
                    String id = modelData.getId();
                    long created = modelData.getCreated();

                    // 使用带参数的构造函数创建 ChatMessageAccumulator 对象
                    ChatMessageAccumulator accumulator = new ChatMessageAccumulator(delta,chatMessage, choice, usage, created, id);
                    return accumulator;
                });
    }

}

处理效果

4、遇到的问题

a、接口相应超时

在测试同步调用时，总是出现响应超时的情况，这里在对请求时间和响应时间做了调整。

private static final ClientV4 client = new ClientV4
            .Builder(API_KEY)
            .networkConfig(1000*20, 1000*20, 1000*20, 1000*20, TimeUnit.MILLISECONDS)
            .build();

b、编译问题

在使用官方提供的代码Demo，进行编译时，多次出现编译错误，排查后，是本地JDK版本过低造成的，做了升级后，不在出现。建议使用JDK17以上版本。

c、包冲突

官方SDK环境中，使用了jackson包，且版本较低，与自己搭建的web项目中有冲突，对其做了移除。

<dependency>
      <groupId>cn.bigmodel.openapi</groupId>
      <artifactId>oapi-java-sdk</artifactId>
      <version>release-V4-2.3.0</version>
      <exclusions>
        <exclusion>
          <groupId>com.fasterxml.jackson.core</groupId>
          <artifactId>jackson-annotations</artifactId>
        </exclusion>
        <exclusion>
          <groupId>com.fasterxml.jackson.core</groupId>
          <artifactId>jackson-databind</artifactId>
        </exclusion>
        <exclusion>
          <groupId>com.fasterxml.jackson.core</groupId>
          <artifactId>jackson-core</artifactId>
        </exclusion>
      </exclusions>
</dependency>

这些问题不一定是共性问题，但遇到的话解决很棘手，供大家借鉴。

部署测试

项目只完成了最基本的功能，下面我们通过宝塔部署测试下。

1、登录宝塔

这里用的旧服务器，已经安装过宝塔，部署环境也已经搭建好了，直接创建新项目。也推家大家通过宝塔部署自己的项目，管理起来非常方便。

2、创建项目

选择左侧网站菜单，并「添加Java项目」-「独立项目」，创建一个新的项目，设置域名和端口号，注意不要冲突。

3、打包上传

项目通过Ftp进行打包，上传，传完解压即可。

4、解析域名

选择A类型，主机记录，指向我们的服务器ip地址

5、运行测试

部署完，直接启动项目，可以看到已经完成了最基本的功能，调用了BigModel的GLM-4-Flash大模型Api，问答界面同样也比较简单，没有过多设计，基本可以满足自己使用。相应时间相对较长，后面会采用流式输出，这个会一点点完善，等到完善起来也会分享给大家。。

最后

最后，如果你有空闲的时间，和不错的idea，也可以尝试去做下，很多东西都是不经意间做出来的。。。

好了，今天就给大家分享到这里，本工具后台是调用BigModel开放平台的GLM-4-Flash模型Api，再次感谢BigModel开放平台免费提供这样优秀的大模型，也推荐给大家去测试体验。

模型介绍：https://bigmodel.cn/dev/howuse/glm-4
API调用：https://bigmodel.cn/dev/api/normal-model/glm-4

点击「原文阅读」，可以直达BigModel开放平台！

终码一生

开发者聚集地。分享Java相关开发技术（JVM，多线程，高并发，性能调优等），开源项目，常见开发问题和前沿科技资讯！

最新文章

为什么数据库连接很消耗资源？被问根本答不出来……

月薪已炒到15w？真心建议全体码农也冲一冲行业新兴领域，工资高前景好！

免费版 GitHub Copilot 上线，VS Code 每月补全 2000 次代码

取代后端岗，国内又一新兴岗位在崛起！这才是程序员未来5年最好的就业方向！

一个注解完美实现分布式锁

牢记这16个SpringBoot 扩展接口，写出更加漂亮的代码

一个薪资可观的Java就业新方向。。

王炸级更新！Spring Boot 3.4 正式发布，新特性真香！

请立即拿下软考证（政策风口）

四步改造一套完美的 Controller 代码层，帅呆了！

只需20个Linux命令，让你的工作效率翻倍！

阿里内部首发2025前端开发手册，完整版开放下载了！

12月跳槽的兄弟注意了。。

Java就业市场是真癫了。。

一款仿 Windows 内网操作系统，高效易用

谈一谈三方接口调用方案设计

一个简单免费的问答系统，人人可学。。。

企业级的OSS对象存储服务，这样封装万能好用！

12月，Java岗又爆了？！

Spring Boot+AI有搞头么？

系统上线前，SQL脚本的9大坑

SpringBoot 插件化开发模式，强烈推荐！

简化本地Feign调用，这样封装真香！

这样实现异步线程间数据传递，太优雅了！

0 Offer?离谱...

Java找工作太逆天了。。

局域网传输神器 — LocalSend

面试官：单核 CPU 支持 Java 多线程吗？为什么？被问懵了！

突发，这可能是软考最好过的一年！

为什么说程序员是一个极度劳累的工作？

今年这面试难度，我给跪了……

后端行情变了，差别真的挺大！

一款 Windows 风格的在线文件管理系统

一口气搞懂分库分表 12 种分片算法，大厂都在用

Spring Security + OAuth2.0 搭建高效认证与资源服务架构

49.3k star，本地 SSL 证书生成神器，轻松解决 HTTPS 配置痛点

明显感觉到Java后端面试已经完全变了！

这招聘环境，绷不住了。。

魔改 Arthas，又一款开源的线上问题定位神器

面试官：业务开发时，接口不能对外暴露怎么办？

【禁止血压飙升】阿里大佬写的Controller太优雅了！

面了一个阿里40k大佬，见识到了基础天花板！

SpringBoot 打造图片阅后即焚功能

详解Java操作PDF：一键生成文件，插入文字、选项、签名及公章

11月面试/跳槽提个醒！

11月，Java岗又爆了？！

公司新来一个同事，把枚举运用得炉火纯青...

Map 只会 put、get？快来学这几个“新”方法

极简版 Java 敏感词检测工具

下半年Java面试风向变了……

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉