小米SU7智能举报不用等，我用智谱的GLM-4-Plus搞定了！

文摘 2024-10-10 18:04 湖北

你好呀，我是小智!这次国庆假期，你堵车了吗？

国庆大拥堵，是每个中国人都深有体会的“节日特色”。在这个时候，应急车道成了一些司机的“捷径”，特别是一些不守规矩的司机违规占用应急车道，导致本就拥堵的交通状况更加恶化。

在小米汽车推出时，有网友杜撰了一键AI智能举报违章功能的设想。虽然这个功能尚未在小米汽车上实现，但我们可以借助现有的AI技术，自己动手实现这样一个功能。本文将带你一步一步拆解这个功能的技术实现，并基于智谱大模型开放平台 bigmodel.cn实战，实现一键AI智能举报违章。

一键智能举报违章功能技术拆解与实战

语音实时对讲与唤醒视频记录

在汽车行驶过程中，驾驶员需要集中注意力驾驶，因此，一个能够通过语音指令启动的视频记录功能就显得尤为重要。这不仅能够记录下违章行为，还能在不干扰驾驶员的情况下，实现“一键举报”。

为了让大家有个直观的感受，我用智谱清言的视频通话功能做了下测试，视频如下：

违章行为发生的时间区间短，并且驾驶员发出指令时，往往违章行为已然发生。这就需要系统不仅能实时响应指令，并且对视频内容具备短期的记忆与理解能力，通过组合现有技术几乎是无法实现的。

❝
目前国内做多模态大模型的厂家不少，但能够通过API的方式支持实时视频通话的，目前智谱是独一家！调研了解到GLM-4-Plus-VideoCall API不仅能够提供实时的视频通话功能，还能通过视频流理解对话当前的环境，确实是目前实现本需求的最优解。

以下为伪代码功能实现

# 定义违章检测函数
def detect_traffic_violations(voice_command):
    # 获取当前时间戳
    current_time = time_stamp_module.get_current_time()
    
    # 根据语音指令，确定需要回溯的时间范围
    time_range = time_stamp_module.calculate_time_range(voice_command)
    
    # 使用视频分析模块检测违章行为
    violations = video_call_api.analyze(video_record)
    
    # 如果检测到违章行为
    if violations:
        # 获取违章类型和起始时间节点
        violation_type, start_time = violations[0]['type'], violations[0]['start_time']
        
        # 截取违章行为发生的视频片段
        video_clip = video_call_api.get_video_clip(start_time, current_time)
        
        # 输出违章类型和视频片段
        return violation_type, video_clip
    else:
        return "No violations detected."

基于实时视频识别车辆违章情况

接下来，在上一阶段记录并提取到违章视频片段的基础上，我们需要一个能够实时识别车辆违章行为，并识别车牌号的系统。通常来说，我们可以使用计算机视觉技术，通过训练一个模型来识别常见的违章行为，例如占用应急车道、闯红灯等。

目前成熟的多模态大模型已经能较好理解和处理视频的内容，这里我们可以直接调用GLM-4V-Plus的api来实现我们的需求。

实现代码如下

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR API KEY") # 填写您自己的APIKey
response = client.chat.completions.create(
    model="glm-4v-plus",  # 填写需要调用的模型名称
    messages=[
      {
        "role": "user",
        "content": [
          {
            "type": "video_url",
            "video_url": {
                "url" : "https://****/video/**.mp4"
            }
          },
          {
            "type": "text",
            "text": "这是一个车辆违章记录的视频，请识别车辆的违章类别，以及违章车辆的车牌号"
          }
        ]
      }
    ]
)
print(response.choices[0].message)

自动调用违章上报接口上报违章情况

我们已经成功提取到车辆违章的所有相关信息，最后一步是将违章信息和关键帧通过API接口上报给相关部门。这一步骤需要与交通管理部门的系统对接，确保信息能够准确无误地传达。

为了实现这一功能，我们需要将模型的文字输出转换为具体的API请求，并将其发送到交通管理部门的API。针对这一需求，大模型已经提供了非常成熟的解决方案：Fucntion Calling。GLM-4-Plus提供了函数调用能力，我们可以利用这一能力构建一个违章上报Agent，实现违章信息的自动上报。

代码如下

from zhipuai import ZhipuAI
client = ZhipuAI(api_key="")
messages = []
tools = [{"type":"function","function":{"name":"traffic_violation","description":"举报交通违章","parameters":{"type":"object","properties":{"type":{"description":"违章类别","type":"string"},"vehicle":{"description":"车牌号","type":"string"}},"required":["type","vehicle"]}}}]
messages = []
messages.append({"role":"user","content":"违章类别:占用应急车道.\n违章车辆的车牌号:** **888"})
response = client.chat.completions.create(
    model="glm-4-plus",  # 填写需要调用的模型名称
    messages=messages,
    tools=tools,
)
print(response.choices[0].message)
messages.append(response.choices[0].message.model_dump())

实战总结

通过大模型提供的视频通话，视频理解，函数解析等多个方面的能力。我们主要实现了以下五个方面的功能需求：

1.语音实时对讲与唤醒视频记录
2.基于实时视频识别车辆违章情况
3.识别违章车辆车牌
4.自动从视频中截取违章情况关键帧
5.自动调用违章上报接口上报违章情况结合车辆行驶的现实情况，通过GLM-4-Plus-VideoCall提供的实时视频通话能力，将以上所有能力集成，并最终实现了一键AI智能举报违章的能力。

❝
当然只有代码，还无法达成我们的目标，搭载以上能力的智能摄像头硬件已经列入我的下一步的规划，到时候我会将方案整体开源，大家尽情期待！

结语

随着大模型与现实世界的交互能力的进一步增强，其应用场景将拓展到我们生活的方方面面，唯一缺乏的是我们自己的想象力! 通过今天的探索，我们不仅实现了一个一键AI智能举报违章的功能，更重要的是，我们看到了AI技术在社会治理中的潜力。未来，让我们继续发挥想象力，用技术为社会带来更多的便利和安全。

今天的内容就到这里，如果老铁觉得还行，可以来一波三连，感谢！

AI小智

AI认知架构师，让我们一起用AI改变世界！

最新文章

LangChain 2024年人工智能发展报告

《一书解决几乎所有机器学习问题》.PDF下载

AI 打工我躺平｜大厂前端摸鱼指南

大模型面试实战！Prompt调优

改个名字，数倍提升Function Calling准确率！

如何生成Function Calling微调数据？

又一本开源免费的大模型书来了，449页pdf！

作为开发者，我如何提高任务型大模型应用的响应性能

总算有人把智能体记忆说清楚了

军用大模型现世，AI战争新时代

AI创造者计划,通义开启电影创作新时代

探索LLM推理全阶段的JSON格式输出限制方法

小米SU7智能举报不用等，我用智谱的GLM-4-Plus搞定了！

AI最大的应用是什么，如何成为初代AGI产品经理？

光与AI：视障玩家的《黑神话：悟空》挑战

必须为孩子存下来的提示词，像玩黑神话游戏一样学习

LangChain百万代码全解析：这个模型胃口很大！

可信Agent构建之道：AI如何重塑工作流？

AI界的新宠：揭秘Llama 3.1如何革新AI合成技术

LLM工具调用破局：Few-shot Prompting

如何改进Agents的推理与规划?

Agent智能体？我们要的到底是什么

难倒吴恩达的LLM评估，有解吗？

全新发布：LangGraph开启认知架构新纪元

探索GLM4-ALLTools：全能AI工具箱，释放开发者潜能

大模型能力分水岭数学考试，文心一言超gpt4o排名第一

吴恩达揭秘：编程Agent如何革新软件开发行业

全网爆火的AI狼人杀：开源了

Hugging Face全面拥抱LangChain：全新官方合作包

无需魔法,无需插件,国内网络即刻愉快的使用搭载GPT4的Newbing!

AI办公自动化｜使用New Bing和Python实现Word转Excel

无网络限制人人可用的ChatGPT-Claude

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉