绝了～GLM 做个代码阅读器，发现更强大的是可以把图片变成代码～

职场 2024-12-05 17:27 福建

我们做开发的都知道，经常会接手一个以前同事的旧项目～～～

别人的项目特点如下：

文档？不存在的～
代码注释？那是什么？
规范？字典没这两个字～

有时候我们向前同事请教，他们总是回复“这很简单，你自己理解下”，宰了前同事的心都有。

我估摸着他自己也忘记当初为什么这么写了～～～

不过时代变了，AI 来了，没有文档，没有注释，同事不帮忙，这些都不是事，求人不如求己，我直接手搓个代码阅读器，让它扫描整个项目的所有文件，然后让 AI 逐一为我解读，甚至还能自动添加注释，更绝的是可以直接把图片变成代码。

今天，我们就来尝试下智谱 BigModel 开放平台的模型 —— GLM-4-Plus 与 GLM-4V-Plus。

GLM-4-Plus：这是一个升级版的 GLM-4 模型，拥有更多的参数和更好的性能，适用于各种文本处理任务，比如文本生成、理解和分类。
GLM-4V-Plus：这是 GLM-4-Plus 的视觉增强版，不仅能够处理文本，还能处理图像信息，适用于需要同时理解文本和图像的多模态任务。

1、环境安装

先安装下智谱的 Python SDK 库：

pip install zhipuai

Python SDK 源码地址：https://github.com/zhipuai/zhipuai-sdk-python-v4

服务端采用 FastAPI 来实现文件读取和 API 的请求功能，安装 FastAPI 和 Uvicorn：

pip install fastapi uvicorn

前端采用的是 SSE 调用，所以还要安装一个专门用于处理 Server-Sent Events (SSE) 的库：

 pip install sse-starlette

在代码中导入 EventSourceResponse：

 from sse_starlette.sse import EventSourceResponse

2、代码编写

前端采用 bootstrap 和 codemirror 来创建，左侧包含文件列表，右侧包含文件的代码内容及 “AI 解读”按钮：

前端部分 HTML 代码如下：

JavaScript 读取文件列表与加载文件内容代码如下：

点击 “AI 解读” 按钮向后端发送请求代码如下：

后端需要实现的功能为：

1、读取指定目录下的文件列表。
2、获取文件代码内容，并输出到代码编辑器中。
3、利用智谱大模型的 API 解析用户提交到代码内容，对其进行解析，并返回输出。

后端读取文件目录列表与读取文件代码内容完整代码如下：

智谱大模型 glm-4-plus API 解析用户发送的代码内容：

启动 FastAPI：

uvicorn main:app --reload

3、功能测试

假设我的项目目录有以下文件：

接下来我们在浏览器中访问 http://127.0.0.1:8000/，就能把项目的文件读取到左侧菜单，页面如下所示：

让我们看代码执行的演示：

4、图片生成代码

以上功能已经很强了，但对 AI 来说也就是基础功能，接下来我们来看一个更牛逼的操作，直接通过网页截图生成需要的网页代码，这里要使用的模型是：GLM-4V-Plus。

GLM-4V-Plus 是集图像理解与视频理解能力于一体的多模态模型，我们就利用它这个强大的能力，把一个图片、设计稿或者网页截图直接转化为 HTML、CSS 或 JavaScript 代码，这样能帮助开发者快速生成前端代码。

假设我们的图片如下：

通过以下代码解析图片内容，并让他生成一个跟他一模一样前端代码文件：

生成的代码如下：

在浏览器查看，展示效果如下：

有了这个能力，下次产品经理出了原型设计稿都可以直接跳过设计师让大模型来实现前端页面了。。。

🚀 想要解锁图片转代码的超能力吗？

👉 长按识别下方二维码，立即体验这项神奇技能！

智谱 AI 开放平台：https://bigmodel.cn?utm_source=2&utm_campaign=yrgzh&_channel_track_key=qY2wSfNO

👇点击「阅读原文」，解锁 AI 超能力！👇

菜鸟教程

学的不仅是技术，更是梦想！

最新文章

什么鬼才搞了个 fuck 命令来纠正 Bug

网友直呼格局，小米开源Home Assistant米家集成，Star 数飙升

请程序员立即拿下软考证书（政策风口）

这个爬虫太好用，学会了感觉要进去～～～

一天写几行代码算正常？行数如果是考核指标，匿名函数就不该出现～～～

专为黑客设计的浏览器！使用键盘来控制，内置广告拦截器～～～

2024 年 12 月编程语言排行榜｜Python 将成为年度编程语言

人人影视开源分享二十年数据，包含字幕、设计模板、软件源码

好玩，花 5 分钟写个图片生成代码神器，附上完整源码！

绝了～GLM 做个代码阅读器，发现更强大的是可以把图片变成代码～

程序员很傲慢？是不是因为问题太菜～～～

人人网已停止服务：死去的记忆突然死去了～～～

既生“/”，何生“\”？

这 10+ 个开发相关的在线工具，还有人没用过吗？？？

真的建议赶紧搞个软考证书！（红利期）

代码如屎山～～～如何让它成为“艺术”，改造成人见人爱的代码？？？

上热搜的何同学用的是哪个开源程序？需要遵守什么协议～～～

地位太过垄断？Google 被要求强制出售 Chrome 浏览器！OpenAI 正考虑推出浏览器～～～

十分钟搞定一个应用！程序员是越来越不用自己写代码了～～～

绝了！图片可以直接转成代码！开发是越来越简单了～～～

想做黑客？先来学习 SQL 注入，一文学会

这波操作看麻了！一亿行数据，从71s到1.7s的优化之路。

微信的第一行代码，看起来，我也会。。。

土老板要我开发个抖音软件？行，十分钟搞定～～～

喜大普奔～当年用不起天天找破解版的收费软件现在免费了！！！

程序员的一周，凌晨 3 点才是效率最高的

2024 年 11 月编程语言排行榜｜Go 已立足主流语言

可惜了，历经 6 年，32.4k star 开源项目宣布停更！！！

15岁初中生，开源项目被数百万收购，简直降维打击。。。

什么原因？Google被开出史上最贵罚单，20000000000000000000000000000000000（35位）美元

听说 GitHub 上阅读源码很费劲？

创业团队最好不要雇佣任何超过30岁的人？并不是因为不能996！！！

回忆杀！这些消失的网站和软件，你经历过哪些？

代码没有测试数据？这个开源项目直接帮你生成

这几个难到令人发指的编程语言，学会了算我输

强烈建议尽快搞个软考证！（重大利好）

2024 年开发者浏览器必备扩展！！

2024 职场中最受欢迎的编程语言

为何大多数程序员做不了独立开发者？

纯血版鸿蒙系统正式发布，PC版本临近｜马斯克 xAI 发布 API

有了这款终端工具，其他的都能给扔掉了

没钱买苹果电脑，试试这个开源黑苹果，享受原生级 macOS 体验！

拼夕夕员工，反对双休？

如何用沙子自制简易cpu?

为什么程序员的社会地位不高？

90 后程序员梦碎 A 股，进场四天亏 32 万

基于浏览器的 OCR，无需后端服务，支持 100 多种语言，支持视频识别

17 岁高中生，三人团队，一款AI应用，月入百万美金，创始人感概，难道是命运的安排吗？

这几款 VSCode 流程图工具，太惊艳了！！！

程序是怎么一步步运行起来的？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉