本地搭建ChatGPT【Ollama + Gemma2】

文摘 2024-07-31 00:00 上海

声明：文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由用户承担全部法律及连带责任，文章作者不承担任何法律及连带责任。

博客新域名：https://gugesay.com

不想错过任何消息？设置星标↓ ↓ ↓

前言

Ollama是一个开源的大模型管理工具，它提供了丰富的功能，包括模型的训练、部署、监控等。通过Ollama，你可以轻松地管理本地的大模型，提高模型的训练速度和部署效率。此外，Ollama还支持多种机器学习框架，如TensorFlow、PyTorch等，使得你可以根据自己的需求选择合适的框架进行模型的训练。

部署教程

下载

macOS：
https://ollama.com/download/Ollama-darwin.zip

Windows：
https://ollama.com/download/OllamaSetup.exe

Linux，直接运行：

curl -fsSL https://ollama.com/install.sh | sh

当然，ollama也支持docker部署。

本文主要介绍我在macOS上的本地部署过程。

安装

下载Ollama-darwin.zip后，解压，直接双击或将程序APP拖入应用程序即可，安装成功的话，就会出现可爱的羊驼图标：

安装模型

现如今开源的大模型已经越来越丰富了，通过ollama网站的模型库：

https://ollama.com/library

就可以看到相应列表：

其中 Gemma 2 是 Google 公司最新的开源大语言模型，可以看到下载量高达587.4K，点击Gemma2后，可以看到该模型的具体信息：

一时脑热，直接下载并安装了27b（27亿参数量）：

ollama run gemma2:27b

结果成功运行后，回答一个问题需要1、2分钟才能蹦出几个字。后来上网一查，哭了 :sob:

咳咳，只好退而求其次，乖乖选择9b：

ollama run gemma2:9b

使用

经过一段时间的等待后，成功下载并运行：

回复速度还是很快的，内存占用大概在90%（骨哥内存18G）左右。

安装其它模型的话，同上，比如骨哥还尝试安装了secgpt_chat（4亿参数量）：

安装运行后和GPT-4o做了一下简单的对比，额，差的不是一点半点，想想也是，毕竟人家可是GPT-4o，这区区的4b模型怎么能比呢。

WebUI

总是通过命令行来提问总觉得不是很舒服，那就装个WebUI吧，ollama本身就提供WebUI，安装起来也非常简单，只需要6步：

下载并安装 Node.js 工具：https://nodejs.org/zh-cn
下载ollama-webui工程代码：git clone https://github.com/ollama-webui/ollama-webui-lite ollama-webui
3.切换ollama-webui代码的目录：cd ollama-webui
4.设置 Node.js 下载提速：npm config set registry http://mirrors.cloud.tencent.com/npm/
5.安装 Node.js 依赖工具包：npm install
6.启动 Web 可视化界面：npm run dev

成功启动后，通过http://localhost:3000 即可访问

这一下就舒服多了～通过简单的对比，发现Gemma2用起来还是很不错的，至少可以满足一些基本需求了（比如生成代码、代码解释、简单的问答等等）。

省钱小妙招（插件使用本地Gemma2）

这两天骨哥使用了一款相当不错VScode插件–Aide，当时安装的时候，安装量还是10k，这两天已经飙到了14k+了：

这个插件的两大功能对我来说特别实用，一个是代码转换，一个是代码注释。

所谓代码转换，就是你可以利用该插件，调用AI接口，实现代码间的转换。比如你有一段JS代码，想要转换成Python代码，那么只要点击右上角的按钮，便可一键完成：

转换效果：

再看代码注释功能，同样右上角一键对代码进行注释，“妈妈再也不用担心我看不懂别人的屎山代码了”：

关于AI的API设置，如果使用诸如OpenAI的API Key，可参照如下设置：

比如使用国内的某API已经算相对便宜了（几块钱就能用上百万tokens）：

但如果我们本地能够部署大模型，那就不用花上一分钱就能畅享使用了～

本地部署API设置参考如下：

URL填写：http://localhost:11434/v1
KEY随便填写：sk-随便写
Model选择：使用哪个模型，就填写哪个，我这里是gemma2:9B

希望本文能对你有所帮助，如果你有更好的模型推荐，尤其是网络安全相关的模型，也欢迎在下方评论区或星球与我交流。

加入星球，随时交流：

（前50位成员）：99元/年
（前100位成员）：128元/年
（100位+成员）：199元/年

感谢阅读，如果觉得还不错的话，欢迎分享给更多喜爱的朋友～

====正文结束====

http://mp.weixin.qq.com/s?__biz=MjM5Mzc4MzUzMQ==&mid=2650259484&idx=1&sn=e4c9a9a55384ba1d4f19b89cbbb465ba

骨哥说事

一个喜爱鼓捣的技术宅

最新文章

如何将低危的 SSRF 盲注升级为严重漏洞

已修复漏洞？如何绕过并再次利用！

研究了100份SSRF漏洞报告后的干货梳理

各大云 AccessKey 特征整理

信息收集技巧分享

如何从IIS欢迎页面中快速挖掘漏洞

2024年10月星球内容汇总

研究人员使用十六进制编码和表情符号实现ChatGPT越狱

JS利用【2024至尊版】

【$20,000】通过 DevTools 实现 Chrome 浏览器沙箱逃逸

发现Facebook SSRF，收获31500美元赏金的故事【2】

发现Facebook SSRF，收获31500美元赏金的故事【1】

【$1,060】GitLab HTML 注入漏洞

【0day】通过 iTunes 实现 Windows 本地提权

【CVE-2024-45409】GitLab 身份验证绕过分析

如何远程控制起亚汽车

2024年9月星球内容汇总

WPS Office攻击细节披露

【$2000】利用重置密码实现帐户接管

【$4133.70】利用 YouTube 窃取文件

如何为任意 YouTube 频道提供验证徽章

绕过 CSP，实现 Netlify CDN 上XSS

Gmail 中的 HTML 表单注入漏洞

【赏金15000美元】通过监控调试模式实现 RCE

Microsoft Copilot：从即时注入到泄露个人信息【部分】

利用 SQL 注入绕过机场安检

IIS欢迎页的安全隐患：从源代码到LFI的攻防之道

‘黑掉NASA’【2】：从发现漏洞到荣登名人堂之旅

‘黑掉NASA’【1】：从发现漏洞到荣登名人堂之旅

在 Copilot Studio 的帮助下实现SSRF【部分】

8月星球内容汇总

利用开放式重定向、2FA 绕过等漏洞获取$1600赏金奖励

巧妙利用内存分配的一种新型利用手段

【$2000】由于缓存配置错误导致授权绕过

IDOR之如何打破订阅限制

价值 3500 美元的管理面板绕过漏洞

hackerone上TOP5的开放重定向漏洞

Apache CVE-2023-25690 漏洞手动调试分析

疑似Ten**t 14亿数据泄露

打造绕过Defender的Windows reverse_tcp Shell【部分】

Blackhat 2024 USA PPT打包下载【62个】

巧妙利用业务逻辑漏洞，实现Google帐户接管

在 Instagram 上查看任何人的私人电子邮件和生日信息

Pixel7/8 Pro 安卓 14 内核漏洞利用

沉浸式翻译调用本地Ollama

手把手教你个人离线AI知识库搭建

ODT文件漏洞利用

本地搭建ChatGPT【Ollama + Gemma2】

在Kafka UI实现RCE的3种方法【部分】

2024年7月星球内容汇总

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉