首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Mac Mini部署大模型实测

文摘 2025-01-02 06:30 四川

上上个月，趁着电商政府补贴，在京东入手了一台Mac mini，基本上能比官方便宜1000左右。

既然买了M4的芯片，拿它来写代码或者PS就太浪费了，于是我将它最为了我本地的一个大模型机器，在上面部署了Qwen2.5-7b-Instruct。

部署方式的话，目前桌面端流行的是Ollama和LM Studio，推理优化的话还有vllm可以选择。

但是我实际折腾下来，最好的还是Ollama。

LM Studio看起来很多地方还在开发中，对M4的支持总是有些不尽人意，有一些莫名其妙的错误。

vllm的话，还是别在非Linux和GPU环境搞了，各种兼容问题，根本解决不完。

Ollama的话就比较简单了，直接去官方网站下载最新的mac的安装包即可。安装完毕就可以使用ollama命令pull对应的镜像，之后就可以启动model进行推理了。

经过代码实测，ollama的部署也是直接支持OpenAI 接口的。

对于Qwen系列的模型来说，你pull的时候不需要加 -instruct 后缀，它托管的地方自动pull下来的就是instruct版本。

启动方式有两种，一种是ollama开机自启之后就会运行，另一种是你退出ollama之后，手动使用 ollama serve 命令。

注意，如果你要在另一台电脑访问你的mac mini启动的 ollama 大模型服务，在执行ollama serve之前，要先设置环境变量：

export OLLAMA_HOST=0.0.0.0:11434

基本上mac mini 跑这个7B系列的模型效果速度都还可以，你本地学习的时候需要频繁调用一些外部接口的话直接使用它就0K了，一般上的对话响应基本是准实时的，响应速度还算得上杠杠的。

下面是我通过langchain的代码调用，可以看到在处理语义理解摘要的时候，它的处理也很快，基本在2秒以内就可以返回，基本上你使用云服务厂商的同等规模参数的模型的响应也就这么快。

如果一直使用循环的方式不断地请求进行推理的话，Mac mini会有发热的现象，但是不是烫手的那种，冬天摸上去就是有点暖和，同时如果你把耳朵靠近它的底盘散热处，能听到小风扇在转。

总体来说还是非常不错的，3000块钱（加上京东的政府补贴）的成本跑一个本地的7b模型，这种性价比哪里找？哈哈哈

参考链接：

https://ollama.com/

https://qwen.readthedocs.io/zh-cn/latest/run_locally/ollama.html

读书，摄影，随笔

最新文章

我不明白，为什么我可以心安理得用AI写代码，却倔着不用它写文章

潮水来信——致《龙族III》未抵达的黎明

DeepSeek-R1：通过强化学习激励LLMs的推理能力

DeepSeek是AI工程学的巅峰

今天避雷针，明天又是大跌？

明天会议超重磅？节前节后怎么看

精通LangGraph-多agent-01

精通LangGraph-多agent-02

精通LangGraph-多agent-03

精通LangGraph-状态管理-01

精通LangGraph-状态管理-02

精通LangGraph-Tools call-05

精通LangGraph-Tools call-06

精通LangGraph-Tools call-03

精通LangGraph-Tools call-04

精通LangGraph-Tools call-01

精通LangGraph-Tools call-02

精通LangGraph-子图

精通LangGraph-Stream

精通LangGraph-人机交互

精通LangGraph-Time Travel ⏱️

精通LangGraph-Memory

精通LangGraph-可控性02

精通LangGraph-可控性03

精通LangGraph-持久化

精通LangGraph-可控性01

基于SQL数据库构建问答系统

Langchain构建ChatBot

Langchain-RAG入门4

过去的2024年，感谢李沐老师

Langchain-RAG入门3

Langchain-RAG入门2

Langchain-RAG入门1

微调实战项目-02

微调实战项目-01

Mac Mini部署大模型实测

AutoDL+vllm部署Qwen2.5-7b

超越transformer？：Neural circuit policies（秀丽隐杆线虫仿生网络）

房产绝对不可能立马退出经济机制，也不可能重回巅峰时期

寻求“快乐”是一种病态主义

《寻找斯宾诺莎》摘录：抑制激情，要靠理性所引导的情绪，而非纯粹的理智。

失眠由何而来？如何解决它？

当你还有手有脚的时候，教唆孩子“流浪猫脏得很，离它远远的”，就别怪孩子以后也这样对生活无法自理的你

芒格：经历过三次房地产衰退期，就算我们再笨，也应该明白了，降价是没用的

曾国藩和芒格，跨越时空的人生理念：尽人事，听天命

曾国藩和芒格，跨越时空的人生理念：任事者当置身利害之外，建言者当设身利害之中

《经济学的思维方式》：经济学不研究为何大多数人为何穷，而研究那些少部分人是如何致富的

《经济学的思维方式》: 仅仅依靠分工和交换就能创造财富的魔法是怎么回事？

《经济学的思维方式》:创造财富不止物质生产一种办法

《经济学的思维方式》：经济系统是由“游戏规则”塑造的

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉