在 Cursor 中配置和使用本地的qwen2.5-coder

文摘   2024-11-18 12:11   湖北  

1. 安装 Ollama

那当然也可以使用的模型接口工具,通过接口形式访问就行

# MacOS
curl https://ollama.ai/install.sh | sh

# 验证安装
ollama --version

2. 安装 ngrok

使用的外网映射比如 frp 也是可以的,可以关注后续的文章

# 使用 Homebrew
brew install ngrok/ngrok/ngrok

# 验证安装
ngrok version

二、配置 Ollama

1. 下载模型

# 下载 qwen2.5-coder 模型
ollama pull qwen2.5-coder

2. 配置 Ollama 环境变量

必须的配置选项为 OLLAMA_HOST, OLLAMA_ORIGINS

# 设置监听所有网络接口
launchctl setenv OLLAMA_HOST "0.0.0.0"

# 允许跨域访问
launchctl setenv OLLAMA_ORIGINS "*"

# 增加并行处理能力(可选)
launchctl setenv OLLAMA_NUM_PARALLEL "4"

# 延长模型在内存中的保持时间(可选)
launchctl setenv OLLAMA_KEEP_ALIVE "1h"

# 增加请求队列长度(可选)
launchctl setenv OLLAMA_MAX_QUEUE "1024"

# 验证设置
launchctl getenv OLLAMA_HOST
launchctl getenv OLLAMA_ORIGINS

3. 重启 Ollama 服务

# 停止当前运行的 Ollama 进程
killall ollama

# 重新启动 Ollama
ollama serve

4. 验证 Ollama 配置

# 测试本地访问
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
  "messages": [
    {
      "role": "user",
      "content": "Say hi"
    }
  ],
  "model": "qwen2.5-coder"
}'

三、配置 ngrok

1. 注册与认证

从 ngrok 控制面板获取

# 配置 authtoken
ngrok config add-authtoken your-authtoken-here

2. 创建配置文件

# 创建或编辑 ngrok 配置文件
vim ~/Library/Application\ Support/ngrok/ngrok.yml

添加以下内容:

version: "2"
authtoken: your-authtoken-here
web_addr: 127.0.0.1:4040
log: ngrok.log
region: us
tunnels:
  ollama:
    addr: 11434
    proto: http
    basic_auth:
      - "username:password"

四、启动服务

1. 启动顺序

# 1. 确保 Ollama 正在运行
ollama serve

# 2. 在新终端启动 ngrok
ngrok start ollama

2. 验证服务状态

# 检查 Ollama 状态
curl http://localhost:11434/api/version

# 检查 ngrok 状态
curl http://localhost:4040/status

五、测试配置

1. 本地测试

# 测试本地 Ollama 服务
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
  "messages": [
    {
      "role": "user",
      "content": "Testing local access"
    }
  ],
  "model": "qwen2.5-coder"
}'

2. 公网测试

# 测试 ngrok 公网访问(替换为实际的 ngrok URL)
curl https://your-tunnel.ngrok-free.app/v1/chat/completions \
-H "Content-Type: application/json" \
-u "username:password" \
-d '{
  "messages": [
    {
      "role": "user",
      "content": "Testing remote access"
    }
  ],
  "model": "qwen2.5-coder"
}'

六、Cursor 配置

1. 进行cursor 配置页面



2. 增加模型名称qwen2.5-coder


3. 填入 ngork 的地址,注意这里的地址后面需要加上/v1,点击verify ,如果没有任何提示就表示通过



4. 验证



遇到问题可以下方留言



字节笔记本
专注于科技领域的分享,AIGC,全栈开发,产品运营
 最新文章