太火爆!Browser-Use WebUI 已被纳入 browser-use 麾下!

职场   2025-01-09 07:22   河南  

在上一篇文章 Browser-Use WebUI + DeepSeek V3 把浏览器整成自动化了! 中,有网友评论说项目不见了...

不知道是不是最近火了,这个项目目前被纳入了 browser-use 麾下,现在地址为 https://github.com/browser-use/web-ui

以下是基于上面文章做修改,还有之前文末的录制视频被微信判定说有引导用户到其它平台的嫌疑,我看了下因为做录制的时候用了新浪微博做示例,不知道是不是这个原因 😂,下文 Demo 地方给大家截图演示。


Github 上有个开源项目 browser-use,这个项目最近老火了,目前拥有 11K Star,它的作用是将 AI Agent 与浏览器链接起来从而实现由 AI 驱动的浏览器自动化。接入也很简单,不过要写一点代码。

这两天有个老哥基于 browser-use,写了个 UI 界面,在体验层面同时也做了一些功能扩展,让它的使用门槛更低了,之前的 Github 开源地址是 https://github.com/warmshao/browser-use-webui。现在为 https://github.com/browser-use/web-ui

browser-use-webui 主要功能

  • 提供了全新的网页界面,简单好用,方便操作。
  • 支持更多大语言模型,比如 Gemini、OpenAI、Azure 等,哦,还有最近爆火的国产大模型 DeepSeek,未来还会加更多。
  • 支持用自己的浏览器,不用再反复登录,还能录屏。
  • 定制了更智能的 Agent,通过优化后的提示让浏览器使用更高效。

安装

这个项目已在 Github 开源,想玩的都可以试试,用 Python 写的,版本必须在 3.11 以上。

我是使用 pyenv 管理 python 版本,在 browser-use/web-ui 最新文档中是推荐 https://docs.astral.sh/uv/ 管理 Python 版本,大家可以根据自己的喜好,哪个顺就用哪个哈,不必太纠结这个。

  1. 首先,让我们拉取项目到本地
git clone https://github.com/browser-use/web-ui.git # 拉取项目
cd browser-use-webui # 进到这个项目里
  1. 安装依赖项:
pip install browser-use
  1. 安装 Playwright
playwright install
  1. 安装项目依赖
pip install -r requirements.txt
  1. 配置环境变量

基于 .env.example 复制一个 .env 文件,并在 .env 文件中修改以下信息

# 路径 Chrome 浏览器路径(检查下自己的路径),例如
# Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"

# 浏览器的用户数据路径,例如
# Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"

# 还有一些大模型的 API Key 也要改
...
  1. 启动运行

执行如下命令启动

python webui.py --ip 127.0.0.1 --port 7788

启动成功如下所示:

浏览器访问 http://127.0.0.1:7788/,看到如下界面就成功了

配置

  1. 配置 Agent

注意,这里的 Use Vision,默认是选中状态,如果使用的 DeepSeek 不能勾选,因为 DeepSeek 不支持视觉输入,注意这里很多人踩坑,一定要注意。

  1. 配置要用的大模型

例如,下面我用的是 deepseek。

  1. 关于浏览器的一些设置

Demo 演示

输入要执行的任务就可以点击 Run Agent 了

以下是运行时的项目日志输出,记录了执行步骤

执行的过程中也会打开浏览器和跳转到目标网站,按照区块一样对页面元素做标注。

在 Recodings 下会记录执行过程和反馈结果,还可以回看的。

感兴趣的大家可以试试哦,不是很复杂!

欢迎关注 “AI智见录”,为您分享更多精彩 AI 内容。

期文章推荐

  1. Windsurf:唯一让 Cursor 瑟瑟发抖的最强对手!

  2. 一起来聊聊 Cursor、Copilot、Windsurf、V0...

  3. 我把最近爆火的 DeepSeek-V3 接到了 Cursor!

  4. Cursor Yolo 模式太棒了!

  5. Cursor发布0.44版本:全面提升Agent能力!

  6. 感受下 Cursor Agent 的强大魅力!

  7. Github Copilot 靠什么反击 Cursor?

  8. 刚刚!GitHub Copilot 宣布免费

  9. 尤大亲自转发点赞!Github Copilot Edits 有何魔力?

  10. 字节最新开源:让 AI 给你写 UI 自动化测试

- 线 -

扫描以下二维码加小编微信,备注 “ai”,一起交流 AI 技术!

AI智见录
洞见AI前沿,分享技术与实践,助力智慧未来
 最新文章