又发现一个能让 AI 智能体自动化操作浏览器的开源工具:Browser Use。只需几行代码,即可让 AI 成为我们的网页助手,能够像真人一样理解网页内容,并完成各种复杂的操作任务。如自动投简历、查询航班信息以及模型筛选等。并具备视觉识别、HTML 元素解析、自动管理多个标签页等特点。此外,还可以自定义操作和并行多个智能体,兼容主流模型,如 GPT-4o、Claude 3.5 Sonnet 等。
参考文献:
[1] GitHub:https://github.com/browser-use/browser-use
[2] https://browser-use.com/
[3] https://browser-use.com/posts/sota-technical-report
欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。
NLP工程化知识星球
NLP工程化分享群