今天这个爬虫有点猛,开源4天,涨了2900星。
星涨的快,那这个项目肯定有过人之处。
我感觉有三方面原因:
1、Maxun 可以在 2 分钟内训练机器人并自动抓取网页数据。
2、不需要写代码。
3、后面还会推出一个支持身份验证和登录后爬取的版本。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)
项目简介
Maxun是一个免费的开源无代码网络数据爬虫,它可以在不编写代码的情况下构建自定义机器人来自动化数据抓取任务。用户只需简单的训练,就能在两分钟内部署一个机器人,自动从网络上抓取数据。Maxun可以通过模拟用户操作来实现数据抓取,可以定时运行,并适应网站布局的变化。Maxun支持将网站数据转换为API或电子表格,极大地简化了数据抓取和处理的流程。
使用教程
主要功能
自动处理分页和滚动:可以自动识别和处理网页的分页及长页面滚动。
验证码识别和代理轮换:具备解决验证码的能力,并能自动更换代理以维护抓取过程的顺畅。
结构化数据提取:能够从网页中提取结构化数据,如表格、列表等。
模拟用户操作:可以模仿用户的点击、输入等行为,增强数据抓取的效果。
自适应网页变化:能自动适应网站布局变更,保持爬虫的持续运行。
抓取屏幕截图:支持捕获并保存网页的屏幕截图。
项目UI截图
项目链接
https://www.dongaigc.com/p/getmaxun/maxun
寻找更多开源项目,就到 懂AI(dongai.ai)
软件开发,AI项目快速落地,专业团队高质量交付。
关注「开源AI项目落地」公众号
与AI时代更靠近一点
关注「AGI光年」公众号
获取每日最新资讯
关注「向量光年」公众号
加速全行业向AI转变