这个Python库把Selenium按在地上摩擦！

职场 2024-07-25 14:49 浙江

转自：快学python

DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器，也能收发数据包，还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大，内置无数人性化设计和便捷功能。它的语法简洁而优雅，代码量少，对新手友好。

背景

用 requests 做数据采集面对要登录的网站时，要分析数据包、JS 源码，构造复杂的请求，往往还要应付验证码、JS 混淆、签名参数等反爬手段，门槛较高，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。

因此，这个库设计初衷，是将它们合而为一，同时实现“写得快”和“跑得快”。能够在不同需要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率。除了合并两者，本库还以网页为单位封装了常用功能，提供非常简便的操作和语句，使用户可减少考虑细节，专注功能实现。以简单的方式实现强大的功能，使代码更优雅。

以前的版本是对 selenium 进行重新封装实现的。从 3.0 开始，作者另起炉灶，对底层进行了重新开发，摆脱对 selenium 的依赖，增强了功能，提升了运行效率。

核心能力

本库采用全自研的内核，内置了 N 多实用功能，对常用功能作了整合和优化，对比 selenium，有以下优点：

无 webdriver 特征
无需为不同版本的浏览器下载不同的驱动
运行速度更快
可以跨 iframe 查找元素，无需切入切出
把 iframe 看作普通元素，获取后可直接在其中查找元素，逻辑更清晰
可以同时操作浏览器中的多个标签页，即使标签页为非激活状态，无需切换
可以直接读取浏览器缓存来保存图片，无需用 GUI 点击另存
可以对整个网页截图，包括视口外的部分（90以上版本浏览器支持）
可处理非open状态的 shadow-root

入门演示

SessionPage对象和WebPage对象的 s 模式，可用收发数据包的形式访问网页。

顾名思义，SessionPage是一个使用使用Session（requests 库）对象的页面，它使用 POM 模式封装了网络连接和 html 解析功能，使收发数据包也可以像操作页面一样便利。

并且，由于加入了本库独创的查找元素方法，使数据的采集便利性远超 requests + beautifulsoup 等组合。

SessionPage是本库几种页面对象中最简单的，我们先从它开始入手。

我们看个简单的例子，来了解SessionPage的工作方式。

# 导入
from DrissionPage import SessionPage
# 创建页面对象
page = SessionPage()
# 访问网页
page.get('https://gitee.com/explore/all')
# 在页面中查找元素
items = page.eles('t:h3')
# 遍历元素
for item in items[:-1]:
    # 获取当前<h3>元素下的<a>元素
    lnk = item('tag:a')
    # 打印<a>元素文本和href属性
    print(lnk.text, lnk.link)

输入效果：

对比被访问页面官网。

简直好简单啊！更多详情可访问作者主页：
https://g1879.gitee.io/drissionpagedocs/

如果你也想玩GPT4o，市场独享4.0一般在190-230/月，但是又想低成本玩GPT4o，其实我们玩共享号也是可以的,目前全部有最新的4o模型，对共享GPT4o感兴趣的可以加v：476430956，活动期55/月，包30天售后，加v时备注：GPT4。

此外，小编为了解决官方的提问次数限制，做了一个账号池，官方是每个号40次/3h提问次数限制，通过账号池技术，如果次数到了，立马换号即可，几乎不用等次数刷新，因为实惠好用，续费还是很多的

http://mp.weixin.qq.com/s?__biz=Mzg5NjMxMTYxNQ==&mid=2247497853&idx=1&sn=f109006fb730f2464e600b881c687a5f

Java面试宝典

深耕IT，8年开发老铁帮你少走弯路，分享我的工作与学习经验，技术涉及一线互联网公司Java架构、Java面试题、大数据、人工智能、Python、全栈开发等各个热门领域，是你IT之路的良师益友。

最新文章

Claude制作精美日程表

导师：自己每天科研工作近 10 小时，都觉得不够。研究生们，每天工作不够 5 小时，拿什么去竞争？

腾讯公布 26 年前第一间办公室照片，太有年代感了

ChatGPT 4o 国内直接用！！！

自己工资 14K，找到月薪 28K工作后，开心地提交辞呈，租了新房子！入职前一天HR说：原来岗位的人不走了，你offer被取消了

最牛天才黑客：21 岁崩溃阿里内网，马云给年薪 500 万，如今怎么样了？

好家伙，尤雨溪创办公司啦！已融资3200万！

10.4k Star，这个开源项目有点强！

弃用3.5！

ChatGPT 4o 国内直接用！！！

GPT-4o不会用？看看网友们总结的GPT-4o的10个最佳用途

GPT4制作中文流程图

ChatGPT 4o 国内直接用！！！

2024 下半年小红书电商的机会在哪里？

GPT-4o大大大降价了！

这个Python库把Selenium按在地上摩擦！

GPT-4o大大大降价了！

ChatGPT最新版！5.0之前最强形态，简直言出法随！

因为打包太慢，我没吃上午饭

GPT-4o大大大降价了！

团队准备解散了。。

突发！阿里云又挂了。。。

GPT-4o大大大降价了！

卖了97万！！！

别惹程序员——印度IT工程师被解雇后删了前东家180台服务器、造成几百万损失

卖了97万！！！

GPT-4o账号大大大降价了！

彻底放弃3.5！

噩耗！裁员50%，赔偿N+1，南京研发所全撤了......

最常用的几个GPTs

卖了97万！！！

ChatGPT最新版！5.0之前最强形态，简直言出法随！

2024年在小红书月入过万

记住看小电影前一定要检查网址是不是 HTTPS 的，不然…

弃用3.5！

卖了97万！！！

裁员了，很严重，劝大家做一手准备吧...

攻略升级！GPT-4o 完美接入苹果手机，更详细版本！

公众号写写文章实现睡后收入，这趟顺风车，就问你搭不搭？

GPT-4o，比想象中的更恐怖

ChatGPT 4o 深夜炸场！！！

GPT4和GPT4o测评, 4o 真真真无敌！

GPT4创建自有知识库保姆级教程！

日入100元且上班族能做的副业有哪些？

GPT4知识库大更新！

弃用3.5！

建议你不要更新到 VMware17.5 ！！！

被GPT-4 Plus价格劝退了！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉