自动化测试小技巧之Airtest-Selenium和Excel的无缝协作

科技 2024-06-27 16:01 广东

👆对私有云感兴趣可以进入公众号回复“私有云”哦。

一、前言

之前在问卷以及Q群上有同学有提出过能否将网页上的一些数据通过Airtest去导出生成一份Excel，那么我们今天一起讨论一下，我们应该如何去实现，以及当我们获取的数据类型不同的时候，获取的方式该怎么随之调整？

二、知识点介绍

2.1 python下的Excel的操作

之前我们有篇文章有介绍过poco跟Excel结合使用的案例，里面介绍了Excel的读写操作，在这里我们是使用了创建Excel，写入并保存Excel的操作。

import xlwings as xw
# 创建一个新的Excel工作簿和工作表
wb = xw.Book()
sheet = wb.sheets[0]

#将内容写入Excel内
sheet.range((row_index, col_index)).value = cell.text

# 保存Excel文件
wb.save('output.xlsx')
wb.close()

2.2 获取table数据

在网页上看到类似图下的表格内容时，可以在界面点击F12唤出页面开发者模式，可以看到表格在HTML中的标签为<table>，以及在表格中<tr>标签是表格的行， <td>标签是表格的列，我们只需要找到<table>标签，将表格内的行列内容以此读取并导出到Excel中或输出即可。

def get_table_data():
    #获取表格
    table = driver.find_element(By.XPATH, "//*[@id=\"content\"]/table")

    # 获取所有行
    rows = table.find_elements(By.TAG_NAME, "tr")

    # 行索引
    row_index = 1

    # 遍历所有行以及每行中的列
    for row in rows:
        # 获取所有列
        cells = row.find_elements(By.TAG_NAME, "td")
        # 列索引
        col_index = 1
        for cell in cells:
            # 写入每个格子的内容到Excel表格
            sheet.range((row_index, col_index)).value = cell.text
            col_index += 1
        row_index += 1

2.3 获取普通数据内容

如果是要将普通的数据依照一定的规律去进行导出的话，我们可以看一下在浏览器内，数据的表现是怎么样的，例如我们这边用的例子是百度热搜界面，想要将热搜榜导出，我们可以先观察一下热搜榜的HTML代码排布，热搜词条是在同一层级下按顺序排布的。

那我们可以看一下在AirtestIDE内获取的语句是否也存在一些规律，可以看到，我们在读取的时候，语句中的其中一个标签的索引值是呈递增的，那我们就可以利用这个特性去进行循环获取我们所需要的内容。

 # 循环获取XPath范围内的元素文本内容和链接
row_index = 1
for i in range(2, 11):  # 假设你要获取10个元素
    xpath = f"//*[@id='sanRoot']/main/div/div/div[2]/a[{i}]/div[2]/div[2]/div/div"

 # 查找元素
    element = driver.find_element(By.XPATH, xpath)

    # 获取元素文本内容
    content = element.text

    # 获取元素的父链接 (a 标签)
    parent_element = driver.find_element(By.XPATH, xpath + "/ancestor::a[1]")
    link = parent_element.get_attribute('href')

    # 写入Excel表格
    sheet.range((row_index, 1)).value = content
    sheet.range((row_index, 2)).value = link
    row_index += 1

三、使用Airtest-selenium获取网页上的table内容并生成excel

接下来我们先来看一个导出网页上的<table>表格数据到本地Excel表的例子：

参考代码：

# -*- encoding=utf8 -*-
__author__ = "Airtest"

from airtest.core.api import *

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from airtest_selenium.proxy import WebChrome
from selenium.webdriver.common.by import By
import xlwings as xw

driver = WebChrome()
driver.implicitly_wait(20)

auto_setup(__file__)

def get_table_data():
    # 获取所有行
    rows = table.find_elements(By.TAG_NAME, "tr")

    # 行索引
    row_index = 1

    # 遍历所有行以及每行中的列
    for row in rows:
        # 获取所有列
        cells = row.find_elements(By.TAG_NAME, "td")
        # 列索引
        col_index = 1
        for cell in cells:
            # 写入每个格子的内容到Excel表格
            sheet.range((row_index, col_index)).value = cell.text
            col_index += 1
        row_index += 1

if __name__ == "__main__":
        
    # 打开目标网页
    driver.get("https://www.runoob.com/python3/python3-os-file-methods.html")

    table = driver.find_element(By.XPATH, "//*[@id=\"content\"]/table")  

    # 创建一个新的Excel工作簿和工作表
    wb = xw.Book()
    sheet = wb.sheets[0]

    get_table_data()

    # 保存Excel文件
    wb.save('output.xlsx')
    wb.close()

四、使用Airtest-selenium获取网页上的热搜榜并导出标题以及链接

然后我们再来看一个更实用的例子，获取百度热搜榜单内容到本地Excel的例子（PS：运营同学甚至可以做成定时脚本，定时收集榜单信息参考，时刻关注热门话题）：

参考代码：

# -*- encoding=utf8 -*-
__author__ = "Airtest"

from airtest.core.api import *

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from airtest_selenium.proxy import WebChrome
import xlwings as xw
from selenium.webdriver.common.by import By
driver = WebChrome()
driver.implicitly_wait(20)

auto_setup(__file__)

def get_element_content_and_link(xpath, sheet, row_index):
    try:
        # 查找元素
        element = driver.find_element(By.XPATH, xpath)
        # 获取元素文本内容
        content = element.text
        # 获取元素的父链接 (a 标签)
        parent_element = driver.find_element(By.XPATH, xpath + "/ancestor::a[1]")
        link = parent_element.get_attribute('href')

        # 写入Excel表格
        sheet.range((row_index, 1)).value = content
        sheet.range((row_index, 2)).value = link
        row_index += 1
    except Exception as e:
        print(f"元素 {xpath} 未找到: {e}")
    return row_index

if __name__ == "__main__":
    # 创建一个新的Excel工作簿和工作表
    wb = xw.Book()
    sheet = wb.sheets[0]    
    
    # 打开目标网页
    driver.get("https://top.baidu.com/board")  # 替换为你的目标网页URL

    # 行索引
    row_index = 1

    # 循环获取XPath范围内的元素文本内容和链接
    for i in range(2, 11):  # 假设你要获取10个元素
        xpath = f"//*[@id='sanRoot']/main/div/div/div[2]/a[{i}]/div[2]/div[2]/div/div"
        row_index = get_element_content_and_link(xpath, sheet, row_index)

    # 保存Excel文件，覆盖已存在的文件
    wb.save('output.xlsx')
    wb.close()

    # 关闭浏览器
    driver.quit()

五、小结

本周推文我们主要是讲了Airtest-selenium获取网页上两种不同数据并导出到Excel表的情况，主要是介绍了关于Airtest-selenium与Excel的协作，以及在获取不同数据内容的时候，我们应该如何去获取以及思考脚本思路。在实际应用过程，同学们可以根据自己的需求，去编写更加复杂和专业的脚本。

如果在测试的过程中，遇到了问题，或者有任何想要深入了解的知识点，欢迎在官方交流群（526033840）里告诉我们或者提交issue，也欢迎大家投稿其他不同的使用小技巧。

（猜你还想看）

▼

Airtest-Selenium实操小课④：微信读书上阅读书籍

Airtest脚本的重构与优化：提升测试效率和可读性

多设备兼容脚本，轻松拿捏

AirtestProject

AirtestProject是网易开源的UI自动化测试方案。关注我们，获取测试领域的最新技术，洞察测试行业的最新动态。

最新文章

关于Airtest近期常见问题解答

iOS-Tagent上新了，iOS17的wda的部署小技巧你get了吗~

轻松掌握在AirtestIDE中切换为本地Python环境的详细指南

Selenium 进阶技巧：实现 Web 端的鼠标操作功能

高效Selenium测试技巧：轻松控制已开启的浏览器

网易Airtest预祝大家国庆节快乐！

【IOS自动化】IOS18如何使用Airtest进行自动化测试及go-ios的基本使用

【私有云场景案例分享③】批量回归测试自动化流程

【装包测试】Android应用权限授权小技巧

【私有云场景案例分享②】批量装包与冒烟测试的自动化实现

批量图像识别的快速遍历技巧

【私有云场景案例分享①】高效的集群管理能力

录屏方法剖析，记录脚本跑测不再难

Airtest封装的Tidevice接口有多好用（二）

网易Airtest私有云新增成员：主板机箱重磅出击

Airtest封装的Tidevice接口有多好用（一）

Airtest成功案例分享：KLab连续2年携Airtest私有云产品参加CEDEC大会！

文字识别技术升级：Airtest与PaddleOCR模型的协作小技巧

自动化测试小技巧之Airtest-Selenium和Excel的无缝协作

Airtest-Selenium实操小课④：微信读书上阅读书籍

Airtest脚本的重构与优化：提升测试效率和可读性

多设备兼容脚本，轻松拿捏

Windows技巧：轻松连接多进程窗口之一

Poco框架实操：对节点可实施的操作

打开、关闭、切换App以及清除App进程，操作so easy！

网易Airtest集群方案大揭秘：升级版便携式机柜来袭~

网易Airtest祝大家劳动节快乐，事业腾飞！

Poco框架实操：获取节点属性的高效技巧(一)

Poco节点关系大公开！

如何用覆盖函数的方式，实现你自己的touch？

遇到时间控件怎么办？不要慌，教你轻松拿下

摸鱼小技巧来啦，速来围观

Airtest全新升级兼容Selenium 4.0，快来看看更新的内容吧

【更新公告】AirtestIDE更新至1.2.17版本

网易Airtest祝大家龙行龘龘，前程朤朤，新春快乐！

2023 Airtest 年终总结来了，大佬们速来围观！

Airtest-Selenium实操小课③：下载可爱猫猫图片

【更新公告】Airtest更新至1.3.3版本

Airtest-Selenium实操小课②：刷B站视频

网易Airtest预祝大家元旦快乐，龙年如意！

Airtest-Selenium实操小课①：爬取新榜数据

【更新公告】Airtest更新至1.3.2版本

Airtest结合Poco对控件实施精准截图，学起来！

Airtest：各平台的剪切板功能汇总

【更新公告】AirtestIDE更新至1.2.16版本

【新手必读】Airtest测试Android手机常见的设置问题

【速看】如何通过合理的封装，让你的自动化脚本更上一层楼！

新手如何用Airtest实现在图片范围内随机点击？

AirtestProject 全体祝大家欢度双节，中秋国庆快乐~

网易Airtest全新推出：小型便携式集群解决方案！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉