大家好我是小白,今天给小伙伴们分享一下Python爬虫数据写入Excel的三种超实用方法,这些方法在咱们日常处理爬取到的数据时可太好用了,妥妥的值得收藏起来,以后遇到相关情况就能轻松应对,现在就跟着我一起来学习学习。
使用 xlwt 库
首先要介绍的就是 xlwt 库,它可是专门用于在Python里创建和写入Excel文件(主要是xls格式哦)的得力小助手。
第一步,咱们得先安装这个库呀,要是你用的是 Anaconda 环境,那就打开 Anaconda Prompt(Windows 系统下是这么操作哈),然后输入以下命令:
conda install xlwt
要是没用 Anaconda,直接用常规的 pip 安装也行哦,在命令行输入:
pip install xlwt
安装好之后,咱们来看具体怎么用它写入数据。示例代码如下:
import xlwt
# 创建一个新的工作簿对象
workbook = xlwt.Workbook(encoding='utf-8')
# 添加一个工作表,这里取名叫 'Sheet1',当然你可以取别的名字哦
worksheet = workbook.add_sheet('Sheet1')
# 假设咱们爬取到了一些简单的数据,这里模拟一下,是个包含姓名和年龄的列表
data = [['小明', 20], ['小红', 22], ['小刚', 18]]
# 写入表头,也就是列名啦,在第一行写入 '姓名' 和 '年龄'
worksheet.write(0, 0, '姓名')
worksheet.write(0, 1, '年龄')
# 循环写入具体的数据,从第二行开始哦,因为第一行是表头了
for row, row_data in enumerate(data, start=1):
worksheet.write(row, 0, row_data[0])
worksheet.write(row, 1, row_data[1])
# 最后保存这个 Excel 文件,起个名字叫 'example.xls',你可以按需更改文件名哦
workbook.save('example.xls')
通过上面这些步骤呀,咱们就能轻松地把数据写入到一个 xls 格式的 Excel 文件里啦,是不是挺简单的。
使用 openpyxl 库
接下来讲讲 openpyxl 库哦,它更强大一些,支持读写 xlsx 格式的 Excel 文件呢,现在这种格式用得也很广泛。
同样先安装它,用 Anaconda 环境的小伙伴在 Anaconda Prompt 里输入:
conda install openpyxl
用 pip 安装的话就在命令行输入:
pip install openpyxl
然后看代码示例:
from openpyxl import Workbook
# 创建工作簿对象
workbook = Workbook()
# 获取默认的工作表,openpyxl 会自动创建一个叫 'Sheet' 的工作表哦,你也可以改名或者添加新的工作表
worksheet = workbook.active
# 模拟爬取的数据,和前面类似哦
data = [['小李', 21], ['小张', 19], ['小王', 23]]
# 写入表头,这里用另一种方式来写啦,指定单元格赋值
worksheet['A1'] = '姓名'
worksheet['B1'] = '年龄'
# 写入具体数据,从第二行开始循环
for index, row_data in enumerate(data, start=2):
worksheet[f'A{index}'] = row_data[0]
worksheet[f'B{index}'] = row_data[1]
# 保存文件,名字叫 'example_openpyxl.xlsx',注意格式哦
workbook.save('example_openpyxl.xlsx')
用 openpyxl 库也能很方便地把咱们的数据安排到 Excel 文件里去呢,而且它在处理更复杂的 Excel 操作时更有优势。
使用 pandas 库
最后再说说强大的 pandas 库呀,它本身是做数据处理和分析的,但也有很便捷的功能来写入 Excel 文件。
一般大家安装 pandas 的时候会顺带把相关依赖都安装好啦,如果没安装的话,同样可以用 Anaconda 或者 pip 安装。
代码示例如下:
import pandas as pd
# 还是模拟那些爬取的数据啦,不过这里用字典形式来表示更符合 pandas 的习惯哦
data = {'姓名': ['小赵', '小钱', '小孙'], '年龄': [20, 24, 18]}
# 直接用 DataFrame 把数据转换为表格形式
df = pd.DataFrame(data)
# 然后就可以轻松保存到 Excel 文件啦,名字叫 'example_pandas.xlsx'
df.to_excel('example_pandas.xlsx', index=False) # index=False 表示不保存行索引哦
pandas 库这种方式超级简洁快速,很适合咱们快速把爬取到的数据整理到 Excel 文件里。
总结
好啦,小伙伴们,这就是Python爬虫数据写入Excel的三种方法啦,每种方法都有它自己的特点和适用场景哦,大家可以根据实际情况去选择使用,赶紧收藏起来,在实际的爬虫项目里试试手,相信很快就能掌握它们。