Python爬虫数据写入Excel的三种方法,值得收藏

文摘   2024-12-07 20:23   广西  

大家好我是小白,今天给小伙伴们分享一下Python爬虫数据写入Excel的三种超实用方法,这些方法在咱们日常处理爬取到的数据时可太好用了,妥妥的值得收藏起来,以后遇到相关情况就能轻松应对,现在就跟着我一起来学习学习。

使用 xlwt 库

首先要介绍的就是 xlwt 库,它可是专门用于在Python里创建和写入Excel文件(主要是xls格式哦)的得力小助手。

第一步,咱们得先安装这个库呀,要是你用的是 Anaconda 环境,那就打开 Anaconda Prompt(Windows 系统下是这么操作哈),然后输入以下命令:

conda install xlwt

要是没用 Anaconda,直接用常规的 pip 安装也行哦,在命令行输入:

pip install xlwt

安装好之后,咱们来看具体怎么用它写入数据。示例代码如下:

import xlwt

# 创建一个新的工作簿对象
workbook = xlwt.Workbook(encoding='utf-8')

# 添加一个工作表,这里取名叫 'Sheet1',当然你可以取别的名字哦
worksheet = workbook.add_sheet('Sheet1')

# 假设咱们爬取到了一些简单的数据,这里模拟一下,是个包含姓名和年龄的列表
data = [['小明', 20], ['小红', 22], ['小刚', 18]]

# 写入表头,也就是列名啦,在第一行写入 '姓名' 和 '年龄'
worksheet.write(0, 0, '姓名')
worksheet.write(0, 1, '年龄')

# 循环写入具体的数据,从第二行开始哦,因为第一行是表头了
for row, row_data in enumerate(data, start=1):
   worksheet.write(row, 0, row_data[0])
   worksheet.write(row, 1, row_data[1])

# 最后保存这个 Excel 文件,起个名字叫 'example.xls',你可以按需更改文件名哦
workbook.save('example.xls')

通过上面这些步骤呀,咱们就能轻松地把数据写入到一个 xls 格式的 Excel 文件里啦,是不是挺简单的。

使用 openpyxl 库

接下来讲讲 openpyxl 库哦,它更强大一些,支持读写 xlsx 格式的 Excel 文件呢,现在这种格式用得也很广泛。

同样先安装它,用 Anaconda 环境的小伙伴在 Anaconda Prompt 里输入:

conda install openpyxl

用 pip 安装的话就在命令行输入:

pip install openpyxl

然后看代码示例:

from openpyxl import Workbook

# 创建工作簿对象
workbook = Workbook()

# 获取默认的工作表,openpyxl 会自动创建一个叫 'Sheet' 的工作表哦,你也可以改名或者添加新的工作表
worksheet = workbook.active

# 模拟爬取的数据,和前面类似哦
data = [['小李', 21], ['小张', 19], ['小王', 23]]

# 写入表头,这里用另一种方式来写啦,指定单元格赋值
worksheet['A1'] = '姓名'
worksheet['B1'] = '年龄'

# 写入具体数据,从第二行开始循环
for index, row_data in enumerate(data, start=2):
   worksheet[f'A{index}'] = row_data[0]
   worksheet[f'B{index}'] = row_data[1]

# 保存文件,名字叫 'example_openpyxl.xlsx',注意格式哦
workbook.save('example_openpyxl.xlsx')

用 openpyxl 库也能很方便地把咱们的数据安排到 Excel 文件里去呢,而且它在处理更复杂的 Excel 操作时更有优势。

使用 pandas 库

最后再说说强大的 pandas 库呀,它本身是做数据处理和分析的,但也有很便捷的功能来写入 Excel 文件。

一般大家安装 pandas 的时候会顺带把相关依赖都安装好啦,如果没安装的话,同样可以用 Anaconda 或者 pip 安装。

代码示例如下:

import pandas as pd

# 还是模拟那些爬取的数据啦,不过这里用字典形式来表示更符合 pandas 的习惯哦
data = {'姓名': ['小赵', '小钱', '小孙'], '年龄': [20, 24, 18]}

# 直接用 DataFrame 把数据转换为表格形式
df = pd.DataFrame(data)

# 然后就可以轻松保存到 Excel 文件啦,名字叫 'example_pandas.xlsx'
df.to_excel('example_pandas.xlsx', index=False)  # index=False 表示不保存行索引哦

pandas 库这种方式超级简洁快速,很适合咱们快速把爬取到的数据整理到 Excel 文件里。

总结

好啦,小伙伴们,这就是Python爬虫数据写入Excel的三种方法啦,每种方法都有它自己的特点和适用场景哦,大家可以根据实际情况去选择使用,赶紧收藏起来,在实际的爬虫项目里试试手,相信很快就能掌握它们。

代码小白python
优质内容创作者
 最新文章