Python与Excel交互:pandas库安装及基本用法

文摘   2024-11-07 07:46   上海  

在之前的文章中,我们探讨了Python处理Excel文件的基本概念,如工作簿、工作表以及单元格等。现在我们将转向具体的工具介绍——pandas库,它是Python中最常用的数据分析库之一,能够非常便捷地读取、处理和写入Excel文件。

安装pandas库

首先,确保你的Python环境中已经安装了pandas库。如果没有安装,可以通过以下命令进行安装:

pip install pandas

如果需要同时支持Excel文件的读写功能,则还需要安装openpyxlxlrdxlsxwriter来读写.xlsx文件:

pip install openpyxl
# 或者
pip install xlrd xlsxwriter

pandas基本用法

读取Excel文件

import pandas as pd

# 读取Excel文件中的第一个Sheet
df = pd.read_excel('example.xlsx')

# 读取指定Sheet(通过名称)
df = pd.read_excel('example.xlsx', sheet_name='SheetName')

# 读取指定Sheet(通过索引)
df = pd.read_excel('example.xlsx', sheet_name=0)

# 获取所有Sheet的名称列表
xls = pd.ExcelFile('example.xlsx')
sheet_names = xls.sheet_names

查看数据

# 查看前几行数据
print(df.head())

# 查看后几行数据
print(df.tail())

基本数据处理

# 选择某一列数据
column_data = df['ColumnName']

# 选择某几列数据
selected_columns = df[['Column1''Column2']]

# 按条件筛选数据
filtered_df = df[df['ColumnName'] > 5]

# 添加新列
df['NewColumn'] = df['ColumnA'] + df['ColumnB']

写入Excel文件

# 将DataFrame写入Excel文件
df.to_excel('output.xlsx', index=False)

实践案例

假设有一个Excel文件包含了员工的信息,我们可以使用pandas来进行简单的数据分析:

# 读取Excel文件
employees_df = pd.read_excel('employees.xlsx')

# 查看前5条记录
print(employees_df.head())

# 筛选出部门为'Engineering'的员工
engineering_employees = employees_df[employees_df['Department'] == 'Engineering']

# 计算Engineering部门员工的平均年龄
average_age = engineering_employees['Age'].mean()
print(f"Average age of Engineering department: {average_age:.2f}")

总结

本文介绍了如何使用pandas库来安装并执行基本的Excel文件读写操作。我们学习了如何读取Excel文件中的数据,筛选和处理数据,以及如何将处理后的数据写回Excel文件。这些技能为使用Python进行数据分析提供了坚实的基础。接下来,我们将继续深入探索更多的pandas功能以及其他与Excel交互的方法。

好了,今天的分享就到这里了,我们下期见。如果本文对你有帮助,请动动你可爱的小手指点赞、转发、在看吧!

付费合集推荐

Python编程基础

Python办公自动化-Excel

微信公众号批量上传发布系统

文末福利

公众号消息窗口回复“编程资料”,获取Python编程、人工智能、爬虫等100+本精品电子书。

精品系统

微信公众号批量上传发布系统

关注我👇,精彩不再错过


手把手PythonAI编程
分享与人工智能和python编程语言相关的笔记和项目经历。
 最新文章