目录:
pip 工具简介 示例:安装numpy库 实际应用场景 维护良好的开发环境
模块与包
pip 工具简介
pip
是Python的包管理工具,可以帮助我们轻松地安装、升级和卸载Python包。它是Python 3.4及以上版本默认自带的工具。对于Python 2.7.9+ 或者 Python 3.4+ 及以上的版本,pip
已经被集成到了标准库中。
常用pip命令:
pip install 包名
- 安装指定包。pip uninstall 包名
- 卸载指定包。pip list
- 列出所有已安装的包及其版本。pip show 包名
- 显示指定包的信息。pip freeze
- 列出当前环境下的所有第三方库,通常用于生成依赖文件。
示例:安装numpy库
numpy
是一个非常流行的Python库,主要用于科学计算,支持大量的维度数组与矩阵运算,并提供了大量的数学函数库。
1、检查是否已经安装了numpy 在命令行中输入:
pip list
查看输出结果中是否有numpy
,如果有,则表示已经安装了。
2、安装numpy 如果还没有安装numpy
,可以通过以下命令安装:
pip install numpy
这个过程可能需要一些时间,因为pip
会自动找到最新版本的numpy
并下载对应的.whl文件进行安装。(如果安装速度太慢,可以使用镜像源安装,方法见文末相关阅读)
3、验证安装 打开你的Python解释器或者IDE,尝试导入numpy
:
import numpy as np
print(np.__version__)
如果没有报错,并且成功打印出了numpy
的版本号,那么就说明numpy
已经成功安装了。
实际应用场景
假设你是一位数据分析师,经常需要处理大量数据集。这时,pandas
库就显得非常有用,它基于numpy
构建,为数据分析提供了一个强大的框架。让我们一起看看如何安装pandas
以及它的简单应用。
1、安装pandas使用同样的方法,通过pip
安装pandas
:
pip install pandas
2、使用pandas读取CSV文件下面是一段简单的代码示例,演示如何使用pandas
读取CSV文件并显示前几行内容:
# 导入必要的库
import pandas as pd
# 从网络加载样本数据集
url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv"
data = pd.read_csv(url)
# 查看数据集的前5行
print(data.head())
此代码将展示如何快速获取并查看数据集,这对于初步了解数据结构是非常有用的。
维护良好的开发环境
随着项目的发展,可能会涉及到越来越多的外部库。为了保持项目的整洁性以及方便迁移至不同的开发环境中,推荐使用虚拟环境(如venv
)和requirements.txt
文件来管理项目依赖。创建一个requirements.txt
文件,列出所有的依赖项及版本,这样就可以很容易地复制整个开发环境到另一台机器上。
创建requirements.txt
的例子:
# 在项目根目录下运行
pip freeze > requirements.txt
之后,在新的环境中只需要执行下面的命令即可一次性安装所有依赖:
pip install -r requirements.txt
相关阅读:创建 Python 虚拟环境 、使用镜像源安装第三方库