学习笔记 | 如何测试自己写的函数程序慢在哪里

文摘 2024-08-22 10:03 北京

如何测试自己写的函数程序慢在哪里

前言

在开发过程中，优化程序性能是一项至关重要的任务。尤其是在处理大量数据或复杂算法时，找出程序中的瓶颈对于提高效率至关重要。本文将介绍如何使用 line_profiler 这一强大的工具来定位 Python 函数中的耗时点。通过具体的例子，我们将演示如何安装和使用 line_profiler，并展示它如何帮助我们识别并优化那些导致程序运行缓慢的部分。

安装

!pip install line_profiler -i https://pypi.mirrors.ustc.edu.cn/simple/

Looking in indexes: https://pypi.mirrors.ustc.edu.cn/simple/
Collecting line_profiler
  Downloading https://mirrors.ustc.edu.cn/pypi/packages/82/ad/06f4321260d709c5503bff79a41141b5725e3a1055151649ccbace98f663/line_profiler-4.1.3-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (718 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m718.1/718.1 kB[0m [31m4.8 MB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[?25hInstalling collected packages: line_profiler
Successfully installed line_profiler-4.1.3

运行测试程序

测试程序为之前编写的计算经纬度距离的函数，已放入 project 中

!head /home/mw/project/test.py

你需要做的仅仅是在函数前增加一个装饰器@profiler

eee

!kernprof -l -v test.py

    Distances (first few elements):

    [[ 3159.18918786 14643.10185207  7650.32449848  8573.73083237

      12650.20642209]

     [ 7037.54644113  3080.23896724 14975.47890911 11841.96330602

       8743.0463527 ]

     [10295.70808389  7033.29073201  4083.76761385 19282.7567062

      18171.59151038]

     [ 2907.8340534   9900.53032942 13261.30789668  9773.43351035

       7203.35265715]

     [13257.5275834   6853.12299363 11334.78737952 19004.35542823

      11065.46618589]]

    Wrote profile results to test.py.lprof

    Timer unit: 1e-06 s



    Total time: 0.000883144 s

    File: test.py

    Function: haversine at line 3



    Line #      Hits         Time  Per Hit   % Time  Line Contents

    ==============================================================

         3                                           @profile

         4                                           def haversine(lat1, lon1, lat2, lon2, R=6371):

         5                                               # 将角度转换成弧度

         6         1         77.2     77.2      8.7      lat1_rad, lon1_rad = np.radians(lat1), np.radians(lon1)

         7         1         71.2     71.2      8.1      lat2_rad, lon2_rad = np.radians(lat2), np.radians(lon2)

         8

         9                                               # 计算差值

        10         1         32.6     32.6      3.7      dLat = lat2_rad - lat1_rad

        11         1         27.7     27.7      3.1      dLon = lon2_rad - lon1_rad

        12

        13                                               # Haversine 公式

        14         1        585.7    585.7     66.3      a = np.sin(dLat / 2.0)**2 + np.cos(lat1_rad) * np.cos(lat2_rad) * np.sin(dLon / 2.0)**2

        15         1         84.9     84.9      9.6      c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))

        16

        17                                               # 返回距离

        18         1          3.8      3.8      0.4      return R * c

运行之后会发现 project 目录多了一个文件，是分析结果的记录

/home/mw/project/test.py.lprof

可以用以下语句查看

```python
!python -m line_profiler test.py.lprof

Timer unit: 1e-06 s



Total time: 0.000883144 s

File: test.py

Function: haversine at line 3



Line #      Hits         Time  Per Hit   % Time  Line Contents

==============================================================

     3                                           @profile

     4                                           def haversine(lat1, lon1, lat2, lon2, R=6371):

     5                                               # 将角度转换成弧度

     6         1         77.2     77.2      8.7      lat1_rad, lon1_rad = np.radians(lat1), np.radians(lon1)

     7         1         71.2     71.2      8.1      lat2_rad, lon2_rad = np.radians(lat2), np.radians(lon2)

     8

     9                                               # 计算差值

    10         1         32.6     32.6      3.7      dLat = lat2_rad - lat1_rad

    11         1         27.7     27.7      3.1      dLon = lon2_rad - lon1_rad

    12

    13                                               # Haversine 公式

    14         1        585.7    585.7     66.3      a = np.sin(dLat / 2.0)**2 + np.cos(lat1_rad) * np.cos(lat2_rad) * np.sin(dLon / 2.0)**2

    15         1         84.9     84.9      9.6      c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))

    16

    17                                               # 返回距离

    18         1          3.8      3.8      0.4      return R * c

从提供的 line_profiler 输出来看，我们可以清楚地看到函数 calculate_qv_divergence 中每一行代码的执行时间。下面是对关键数据点的分析：

最耗时的部分是在 ha 公式的主要计算上 (Line # 14)，占用了总执行时间的 64.7%。
转换纬度和经度为弧度 (Line # 6 和 Line # 7) 也消耗了一定的时间，分别占用了总执行时间的 8.8% 和 8.7%。
计算大圆弧的中心角 (Line # 15) 占用了总执行时间的 10.3%。。

执行上述代码后，line_profiler 将输出每个函数调用的时间统计信息。通过观察这些统计数据，我们可以发现哪些行或哪些部分消耗了最多的时间，从而找到优化的目标。

小结

通过使用 line_profiler，我们能够轻松地识别出程序中耗时较长的部分。这对于优化代码执行效率非常有用，特别是在处理大型数据集或执行密集型计算时。在实践中，我们建议定期使用这类工具来审查代码，以便及时发现并解决性能问题

参考链接：https://www.cnblogs.com/fnng/p/14702535.html
https://www.jianshu.com/p/a06a715b5a52

http://mp.weixin.qq.com/s?__biz=MzkzMDYxNDYzOQ==&mid=2247486710&idx=1&sn=d06a430921e1a59523e8c126ebab88f2

气python风雨

主要发一些涉及大气科学的Python文章与个人学习备忘录

最新文章

雷达系列：两种方法将气象雷达数据转为易处理的格式

CMAQ 5.4 输入与输出数据整理

在Jupyter环境中创建交互式可视化地图

读者答疑：使用Matplotlib绘制带有端头的垂直线段标注数据

增强云图

回旋镖！meteva也能绘制wrfout气象要素分布

python | x-y 网格切片

悟空传、西游日记和斗战神

meteva，这可能是气象萌新最需要的python库

Python | 降水 | 批量下载GPCP日数据

Python | MJO | 位相图

笔记 | Kelvin wave | 热带气旋

读者答疑 | python怎么计算流函数

深度学习 | 机器学习 | 气候预报 | 研究综述

气象绘图加强版（二十八）—cmap、cbar

看好了，雷达剖面可以这样画

Matplotlib双变量热力等级图

雷达系列 | 如何对国产雷达数据进行衰减订正

雷达系列 | 使用Plotly生成三维CAPPI反射率图

看好了，雷达产品廓线可以这样画

气象处理技巧—时间序列处理4

读者答疑：如何简单绘制全球土地覆盖图

Python | 泰勒图

MATLAB 绘制夏季海表流场

读者答疑：使用 metpy 散度函数计算时的报错

气象绘图加强版（十三）——底图的添加

与局地极端降雨相关的对流结构以及风暴尺度涡旋

学习笔记 | 如何测试自己写的函数程序慢在哪里

Python | 批量下载NCEP2再分析数据

NeuralGCM: 一种融合机器学习与物理原理来模拟地球大气的新方法

雷达系列 | 基于 pydda 使用国产单部雷达反演 3d 风场

Python | xinvert | 气象和海洋领域中椭圆型偏微分方程如何求解？

Easyclimate: 一行代码实现气候学的快速分析

学习笔记 | 如何转换文本文件的编码格式

Python | SST | 高通滤波 | EOF | 论文复现

10个机器学习数据处理Sklearn技巧，建议收藏！

雷达系列：如何使用python进行多部雷达数据反演风

新版本的欧空局下载哨兵方便很多

天气雷达拼图系统V3.0产品数据解析

业务刚需 | meteva复现多模式降水站点值mesh图

Python | 海洋气象 | Xarray:数据读取与切片01

Python | 大气科学 | 偏相关

xarray基础之计算篇

深度学习 | UNet | 代码实现 | Tensorflow

Python | 北大西洋涛动 | NAO指数 | EOF

超长篇幅！PyCINRAD保姆级教程

ERA5数据官网下载之CDS-Beta升级方法和避坑指南！

暖区暴雨是否会受到锋面暴雨的影响？

气候统计界的瑞士军刀——sacpy

Data | 降水数据集：概述和比较

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉