使用 Asyncio 实现 Python 自由线程

文摘 2024-10-18 11:12 上海

随着 Python 3.13 即将发布,我想看看 Python 即将推出的最大变化。我认为迄今为止最令人兴奋的特性是来自 PEP-703^[1] 的自由线程 Python。

由于我加入得比较晚,已经有很多文章在讨论这个话题了。我看到了 Simon Wilson 的一篇优秀文章^[2] ,成功演示了纯 Python 函数的并行性。在此基础上,我想探索一下除了使用 ThreadPoolExecutor.map 之外的线程同步方法。

在 Python 3.13 之前,由于 GIL 的存在,线程被用于 IO 密集型任务,Asyncio 也用于 IO(显而易见...),我们可以使用 asyncio.to_thread^[3] 来包装线程。例如,

await asyncio.to_thread(io_bound_task, "first_arg", optional="optional")

我们能否将其用于 CPU 密集型任务?这里有一段直接引用自 Asyncio 文档的内容:

注意:由于 GIL 的存在,asyncio.to_thread() 通常只能用于使 IO 密集型函数变为非阻塞。然而,对于释放 GIL 的扩展模块或没有 GIL 的替代 Python 实现,asyncio.to_thread() 也可以用于 CPU 密集型函数。唯一阻碍我们的是 GIL,所以 CPU 密集型任务应该不成问题。尽管考虑到 Async_IO_ 这个名字,这仍然感觉有点傻。

我用 AsyncIO 修改更新了 Simon 的测试脚本:

import argparse
import os
import sys
import time
from asyncio import get_running_loop, run, to_thread, TaskGroup
from concurrent.futures import ThreadPoolExecutor
from contextlib import contextmanager

@contextmanager
def timer():
    start = time.time()
    yield
    print(f"Elapsed time: {time.time() - start}")

def cpu_bound_task(n):
    """A CPU-bound task that computes the sum of squares up to n."""
    return sum(i * i for i in range(n))

async def main():
    parser = argparse.ArgumentParser(description="Run a CPU-bound task with threads")
    parser.add_argument("--threads", type=int, default=4, help="Number of threads")
    parser.add_argument("--tasks", type=int, default=10, help="Number of tasks")
    parser.add_argument(
        "--size", type=int, default=5000000, help="Task size (n for sum of squares)"
    )
    args = parser.parse_args()

    get_running_loop().set_default_executor(ThreadPoolExecutor(max_workers=args.threads))

    with timer():
        async with TaskGroup() as tg:
            for _ in range(args.tasks):
                tg.create_task(to_thread(cpu_bound_task, args.size))

if __name__ == "__main__":
    print("Parallel with Asyncio")
    print(f"GIL {sys._is_gil_enabled()}")  # type: ignore
    run(main())

我在我的 M3 Macbook Pro 上分别在有 GIL 和无 GIL 的情况下运行了它:

➜ python parallel_asyncio.py
Parallel with Asyncio
GIL False
Elapsed time: 0.5552260875701904

在没有自由线程的情况下:

➜  python parallel_asyncio.py
Parallel with Asyncio
GIL True
Elapsed time: 1.6787209510803223

结果如预期一样,当我们使用 AsyncIO 并发运行代码时,我们观察到了预期的并行执行带来的速度提升。

但为什么要这样做?

通常在讨论 Asyncio 时,人们总是关注其性能或性能不足。虽然性能当然很重要,但能够推理并发性是最大的好处。

我个人认为,TaskGroup 的加入使得 Asyncio 并发任务变得相当容易理解,我们可以用它来同步线程任务的结果。

根据你对 AsyncIO 的熟悉程度,它实际上可能是启动线程最简单的方法。这有点类似于 golang 中 go 例程的便利性。

这种方式还可以混合 IO 密集型异步任务和 CPU 密集型任务。比如像这样:

async with TaskGroup() as tg:
    io_task_future = tg.create_task(fetch(url))
    tg.create_task(to_thread(cpu_bound_task))
    tg.create_task(to_thread(cpu_bound_task))

await to_thread(compute_results, await io_task_future)

具体示例

现在还很难判断这是否是我们想要的,我认为有一些更具体的例子会让我们更好地理解。如果我想到什么,我会尝试跟进这个话题。

参考链接

PEP-703: https://peps.python.org/pep-0703/
文章: https://til.simonwillison.net/python/trying-free-threaded-python
asyncio.to_thread: https://docs.python.org/3/library/asyncio-task.html#asyncio.to_thread

http://mp.weixin.qq.com/s?__biz=MjM5NzUwODgyNA==&mid=2247487802&idx=1&sn=a078259635c12c607c2d099055ee11c7

幻想发生器

图解技术本质

最新文章

为 Nintendo Switch™ 编译 Go 程序

Go sync.Once 很简单... 真的是这样吗？

为高延迟环境优化HTTP

3种简单方法在Go中添加版本标识

通过从头编写HTTP服务器探索Postgres的内存分配器

优化和可视化 Go 测试的并行性：为什么更多的核心并不能加速你的 Go 测试

奇怪的语言词法

如何构建更小的容器镜像：Docker 多阶段构建

Octoverse：AI推动Python成为顶级语言，全球开发者数量激增

Web已死？前一千万个网站中有27.6%已经死亡

编写安全的 Go 代码

基准测试：Go语言中的性能测试

Genie：Uber的生成式AI随叫随到副驾驶

使用装饰器实现Python单例模式

使用 Asyncio 实现 Python 自由线程

使用htmx构建单页应用

关于 Python 3.13 你需要知道的一切 – JIT 和 GIL 携手并进

在浏览器中使用 Pyodide、PyScript 和 JupyterLite 运行 Python 版 DuckDB

超越多核并行：使用 SIMD 加速 Mandelbrot 计算

重构：从 Redis 到 SQLite

Golang 在 Windows 上的高精度计时器

Golang 的反射

使用Go Embed

一些 Go Web 开发笔记

将 Golang API 与 MySQL 和 Docker Compose 容器化

使用SQL进行采样

Golang 解释器：Yaegi 内部实现

云上资源到本地IaC

实现自己的拼写检查

Discord如何将Websocket流量减少40%

让我们构建并优化一个 Rust 的 Python 扩展

在生产环境中使用Rust 一年之后感想

Golang 随机公平库 satmihir/fair

Go/Golang中的集合 – 使用映射和推荐的包

Golang Type Alias 中有什么?

我们应该拆解我们的单体应用吗?

理解Rust中的内存排序

为什么语言文档仍然如此糟糕?

拥有灵魂的软件:人工智能被低估的前沿领域

在 Go 中构建基于 LLM 的应用程序 - Go 编程语言

为什么我在Docker中仍然使用Python虚拟环境

构建 Bubble Tea 程序的技巧

网络剪贴板及其如何存储不同类型的数据

良好的软件开发习惯 - Zarar

推到极限：Netflix WebSocket代理的未来演进

使用trace和PYREPL_TRACE调试新的Python REPL

为什么我要转向 Polars

探索 Goja: 一个 Golang JavaScript 运行时

异步 Rust 可以很愉快

函数类型的Range - Go编程语言

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉