面试官：说一下Python中的多线程和多进程的应用场景和优缺点

科技 2024-12-10 15:04 陕西

今天咱们来聊聊 Python 中的多线程和多进程，它们在不同应用场景下的优缺点以及适用范围。

如果你是 Python 开发工程师，可能在日常工作中已经或多或少接触过这两者，但到底什么时候该用多线程，什么时候该用多进程，可能还是有些迷茫。今天咱们就来一探究竟。

首先，咱们得搞清楚“线程”和“进程”这两个概念。进程是操作系统分配 CPU 资源的基本单位，而线程则是操作系统分配 CPU 的更小的单位。

通俗地讲，进程就像是一个大型的容器，而线程是容器里的工人。每个进程有自己的内存空间，而多个线程共享同一个进程的内存。这是它们最本质的区别。知道这一点，我们接下来的讨论就会更清晰。

多线程适用于 I/O 密集型的应用场景，比如网络爬虫、数据库访问等。为什么是 I/O 密集型？因为 I/O 操作一般会涉及到大量的等待，比如读取磁盘、网络请求等。

在这些等待期间，CPU 是空闲的，而多线程的优势就在于，它们能在一个线程等待 I/O 操作完成时，切换到另一个线程继续工作。

这样，不仅可以提高 CPU 的利用率，也能让程序更加高效。对于 Python 来说，多线程的一个大问题是 GIL（全局解释器锁）。

GIL 会导致 Python 线程在执行字节码时，不能实现真正的并行处理。所以，如果任务是 CPU 密集型的，GIL 就成了一个很大的瓶颈。

举个简单的例子，假设我们有两个任务：一个是读取文件，另一个是进行复杂的计算。如果使用多线程来做，读取文件时 CPU 就会空闲，等待的时间内另一个线程可以执行计算任务，这时的 CPU 利用率较高。代码示例：

import threading
import time

def read_file():
    print("Reading file...")
    time.sleep(3)
    print("File read done")

def compute():
    print("Start computing...")
    time.sleep(2)
    print("Computation done")

threads = []
t1 = threading.Thread(target=read_file)
t2 = threading.Thread(target=compute)

threads.append(t1)
threads.append(t2)

for t in threads:
    t.start()

for t in threads:
    t.join()

print("All tasks completed")

在这段代码中，我们有两个线程：一个是执行文件读取的，另一个是执行计算的。在文件读取时，线程会等待 3 秒，而计算任务需要 2 秒。通过多线程，这两个任务可以重叠执行，从而提高效率。

但是，如果任务涉及到大量计算，比如矩阵运算、视频编码等，多线程就不那么合适了，因为即使你有多个线程，GIL 也限制了它们的并行执行，最终可能导致 CPU 资源无法充分利用。

这时就轮到 多进程 上场了。多进程可以绕开 GIL 的限制，每个进程都有独立的内存空间和 GIL。因此，多进程特别适合 CPU 密集型的任务。

例如，数据处理、科学计算、图像处理等，都可以通过多进程来加速。每个进程可以在不同的 CPU 核心上并行运行，充分发挥多核 CPU 的性能。

代码示例：

from multiprocessing import Process
import time

def compute():
    print("Start computing...")
    time.sleep(2)
    print("Computation done")

processes = []
p1 = Process(target=compute)
p2 = Process(target=compute)

processes.append(p1)
processes.append(p2)

for p in processes:
    p.start()

for p in processes:
    p.join()

print("All tasks completed")

在这个例子中，计算任务被放在了两个独立的进程中，这两个进程可以在不同的 CPU 核心上并行执行，从而提升计算效率。

虽然多进程能够解决 GIL 的限制，并且能够充分利用多核 CPU 的能力，但它也有一些缺点。首先，进程之间的通信非常复杂。

由于每个进程有独立的内存空间，进程间不能直接共享数据。我们必须通过进程间通信（IPC）机制来实现数据的交换，常见的方式包括管道、队列、共享内存、套接字等。这就导致了多进程在数据交换时比多线程更复杂，代码的可维护性也降低。

此外，进程的启动和销毁比线程要更为昂贵，尤其是在大规模并行任务下，频繁地创建和销毁进程会带来较大的性能开销。

除了多线程和多进程，异步编程也是一种常见的并发编程方式。异步编程与线程和进程不同，它并不依赖于操作系统的并发机制，而是通过事件循环和协程来模拟并发。

具体来说，异步编程通常采用 async/await 关键字，通过 事件循环 来调度任务。异步编程非常适合 I/O 密集型任务，尤其是需要大量等待 I/O 操作的场景。它的优点在于能够避免线程的上下文切换，且内存消耗较低。

以 asyncio 为例：

import asyncio

async def read_file():
    print("Reading file...")
    await asyncio.sleep(3)
    print("File read done")

async def compute():
    print("Start computing...")
    await asyncio.sleep(2)
    print("Computation done")

async def main():
    await asyncio.gather(read_file(), compute())

asyncio.run(main())

这段代码通过 asyncio.gather() 将两个异步任务并发执行，执行过程中，read_file() 和 compute() 可以同时进行，避免了不必要的等待。

在 Python 中，选择多线程、还是多进程、还是异步编程，主要取决于任务的性质。

如果是 I/O 密集型任务，可以考虑使用多线程或者异步编程，它们都可以避免过多的等待，提高 CPU 利用率。

而如果任务是 CPU 密集型的，那么多进程是最佳选择，能够充分发挥多核 CPU 的优势。

那面试官问你：在 Python 中，如何选择多线程、多进程和异步编程？它们各自的优缺点是什么？

你的回答可以是：

Python 中的并发编程主要有多线程、多进程和异步编程三种方式：

多线程：适合 I/O 密集型任务，如文件读取、网络请求等。多个线程共享同一个进程的内存空间，可以高效利用 CPU 的空闲时间。缺点是受到 GIL 的限制，无法实现 CPU 密集型任务的并行计算。
多进程：适合 CPU 密集型任务，如数据处理、科学计算等。通过创建多个独立的进程，每个进程有自己的内存空间和 GIL，能充分利用多核 CPU。缺点是进程间通信较为复杂，并且启动和销毁进程的开销较大。
异步编程：适合 I/O 密集型任务，特别是在大量等待 I/O 操作时（如网络爬虫）。通过协程和事件循环，避免了线程切换的开销，内存消耗较少。缺点是代码逻辑相对复杂，需要理解事件循环的机制。

最终选择何种方式，需要根据任务的性质来判断。

对编程、职场感兴趣的同学，大家可以联系我微信：golang404，拉你进入“程序员交流群”。

🔥虎哥私藏精品热门推荐🔥

虎哥作为一名老码农，整理了全网最全《python高级架构师资料合集》。

资料包含了《IDEA视频教程》、《最全python面试题库》、《最全项目实战源码及视频》及《毕业设计系统源码》，总量高达 650GB，全部 免费领取。

Python技术迷

回复：python，领取Python面试题。分享AI编程，AI工具，Python技术栈，Python教程，Python编程视频，Pycharm项目，Python爬虫，Python数据分析，Python核心技术，Python量化交易。

最新文章

服了！凌晨二点多领导在微信群里骂人。。

为什么Python没有main函数？

70k，直接封神！

程序员的工资建议统一10k，反正人多。。

微信特别关注怎么设置？

麻了！因为0offer太久，家里人给我做法事了~

百度面试题：数据库出现死锁，该如何排查解决？

微信如何查看实名认证状态？

微信推出超赞的新功能 “送礼物”！

python写后端明明那么好用，为啥国内那么少？

美团面试官：mysql可能出现什么和并发相关问题？

微信怎么绑定QQ号/邮箱？

网友爆料:被降薪10%，主管让我别着急，降薪总比被裁员好，结果2个月后，主管被降薪25%~

面试官：讲一下mysql里有哪些锁？

这个hr的简历，简直炸裂！成功劝退员工4人，未支付赔偿金，工伤调查两起没提报工伤。。

面试官：在 B+ 树的叶子节点之后，如何进行数据查询？

x蚁员工爆料：最近绩效出来了，CTO线老板帮员工背了3.25。。

面试官：如何选择合适的事务隔离级别？

网友爆料：最近隔壁组来了个清华姚班的od，2018辽宁理科状元，太狠了~

面试官：什么是联合索引，它有什么优缺点？在使用时应注意什么？

微信群怎么只关注群内某个人？

刚入职一周的同事提交了一个新增 2w和删减1.4w的代码，不想review代码，头大~

实习了四十天突然被抓。导员：回不去就开除。。

面试官：执行一条SQL请求的过程是什么？

微信豆在哪里查看？微信豆有什么用？

迪子员工爆料：经过裁员优化后，发现35+员工堪比985/211的员工了，他们既听话又好用，又有丰富踩坑经验，不容易犯错!

面试官：mysql中的一些基本函数，你知道哪些？

外包公司的人写的代码，被扒出，骂惨了～

客户要求100块做个百度，我用10行Python代码搞定

X疆员工爆料：组里新来的实习生妹妹要把我这个老员工卷死了啊！领导安排一星期的任务，她提前两天搞定，然后居然还主动拉来了新任务！

一个零差评的 Python 内置库

X耀员工爆料：月薪25K，其中25%看绩效。年终2-4个月，看个人绩效，5%公积金，一二四加班，周六加班有双倍工资。

面试官：说一下Python中的多线程和多进程的应用场景和优缺点

一觉醒来，美团的offer作废了。。

面试官：你都怎么剖析Python代码的执行性能？

面试官：请说一下你对协程的理解，与线程有什么区别？

为什么微信朋友圈更新没有红点提醒？

牛逼！同事在会议室扇了自己几个大嘴巴子~

Python爆破ZIP文件

微信支付提示绑定银行卡？教你轻松解决！

网友吐槽：失业两个月，面试java研发，连外包offer都接不到，居然接到外企技术经理的offer。。

利用Python做一个漂亮小姐姐词云跳舞视频

鹅厂员工爆料：组里来了个有意思的新人，GitHub天天打卡、周末坚持写技术博客、在各种技术群里高谈阔论。。

面试官：如何将with语句用于一个自定义类？

尴尬！在楼梯睡觉被领导抓到了。。

Python 实现循环的最快方式（for、while 等速度对比）

微信登录电脑端后如何同步聊天记录?

外包竟敢用vim，我一个正编都没敢用。。

面试官：说一下你知道的Python编码规范。。。

外包对我怀恨在心，处处给我使绊子。。。

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉