(P1) 多进程/多线程/协程 (for Python)

动机、参考资料、涉及内容

threading, multiprocessing, asyncio 内容杂记

例子部分是一些使用按理, 其余部分为原理/API/源码介绍

os

os.waitpid

os.waitpid(-1, os.WNOHANG) 似乎应该理解为? 从已经结束的子进程里取出一个, 如果全部被取出则报错

import os
import time

for i in range(2):
    if os.fork() == 0:  # 子进程
        time.sleep(0.2)
        os._exit(0)
    else:  # 父进程
        pass

print(os.waitpid(-1, os.WNOHANG))  # (0, 0)
time.sleep(0.1)
print(os.waitpid(-1, os.WNOHANG))  # (0, 0)
time.sleep(1)
print(os.waitpid(-1, os.WNOHANG))  # (7746, 0)
print(os.waitpid(-1, os.WNOHANG))  # (7747, 0)
try:
    print(os.waitpid(-1, os.WNOHANG))
except OSError as err:
    print(err)  # ChildProcessError: [Errno 10] No child processes

os._exit

https://www.geeksforgeeks.org/python-os-_exit-method/

在 python 程序中, 提前退出的方式有这么几种: quit(), exit(), sys.exit(), os._exit(), 其中前三者原理相同, 都是通过 raise SystemExit 来实现的, 注意 quit 和 exit 的功能完全一样, 只是函数名不同, 但它们原本都在 site 模块中, 并且一般情况下不需要额外 import 就能直接使用(但这一行为不能完全确保), 而 sys.exit() 的原理与前两者相同. 但 os._exit() 是直接使用的操作系统提供的系统调用, 通常用于 os.fork 产生的子进程里退出子进程, 它会自动做些清理工作, 例如关闭没有被关闭的文件描述符.

os._exit 与 sys.exit 的微妙区别: python 有个内置模块是 atexit, 用于注册在程序结束时执行一些脚本, 但如果使用 os._exit 进行退出时, 这些脚本将不会被执行. multiprocessing 在 linux 上子进程的默认创建方式是 fork, 这种方式产生的子进程的退出方式是 os._exit.

os.pipe

os.pipe 用于创建管道, 管道分为读端与写端, 使用 os.fork 的子进程与其父进程共享文件描述符, 但是子进程关闭读端不会引起父进程关闭读端, 因此 os.pipe 常用于进程间的通信. multiprocessing.Process 的底层也使用到了 os.pipe

例 1: 父子进程通信

import os

# 创建管道
read_end, write_end = os.pipe()  # 此处返回的是两个文件描述符

# 在子进程中，关闭不需要的管道端，并向管道写入数据
if os.fork() == 0:  # 子进程
    print(f"Child End, read_end: {read_end}, write_end: {write_end}")
    os.close(read_end)  # 关闭读端
    data_to_send = b"Hello, pipe!"
    os.write(write_end, data_to_send)
    os.close(write_end)  # 写完数据后关闭写端
    exit()  # 或者使用 os._exit(0)

# 在父进程中，关闭不需要的管道端，并从管道读取数据
else:  # 父进程
    print(f"Parent End, read_end: {read_end}, write_end: {write_end}")
    os.close(write_end)  # 关闭写端
    data_received = os.read(read_end, 1024)
    os.close(read_end)  # 读完数据后关闭读端
    print("Received:", data_received.decode())

输出 (推测是 0, 1, 2 文件描述符分别被 STDIN, STDOUT, STDERR 占据, 然后接下来就是 3 和 4):

Parent End, read_end: 3, write_end: 4
Child End, read_end: 3, write_end: 4
Received: Hello, pipe!

例 2: 兄弟进程通信

import os

def child_write(write_end):
    os.close(write_end)  # 关闭不需要的管道端
    data_to_send = b"Hello from child!"
    os.write(read_end, data_to_send)
    os.close(read_end)  # 写完数据后关闭管道

def child_read(read_end):
    os.close(read_end)  # 关闭不需要的管道端
    data_received = os.read(write_end, 1024)
    print("Received:", data_received.decode())

# 创建管道
read_end, write_end = os.pipe()

# 创建第一个子进程，负责写数据
if os.fork() == 0:
    child_write(write_end)
    exit()

# 创建第二个子进程，负责读数据
if os.fork() == 0:
    child_read(read_end)
    exit()

# 父进程关闭管道
os.close(read_end)
os.close(write_end)

例 3: 创建多个子进程

import os

ends = []

for i in range(3):
    # 创建管道
    read_end, write_end = os.pipe()
    
    ends.append(read_end)
    ends.append(write_end)

    # 在子进程中，关闭不需要的管道端，并向管道写入数据
    if os.fork() == 0:  # 子进程
        print(f"Child End, read_end: {read_end}, write_end: {write_end}")
        os.close(read_end)  # 关闭读端
        data_to_send = f"Hello, pipe write_end: {write_end}!".encode()
        os.write(write_end, data_to_send)
        os.close(write_end)  # 写完数据后关闭写端
        os._exit(0)

    # 在父进程中，关闭不需要的管道端，并从管道读取数据
    else:  # 父进程
        print(f"Parent End, read_end: {read_end}, write_end: {write_end}")
        # os.close(write_end)  # 关闭写端
        data_received = os.read(read_end, 1024)
        # os.close(read_end)  # 读完数据后关闭读端
        print("Received:", data_received.decode())

for end in ends:
    os.close(end)

输出

Parent End, read_end: 3, write_end: 4
Child End, read_end: 3, write_end: 4
Received: Hello, pipe write_end: 4!
Parent End, read_end: 5, write_end: 6
Child End, read_end: 5, write_end: 6
Received: Hello, pipe write_end: 6!
Parent End, read_end: 7, write_end: 8
Child End, read_end: 7, write_end: 8
Received: Hello, pipe write_end: 8!

threading

threading.Event

参考博客: https://www.pythontutorial.net/python-concurrency/python-threading-event/

threading.Event 是对 bool 类型的一个包装, 使用 event.set() 表示将其设置为 True, 使用 event.clear() 表示将其设置为 False, event.is_set() 判断其为 True 或 False, event.wait() 会阻塞当前线程, 直到有别的线程将其设置为 True, 本线程才会继续执行. 更详细的说明上面的博客比较清楚.

from threading import Thread, Event
from time import sleep

def task(event: Event, id: int):
    print(f'Thread {id} started. Waiting for the signal....')
    event.wait()
    print(f'Received signal. The thread {id} was completed.')

def main():
    event = Event()  # 默认为 False
    t1 = Thread(target=task, args=(event,1))
    t2 = Thread(target=task, args=(event,2))
    t1.start()
    t2.start()
    print('Blocking the main thread for 3 seconds...')
    sleep(3) 
    event.set()

if __name__ == '__main__':
    main()

上面的例子中, 直到主线程将 event 设置为 True 时, 两个子线程才继续执行下去.

Lock, RLock

锁对象必须是同一个, 且必须是多个线程共享, 多个线程修改的对象是同一个.

# tlock.py
import threading
import time

# 共享变量
shared_variable = 0
lock = threading.Lock()
rlock = threading.RLock()

def thread_with_lock(op, name):
    global shared_variable
    for _ in range(1000):
        lock.acquire()
        try:
            if op == "add":
                shared_variable += 1
            elif op == "sub":
                shared_variable -= 1
            else:
                raise ValueError("")
            time.sleep(0.001)
        finally:
            lock.release()

def thread_with_rlock(op, name):
    global shared_variable
    for i in range(1000):
        rlock.acquire()
        try:
            if op == "add":
                temp = shared_variable + 1
            elif op == "sub":
                temp = shared_variable - 1
            else:
                raise ValueError("")
            if (i+1) % 200 == 0: print(name, i+1, shared_variable)
            time.sleep(0.001)   # 模拟修改过程要耗费一些时间, 这样子如果不加 lock 的话, 最后的 shared_variable 很可能不是 0
            shared_variable = temp
        finally:
            rlock.release()

t1 = threading.Thread(target=thread_with_rlock, args=("add", "thread-1"))
t2 = threading.Thread(target=thread_with_rlock, args=("sub", "thread-2"))

start_time = time.time()
t1.start()
t2.start()
t1.join()
t2.join()
end_time = time.time()

print("Final value of shared_variable:", shared_variable)
print(f"耗时: {end_time - start_time} 秒")

使用 python -u tlock.py 输出:

thread-1 200 200
thread-1 400 400
thread-1 600 572
thread-2 200 597
thread-2 400 397
thread-1 800 271
thread-1 1000 471
thread-2 600 400
thread-2 800 200
thread-2 1000 0
Final value of shared_variable: 0
耗时: 2.4496095180511475 秒

Lock vs RLock

RLock 有 Python 的实现: threading.py:_RLock, 它的 __init__ 函数 (python=3.9) 如下:

注意: 正常情况下, threading.RLock 不会指向 python 的实现 threading.py:_RLock, 但它们是兼容的, 只是便于分析

class _RLock:
    def __init__(self):
        self._block = _allocate_lock()  # 这个实际上就是 self._block = Lock()
        self._owner = None      # _owner 是一个整数值, 代表线程id
        self._count = 0
    def acquire(self, blocking=True, timeout=-1):
        me = get_ident()   # 获取当前线程 id
        if self._owner == me:  # _owner 记录了当前是哪个 thread 最初获取的本 RLock, 可重复获取 RLock, 但后面也要释放同样次数的 RLock
            self._count += 1
            return 1
        rc = self._block.acquire(blocking, timeout)
        if rc:
            self._owner = me
            self._count = 1
        return rc
    __enter__ = acquire  # __enter__ 与 __exit__ 用于实现 with 语句
    def release(self):
        if self._owner != get_ident():
            raise RuntimeError("cannot release un-acquired lock")
        self._count = count = self._count - 1
        if not count:    # count = 0 时释放内部的 Lock 对象 
            self._owner = None
            self._block.release()
    def __exit__(self, t, v, tb):
        self.release()
    # 其余方法: ...

什么时候用 RLock, 什么时候用 Lock 呢? https://stackoverflow.com/questions/16567958/when-and-how-to-use-pythons-rlock, 以下是上面问答里的一个例子

import threading
class X:
    def __init__(self):
        self.a = 1
        self.b = 2
        self.lock = threading.RLock()

    def changeA(self):
        with self.lock:  # 如果 self.lock 是 Lock 而不是 RLock, 则从 changeAandB 进到这里时会被堵住
            self.a = self.a + 1

    def changeB(self):
        with self.lock:
            self.b = self.b + self.a

    def changeAandB(self):
        # you can use chanceA and changeB thread-safe!
        with self.lock:
            self.changeA() # a usual lock would block at here
            self.changeB()

x = X()
x.changeAandB()

在这个例子里, 我们希望 X 类能分别提供线程安全的修改 a, b 以及按次序修改 a 和 b 的接口

如果这里的实现 self.lock 是 Lock 而不是 RLock, 那么整个程序会在 changeAandB 在调用 changeA 时会被堵塞住, 导致程序无法结束 (死锁). 而此处使用的是 RLock, 则会检查 lock 属于本线程, 进入 changeA 时不会堵住

Lock in FastAPI

注意: 尚不确定 asyncio.Lock 与 threading.Lock 应该用哪个

服务端

# server.py
from fastapi import FastAPI
import time
import threading

app = FastAPI()

a = 1
lock = threading.Lock()

@app.get("/modify")
def modify():
    global a, lock
    with lock:
        temp = a + 1
        time.sleep(0.1)
        a = temp
        time.sleep(0.1)
        a -= 1
    return {"temp": a}

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="127.0.0.1", port=8000)

客户端

# client.py
import requests
import threading

def foo(name):
    res = requests.get("http://127.0.0.1:8000/modify")
    print(name, res.json())

threads = []
for i in range(10):
    threads.append(threading.Thread(target=foo, args=(f"thread-{i}",)))

for t in threads:
    t.start()

for t in threads:
    t.join()

输出 (注意不加lock返回结果将不是这样):

thread-2 {'temp': 1}
thread-0 {'temp': 1}
thread-1 {'temp': 1}
thread-3 {'temp': 1}
thread-4 {'temp': 1}
thread-5 {'temp': 1}
thread-7 {'temp': 1}
thread-6 {'temp': 1}
thread-8 {'temp': 1}
thread-9 {'temp': 1}

GIL(待厘清, 感觉还是不理解)

GIL 是 Cpython 的特性, 原因是代码被python解释器执行时, 附带了一个垃圾回收线程, python 解释器在执行一个“单元”时会预先获取全局解释器锁 GIL. 下面的代码可以验证 GIL 的存在性

from threading import Thread
import time

num = 100

def task():
    global num
    temp = num
    num = temp - 1

if __name__ == "__main__":
    ts = []
    for i in range(100):
        ts.append(Thread(target=task))
    for t in ts:
        t.start()
    for t in ts:
        t.join()
    print(num)   # 0

在上面的例子中, 所有的线程都会先去抢 GIL 锁, 抢到后能很快执行 temp=num 以及 num=temp-1, 然后释放 GIL 锁. 注意: GIL 会在遇到 IO 时自动释放, 然后各线程继续抢 GIL 锁

ThreadPoolExecutor

from concurrent.futures import ThreadPoolExecutor, as_completed
import time

def run_in_thread_pool(func, params):
    tasks = []
    with ThreadPoolExecutor() as pool:
        for kwargs in params:
            thread = pool.submit(func, **kwargs)
            tasks.append(thread)

        for obj in as_completed(tasks):
            yield obj.result()

def foo(t, name):
    time.sleep(t)
    return t, name

results = run_in_thread_pool(foo, [
    {"t": 7, "name": "thread_1"},
    {"t": 3, "name": "thread_2"},
    {"t": 4, "name": "thread_3"},
    {"t": 5, "name": "thread_4"},
    {"t": 1, "name": "thread_5"},
])

start_time = time.time()
for result in results:
    print(result)
end_time = time.time()
print(f"total time: {end_time - start_time}s")

输出:

(1, 'thread_5')
(3, 'thread_2')
(4, 'thread_3')
(5, 'thread_4')
(7, 'thread_1')
total time: 7.008014678955078s

threading.local

threading.local 用于为每个线程设置自己的私有值, 不同线程不共享. 在代码写法上, 像是在用全局变量

import threading
import time
import random

local_data = threading.local()

def worker(thread_id):
    t = random.random()
    local_data.value = f"Thread {thread_id} setting data: {t}"
    time.sleep(t)
    print(f"[Thread {thread_id} read] {local_data.value}")

n = 5
ts = []
for i in range(n):
    ts.append(threading.Thread(target=worker, args=(i,)))
for i in range(n):
    ts[i].start()
for i in range(n):
    ts[i].join()

# 可以看到每个线程读取的都是它自己设置的私有值
# [Thread 0 read] Thread 0 setting data: 0.14037306397403715
# [Thread 3 read] Thread 3 setting data: 0.5426007168896825
# [Thread 4 read] Thread 4 setting data: 0.5997684976764723
# [Thread 2 read] Thread 2 setting data: 0.6010571379303268
# [Thread 1 read] Thread 1 setting data: 0.6663547889407234

multiprocessing

Lock

# plock.py
import multiprocessing
import time

# 共享变量
shared_variable = multiprocessing.Value('i', 0)
lock = multiprocessing.Lock()

def process_with_lock(op, name):
    global shared_variable
    for i in range(1000):
        lock.acquire()
        try:
            if op == "add":
                temp = shared_variable.value + 1
            elif op == "sub":
                temp = shared_variable.value - 1
            else:
                raise ValueError("")
            time.sleep(0.001)
            shared_variable.value = temp
            if (i+1) % 200 == 0: print(name, i+1, shared_variable.value)
        finally:
            lock.release()

p1 = multiprocessing.Process(target=process_with_lock, args=("add", "process-1"))
p2 = multiprocessing.Process(target=process_with_lock, args=("sub", "process-2"))

start_time = time.time()
p1.start()
p2.start()
p1.join()
p2.join()
end_time = time.time()

print("Final value of shared_variable:", shared_variable.value)
print(f"耗时: {end_time - start_time} 秒")

使用 python -u plock.py 输出:

process-1 200 200
process-1 400 400
process-1 600 600
process-1 800 800
process-2 200 719
process-2 400 519
process-2 600 319
process-2 800 119
process-1 1000 66
process-2 1000 0
Final value of shared_variable: 0
耗时: 2.5805752277374268 秒

Process 源码

分析 Python 3.9 源码

参考: https://www.cnblogs.com/ellisonzhang/p/10440453.html

注意点:

multiprocessing.Process 中的 daemon 属性与 Linux 中的 daemon 进程是不同的概念.
- 在 multiprocessing 模块中, Process 类的 daemon 属性用于指定进程是否为守护进程. 守护进程是一种在主进程结束时自动结束的子进程. 如果将 daemon 属性设置为 True, 则子进程将随着主进程的结束而结束; 如果设置为 False, 则子进程将在主进程结束后继续运行. 默认情况下, daemon 属性的值为 False.
- 在 Linux 中，daemon 进程是一种在后台运行且不受终端影响的进程。它们通常在系统启动时启动，并在后台持续运行，常用于提供系统服务或执行周期性任务。
import multprocessing 的时候发生了一些行为
Process.start 触发 ForkProcess 的初始化, 初始化触发 ForkProcess._launch, _launch 触发 Process._bootstrap, _bootstrap 触发 Process.run, 而 Process.run 很简单, 只是将 target 运行, 因此继承 Process 可以考虑对 run 重载

测试代码

import multiprocessing

def print_hello():
    print("hello world")

# 疑问: 此处打印 globals(), 发现并没有 multiprocessing.__init__ 对 globals() 添加的属性
# (2024/05/14 update) 见下面的解释
if __name__ == "__main__":
    # 疑问: 此处打印 globals(), 发现并没有 multiprocessing.__init__ 对 globals() 添加的属性
    # (2024/05/14 update) 见下面的解释
    p = multiprocessing.Process(target=print_hello)
    p.start()
    p.join()

import multiprocessing

# multiprocessing.__init__.py
import sys
from . import context

__all__ = [x for x in dir(context._default_context) if not x.startswith('_')]
# 注意此处加了些全局变量, 但似乎在入口脚本中没有体现
# (2024/05/14 update) globals() 实际上仅限于当前脚本
globals().update((name, getattr(context._default_context, name)) for name in __all__)

SUBDEBUG = 5
SUBWARNING = 25

if '__main__' in sys.modules:  # 疑似与 multiprocessing 代码需要在 `__main__` 下被调用相关, 待研究
    sys.modules['__mp_main__'] = sys.modules['__main__']

继续追溯 multiprocessing/context.py 在被 import 的时候发生的一些初始化动作

# multiprocessing/context.py
import os
import sys
import threading

from . import process    # 这里面初始化了一些全局变量
from . import reduction  # 这里面似乎没有初始化全局变量

# 省略若干代码

# 这里只体现 sys.platform == "linux" 的情况
class ForkProcess(process.BaseProcess):
    _start_method = 'fork'
    @staticmethod
    def _Popen(process_obj):
        from .popen_fork import Popen   # !!真正的逻辑发生在这里!!, multiprocessing.popen_fork.Popen 是一个 class
        return Popen(process_obj)

class SpawnProcess(process.BaseProcess):
    _start_method = 'spawn'
    @staticmethod
    def _Popen(process_obj):
        from .popen_spawn_posix import Popen
        return Popen(process_obj)

class ForkServerProcess(process.BaseProcess):
    _start_method = 'forkserver'
    @staticmethod
    def _Popen(process_obj):
        from .popen_forkserver import Popen
        return Popen(process_obj)

class ForkContext(BaseContext):
    _name = 'fork'
    Process = ForkProcess

class SpawnContext(BaseContext):
    _name = 'spawn'
    Process = SpawnProcess

class ForkServerContext(BaseContext):
    _name = 'forkserver'
    Process = ForkServerProcess
    def _check_available(self):
        if not reduction.HAVE_SEND_HANDLE:
            raise ValueError('forkserver start method not available')

_concrete_contexts = {
    'fork': ForkContext(),
    'spawn': SpawnContext(),
    'forkserver': ForkServerContext(),
}

_default_context = DefaultContext(_concrete_contexts['fork'])  # linux 下默认用 fork

继续追溯 multiprocessing/process.py 待后续分析

# multiprocessing/process.py
import os
import sys
import signal
import itertools
import threading   # 这个 import 也初始化了一些东西
from _weakrefset import WeakSet

# ...

# _MainProcess 很简单, 后面分析 BaseProcess 时可以看到主要时为 BaseProcess 设置一些属性用
class _MainProcess(BaseProcess):
    def __init__(self):
        self._identity = ()
        self._name = 'MainProcess'
        self._parent_pid = None
        self._popen = None
        self._closed = False
        self._config = {'authkey': AuthenticationString(os.urandom(32)), 'semprefix': '/mp'}
        # Everything in self._config will be inherited by descendant processes.
    def close(self):
        pass

_parent_process = None
_current_process = _MainProcess()
_process_counter = itertools.count(1)
_children = set()
del _MainProcess   # 这里又被 del 掉了

_exitcode_to_name = {}

for name, signum in list(signal.__dict__.items()):
    if name[:3]=='SIG' and '_' not in name:
        _exitcode_to_name[-signum] = f'-{name}'

# For debug and leak testing
_dangling = WeakSet()

这样我们在 import multiprocessing 模块时, 至少有如下这些分析目标:

multiprocessing/context.py 中的 _default_context 是什么
multiprocessing/process.py 中的 _current_process 是什么

我们先回到测试代码的这一行: p = multiprocessing.Process(target=print_hello)

# process.py: BaseProcess
# context.py: Process/ForkProcess/SpawnProcess/ForkServerProcess, BaseContext/ForkContext/SpawnContext/ForkServerContext
class Process(process.BaseProcess):
    _start_method = None
    @staticmethod
    def _Popen(process_obj):
        return _default_context.get_context().Process._Popen(process_obj)   # !!!最要紧之处!!!

于是我们回到了对 _default_context 的研究

# 注意: 在 linux 上, 默认是 fork, 因此 _default_context 本质上是这个
# _default_context = DefaultContext(ForkContext())
# 而 DefaultContext 与

class DefaultContext(BaseContext):
    Process = Process

    def __init__(self, context):
        self._default_context = context
        self._actual_context = None

    def get_context(self, method=None):
        if method is None:  # 一般来说会进到这个分支
            if self._actual_context is None:
                self._actual_context = self._default_context
            return self._actual_context
        else:
            return super().get_context(method)

    def set_start_method(self, method, force=False):
        if self._actual_context is not None and not force:
            raise RuntimeError('context has already been set')
        if method is None and force:
            self._actual_context = None
            return
        self._actual_context = self.get_context(method)

    def get_start_method(self, allow_none=False):
        if self._actual_context is None:
            if allow_none:
                return None
            self._actual_context = self._default_context
        return self._actual_context._name

    def get_all_start_methods(self):
        if sys.platform == 'win32':
            return ['spawn']
        else:
            methods = ['spawn', 'fork'] if sys.platform == 'darwin' else ['fork', 'spawn']
            if reduction.HAVE_SEND_HANDLE:
                methods.append('forkserver')
            return methods

class ForkContext(BaseContext):
    _name = 'fork'
    Process = ForkProcess

Process 的 _Popen 方法: return _default_context.get_context().Process._Popen(process_obj)

_default_context.get_context(): ForkContext
_default_context.get_context().Process: ForkProcess

class BaseProcess:
    def start(self):
        '''
        Start child process
        '''
        self._check_closed()
        assert self._popen is None, 'cannot start a process twice'
        assert self._parent_pid == os.getpid(), \
               'can only start a process object created by current process'
        assert not _current_process._config.get('daemon'), \
               'daemonic processes are not allowed to have children'
        _cleanup()
        self._popen = self._Popen(self)
        self._sentinel = self._popen.sentinel
        # Avoid a refcycle if the target function holds an indirect
        # reference to the process object (see bpo-30775)
        del self._target, self._args, self._kwargs
        _children.add(self)

# multiprocessing/popen_fork.py 的完整源码:
import os
import signal

from . import util

__all__ = ['Popen']

class Popen(object):
    method = 'fork'

    def __init__(self, process_obj):
        util._flush_std_streams()
        self.returncode = None
        self.finalizer = None
        self._launch(process_obj)

    def duplicate_for_child(self, fd):
        return fd

    def poll(self, flag=os.WNOHANG):
        if self.returncode is None:
            try:
                pid, sts = os.waitpid(self.pid, flag)
            except OSError:
                return None
            if pid == self.pid:
                self.returncode = os.waitstatus_to_exitcode(sts)
        return self.returncode

    def wait(self, timeout=None):
        if self.returncode is None:
            if timeout is not None:
                from multiprocessing.connection import wait
                if not wait([self.sentinel], timeout):
                    return None
            # This shouldn't block if wait() returned successfully.
            return self.poll(os.WNOHANG if timeout == 0.0 else 0)
        return self.returncode

    def _send_signal(self, sig):
        if self.returncode is None:
            try:
                os.kill(self.pid, sig)
            except ProcessLookupError:
                pass
            except OSError:
                if self.wait(timeout=0.1) is None:
                    raise

    def terminate(self):
        self._send_signal(signal.SIGTERM)

    def kill(self):
        self._send_signal(signal.SIGKILL)

    def _launch(self, process_obj):
        code = 1
        parent_r, child_w = os.pipe()
        child_r, parent_w = os.pipe()
        self.pid = os.fork()
        if self.pid == 0:
            try:
                os.close(parent_r)
                os.close(parent_w)
                code = process_obj._bootstrap(parent_sentinel=child_r)  # 此处似乎并没有关闭 child_r
            finally:
                os._exit(code)  # 这里会自动关闭 child_r 与 child_w
        else:
            os.close(child_w)
            os.close(child_r)
            self.finalizer = util.Finalize(self, util.close_fds, (parent_r, parent_w,))
            self.sentinel = parent_r

    def close(self):
        if self.finalizer is not None:
            self.finalizer()  # 此处内部会关闭 parent_r 和 parent_w

例子 (Cookbook, 后续再整理)

例 1: 进程间共享数据

from multiprocessing import Process, Value
from threading import Thread
import time

class MyWorker(Process):
    def __init__(self, a):
        super().__init__(daemon=True)
        self.a = a
    
    def run(self):
        while True:
            time.sleep(1)
            # print("from worker: ", self.a)
            print("from worker: ", self.a.value)

    def add_one(self):
        self.a += 1

class Scheduler:
    def __init__(self, num_workers=1):
        self.num_workers = num_workers
        self.workers = []

    # def update_worker(self):
    #     while True:
    #         time.sleep(5)
    #         for worker in self.workers:
    #             worker.add_one()
    #             print("from scheduler:", worker.a)
        
    def update_worker(self):
        while True:
            time.sleep(5)
            for worker in self.workers:
                worker.a.value += 1
                # print("from scheduler:", worker.a)
                print("from scheduler:", worker.a.value)

    def start(self):
        for i in range(self.num_workers):
            # self.workers.append(MyWorker(1))
            a = Value('i', 1)  # i 表示整数
            self.workers.append(MyWorker(a))
        for worker in self.workers:
            worker.start()
        Thread(target=self.update_worker).start()

if __name__ == "__main__":
    s = Scheduler(num_workers=2)
    s.start()

整个脚本的目的是: 每隔 1 秒, 每个 worker 都打印 a 的值, 然后由 scheduler 控制每隔 5 秒, 更新 worker 中 a 的值

如果使用被注释掉的内容, 达不到效果, 原因是进程间的数据共享必须用 multiprocessing.Value, multiprocessing.Queue, multiprocessing.Array 等, 另外还有一种做法是使用 multiprocessing.Manager(). 使用 multiprocessing.Manager() 实际上是增加了一个进程, 用来管理共享的数据, 并通过通信来同步数据, 而 multiprocessing.Queue 这种不会产生额外的进程, 因此效率较高.

例 2: multiprocessing.Manager

from multiprocessing import Process, Manager

def worker(shared_list, shared_dict, key, value):
    shared_list.append(len(shared_list))  # 向列表中添加一个元素
    shared_dict[key] = value  # 向字典中添加一个键值对

if __name__ == "__main__":
    with Manager() as manager:
        shared_list = manager.list()  # 创建一个共享列表
        shared_dict = manager.dict()  # 创建一个共享字典

        # 创建两个工作进程
        p1 = Process(target=worker, args=(shared_list, shared_dict, 'key1', 'value1'))
        p2 = Process(target=worker, args=(shared_list, shared_dict, 'key2', 'value2'))

        # 启动进程
        p1.start()
        p2.start()

        # 等待进程结束
        p1.join()
        p2.join()

        # 打印结果
        print("Shared List:", shared_list)
        print("Shared Dict:", shared_dict)

解释: 首先, manager 是一个独立的进程, 在 p1 进程执行 shared_list.append(len(shared_list)) 时, 会触发 manager 进程与 p1 进程间的进程间通信 (Inter-Process Communication, IPC), IPC 的常见机制是: 管道(Pipes), 消息队列(Message Queues), 共享内存(Shared Memory), 信号量(Semaphores), 套接字(Sockets), 信号(Signals), 锁(Locks).

在使用 multiprocessing.Manager 时, 通常是涉及到的 IPC 机制是套接字和管道.
在使用 multiprocessing.Value 时, 涉及到的 IPC 机制是共享内存, 为了避免同时写入的冲突, 还要使用锁或信号量
在使用 multiprocessing.Queue 时, 涉及到的 IPC 机制是管道和锁.

管道机制的效率比共享内存要低, 因为管道机制通常涉及到把数据从进程的内存复制进管道, 以及从管道中复制数据进内存. 而共享内存不存在这种复制过程.

Queue

Queue 与管道的关系是: Queue = 管道 + 锁, 也就是说在 put 和 get 时, 都是加锁的操作. 因此在使用 Queue 时, 通常不会手动使用加锁的机制

使用多线程时, 应该使用 queue.Queue, 另外, queue 模块还提供了 LifoQueue (后进先出队列) 和 PriorityQueue (优先级队列). 备注: threading 模块中没有 Queue

使用多进程时, 应该使用 multiprocessing.Queue, 但 multiprocessing 模块没有提供后进先出队列和优先级队列的标准实现. 备注: multiprocessing.Queue 也就是 multiprocessing.queues.Queue

TODO: multiprocessing.JoinableQueue

TODO: Queue.task_done

守护线程 vs 守护进程

from threading import Thread
import time

def task1():
    print("task1 alive")
    time.sleep(1)
    print("task1 dead")

def task2():
    print("task2 alive")
    time.sleep(2)
    print("task2 dead")

if __name__ == "__main__":
    t1 = Thread(target=task1, daemon=True)
    t2 = Thread(target=task2)
    t1.start()
    t2.start()
    print("main")

# 输出
# task1 alive
# task2 alive
# main
# task1 dead
# task2 dead

如果将上面的 Thread 改成 Process

输出结果则很可能是

main
task2 alive
task2 dead

代码执行完毕与退出是两回事，无论是多进程还是多线程，主进程/主线程代码执行完毕都会等待非守护进程/线程执行完毕后退出。

在线程的情况下，如果主线程代码执行完毕，此时还有非守护线程在执行，那么守护线程也不会被立刻终止，守护线程在非守护线程执行完毕后才会被立刻终止。
而进程的情况下，如果主进程代码执行完毕，那么守护进程程会被立刻终止，但仍须等待其他非守护进程执行完毕才会退出整个程序

对上面代码的解释: 在多线程情况下, 由于创建线程开销较小, 所以在创建线程时线程可以快速先执行 print("task1 alive") 和 print("task2 alive"), 随后伴随着主线程 print("main") 执行完, 主线程代码执行完毕, 由于此时主进程内仍有非守护线程 t2 没有结束, 此时, 主线程在等待 t2 结束的同时, 也不会终止守护线程 t1 的执行, 接下来等到非守护线程 t2 结束后, 主线程会终止守护线程的执行, 然而此时由于 t1 等待时间较短, 在 t2 结束前已经结束.

在多进程情况下, 由于创建进程开销比较大, 所以在创建进程好之前就先执行了 print("main"), 此时主进程代码执行完毕, 立即终止守护进程 p1, 此时 p1 还没来得及打印. 接下来主进程继续等待非守护进程 p2 执行结束.

asyncio

hello world

import asyncio

async def main():
    await ayncio.sleep(1)
    print("hello world")

asyncio.run(main())

初看上去这个 hello world 程序有着诸多难以理解的地方:

async def main() 是什么
await ... 是什么
async.sleep(1) 是什么
async.run(...) 是什么

TODO: 希望后面能解释清楚上面的这些问题

asyncio.run

import asyncio

asyncio.run(main())

# 用于替换下面的写法
# loop = asyncio.get_event_loop()
# try:
#     loop.run_until_complete(main())
# finally:
#     loop.close()

async for (待厘清)

一个对象能使用 for 语句的前提是它必须满足迭代器协议(也就是必须定义 __iter__ 和 __next__, 其中 __next__ 应该是一个普通函数, 实现迭代的语义逻辑, 也就是连续调用 next(iter(x)) 时应该迭代整份数据, 并且在迭代完成后 raise StopIteration)

类似地, 使用 async for 的前提是必须满足异步迭代器协议(也就是必须定义 def __aiter__ 与 async def __anext__), 没有数据迭代时需要 raise StopAsyncIteration.

import asyncio
class AsyncIterator:
    def __init__(self, start, end):
        self.current = start
        self.end = end
    
    def __aiter__(self):
        return self
    
    async def __anext__(self):
        if self.current >= self.end:
            raise StopAsyncIteration
        self.current += 1
        return self.current - 1

async def main():
    async for value in AsyncIterator(0, 5):
        print(value)

asyncio.run(main())

注意, async for 是下面写法的语法糖

async def main():
    iterator = AsyncIterator(0, 5).__aiter__()
    while True:
        try:
            value = await iterator.__anext__()  # 每次进入前都会 await, 意味着会交出控制权给事件循环
        except StopAsyncIteration:
            break
        else:
            # 循环体
            print(value)

除了上面的做法外, async for 还能对 async generator 使用 (所谓 async generator, 就是在 async def 中使用了 await 和 yield 语句, 其中 yield 是为了保证它能被用于 async for, 而 await 的目的是希望 async for 在迭代过程中能多次交出控制权给事件循环):

async def mygen(u: int = 10):
    i = 0
    while i < u:
        await asyncio.sleep(0.1)  # 只有 await 会交出控制权
        yield 2 ** i  # 此时不会交出控制权
        i += 1

async def main():
    async for value in mygen(5):
        print(value)

asyncio.run(main())

async with (待厘清)

这个也是 with 语法协议的对应物, 例如:

class AsyncContextManager:
    async def __aenter__(self):
        print("Entering context")
        await asyncio.sleep(1)  # 模拟异步操作
        return self

    async def __aexit__(self, exc_type, exc_val, exc_tb):
        print("Exiting context")
        await asyncio.sleep(1)  # 模拟异步清理操作

async def main():
    async with AsyncContextManager() as manager:
        print("Inside context")

import asyncio
asyncio.run(main())

contextvars.ContextVar

contextvars.ContextVar 用于设置协程中每个 task 的私有变量. 注意这个东西专用于协程任务的私有变量, 不同任务可能会使用同一线程, 所以不能用 threading.local

import threading
import random
import asyncio
from contextvars import ContextVar

local_data = threading.local()
context_var = ContextVar("context_var")


async def coro(coro_id):
    t = random.random()
    # local_data.value = f"coro {coro_id} setting data: {t}"
    context_var.set(f"coro {coro_id} setting data: {t}")
    print(f"coro {coro_id} sleep {t}")
    await asyncio.sleep(t)
    # return local_data.value
    return context_var.get()

async def main():
    return await asyncio.gather(*[coro(i) for i in range(5)])

res = asyncio.run(main())
print(res)

杂录

以下代码能正常运行

async def main():
    return 1

if __name__ == "__main__":
    x = main()
    try:
        x.send(None)
    except StopIteration as e:
        print(e.value)

总述

私有变量

代码写法上像是引用全局变量, 但实际上是线程或协程任务内私有变量. 这种用法在多线程情形下是 threading.local, 在协程情况下是 contextvars.ContextVar, 在进程情况下直接使用 global 关键字.

共享变量

附录: 一些冷知识

本例来源于: https://www.bilibili.com/video/BV1PY411J7TA 视频结尾, 以及关于 multiprocessing 的介绍

import atexit
import multiprocessing

multiprocessing.set_start_method("spawn", True)  # 如果使用 spawn, 那么子进程会打印 exiting, 使用 fork 就不会打印
# 原因是 fork 使用的是 os._exit() 这个系统调用退出的, 不在 python 解释器的控制范围内

def t():
    def f():
        print("exiting")
    atexit.register(f)

if __name__ == "__main__":
    p = multiprocessing.Process(target=t)
    p.start()
    p.join()