【Python】Python多进程编程中的守护进程陷阱及解决方案-Euler的博客

在Python多进程编程中，我们经常会遇到一个令人困惑的错误：RuntimeError: daemonic processes are not allowed to have children。这个错误通常出现在我们尝试在一个守护进程中创建子进程时，本文将深入解析这个问题的原因，并提供几种实用的解决方案。

问题背景

Python的 multiprocessing库提供了强大的多进程编程能力，其中包括守护进程（daemon process）的概念。守护进程是指那些在主程序退出时会自动终止的后台进程。这种设计有助于避免"僵尸进程"的产生，但也带来了一些限制。

最主要的限制就是：守护进程不允许创建子进程。这是因为如果允许守护进程创建子进程，当主程序退出时，守护进程会被强制终止，而它创建的子进程则可能变成"孤儿进程"，这会导致资源泄漏和其他潜在问题。

问题复现

下面是一个简单的示例代码，可以复现这个错误：

import multiprocessing

def worker_function():
    # 尝试在工作进程中创建一个进程池
    pool = multiprocessing.Pool(processes=2)
    pool.map(lambda x: x*x, [1, 2, 3, 4, 5])
    pool.close()
    pool.join()

if __name__ == "__main__":
    # 创建一个守护进程
    p = multiprocessing.Process(target=worker_function)
    p.daemon = True  # 设置为守护进程
    p.start()
    p.join()

运行上面的代码，你会得到以下错误：

RuntimeError: daemonic processes are not allowed to have children

这个错误发生在 worker_function函数中尝试创建进程池的时候，因为工作进程被设置为了守护进程。

常见场景

这个错误在以下场景中经常出现：

在Web应用中使用多进程处理请求，同时每个请求处理又需要并行计算
在数据处理管道中，一个守护进程负责监控和分发任务，同时需要创建子进程处理数据
在使用第三方库时，库内部可能使用了进程池，而你的代码将其放在了守护进程中

官方解释

解决方案

方案一：不使用守护进程

最简单的解决方案是不将进程设置为守护进程：

if __name__ == "__main__":
    p = multiprocessing.Process(target=worker_function)
    # p.daemon = True  # 注释掉这一行
    p.start()
    p.join()

但这种方法的缺点是，如果主程序因为某些原因提前退出，非守护进程可能会继续运行，导致资源无法及时释放。

方案二：使用线程池替代进程池

如果你的任务不是CPU密集型的，可以考虑使用线程池替代进程池：

from concurrent.futures import ThreadPoolExecutor

def worker_function():
    # 使用线程池替代进程池
    with ThreadPoolExecutor(max_workers=2) as executor:
        executor.map(lambda x: x*x, [1, 2, 3, 4, 5])

if __name__ == "__main__":
    p = multiprocessing.Process(target=worker_function)
    p.daemon = True
    p.start()
    p.join()

线程不受守护进程限制，因此这段代码可以正常运行。

方案三：自定义非守护进程池

最灵活的解决方案是创建一个自定义的非守护进程池：

import multiprocessing
from multiprocessing.pool import Pool
from multiprocessing import get_context

# 自定义非守护进程类
class NoDaemonProcess(get_context("fork").Process):
    @property
    def daemon(self):
        return False

    @daemon.setter
    def daemon(self, value):
        pass

# 自定义非守护进程池类
class NoDaemonPool(Pool):
    def __init__(self, *args, **kwargs):
        kwargs["context"] = get_context("fork")
        super().__init__(*args, **kwargs)

    def Process(self, *args, **kwds):
        proc = super().Process(*args, **kwds)
        proc.__class__ = NoDaemonProcess
        return proc

def worker_function():
    # 使用自定义的非守护进程池
    pool = NoDaemonPool(processes=2)
    pool.map(lambda x: x*x, [1, 2, 3, 4, 5])
    pool.close()
    pool.join()

if __name__ == "__main__":
    p = multiprocessing.Process(target=worker_function)
    p.daemon = True
    p.start()
    p.join()

这个解决方案通过继承和重写 Process类的 daemon属性，创建了一个始终为非守护状态的进程类，然后基于这个类创建了一个自定义的进程池。这样，即使在守护进程中，也可以安全地创建和使用进程池。

方案四：使用Manager管理共享资源

另一种方法是使用 multiprocessing.Manager来管理共享资源：

import multiprocessing

def worker_task(x):
    return x * x

def worker_function():
    # 使用Manager创建一个共享列表
    with multiprocessing.Manager() as manager:
        results = manager.list()
        for i in [1, 2, 3, 4, 5]:
            # 为每个任务创建一个单独的进程
            p = multiprocessing.Process(target=lambda x, r: r.append(x * x), args=(i, results))
            p.start()
            p.join()
        print(list(results))

if __name__ == "__main__":
    p = multiprocessing.Process(target=worker_function)
    p.daemon = True
    p.start()
    p.join()

这种方法避免了使用进程池，而是为每个任务创建单独的进程，并使用Manager管理共享结果列表。

最佳实践建议

了解你的需求：在使用守护进程前，明确你的应用是否真的需要守护进程的特性
合理设计进程层次：避免在守护进程中创建子进程，设计合理的进程层次结构
选择合适的并发模型：根据任务特性选择合适的并发模型（进程、线程、协程）
使用上下文管理器：使用 with语句和上下文管理器确保资源的正确释放
错误处理：实现完善的错误处理机制，确保进程异常时能够被正确捕获和处理

总结

Python多进程编程中的"守护进程不能有子进程"限制是一个常见的陷阱，但通过理解其背后的原理，我们可以采取多种策略来解决这个问题。根据具体的应用场景，可以选择不使用守护进程、使用线程池、创建自定义非守护进程池或使用Manager来管理共享资源。

希望本文能帮助你更好地理解和解决Python多进程编程中的这一常见问题。

参考资料

Python官方文档 - multiprocessing
Python Issue 6721: Allow daemonic processes to have children
Stack Overflow: Python multiprocessing daemonic processes
Python Multiprocessing: Pool vs Process - Comparative Analysis
Effective Python: 90 Specific Ways to Write Better Python - Item 53: Use Threads for Blocking I/O, Avoid for Parallelism

目录CONTENT

【Python】Python多进程编程中的守护进程陷阱及解决方案