Python 多线程输出的问题

python基础

浏览数:218

2019-8-25

先来看下面这段代码的执行:


image.png

如图中的代码所示,Python 在多线程环境下 print 的时候,由于输出显示的资源只有一个,当过多个线程想要在同一时间打印输出的时候,有的线程会因为没有抢到输出显示的资源而无法输出。

在实际的执行过程中 “Hello” 的输出次数基本都是正常的 4 次,极少的情况下出现如图中所示的 3 次。而 “the arg is” 的语句输出的次数有很大的概率不是 4 次。因为 i 是线程共享的变量,也就是说只有一个内存空间,而”Hello”字符串每个线程在执行 action 方法时会为它单独开辟一个内存空间。

还有一种情况是 print 的时候存在缓冲,但是,首先在 IDE 环境下默认是没有开启缓冲的,而且在 print 语句后调用 sys.stdout.flush(),强制立刻刷新缓冲依然没有解决异常。

期间我还以为是因为主线程退出了,导致子线程没执行到 print 程序就结束运行了。但是在 Python 中,当主线程退出之后,即使之线程没有 join, 子线程仍然会继续执行。如果希望主线程退出后,其子线程也退出而不再执行,则需要设置子线程为后台线程。Python 提供 setDaemon 方法,将子线程与主线程进行绑定,当主线程退出时,子线程的生命也随之结束。

值得注意的是,虽然 print 的次数会有异常(这里的异常是指
输出到控制台异常,实际上 print 语句是执行了的,只不过控制台上没有显示)。但是将 arg 变量写到文件里是正常的,虽然顺序是混乱的。

结论 Python print 不是线程安全的,在并发的情况下不按照正确的方式去写会出现无法预期的异常,正确的写法是在 t.start() 之后加一句 t.join() 来阻塞主线程,直到当前子线程执行完毕,或者加锁处理。

import threading
import time

def action(arg):
    time.sleep(1)
    sys.stdout.flush()
    print 'the arg is:%s\r' %arg
    print 'Hello'

for i in xrange(4):
    t = threading.Thread(target=action, args=(i,))
    t.start()
    t.join()
import threading
import time

def action(arg):
    lock.acquire()
    time.sleep(1)
    sys.stdout.flush()
    print 'the arg is:%s\r' %arg
    print 'Hello'
    lock.release()

lock = threading.Lock()

for i in xrange(4):
    t = threading.Thread(target=action, args=(i,))
    t.start()

作者:e227f7966522