python线程与进程-白红宇

python线程与进程
阅读量：6440 次
发布时间：2019-06-23
本文共 11154 字，大约阅读时间需要 37 分钟。
建议用pycharm阅读，可以收缩，也可以测试 ''' IO多路复用     I/O多路复用指：通过一种机制，可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程 序进行相应的读写操作。目前支持I/O多路复用的系统调用有 select，poll，epoll 应用场景：     服务器需要同时处理多个处于监听状态或者多个连接状态的套接字。     服务器需要同时处理多种网络协议的套接字。 #!/usr/bin/python # -*- coding: utf-8 -*- import select import socket import Queue server = socket.socket(socket.AF_INET,socket.SOCK_STREAM) server.setblocking(False) server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR , 1) server_address= ('192.168.1.5',8080) server.bind(server_address) server.listen(10) #select轮询等待读socket集合 inputs = [server] #select轮询等待写socket集合 outputs = [] message_queues = {} #select超时时间 timeout = 20 while True:     print "等待活动连接......"     readable , writable , exceptional = select.select(inputs, outputs, inputs, timeout)     if not (readable or writable or exceptional) :         print "select超时无活动连接，重新select...... "         continue;     #循环可读事件     for s in readable :         #如果是server监听的socket         if s is server:             #同意连接             connection, client_address = s.accept()             print "新连接： ", client_address             connection.setblocking(0)             #将连接加入到select可读事件队列             inputs.append(connection)             #新建连接为key的字典，写回读取到的消息             message_queues[connection] = Queue.Queue()         else:             #不是本机监听就是客户端发来的消息             data = s.recv(1024)             if data :                 print "收到数据：" , data , "客户端：",s.getpeername()                 message_queues[s].put(data)                 if s not in outputs:                     #将读取到的socket加入到可写事件队列                     outputs.append(s)             else:                 #空白消息，关闭连接                 print "关闭连接：", client_address                 if s in outputs :                     outputs.remove(s)                 inputs.remove(s)                 s.close()                 del message_queues[s]     for s in writable:         try:             msg = message_queues[s].get_nowait()         except Queue.Empty:             print "连接：" , s.getpeername() , '消息队列为空'             outputs.remove(s)         else:             print "发送数据：" , msg , "到", s.getpeername()             s.send(msg)     for s in exceptional:         print "异常连接：", s.getpeername()         inputs.remove(s)         if s in outputs:             outputs.remove(s)         s.close()         del message_queues[s] ''' '''     进程和线程的区别和关系：     对于操作系统来说，一个任务就是一个进程（Process），比如打开一个浏览器就是启动一个浏览器进程，打开一个记事 本就启动了一个记事本进程，打开两个记事本就启动了两个记事本进程，打开一个Word就启动了一个Word进程。     有些进程还不止同时干一件事，比如Word，它可以同时进行打字、拼写检查、打印等事情。在一个进程内部，要同时干多 件事，就需要同时运行多个“子任务”，我们把进程内的这些“子任务”称为线程（Thread）。     由于每个进程至少要干一件事，所以，一个进程至少有一个线程。当然，像Word这种复杂的进程可以有多个线程，多个线 程可以同时执行，多线程的执行方式和多进程是一样的，也是由操作系统在多个线程之间快速切换，让每个线程都短暂地交替 运行，看起来就像同时执行一样。当然，真正地同时执行多线程需要多核CPU才可能实现。     线程是最小的执行单元，而进程由至少一个线程组成。如何调度进程和线程，完全由操作系统决定，程序自己不能决定什 么时候执行，执行多长时间。 ''' ''' python的进程     multiprocessing包的组件Process, Queue, Pipe, Lock等组件提供了与多线程类似的功能。使用这些组件，可以方便 地编写多进程并发程序。 ''' ''' Queue队列     Queue是多进程安全的队列，可以使用Queue实现多进程之间的数据传递。put方法用以插入数据到队列中，put方法还有 两个可选参数：blocked和timeout。如果blocked为True（默认值），并且timeout为正值，该方法会阻塞timeout指定的时 间，直到该队列有剩余的空间。如果超时，会抛出Queue.Full异常。如果blocked为False，但该Queue已满，会立即抛出 Queue.Full异常。     get方法可以从队列读取并且删除一个元素。同样，get方法有两个可选参数：blocked和timeout。如果blocked为True （默认值），并且timeout为正值，那么在等待时间内没有取到任何元素，会抛出Queue.Empty异常。如果blocked为False， 有两种情况存在，如果Queue有一个值可用，则立即返回该值，否则，如果队列为空，则立即抛出Queue.Empty异常。 from multiprocessing import Process, Queue def offer(queue):     queue.put("Hello World") if __name__ == '__main__':     q = Queue()     p = Process(target=offer, args=(q,))     p.start()     print q.get() ''' ''' Pipes管道     Pipe方法返回(conn1, conn2)代表一个管道的两个端。Pipe方法有duplex参数，如果duplex参数为True(默认值)那么 这个管道是全双工模式，也就是说conn1和conn2均可收发。duplex为False，conn1只负责接受消息，conn2只负责发送消息     send和recv方法分别是发送和接受消息的方法。例如，在全双工模式下，可以调用conn1.send发送消息，conn1.recv接 收消息。如果没有消息可接收，recv方法会一直阻塞。如果管道已经被关闭，那么recv方法会抛出EOFError。 from multiprocessing import Process, Pipe def send(conn):     conn.send("Hello World")     conn.close() if __name__ == '__main__':     parent_conn, child_conn = Pipe()     p = Process(target=send, args=(child_conn,))     p.start()     print parent_conn.recv() ''' ''' 创建进程示例 #!/usr/bin/env python # -*- coding:utf-8 -*- from multiprocessing import Process import os def run_proc(name):     print 'Run child process %s (%s)...' % (name, os.getpid()) if __name__=='__main__':     print 'Parent process %s.' % os.getpid()     p = Process(target=run_proc, args=('test',))     print 'Process will start.'     p.start()     print 'Process end.' 创建子进程时，只需要传入一个执行函数和函数的参数，创建一个Process实例，用start()方法启动。 注意：由于进程之间的数据需要各自持有一份，所以创建进程需要的非常大的开销。 ''' ''' 进程锁示例 from multiprocessing import Process, Array, RLock def Foo(lock,temp,i):     """     将第0个数加100     """     lock.acquire()     temp[0] = 100+i     for item in temp:         print i,'----->',item     lock.release() lock = RLock() temp = Array('i', [11, 22, 33, 44]) for i in range(20):     p = Process(target=Foo,args=(lock,temp,i,))     p.start() ''' ''' 进程池示例     在利用Python进行系统管理的时候，特别是同时操作多个文件目录，或者远程控制多台主机，并行操作可以节约大量的时 间。当被操作对象数目不大时，可以直接利用multiprocessing中的Process动态成生多个进程，十几个还好，但如果是上百 个，上千个目标，手动的去限制进程数量却又太过繁琐，此时可以发挥进程池的功效。     Pool可以提供指定数量的进程供用户调用，当有新的请求提交到pool中时，如果池还没有满，那么就会创建一个新的进程 用来执行该请求；但如果池中的进程数已经达到规定最大值，那么该请求就会等待，直到池中有进程结束，才会创建新的进程 来它。 #!/usr/bin/env python #coding:utf-8 from multiprocessing import Pool import os, time, random def long_time_task(name):     print 'Run task %s (%s)...' % (name, os.getpid())     start = time.time()     time.sleep(random.random() * 3)     end = time.time()     print 'Task %s runs %0.2f seconds.' % (name, (end - start)) if __name__=='__main__':     print 'Parent process %s.' % os.getpid()     p = Pool(4)     for i in range(5):         p.apply_async(long_time_task, args=(i,))     print 'Waiting for all subprocesses done...'     p.close()     p.join()     print 'All subprocesses done.' join()方法可以等待子进程结束后再继续往下运行，通常用于进程间的同步。     task 0，1，2，3是立刻执行的，而task 4要等待前面某个task完成后才执行，这是因为Pool的默认大小在我的电脑上是4， 因此，最多同时执行4个进程。 ''' ''' 进程间共享数据 #!/usr/bin/env python # -*- coding:utf-8 -*- from multiprocessing import Process, Queue import os, time, random # 写数据进程执行的代码: def write(q):     for value in ['A', 'B', 'C']:         print 'Put %s to queue...' % value         q.put(value)         time.sleep(random.random()) # 读数据进程执行的代码: def read(q):     while True:         value = q.get(True)         print 'Get %s from queue.' % value if __name__=='__main__':     # 父进程创建Queue，并传给各个子进程：     q = Queue()     pw = Process(target=write, args=(q,))     pr = Process(target=read, args=(q,))     # 启动子进程pw，写入:     pw.start()     # 启动子进程pr，读取:     pr.start()     # 等待pw结束:     pw.join()     # pr进程里是死循环，无法等待其结束，只能强行终止:     pr.terminate() 进程间默认无法共享数据 ''' ''' Python的线程     多任务可以由多进程完成，也可以由一个进程内的多线程完成。进程是由若干线程组成的，一个进程至少有一个线程。     Python的标准库提供了两个模块：thread和threading，thread是低级模块，threading是高级模块，对thread进行了 封装。绝大多数情况下，我们只需要使用threading这个高级模块。启动一个线程就是把一个函数传入并创建Thread实例，然 后调用start()开始执行 ''' ''' python的多线程模块：threading     Thread                  #线程执行的对象         start               线程准备就绪，等待CPU调度         setName             为线程设置名称         getName             获取线程名称         setDaemon           设置为后台线程或前台线程（默认）                             如果是后台线程，主线程执行过程中，后台线程也在进行，主线程执行完毕后，后台线程不                             论成功与否，均停止如果是前台线程，主线程执行过程中，前台线程也在进行，主线程执行                             完毕后，等待前台线程也执行完成后，程序停止         join                逐个执行每个线程，执行完毕后继续往下执行，该方法使得多线程变得无意义         run                 线程被cpu调度后执行Thread类对象的run方法     Rlock                   #线程锁：可重入锁对象.使单线程可以在此获得已获得了的锁(递归锁定)         acquire             为线程加锁         release             为线程解锁     Event                   #python线程的事件用于主线程控制其他线程的执行。         set                 将全局变量设置为True         wait                事件处理的机制：全局定义了一个“Flag”，如果“Flag”值为 False，那么当程序执行                             event.wait方法时就会阻塞，如果“Flag”值为True，那么event.wait 方法时便不再阻塞         clear               将全局变量设置为False     Semaphore               为等待锁的线程提供一个类似等候室的结构     BoundedSemaphore        与Semaphore类似,只是不允许超过初始值     Time                    与Thread相似,只是他要等待一段时间后才开始运行     activeCount()           当前活动的线程对象的数量     currentThread()         返回当前线程对象     enumerate()             返回当前活动线程的列表     settrace(func)          为所有线程设置一个跟踪函数     setprofile(func)        为所有线程设置一个profile函数 ''' ''' 线程示例 #!/usr/bin/env python #coding:utf-8 import threading import time def show(arg):     time.sleep(1)     print 'thread'+str(arg) for i in range(10):     t = threading.Thread(target=show, args=(i,))     t.start() print 'main thread stop' ''' ''' 线程锁示例     多线程和多进程最大的不同在于，多进程中，同一个变量，各自有一份拷贝存在于每个进程中，互不影响，而多线程中， 所有变量都由所有线程共享，所以，任何一个变量都可以被任何一个线程修改，因此，线程之间共享数据最大的危险在于多个 线程同时改一个变量，把内容给改乱了。 #!/usr/bin/env python #coding:utf-8 import threading import time gl_num = 0 def show(arg):     global gl_num     time.sleep(1)     gl_num +=1     print gl_num for i in range(10):     t = threading.Thread(target=show, args=(i,))     t.start() print 'main thread stop' 由于线程之间是进行随机调度，并且每个线程可能只执行n条执行之后，CPU接着执行其他线程 如果按上例的话会出现一种情况多个线程同时修改一份内存资源，造成数据的修改混乱那么线程锁可以解决这个问题 #!/usr/bin/env python #coding:utf-8import threading import time gl_num = 0 lock=threading.RLock() def show(arg):     lock.acquire()     global gl_num     time.sleep(1)     gl_num +=1     print gl_num     lock.release() for i in range(10):     t = threading.Thread(target=show, args=(i,))     t.start() print 'main thread stop'     因为Python的线程虽然是真正的线程，但解释器执行代码时，有一个GIL锁：Global Interpreter Lock，任何Python 线程执行前，必须先获得GIL锁，然后，每执行100条字节码，解释器就自动释放GIL锁，让别的线程有机会执行。这个GIL全 局锁实际上把所有线程的执行代码都给上了锁，所以，多线程在Python中只能交替执行，即使100个线程跑在100核CPU上，也 只能用到1个核。     GIL是Python解释器设计的历史遗留问题，通常我们用的解释器是官方实现的CPython，要真正利用多核，除非重写一个 不带GIL的解释器。所以，在Python中，可以使用多线程，但不要指望能有效利用多核。如果一定要通过多线程利用多核，那 只能通过C扩展来实现，不过这样就失去了Python简单易用的特点。     不过，也不用过于担心，Python虽然不能利用多线程实现多核任务，但可以通过多进程实现多核任务。多个Python进程有 各自独立的GIL锁，互不影响。     多线程编程，模型复杂，容易发生冲突，必须用锁加以隔离，同时，又要小心死锁的发生。     Python解释器由于设计时有GIL全局锁，导致了多线程无法利用多核。多线程的并发在Python中就是一个美丽的梦。 ''' ''' 线程的事件示例 #!/usr/bin/env python # -*- coding:utf-8 -*- import threading def do(event):     print 'start'     event.wait()     print 'execute' event_obj = threading.Event() for i in range(10):     t = threading.Thread(target=do, args=(event_obj,))     t.start() event_obj.clear() inp = raw_input('input:') if inp == 'true':     event_obj.set() ''' ''' 协程简介     线程和进程的操作是由程序触发系统接口，最后的执行者是系统；协程的操作则是程序员。     协程存在的意义：对于多线程应用，CPU通过切片的方式来切换线程间的执行，线程切换时需要耗时（保存状态，下次继 续）。协程，则只使用一个线程，在一个线程中规定某个代码块执行顺序。     协程的适用场景：当程序中存在大量不需要CPU的操作时（IO），适用于协程； ''' ''' 协程示例 #!/usr/bin/env python # -*- coding:utf-8 -*- from greenlet import greenlet def test1():     print 12     gr2.switch()     print 34     gr2.switch() def test2():     print 56     gr1.switch()     print 78 gr1 = greenlet(test1) gr2 = greenlet(test2) gr1.switch() ''' ''' 进程vs线程     我们可以把任务分为计算密集型和IO密集型。     计算密集型任务的特点是要进行大量的计算，消耗CPU资源，比如计算圆周率、对视频进行高清解码等等，全靠CPU的运算 能力。这种计算密集型任务虽然也可以用多任务完成，但是任务越多，花在任务切换的时间就越多，CPU执行任务的效率就越 低，所以，要最高效地利用CPU，计算密集型任务同时进行的数量应当等于CPU的核心数。     计算密集型任务由于主要消耗CPU资源，因此，代码运行效率至关重要。用Python的话适合多进程 第二种任务的类型是IO密集型，涉及到网络、磁盘IO的任务都是IO密集型任务，这类任务的特点是CPU消耗很少，任务的大部 分时间都在等待IO操作完成（因为IO的速度远远低于CPU和内存的速度）。对于IO密集型任务，任务越多，CPU效率越高，但也 有一个限度。常见的大部分任务都是IO密集型任务，比如Web应用。这时候不需要cpu做过多的计算，应当用多线程。 '''
转载于:https://blog.51cto.com/lxb994/1728238
你可能感兴趣的文章
ExtJs--09--javascript对象的方法的3种写法 prototype通过原型设置方法效率最好
查看>>
磁盘镜像工具Guymager
查看>>