并发编程 - hiluna

[toc]

0x0 多任务编程

意义：充分利用计算机多核资源，提高程序的运行效率。

实现方案：多进程，多线程

并行与并发

并发：同时处理多个任务，内核在任务间不断的切换达到好像多个任务被同时执行的效果，实际每个时刻只有一个任务占用内核

注意：程序在运行中会有IO阻塞的存在，当一个程序被阻塞后会被立刻cpu踢出，等待阻塞结束后，再次排队等待cpu执行

并行：多个任务利用计算机多核资源在同时执行，此时多个任务间并行关系。

1×0 进程（process）

1×1 进程理论基础

定义：程序在计算机中的一次运行

程序是一个可执行的文件，是静态的占有磁盘

进程是一个动态的过程描述，占有计算机的运行资源，有一定的生命周期

系统中如何产生一个进程

用户控件通过调用程序接口或者命令发起请求
操作系统接受用户请求，开始创建进程
操作系统调配计算机资源，确定进程的状态
操作系统将创建的进程提供给用户使用

进程的基本概念

cpu时间片：如果一个进程占有cpu内核则称这个进程在cpu时间片上。

PCB(进程控制块)：在内存中开辟的一块空间，用于存放进程的基本信息，也用于系统查找识别进程。

进程ID（PID）：系统为每个进程分配的一个大于0的整数，作为进程ID。每个进程ID不重复。 Linux查看进程ID ： ps -aux

父子进程：系统中每一个进程(除了系统初始化进程)都有唯一的父进程，可以有0个或多个子进程。父子进程关系便于进程管理。
查看进程树： pstree

进程状态：

就绪态	进程具备执行条件，等待分配CPU资源
运行态	进程占有CPU时间片正在运行
等待态	进程暂时停止运行，让出cpu

五态 (在三态基础上增加新建和终止)
新建：创建一个进程，获取资源的过程
终止：进程结束，释放资源的过程

状态查看命令：ps -aux –> STAT列

进程的运行特征
【1】进程可以使用计算机多核资源
【2】进程是计算机分配资源的最小单位
【3】进程之间的运行互不影响，各自独立
【4】每个进程拥有独立的空间，各自使用自己空间资源

面试要求

什么是进程，进程和程序有什么区别
进程有哪些状态，状态之间如何转化

2×0 基于fork的多进程编程

2×1 fork使用

语法：pid = os.fork()

功能：创建新的进程
返回值：整数，如果创建进程失败返回一个负数，如果成功则在原有进程中返回新进程的PID，在新进程中返回0

注意：

子进程会复制父进程全部内存空间，从fork下一句开始执行。
父子进程各自独立运行，运行顺序不一定。
利用父子进程fork返回值的区别，配合if结构让父子进程执行不同的内容几乎是固定搭配。
父子进程有各自特有特征比如PID PCB 命令集等。
父进程fork之前开辟的空间子进程同样拥有，父子进程对各自空间的操作不会相互影响。

"""
fork函数演示
"""
import os
from time import sleep
pid = os.fork()

if pid < 0:
    print("Create process failed")
elif pid == 0:
    sleep(5)
    print("The new process")
else:
    sleep(6)
    print("The old process")

print("Fork test over")

import os

print("==============")
a = 1
pid = os.fork()

if pid < 0:
    print("Error")
elif pid == 0:
    print("Child process")
    print("a = %d" %a)
    a = 10000
else:
    print("Parent process")
    print("a:",a)

print("ALL a",a)

进程父子空间的关系 Download

2×2 进程相关函数

os.getpid()
- 功能：获取一个进程的PID值
- 返回值：返回父进程的PID
os.getppid()
- 功能：获取父进程的PID号
- 返回值：返回父进程PID
os_exit([status])
- 功能：结束一个进程
- 参数：进程的终止状态，可以传任意数值，在没有约定的情况下没有意义，在约定的情况下就会拥有意义
- status会做一个乘以256的操作
sys.exit([status])
- 功能：退出进程
- 参数：整数表示退出状态（为可选参数，不选默认为0）。可以写字符串，表示退出时打印的内容
父子进程的退出是相互独立的

2×3 孤儿和僵尸

孤儿进程

父进程先于子进程退出，此时子进程成为孤儿进程

特点：孤儿进程会被系统进程收养，此时系统进程就会成为孤儿进程新的父进程，孤儿进程退出该进程会自动处理。并不会被爷爷进程所接受

僵尸进程

子进程先于父进程退出，父进程又没有处理子进程的退出状态，此时子进程就会称为僵尸进程

特点：僵尸进程虽然结束，但是会存留部分PCB（进程信息）在内存中，大量的僵尸进程会浪费系统的内存资源。

孤儿进程不会变成僵尸进程，因为孤儿进程退出，该系统进程会自动处理

如何避免僵尸进程产生

使用wati函数处理子进程退出

"""
wait处理僵尸进程
"""
import os

pid = os.fork()

if pid < 0:
    print("Error")
elif pid == 0:
    print("child process", os.getpid())
    os._exit(2)  # 这个参数会乘以256
else:
    # pid, status = os.wait()  # 等待处理僵尸
    pid, status = os.waitpid(-1, os.WNOHANG)  # 非阻塞处理僵尸
    print(pid)
    print(status, os.WEXITSTATUS(status))
    while True:
        pass

创建二级子进程处理僵尸

父进程创建子进程，等待回收子进程
子进程创建二级子进程然后退出
二级子进程称为孤儿，和原本父进程一同执行事件

"""
创建二级子进程防止僵尸进程
"""
import os
from time import *


def f1():
    for i in range(4):
        sleep(2)
        print("写代码...")


def f2():
    for i in range(5):
        sleep(1)
        print("测代码...")


pid = os.fork()

if pid < 0:
    print("Error")
elif pid == 0:
    p = os.fork()  # 二级子进程
    if p == 0:
        f2()  # 二级子进程执行
    else:
        os._exit(0)
else:
    os.wait()
    f1()

通过信号处理子进程退出

原理：子进程退出时会发送信号给父进程，如果父进程忽略子进程信号，则系统就会自动处理子进程退出。

方法：使用signal模块在父进程创建子进程前写如下语句：

import signal
	signal.signal(signal.SIGCHLD,signal.SIG_IGN)

特点：非阻塞，不会影响父进程运行，可以处理所有子进程退出

2×4 群聊聊天室

功能：类似qq群功能
【1】有人进入聊天室需要输入姓名，姓名不能重复
【2】有人进入聊天室时，其他人会收到通知：xxx 进入了聊天室
【3】一个人发消息，其他人会收到：xxx ： xxxxxxxxxxx
【4】有人退出聊天室，则其他人也会收到通知:xxx退出了聊天室
【5】扩展功能：服务器可以向所有用户发送公告:管理员消息： xxxxxxxxx

思路分析

1.技术点的确认
    转发模型，客户端-->服务端-->转发给其他客户端
    网络模型，udp通信
    保存用户信息：字典
    收发关系处理：采用多进程分别进行收发操作
2.结构设计
    采用什么样的封装结构：函数
    编写一个功能，测试一个功能
    注意注释和结构的设计

进程父子空间的关系 Download

3.分析功能模块，指定具体编写流程
    搭建网络连接
    进入聊天室
        客户端：
            输入新名
            将新名发送给服务端
            接受返回的结果
            如果不允许则重复输入姓名
        服务端：
            接受姓名
            判断姓名是否存在
            将结果返回给客户端
            如果允许进入聊天室，增加用户信息
            通知其他用户
    聊天
        客户端
            创建新的进程
            一个进程循环发送消息
            一个进程循环接受消息
        服务端
            接受请求，判断请求类型
            将消息转发给其他用户

    退出聊天室
        客户端
            输入quit或者ctrl-c退出
            将请求发送给服务端
            结束进程
            接收进程收到EXIT退出进程
        服务端
            接收消息
            将突出消息告知其他人
            给该用户发送"EXIT"
            删除用户
    管理员消息

4.协议
    如果允许进入聊天室，那么服务端发送"OK"给客户端
    如果不允许进入聊天室，则服务端发送"不允许的原因"
    请求类别：
        L --> 进入聊天室
        C --> 聊天信息
        Q --> 退出聊天室
    用户存储结构：{name:addr....}
    客户端如果输入quit或者ctrl-c，点击esc表示退出

"""
Chat room
env:python3.7
socket fork 练习
"""
from socket import *
import os
import sys

# 服务器地址
BIND = ("0.0.0.0", 8888)
# 用户列表
USER = {super: ("0.0.0.0", 8888)}


# 聊天
def do_chat(s, name, text):
    msg = "%s : %s" % (name, text)
    for i in USER:
        s.sendto(msg.encode(), USER[i])


# 退出聊天室
def do_quit(s, name):
    msg = "%s退出了聊天室" % name
    print(msg)
    for i in USER:
        if i != name:
            s.sendto(msg.encode(), USER[i])
        else:
            s.sendto("EXIT".encode(), USER[i])
    # 删除用户
    del USER[name]


def do_login(s, name, addr):
    if name in USER or "管理员" in name:
        s.sendto("该用户已存在".encode(), addr)
        return
    s.sendto(b"OK", addr)
    # 通知其他人
    msg = "欢迎%s进入聊天室" % name
    print(msg)
    for i in USER:
        if i != name:
            s.sendto(msg.encode(), USER[i])
    # 将用户加入
    USER[name] = addr


def do_request(s):
    """
    接受数据函数
    :param s: obj类型，socket类型
    :return:
    """
    while True:
        data, addr = s.recvfrom(1024)
        msg = data.decode().split(" ")
        # 区分请求类型
        if msg[0] == "L":
            do_login(s, msg[1], addr)
        elif msg[0] == "C":
            do_chat(s, msg[1], " ".join(msg[2:]))
        elif msg[0] == "Q":
            do_quit(s, msg[1])


def main():
    #  套接字
    s = socket(AF_INET, SOCK_DGRAM)
    s.bind(BIND)

    pid = os.fork()
    if pid < 0:
        return
    elif pid == 0:
        while True:
            msg = input("管理员消息:")
            msg = "C super" + msg
            s.sendto(msg.encode(), BIND)
    else:
        # 请求处理
        do_request(s)


def udp_connect():
    """
    建立udp连接选项
    :return: object类型，socket对象
    """
    soc = socket(AF_INET, SOCK_DGRAM)
    soc.bind(BIND)


if __name__ == '__main__':
    main()

"""
chat room
client
"""

from socket import *
import os
import sys

# 服务器地址
BIND = ("0.0.0.0", 8888)


# 发送消息
def send_msg(s, name):
    while True:
        try:
            text = input(">>")
        except KeyboardInterrupt:
            text = "quit"
        if text == "quit":
            msg = "Q " + name
            s.sendto(msg.encode(), BIND)
            sys.exit("退出聊天室")
        msg = "C %s %s" % (name, text)
        s.sendto(msg.encode(), BIND)


# 接受消息
def recv_msg(s):
    while True:
        data, addr = s.recvfrom(2048)
        # 服务端发送EXIT表示让客户端退出
        if data.decode() == "EXIT":
            sys.exit()
        print(data.decode())


# 创建网络连接
def main():
    s = socket(AF_INET, SOCK_DGRAM)
    while True:
        name = input("请输入姓名")
        msg = "L " + name
        s.sendto(msg.encode(), BIND)
        data, addr = s.recvfrom(1024)
        if data.decode() == "OK":
            print("进入聊天室")
            break
        else:
            print(data.decode())

    # 创建新的进程
    pid = os.fork()
    if pid < 0:
        sys.exit("Error!")
    elif pid == 0:
        send_msg(s, name)
    else:
        recv_msg(s)


if __name__ == "__main__":
    main()

3×0 multiprocessing模块创建进程

流程特点
【1】将需要子进程执行的事件封装为函数
【2】通过模块的Process类创建进程对象，关联函数
【3】可以通过进程对象设置进程信息及属性
【4】通过进程对象调用start启动进程
【5】通过进程对象调用join回收进程
基本接口使用
1. Process(target,*args,*kwargs)
  1. args元组，用于给target函数位置传参
  2. kwargs字典，给target函数键值传参
2. p.start()
  1. 功能：启动进程
  2. 注意：启动进程时target绑定函数开始执行，该函数作为子进程执行内容，此时进程真正被创建
3. p.join([timeout])
  1. 功能：阻塞等待回收进程
  2. 参数：超时时间

注意：

使用multiprocessing创建进程同样是子进程复制父进程空间代码段，父子进程运行互不影响。
子进程只运行target绑定的函数部分，其余内容均是父进程执行内容。
multiprocessing中父进程往往只用来创建子进程回收子进程，具体事件由子进程完成。
multiprocessing创建的子进程中无法使用标准输入

Process创建进程 Download

3. 进程对象属性

p.name 进程名称

p.pid 对应子进程的PID号

p.is_alive() 查看子进程是否在生命周期

p.daemon 设置父子进程的退出关系

如果设置为True则子进程会随父进程的退出而结束
要求必须在start()前设置
如果daemon设置成True 通常就不会使用 join()

3×1 进程池实现

3x1x1 必要性

进程的创建和销毁过程消耗的资源较多
当任务量众多，每个任务在很短时间内完成时，需要频繁的创建和销毁进程。此时对计算机压力较大
进程池技术很好的解决了以上问题

3x1x2 原理

创建一定数量的进程来处理事件，事件处理完进程不退出而是继续处理其他事件，直到所有事件全都处理完毕统一销毁。增加进程的重复利用，降低资源消耗。

3x1x3 进程池实现

1 创建进程池对象，放入适当的进程

from multiprocessing import Pool

Pool(processes)
功能： 创建进程池对象
参数： 指定进程数量，默认根据系统自动判定

2 将事件加入进程池队列执行

pool.apply_async(func,args,kwds)
功能: 使用进程池执行 func事件
参数： func 事件函数
			 args 元组  给func按位置传参
			 kwds 字典  给func按照键值传参
返回值： 返回函数事件对象

3 关闭进程池

pool.close()
功能： 关闭进程池

4 回收进程池中进程

pool.join()
功能： 回收进程池中进程

5 获取进程执行函数的返回值

get()

进程池 Download

4×0 进程间通信（IPC）

必要性：进程间空间独立，资源不共享，此时在需要进程间数据传输时就需要特定的手段进行数据通信。

常用进程间通信方法：

管道通信消息队列共享内存信号量套接字

4×1 管道通信（Pipe）

4x1x1 通信原理：

在内存中开辟管道空间，生成管道操作对象，多个进程使用同一个管道对象进行读写即可实现通信

4x1x2 实现方法

from  multiprocessing import Pipe

fd1,fd2 = Pipe(duplex = True)
# 功能: 创建管道
# 参数：默认表示双向管道
# 如果为False 表示单向管道
# 返回值：表示管道两端的读写对象
#	如果是双向管道均可读写
#	如果是单向管道fd1只读  fd2只写

fd.recv()
# 功能 ： 从管道获取内容
# 返回值：获取到的数据

fd.send(data)
# 功能： 向管道写入内容
# 参数： 要写入的数据

管道通信 Download

# 管道通信
from multiprocessing import Process, Pipe
import os, time

# 创建管道,参数为默认（True）双向通信管道
fd1, fd2 = Pipe()


def fun(name):
    time.sleep(3)
    # 子进程向管道写入内容
    fd1.send({name: os.getpid()})


# 用于保存子进程对象
jobs = []

for i in range(5):
    # 创建进程
    p = Process(target=fun, args=(i,))
    jobs.append(p)
    p.start()
for i in range(5):
    # 父进程读取管道
    data = fd2.recv()
    print(data)

for i in jobs:
    i.join()

4×2 消息队列

4x2x1 通信原理

在内存中建立队列模型，进程通过队列将消息存入，或者从队列去除完成进程间通信。

4x2x2 实现方法

from multiprocessing import Queue

q = Queue(maxsize=0)
# 功能: 创建队列对象
# 参数：最多存放消息个数
# 返回值：队列对象

q.put(data,[block,timeout])
# 功能：向队列存入消息
# 参数：data  要存入的内容
# block  设置是否阻塞 False为非阻塞
# timeout  超时检测

q.get([block,timeout])
# 功能：从队列取出消息
# 参数：block  设置是否阻塞 False为非阻塞，默认为True，一直等到有数据为止
# timeout  超时检测，当过时间还没有数据抛出异常
# 返回值： 返回获取到的内容

q.get_nowait() # 相当于q.get(False) 如果空 立刻抛出异常

q.full()   # 判断队列是否为满
q.empty()  # 判断队列是否为空
q.qsize()  # 获取队列中消息个数
q.close()  # 关闭队列

# 消息队列通信
from multiprocessing import Queue, Process
from time import sleep
from random import randint
# 创建消息队列
q = Queue(3)


def request():
    for i in range(20):
        x = randint(0, 100)
        y = randint(0, 100)
        # 向消息队列中写入信息
        q.put((x, y))


def handle():
    while True:
        sleep(0.5)
        try:
            # 取出消息队列的数据，延迟等待3秒，3秒过后抛出异常
            x, y = q.get(timeout=3)
        except:
            break
        else:
            print(x + y)


p1 = Process(target=request)
p2 = Process(target=handle)

p1.start()
p2.start()

p1.join()
p2.join()

4×3 共享内存

4x3x1 通信原理

在内存中开辟一块空间，进程可以写入内容和读取内容完成通信，但是每次写入内容会覆盖之前内容

4x3x2 实现方法

from multiprocessing import Value,Array

obj = Value(ctype,data)
# 功能 ： 开辟共享内存
# 参数 ： ctype  表示共享内存空间类型 'i'  'f'  'c'
#	data   共享内存空间初始数据
# 返回值：共享内存对象

obj.value  # 对该属性的修改查看即对共享内存读写


obj = Array(ctype,data)
# 功能： 开辟共享内存空间
# 参数： ctype  表示共享内存数据类型
#     data   整数则表示开辟空间的大小，其他数据类型				
#       表示开辟空间存放的初始化数据
# 返回值：共享内存对象

# Array共享内存读写： 通过遍历obj可以得到每个值，直接可以通过索引序号修改任意值。

# 可以使用obj.value直接打印共享内存中的字节串

value

from multiprocessing import Process, Value
import time
import random

# 创建共享内存
money = Value("i", 5000)


# 操作共享内存
def man():
    for i in range(30):
        time.sleep(0.2)
        money.value += random.randint(1, 1000)


def girl():
    for i in range(30):
        time.sleep(0.15)
        money.value -= random.randint(100, 800)


m = Process(target=man)
g = Process(target=girl)

m.start()
g.start()

m.join()
g.join()

print("一月余额", money.value)

Array

from multiprocessing import Process, Array

# 　创建共享内存
# 　共享内存开辟５个整型列表空间
# shm = Array('i',5)
# 　共享内存初始化数据[1,2,3]
# shm = Array('i', [1, 2, 3])

# 　字节串
shm = Array('c', b'hello')


def fun():
    # 　共享内存对象可迭代
    for i in shm:
        print(i)
    # 　修改共享内存
    shm[0] = b'H'


p = Process(target=fun)
p.start()
p.join()

for i in shm:
    print(i, end=' ')

# 通过ｖａｌｕｅ属性访问字节串
print(shm.value)

4×4 本地套接字

功能：用于本地两个程序之间进行数据的收发。

套接字文件：用于本地套接字之间通信时，进行数据传输的介质。

创建本地套接字流程：

【1】创建本地套接字
>sockfd = socket(AF_UNIX,SOCK_STREAM)

【2】绑定本地套接字文件
>sockfd.bind(file)

【3】监听，接收客户端连接，消息收发
>listen()-->accept()-->recv(),send()

本地套接字通信 Download

unix_send.py

from socket import *

sock_file = "./sock"

sockfd = socket(AF_UNIX,SOCK_STREAM)

sockfd.connect(sock_file)

while True:
    msg = input(">>")
    if not msg:
        break
    sockfd.send(msg.encode())
sockfd.close()

unix_recv.py

from socket import *
import os

# 确定本地套接字文件
sock_file = "./sock"

# 判断文件是否存在，存在就删
if os.path.exists(sock_file):
    os.remove(sock_file)

# 创建本地套接字
sockfd = socket(AF_UNIX, SOCK_STREAM)
# 绑定本地套接字
sockfd.bind(sock_file)
# 监听，连接
sockfd.listen(3)
while True:
    c, addr = sockfd.accept()
    while True:
        data = c.recv(1024)
        if not data:
            break
        print(data.decode())
    c.close()

sockfd.close()

4×5 信号量（信号灯集）

4x5x1 通信原理

给定一个数量对多个进程可见。多个进程都可以操作该数量增减，并根据数量值决定自己的行为。

4x5x2 实现方法

from multiprocessing import Semaphore

sem = Semaphore(num)
# 功能 ： 创建信号量对象
# 参数 ： 信号量的初始值
# 返回值 ： 信号量对象

sem.acquire()  # 将信号量减1 当信号量为0时阻塞
sem.release()  # 将信号量加1
sem.get_value() # 获取信号量数量

from multiprocessing import Semaphore, Process
from time import sleep
import os

# 创建信号量
# 服务程序最多允许3个进程同时执行实践
sem = Semaphore(3)


def handle():
    print("%d 想执行实践" % os.getpid())
    # 想执行必须获取信号量
    sem.acquire()
    print("%d 开始执行操作" % os.getpid())
    sleep(3)
    print("%d 完成操作" % os.getpid())
    # 增加信号量
    sem.release()


jobs = []
for i in range(1000):
    p = Process(target=handle)
    jobs.append(p)
    p.start()

for i in jobs:
    i.join()

5×0 线程编程（Thread）

5×1 线程基本概念

什么是线程
【1】线程被称为轻量级的进程
【2】线程也可以使用计算机多核资源，是多任务编程方式
【3】线程是系统分配内核的最小单元
【4】线程可以理解为进程的分支任务

线程特征
【1】一个进程中可以包含多个线程
【2】线程也是一个运行行为，消耗计算机资源
【3】一个进程中的所有线程共享这个进程的资源
【4】多个线程之间的运行互不影响各自运行
【5】线程的创建和销毁消耗资源远小于进程
【6】各个线程也有自己的ID等特征

5×2 threading模块创建线程

1.创建线程对象

from threading import Thread 

t = Thread()
# 功能：创建线程对象
# 参数：target 绑定线程函数
#     args   元组 给线程函数位置传参
#     kwargs 字典 给线程函数键值传参

2.启动与回收线程

t.start()
t.join([timeout])

5×3 线程对象属性

t.name	线程名称
t.setName()	设置线程名称
t.getName()	获取线程名称
t.is_alive()	查看线程是否在生周期
t.daemon	设置主线程和分支线程的退出关系
t.setDaemon()	设置daemon属性值
t.isDaemon()	查看daemon属性值

Deamon为true时主线程退出分支线程也退出。要在start前设置，通常不和join一起使用

5×4 自定义线程类

创建步骤
【1】继承Thread类
【2】重写init方法添加自己的属性，使用super加载父类属性
【3】重写run方法
使用方法
【1】实例化对象
【2】调用start自动执行run方法
【3】调用join回收线程

from threading import Thread
from time import sleep, ctime


class MyThread(Thread):
    def __init__(self, target, args=(), kwargs={}, name='Tedu'):
        super().__init__()
        self.target = target
        self.ctime = args
        self.song = kwargs
        self.name = name

    def run(self):
        self.target(*self.ctime, **self.song)


# 通过完成上面的MyThread类让整个程序可以正常执行，当调用start时player作为一个线程功能函数运行
# 注意：函数的名称和参数并不确定，player只是测试函数

def player(sec, song):
    for i in range(2):
        print("Playing %s:%s" % (song, ctime()))
        sleep(sec)


t = MyThread(target=player, args=(3,), kwargs={"song": "凉凉"}, name="happy")
t.start()
t.join()

6×0 同步互斥

6×1 线程间通信方法

1.通信方法

线程间使用全局变量进行通信

2.共享资源争夺

共享资源：多个进程或者线程都可以操作的资源称为共享资源。对共享资源的操作代码段称为临界区。
影响：对共享资源的无序操作可能会带来数据的混乱，或者操作错误。此时往往需要同步互斥机制协调操作顺序。

3.同步互斥机制

同步：同步是一种写作关系，为完成操作，多进程或线程间形成一种协调，按照必要的步骤有序执行操作。

互斥：互斥是一种制约关系，当一个进程或者线程占有资源时会进程加锁处理，此时其他进程就无法操作该资源，直到解锁后才能操作。

6×2 线程同步互斥方法

线程Event

from threading import Event

e = Event()  # 创建线程event对象

e.wait([timeout])  # 阻塞等待e被set

e.set()  # 设置e，使wait结束阻塞

e.clear() # 使e回到未被设置状态

e.is_set()  # 查看当前e是否被设置

右边的代码中e.wait() 表示阻塞等待子线程执行完毕。这里如果不阻塞等待的话就会出现2中结果。

1.父进程先结束，子进程在结束

1.子进程先结束，父进程在结束

from threading import Thread, Event
from time import sleep

s = None  # 全局变量用于通信
e = Event()  # 时间对象


def f1():
    print("杨子荣前来拜山头")
    global s
    s = "天王盖地虎"
    e.set()  # 共享资源操作完毕


t = Thread(target=f1)
t.start()
print("说对口令就是自己人")
e.wait()  # 阻塞等待
if s == "天王盖地虎":
    print("宝塔镇河妖")
    print("确认过眼神，你是对的人")
else:
    print("打死他")

t.join()

线程锁

from  threading import Lock

lock = Lock()  # 创建锁对象
lock.acquire() # 上锁  如果lock已经上锁再调用会阻塞
lock.release() # 解锁

with  lock:  # 上锁
...
...
	 # with代码块结束自动解锁

with代码块结束自动解锁

from threading import Thread, Lock

a = b = 0
lock = Lock()


def value():
    while True:
        lock.acquire() # 上锁
        if a != b:
            print("a = %d,b = %d" % (a, b))
        lock.release() # 解锁


t = Thread(target=value)
t.start()
while True:
    with lock: 
        a += 1
        b += 1

t.join()

6×3 死锁及其处理

1.定义

死锁是指两个或两个以上的线程在执行过程中，由于竞争资源或者由于彼此通信而造成的一种阻塞的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁。

2.死锁产生的条件

互斥条件：指线程对所分配到的资源进行排它性使用，即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源，则请求者只能等待，直至占有资源的进程用毕释放。
请求和保持条件：指线程已经保持至少一个资源，但又提出了新的资源请求，而该资源已被其它进程占有，此时请求线程阻塞，但又对自己已获得的其它资源保持不放。互斥条件：指线程对所分配到的资源进行排它性使用，即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源，则请求者只能等待，直至占有资源的进程用毕释放。
不剥夺条件：指线程已获得的资源，在未使用完之前，不能被剥夺，只能在使用完时由自己释放,通常CPU内存资源是可以被系统强行调配剥夺的。
环路等待条件：指在发生死锁时，必然存在一个线程——资源的环形链，即进程集合{T0，T1，T2，···，Tn}中的T0正在等待一个T1占用的资源；T1正在等待T2占用的资源，……，Tn正在等待已被T0占用的资源。

死锁产生的原因：

当前线程拥有其他线程需要的资源
当前线程等待其他线程已拥有的资源
都不放弃自己拥有的资源

3.如何避免死锁

死锁是我们非常不愿意看到的一种现象，我们要尽可能避免死锁的情况发生。通过设置某些限制条件，去破坏产生死锁的四个必要条件中的一个或者几个，来预防发生死锁。预防死锁是一种较易实现的方法。但是由于所施加的限制条件往往太严格，可能会导致系统资源利用率。

使用定时锁

使用重入锁RLock(),用法同Lock。RLock内部维护着一个Lock和一个counter变量，counter记录了acquire的次数，从而使得资源可以被多次require。直到一个线程所有的acquire都被release，其他的线程才能获得资源。

7×0 python线程GIL

python线程的GIL问题（全局解释器锁）
1. 什么是GIL ：由于python解释器设计中加入了解释器锁，导致python解释器同一时刻只能解释执行一个线程，大大降低了线程的执行效率。python线程的GIL问题（全局解释器锁）
2. 导致后果：因为遇到阻塞时线程会主动让出解释器，去解释其他线程。所以python多线程在执行多阻塞高延迟IO时可以提升程序效率，其他情况并不能对效率有所提升
3. GIL问题建议（官方）
  1. 尽量使用进程完成无阻塞的并发行为
  2. 不使用c作为解释器（Java C#）
结论：在无阻塞状态下，多线程程序和单线程程序执行效率几乎差不多，甚至还不如单线程效率。但是多进程运行相同内容却可以有明显的效率提升

8×0 进程线程的区别联系

8×1 区别联系

两者都是多任务编程方式，都能使用计算机多核资源
进程的创建删除消耗的计算机资源比线程多
进程空间多里，数据互不干扰，有专门通信方法；线程使用去哪局变量通信
一个进程可以有多个分支线程，两者有包含关系
多个线程共享进程资源，在共享资源操作时往往需要同步互斥处理
进程线程在系统中都有自己的特有属性标志，如ID,代码段，命令集等。

8×2 使用场景

任务场景：如果是相对独立的任务模块，可能使用多进程，如果是多个分支共同形成一个整体任务可能用多线程
项目结构：多中编程语言实现不同任务模块，可能是多进程，或者前后端分离应该各自为一个进程。
难以程度：通信难度，数据处理的复杂度来判断用进程间通信还是同步互斥方法。

8×3 要求

对进程线程怎么理解/说说进程线程的差异
进程间通信知道哪些，有什么特点
什么是同步互斥，你什么情况下使用，怎么用
给一个情形，说说用进程还是线程，为什么
问一些概念，僵尸进程的处理，GIL问题，进程状态

9×0 并发网络通信模型

9×1 常见模型分类

循环服务器模型：循环接受客户端请求，处理请求。同一时刻只能处理一个请求，处理完毕后再处理下一个。
1. 优点：实现简单，占用资源少
2. 缺点：无法同时处理多个客户端请求
3. 使用情况：处理的任务可以很快完成，客户端无需长期占用服务端程序。udp比tcp更适合循环。
IO并发模型：使用IO多路复用，异步IO等技术，同时处理多个客户端IO请求
1. 优点：资源消耗少，能同时高效处理多个IO行为
2. 缺点：只能处理并发产生的IO事件，无法处理cpu计算
3. 适用情况：HTTP请求，网络传输等都是IO行为。
多进程、多线程网络并发模型：每当一个客户端连接服务器，就创建一个新的进程、线程为该客户端服务，客户端退出时在销毁该进程、线程。
1. 优点：能同时满足多个客户端长期占有服务端需求，可以处理各种请求。
2. 缺点：消耗资源较大
3. 使用情况：客户端同时连接量较少，需要处理行为较为复杂情况。

9×2 基于fork的多进程网络并发模型

实现步骤：

创建监听套接字
等待接收客户端请求
客户端连接创建新的进程处理客户端请求
原进程继续等待其他客户端连接
如果客户端退出，则销毁对应的进程

"""
基于fork的多进程网络并发
重点代码
"""
from socket import *
import sys, os
import signal


def handle(c):
    print("客户端：", c.getpeername())
    while True:
        data = c.recv(1024)
        if not data:
            break
        print(data.decode())
        c.send(b"OK")
    c.close()


# 创建监听套接字
HOST = "0.0.0.0"
PORT = 8888
ADDR = (HOST, PORT)

s = socket()  # tcp套接字
s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)  # 设置端口的地址重用
s.bind(ADDR)
s.listen(3)

# 僵尸进程处理
signal.signal(signal.SIGCHLD, signal.SIG_IGN)

print("Listen the port 8888....")

# 循环等待客户端连接
while True:
    try:
        c, addr = s.accept()
    except KeyboardInterrupt:
        sys.exit("服务器退出")
    except Exception as e:
        print(e)
        continue

    # 创建子进程处理客户端请求
    pid = os.fork()
    if pid == 0:
        s.close()  # 子进程不需要s
        handle(c)  # 具体处理客户端请求
        os._exit(0)
    # 父进程实际只用来处理客户端链接
    else:
        c.close()  # 父进程不需要c

9×3 基于threading的多线程网络并发

实现步骤

创建监听套接字
循环接收客户端连接请求
当有新的客户端连接创建线程处理客户端请求
主线程继续等待其他客户端连接
当客户端退出，则对应分支线程退出

"""
多线程网络并发
重点代码
"""

from socket import *
from threading import Thread
import sys


# 客户端处理
def handle(c):
    print("Connect from：", c.getpeername())
    while True:
        data = c.recv(1024)
        if not data:
            break
        print(data.decode())
        c.send(b"OK")
    c.close()


# 创建监听套接字
HOST = "0.0.0.0"
PORT = 8888
ADDR = (HOST, PORT)

s = socket()
s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
s.bind(ADDR)
s.listen(3)
print("监听开始：8888")

# 循环等待
while True:
    try:
        c, addr = s.accept()
    except KeyboardInterrupt:
        sys.exit("退出服务器")
    except Exception as e:
        print(e)
        continue

    # 创建新的线程处理客户端请求
    t = Thread(target=handle, args=(c,))
    t.setDaemon(True)  # 主线程退出，分支线程也退出
    t.start()

9×4 扩展：集成模块完成多进程、多线程网络并发

1.使用方法

import socketserver

# 通过模块提供的不同的类的组合完成多进程或者多线程，tcp或者udp的网络并发模型

2.常用类说明

TCPServer 创建tcp服务端套接字
UDPServer 创建udp服务端套接字

StreamRequestHandler 处理tcp客户端请求
DatagramRequestHandler 处理udp客户端请求

ForkingMixIn 创建多进程并发
ForkingTCPServer ForkingMixIn + TCPServer
ForkingUDPServer ForkingMixIn + UDPServer

ThreadingMixIn 创建多线程并发
ThreadingTCPServer ThreadingMixIn + TCPServer
ThreadingUDPServer ThreadingMixIn + UDPServer

3.使用步骤

【1】创建服务器类，通过选择继承的类，决定创建TCP或者UDP，多进程或者多线程的并发服务器模型。

【2】创建请求处理类，根据服务类型选择stream处理类还是Datagram处理类。重写handle方法，做具体请求处理。

【3】通过服务器类实例化对象，并绑定请求处理类。

【4】通过服务器对象，调用serve_forever()启动服务

9×5 ftp文件服务器

功能：

【1】分为服务端和客户端，要求可以有多个客户端同时操作。
【2】客户端可以查看服务器文件库中有什么文件。
【3】客户端可以从文件库中下载文件到本地。
【4】客户端可以上传一个本地文件到文件库。
【5】使用print在客户端打印命令输入提示，引导操作

10×0 IO并发

10×1 IO分类

阻塞IO、非阻塞IO、IO多路复用、异步IO等

阻塞IO
1. 定义：在执行IO操作时如果执行条件不满足则阻塞。阻塞IO是IO的默认形态
2. 效率：阻塞IO是效率很低的一种IO。但是由于逻辑简单所以是默认的IO行为。
3. 阻塞情况：
  1. 因为某种执行条件没有满足造成的函数阻塞
    1. accept input recv
  2. 处理IO的时间较长产生的阻塞状态
    1. 网络传输，大文件读写
非阻塞IO
1. 定义：通过修改IO属性行为，使原本阻塞的IO变为非阻塞的状态
2. 设置套接字为非阻塞IO
  1. sockfd.setblocking(bool)
  2. 功能：设置套接字为非阻塞IO
  3. 参数：默认为True，表示套接字IO阻塞；设置为False则套接字IO变为非阻塞
3. 超时检测：设置一个最长阻塞时间，超过该时间后则不再阻塞等待。
  1. sockfd.settimeout(sec)
  2. 功能：设置套接字的超时时间
  3. 参数：设置的时间

10×2 IO多路复用

1.定义

同时监控多个IO事件，当哪个IO事件准备就绪就执行哪个IO事件。以此形成可以同时处理多个IO的行为，避免一个IO阻塞造成其他IO均无法执行，提高了IO执行效率。

IO 多路复用，实现单进程同时处理多个 socket 请求。所以无法使用计算机多核资源！

2.具体方案

select方法： windows linux unix

poll方法： linux unix
epoll方法： linux

select方法

rs, ws, xs=select(rlist, wlist, xlist[, timeout])
# 功能: 监控IO事件，阻塞等待IO发生
# 参数：rlist  列表  存放关注的等待发生的IO事件
#      wlist  列表  存放关注的要主动处理的IO事件
#      xlist  列表  存放关注的出现异常要处理的IO
#      timeout  超时时间

# 返回值： rs 列表  rlist中准备就绪的IO
#         ws 列表  wlist中准备就绪的IO
# 	  xs 列表  xlist中准备就绪的IO

select 实现tcp服务

【1】将关注的IO放入对应的监控类别列表
【2】通过select函数进行监控
【3】遍历select返回值列表，确定就绪IO事件
【4】处理发生的IO事件

注意

wlist中如果存在IO事件，则select立即返回给ws
处理IO过程中不要出现死循环占有服务端的情况
IO多路复用消耗资源较少，效率较高

"""
IO多路复用ｓｅｌｅｃｔ实现多客户端通信
重点代码
"""

from socket import *
from select import select

# 　设置套接字为关注ＩＯ
s = socket()
s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
s.bind(('0.0.0.0', 8888))
s.listen(5)

# 设置关注的ＩＯ
rlist = [s]
wlist = []
xlist = []

while True:
    # 　监控ＩＯ的发生
    rs, ws, xs = select(rlist, wlist, xlist)
    # 遍历三个返回值列表，判断哪个ＩＯ发生
    for r in rs:
        # 　如果是套接字就绪则处理链接
        if r is s:
            c, addr = r.accept()
            print("Connect from", addr)
            rlist.append(c)  # 加入新的关注ＩＯ
        else:
            data = r.recv(1024)
            if not data:
                rlist.remove(r)
                r.close()
                continue
            print(data.decode())
            # r.send(b'OK')
            # 　希望我们主动处理这个ＩＯ
            wlist.append(r)

    for w in ws:
        w.send(b'Ok,Thanks')
        wlist.remove(w)
    for x in xs:
        pass

扩展：位运算

定义：将整数转换为二进制，按二进制位进行运算

运算符号：

   &  按位与
   |  按位或
   ^  按位异或
   << 左移
   >> 右移
e.g.  14 --> 01110
      19 --> 10011

14 & 19 = 00010 = 2  一0则0
14 | 19 = 11111 = 31 一1则1
14 ^ 19 = 11101 = 29 相同为0不同为1
14 << 2 = 111000 = 56 向左移动低位补0
14 >> 2 = 11 = 3  向右移动去掉低位

poll方法

p = select.poll()

功能：创建poll对象

返回值：poll对象

p.register(fd,event)   
功能: 注册关注的IO事件
参数：fd  要关注的IO
      event  要关注的IO事件类型
  	     常用类型：POLLIN  读IO事件（rlist）
		      POLLOUT 写IO事件 (wlist)
		      POLLERR 异常IO  （xlist）
		      POLLHUP 断开连接 
		  e.g. p.register(sockfd,POLLIN|POLLERR)

p.unregister(fd)
功能：取消对IO的关注
参数：IO对象或者IO对象的fileno

events = p.poll()
功能： 阻塞等待监控的IO事件发生
返回值： 返回发生的IO
        events格式  [(fileno,event),()....]
        每个元组为一个就绪IO，元组第一项是该IO的fileno，第二项为该IO就绪的事件类型

poll_server步骤

【1】创建套接字
【2】将套接字register
【3】创建查找字典，并维护
【4】循环监控IO发生
【5】处理发生的IO

"""
poll多路复用
次重点
"""

from socket import *
from select import *

#　设置套接字为关注ＩＯ
s = socket()
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('0.0.0.0',8888))
s.listen(5)

#　创建ｐｏｌｌ
p = poll()

#　建立查找字典 {fileno: io_obj}
fdmap = {s.fileno():s}

#　设置关注ＩＯ
p.register(s,POLLIN|POLLERR)

#　循环监控ｉｏ事件发生
while True:
    events = p.poll() #　阻塞等待ＩＯ发生
    print(events)
    # 遍历列表处理ＩＯ　
    for fd,event in events:
        if fd == s.fileno():
            c,addr = fdmap[fd].accept()
            print("Connect from",addr)
            #　添加新的关注事件
            p.register(c,POLLIN|POLLHUP)
            fdmap[c.fileno()] = c
        # elif event & POLLHUP:  #　客户端断开
        #     print("客户端退出")
        #     p.unregister(fd) #　取消关注
        #     fdmap[fd].close()
        #     del fdmap[fd]  #　从字典删除
        elif event & POLLIN: # 客户端发消息
            data = fdmap[fd].recv(1024)
            # 断开发生时data得到空此时POLLIN也会就绪
            if not data:
                p.unregister(fd)  # 取消关注
                fdmap[fd].close()
                del fdmap[fd]
                continue
            print(data.decode())
            fdmap[fd].send(b'OK')

epoll方法

使用方法：基本与poll相同
- 生成对象改为 epoll()

将所有事件类型改为EPOLL类型

epoll特点

epoll 效率比select poll要高
epoll 监控IO数量比select poll要多
epoll 的触发方式比poll要多（EPOLLET边缘触发）

"""
epoll多路复用
次重点
"""

from socket import *
from select import *

#　设置套接字为关注ＩＯ
s = socket()
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('0.0.0.0',8888))
s.listen(5)

#　创建eｐｏｌｌ
ep = epoll()

#　建立查找字典 {fileno: io_obj}
fdmap = {s.fileno():s}

#　设置关注ＩＯ
ep.register(s,EPOLLIN|EPOLLERR)

#　循环监控ｉｏ事件发生
while True:
    events = ep.poll() #　阻塞等待ＩＯ发生
    print(events)
    # 遍历列表处理ＩＯ　
    for fd,event in events:
        if fd == s.fileno():
            c,addr = fdmap[fd].accept()
            print("Connect from",addr)
            #　添加新的关注事件
            ep.register(c,EPOLLIN|EPOLLHUP|EPOLLET)
            fdmap[c.fileno()] = c
        # elif event & EPOLLIN: # 客户端发消息
        #     data = fdmap[fd].recv(1024)
        #     # 断开发生时data得到空此时EPOLLIN也会就绪
        #     if not data:
        #         ep.unregister(fd)  # 取消关注
        #         fdmap[fd].close()
        #         del fdmap[fd]
        #         continue
        #     print(data.decode())
        #     fdmap[fd].send(b'OK')

select与poll图解

1558159594-select和poll Download

1558159628-epoll Download

10×3 协程技术

基础概念

定义：纤程，微线程。是为非抢占式多任务产生子程序的计算机组件。协程允许不同入口点在不同位置暂停或开始，简单来说，协程就是可以暂停执行的函数。
协程原理：记录一个函数的上下文栈帧，协程调度切换时会将记录的上下文保存，在切换回来时进行调取，恢复原有的执行内容，以便从上一次执行位置继续执行。
协程优缺点

优点

协程完成多任务占用计算资源很少
由于协程的多任务切换在应用层完成，因此切换开销少
协程为单线程程序，无需进行共享资源同步互斥处理

缺点

协程的本质是一个单线程，无法利用计算机多核资源

第三方协程模块：greenlet模块、gevent模块

11×0 HTTPServer v2.0

主要功能：
【1】接收客户端（浏览器）请求
【2】解析客户端发送的请求
【3】根据请求组织数据内容
【4】将数据内容形参http响应格式返回给浏览器
升级点：
【1】采用IO并发，可以满足多个客户端同时发起请求情况
【2】做基本的请求解析，根据具体请求返回具体内容，同时满足客户端简单的非网页请求情况
【3】通过类接口形式进行功能封装

"""
技术点
    1.使用tcp通信
    2.select io多路复用
结构：
    1.采用类封装
类的接口设计：
    1.在用户使用角度进行工作流程设计
    2.尽可能提供全面的功能，能为用户决定的在类中实现
    3.不能替用户决定的变量可以通过实例化对象传入类中
    4.不能替用户决定的复杂功能，可以通过重写让用户自己决定
"""

# httpserver2.0
# IO并发处理
# 基本request解析
# 使用类封装
from socket import *
from select import select


# 将具体http server功能封装
class HTTPServer:
    def __init__(self, server_addr, static_dir):
        # 添加属性
        self.server_addr = server_addr
        self.static_dir = static_dir
        self.rlist = self.wlist = self.xlist = []
        self.create_socket()
        self.bind()
        self.serve_forever()

    def create_socket(self):
        """
        创建套接字
        :return:
        """
        self.sockfd = socket()
        self.sockfd.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)

    def bind(self):
        """
        绑定ip端口
        :return:
        """
        self.sockfd.bind(self.server_addr)
        self.ip = self.server_addr[0]
        self.port = self.server_addr[1]

    def serve_forever(self):
        """
        开启服务
        :return:
        """
        self.sockfd.listen(5)
        print("listen the port:%s" % self.port)
        self.rlist = [self.sockfd]
        while True:
            rs, ws, xs = select(self.rlist, self.wlist, self.xlist)
            for r in rs:
                if r is self.sockfd:
                    c, addr = r.accept()
                    print("connect from:", addr)
                    self.rlist.append(c)
                else:
                    # 处理浏览器请求
                    self.handle(r)

    def handle(self, conn):
        """
        处理浏览器请求
        :param conn: obj类型，客户端连接的套接字
        :return:
        """
        # 接受http请求
        request = conn.recv(4096)
        # 防止游览器断开
        if not request:
            self.rlist.remove(conn)
            conn.close()
            return
        # 请求解析
        request_line = request.splitlines()[0]
        info = request_line.decode().split(" ")[1]
        print(conn.getpeername, ":", info)
        # info 分为访问网页和其他
        if info == "/" or info[-5:] == ".html":
            self.get_html(conn, info)
        else:
            self.get_data(conn, info)
        self.rlist.remove(conn)
        conn.close()

    def get_html(self, coon, info):
        """
        处理网页
        :param coon: obj类型，客户端连接的套接字
        :param info: str类型，客户端请求体
        :return:
        """
        if info == "/":
            filename = self.static_dir + "/index.html"
        else:
            filename = self.static_dir + info
        try:
            fr = open(filename)
        except Exception:
            # 没有网页返回404
            responseHeader = "HTTP/1.1 404 Not Found\r\n"
            responseHeader += "\r\n"
            responseBody = "<h1>没有发现这个网页</h1>"
        else:
            responseHeader = "HTTP/1.1 200 OK\r\n"
            responseHeader += "\r\n"
            responseBody = fr.read()
        finally:
            response = responseHeader + responseBody
            coon.send(response.encode())

    def get_data(self, coon, info):
        """
        表示访问的不是网页，是其他内容的情况
        :param coon: obj类型，客户端连接的套接字
        :param info: str类型，客户端请求体
        :return:
        """
        responseHeader = "HTTP/1.1 200 OK\r\n"
        responseHeader += "\r\n"
        responseBody = "<span>waiting HTTPServer 3.0<span>"
        response = responseHeader + responseBody
        coon.send(response.encode())


# 如何使用HTTPServer类
if __name__ == '__main__':
    #  用户自己决定：地址，内容
    server_addr = ("0.0.0.0", 8888)  # 服务器地址
    static_dir = "./static"  # 网页存放地址
    httpd = HTTPServer(server_addr, static_dir)  # 生成实例对象
    httpd.serve_forever()  # 启动服务