xref: /openbmc/linux/Documentation/translations/zh_CN/locking/mutex-design.rst (revision 4f2c0a4acffbec01079c28f839422e64ddeff004)
1*ee5956bbSTang Yizhou.. SPDX-License-Identifier: GPL-2.0
2*ee5956bbSTang Yizhou.. include:: ../disclaimer-zh_CN.rst
3*ee5956bbSTang Yizhou
4*ee5956bbSTang Yizhou:Original: Documentation/locking/mutex-design.rst
5*ee5956bbSTang Yizhou
6*ee5956bbSTang Yizhou:翻译:
7*ee5956bbSTang Yizhou
8*ee5956bbSTang Yizhou  唐艺舟 Tang Yizhou <tangyeechou@gmail.com>
9*ee5956bbSTang Yizhou
10*ee5956bbSTang Yizhou================
11*ee5956bbSTang Yizhou通用互斥锁子系统
12*ee5956bbSTang Yizhou================
13*ee5956bbSTang Yizhou
14*ee5956bbSTang Yizhou:初稿:
15*ee5956bbSTang Yizhou
16*ee5956bbSTang Yizhou  Ingo Molnar <mingo@redhat.com>
17*ee5956bbSTang Yizhou
18*ee5956bbSTang Yizhou:更新:
19*ee5956bbSTang Yizhou
20*ee5956bbSTang Yizhou  Davidlohr Bueso <davidlohr@hp.com>
21*ee5956bbSTang Yizhou
22*ee5956bbSTang Yizhou什么是互斥锁?
23*ee5956bbSTang Yizhou--------------
24*ee5956bbSTang Yizhou
25*ee5956bbSTang Yizhou在Linux内核中,互斥锁(mutex)指的是一个特殊的加锁原语,它在共享内存系统上
26*ee5956bbSTang Yizhou强制保证序列化,而不仅仅是指在学术界或类似的理论教科书中出现的通用术语“相互
27*ee5956bbSTang Yizhou排斥”。互斥锁是一种睡眠锁,它的行为类似于二进制信号量(semaphores),在
28*ee5956bbSTang Yizhou2006年被引入时[1],作为后者的替代品。这种新的数据结构提供了许多优点,包括更
29*ee5956bbSTang Yizhou简单的接口,以及在当时更少的代码量(见缺陷)。
30*ee5956bbSTang Yizhou
31*ee5956bbSTang Yizhou[1] https://lwn.net/Articles/164802/
32*ee5956bbSTang Yizhou
33*ee5956bbSTang Yizhou实现
34*ee5956bbSTang Yizhou----
35*ee5956bbSTang Yizhou
36*ee5956bbSTang Yizhou互斥锁由“struct mutex”表示,在include/linux/mutex.h中定义,并在
37*ee5956bbSTang Yizhoukernel/locking/mutex.c中实现。这些锁使用一个原子变量(->owner)来跟踪
38*ee5956bbSTang Yizhou它们生命周期内的锁状态。字段owner实际上包含的是指向当前锁所有者的
39*ee5956bbSTang Yizhou`struct task_struct *` 指针,因此如果无人持有锁,则它的值为空(NULL)。
40*ee5956bbSTang Yizhou由于task_struct的指针至少按L1_CACHE_BYTES对齐,低位(3)被用来存储额外
41*ee5956bbSTang Yizhou的状态(例如,等待者列表非空)。在其最基本的形式中,它还包括一个等待队列和
42*ee5956bbSTang Yizhou一个确保对其序列化访问的自旋锁。此外,CONFIG_MUTEX_SPIN_ON_OWNER=y的
43*ee5956bbSTang Yizhou系统使用一个自旋MCS锁(->osq,译注:MCS是两个人名的合并缩写),在下文的
44*ee5956bbSTang Yizhou(ii)中描述。
45*ee5956bbSTang Yizhou
46*ee5956bbSTang Yizhou准备获得一把自旋锁时,有三种可能经过的路径,取决于锁的状态:
47*ee5956bbSTang Yizhou
48*ee5956bbSTang Yizhou(i) 快速路径:试图通过调用cmpxchg()修改锁的所有者为当前任务,以此原子化地
49*ee5956bbSTang Yizhou    获取锁。这只在无竞争的情况下有效(cmpxchg()检查值是否为0,所以3个状态
50*ee5956bbSTang Yizhou    比特必须为0)。如果锁处在竞争状态,代码进入下一个可能的路径。
51*ee5956bbSTang Yizhou
52*ee5956bbSTang Yizhou(ii) 中速路径:也就是乐观自旋,当锁的所有者正在运行并且没有其它优先级更高的
53*ee5956bbSTang Yizhou     任务(need_resched,需要重新调度)准备运行时,当前任务试图自旋来获得
54*ee5956bbSTang Yizhou     锁。原理是,如果锁的所有者正在运行,它很可能不久就会释放锁。互斥锁自旋体
55*ee5956bbSTang Yizhou     使用MCS锁排队,这样只有一个自旋体可以竞争互斥锁。
56*ee5956bbSTang Yizhou
57*ee5956bbSTang Yizhou     MCS锁(由Mellor-Crummey和Scott提出)是一个简单的自旋锁,它具有一些
58*ee5956bbSTang Yizhou     理想的特性,比如公平,以及每个CPU在试图获得锁时在一个本地变量上自旋。
59*ee5956bbSTang Yizhou     它避免了常见的“检测-设置”自旋锁实现导致的(CPU核间)缓存行回弹
60*ee5956bbSTang Yizhou     (cacheline bouncing)这种昂贵的开销。一个类MCS锁是为实现睡眠锁的
61*ee5956bbSTang Yizhou     乐观自旋而专门定制的。这种定制MCS锁的一个重要特性是,它有一个额外的属性,
62*ee5956bbSTang Yizhou     当自旋体需要重新调度时,它们能够退出MCS自旋锁队列。这进一步有助于避免
63*ee5956bbSTang Yizhou     以下场景:需要重新调度的MCS自旋体将继续自旋等待自旋体所有者,即将获得
64*ee5956bbSTang Yizhou     MCS锁时却直接进入慢速路径。
65*ee5956bbSTang Yizhou
66*ee5956bbSTang Yizhou(iii) 慢速路径:最后的手段,如果仍然无法获得锁,该任务会被添加到等待队列中,
67*ee5956bbSTang Yizhou      休眠直到被解锁路径唤醒。在通常情况下,它以TASK_UNINTERRUPTIBLE状态
68*ee5956bbSTang Yizhou      阻塞。
69*ee5956bbSTang Yizhou
70*ee5956bbSTang Yizhou虽然从形式上看,内核互斥锁是可睡眠的锁,路径(ii)使它实际上成为混合类型。通过
71*ee5956bbSTang Yizhou简单地不中断一个任务并忙着等待几个周期,而不是立即睡眠,这种锁已经被认为显著
72*ee5956bbSTang Yizhou改善一些工作负载的性能。注意,这种技术也被用于读写信号量(rw-semaphores)。
73*ee5956bbSTang Yizhou
74*ee5956bbSTang Yizhou语义
75*ee5956bbSTang Yizhou----
76*ee5956bbSTang Yizhou
77*ee5956bbSTang Yizhou互斥锁子系统检查并强制执行以下规则:
78*ee5956bbSTang Yizhou
79*ee5956bbSTang Yizhou    - 每次只有一个任务可以持有该互斥锁。
80*ee5956bbSTang Yizhou    - 只有锁的所有者可以解锁该互斥锁。
81*ee5956bbSTang Yizhou    - 不允许多次解锁。
82*ee5956bbSTang Yizhou    - 不允许递归加锁/解锁。
83*ee5956bbSTang Yizhou    - 互斥锁只能通过API进行初始化(见下文)。
84*ee5956bbSTang Yizhou    - 一个任务不能在持有互斥锁的情况下退出。
85*ee5956bbSTang Yizhou    - 持有锁的内存区域不得被释放。
86*ee5956bbSTang Yizhou    - 被持有的锁不能被重新初始化。
87*ee5956bbSTang Yizhou    - 互斥锁不能用于硬件或软件中断上下文,如小任务(tasklet)和定时器。
88*ee5956bbSTang Yizhou
89*ee5956bbSTang Yizhou当CONFIG DEBUG_MUTEXES被启用时,这些语义将被完全强制执行。此外,互斥锁
90*ee5956bbSTang Yizhou调试代码还实现了一些其它特性,使锁的调试更容易、更快速:
91*ee5956bbSTang Yizhou
92*ee5956bbSTang Yizhou    - 当打印到调试输出时,总是使用互斥锁的符号名称。
93*ee5956bbSTang Yizhou    - 加锁点跟踪,函数名符号化查找,系统持有的全部锁的列表,打印出它们。
94*ee5956bbSTang Yizhou    - 所有者跟踪。
95*ee5956bbSTang Yizhou    - 检测自我递归的锁并打印所有相关信息。
96*ee5956bbSTang Yizhou    - 检测多任务环形依赖死锁,并打印所有受影响的锁和任务(并且只限于这些任务)。
97*ee5956bbSTang Yizhou
98*ee5956bbSTang Yizhou
99*ee5956bbSTang Yizhou接口
100*ee5956bbSTang Yizhou----
101*ee5956bbSTang Yizhou静态定义互斥锁::
102*ee5956bbSTang Yizhou
103*ee5956bbSTang Yizhou   DEFINE_MUTEX(name);
104*ee5956bbSTang Yizhou
105*ee5956bbSTang Yizhou动态初始化互斥锁::
106*ee5956bbSTang Yizhou
107*ee5956bbSTang Yizhou   mutex_init(mutex);
108*ee5956bbSTang Yizhou
109*ee5956bbSTang Yizhou以不可中断方式(uninterruptible)获取互斥锁::
110*ee5956bbSTang Yizhou
111*ee5956bbSTang Yizhou   void mutex_lock(struct mutex *lock);
112*ee5956bbSTang Yizhou   void mutex_lock_nested(struct mutex *lock, unsigned int subclass);
113*ee5956bbSTang Yizhou   int  mutex_trylock(struct mutex *lock);
114*ee5956bbSTang Yizhou
115*ee5956bbSTang Yizhou以可中断方式(interruptible)获取互斥锁::
116*ee5956bbSTang Yizhou
117*ee5956bbSTang Yizhou   int mutex_lock_interruptible_nested(struct mutex *lock,
118*ee5956bbSTang Yizhou				       unsigned int subclass);
119*ee5956bbSTang Yizhou   int mutex_lock_interruptible(struct mutex *lock);
120*ee5956bbSTang Yizhou
121*ee5956bbSTang Yizhou当原子变量减为0时,以可中断方式(interruptible)获取互斥锁::
122*ee5956bbSTang Yizhou
123*ee5956bbSTang Yizhou   int atomic_dec_and_mutex_lock(atomic_t *cnt, struct mutex *lock);
124*ee5956bbSTang Yizhou
125*ee5956bbSTang Yizhou释放互斥锁::
126*ee5956bbSTang Yizhou
127*ee5956bbSTang Yizhou   void mutex_unlock(struct mutex *lock);
128*ee5956bbSTang Yizhou
129*ee5956bbSTang Yizhou检测是否已经获取互斥锁::
130*ee5956bbSTang Yizhou
131*ee5956bbSTang Yizhou   int mutex_is_locked(struct mutex *lock);
132*ee5956bbSTang Yizhou
133*ee5956bbSTang Yizhou缺陷
134*ee5956bbSTang Yizhou----
135*ee5956bbSTang Yizhou
136*ee5956bbSTang Yizhou与它最初的设计和目的不同,'struct mutex' 是内核中最大的锁之一。例如:在
137*ee5956bbSTang Yizhoux86-64上它是32字节,而 'struct semaphore' 是24字节,rw_semaphore是
138*ee5956bbSTang Yizhou40字节。更大的结构体大小意味着更多的CPU缓存和内存占用。
139*ee5956bbSTang Yizhou
140*ee5956bbSTang Yizhou
141*ee5956bbSTang Yizhou何时使用互斥锁
142*ee5956bbSTang Yizhou--------------
143*ee5956bbSTang Yizhou
144*ee5956bbSTang Yizhou总是优先选择互斥锁而不是任何其它锁原语,除非互斥锁的严格语义不合适,和/或临界区
145*ee5956bbSTang Yizhou阻止锁被共享。
146