1ccfaed7bSLukas Bulwahn========
2e210c66dSTao ZhouCPU 负载
3ccfaed7bSLukas Bulwahn========
4e210c66dSTao Zhou
5e210c66dSTao ZhouLinux通过``/proc/stat``和``/proc/uptime``导出各种信息,用户空间工具
6e210c66dSTao Zhou如top(1)使用这些信息计算系统花费在某个特定状态的平均时间。
7e210c66dSTao Zhou例如:
8e210c66dSTao Zhou
9e210c66dSTao Zhou    $ iostat
10e210c66dSTao Zhou    Linux 2.6.18.3-exp (linmac)     02/20/2007
11e210c66dSTao Zhou
12e210c66dSTao Zhou    avg-cpu:  %user   %nice %system %iowait  %steal   %idle
13e210c66dSTao Zhou              10.01    0.00    2.92    5.44    0.00   81.63
14e210c66dSTao Zhou
15e210c66dSTao Zhou    ...
16e210c66dSTao Zhou
17e210c66dSTao Zhou这里系统认为在默认采样周期內有10.01%的时间工作在用户空间,2.92%的时
18e210c66dSTao Zhou间用在系统空间,总体上有81.63%的时间是空闲的。
19e210c66dSTao Zhou
20e210c66dSTao Zhou大多数情况下``/proc/stat``的信息几乎真实反映了系统信息,然而,由于内
21e210c66dSTao Zhou核采集这些数据的方式/时间的特点,有时这些信息根本不可靠。
22e210c66dSTao Zhou
23e210c66dSTao Zhou那么这些信息是如何被搜集的呢?每当时间中断触发时,内核查看此刻运行的
24e210c66dSTao Zhou进程类型,并增加与此类型/状态进程对应的计数器的值。这种方法的问题是
25e210c66dSTao Zhou在两次时间中断之间系统(进程)能够在多种状态之间切换多次,而计数器只
26e210c66dSTao Zhou增加最后一种状态下的计数。
27e210c66dSTao Zhou
28e210c66dSTao Zhou举例
29e210c66dSTao Zhou---
30e210c66dSTao Zhou
31e210c66dSTao Zhou假设系统有一个进程以如下方式周期性地占用cpu::
32e210c66dSTao Zhou
33e210c66dSTao Zhou     两个时钟中断之间的时间线
34e210c66dSTao Zhou    |-----------------------|
35e210c66dSTao Zhou     ^                     ^
36e210c66dSTao Zhou     |_ 开始运行           |
37e210c66dSTao Zhou                           |_ 开始睡眠
38e210c66dSTao Zhou                           (很快会被唤醒)
39e210c66dSTao Zhou
40e210c66dSTao Zhou在上面的情况下,根据``/proc/stat``的信息(由于当系统处于空闲状态时,
41e210c66dSTao Zhou时间中断经常会发生)系统的负载将会是0
42e210c66dSTao Zhou
43e210c66dSTao Zhou大家能够想象内核的这种行为会发生在许多情况下,这将导致``/proc/stat``
44e210c66dSTao Zhou中存在相当古怪的信息::
45e210c66dSTao Zhou
46e210c66dSTao Zhou	/* gcc -o hog smallhog.c */
47e210c66dSTao Zhou	#include <time.h>
48e210c66dSTao Zhou	#include <limits.h>
49e210c66dSTao Zhou	#include <signal.h>
50e210c66dSTao Zhou	#include <sys/time.h>
51e210c66dSTao Zhou	#define HIST 10
52e210c66dSTao Zhou
53e210c66dSTao Zhou	static volatile sig_atomic_t stop;
54e210c66dSTao Zhou
55e210c66dSTao Zhou	static void sighandler (int signr)
56e210c66dSTao Zhou	{
57e210c66dSTao Zhou	(void) signr;
58e210c66dSTao Zhou	stop = 1;
59e210c66dSTao Zhou	}
60e210c66dSTao Zhou	static unsigned long hog (unsigned long niters)
61e210c66dSTao Zhou	{
62e210c66dSTao Zhou	stop = 0;
63e210c66dSTao Zhou	while (!stop && --niters);
64e210c66dSTao Zhou	return niters;
65e210c66dSTao Zhou	}
66e210c66dSTao Zhou	int main (void)
67e210c66dSTao Zhou	{
68e210c66dSTao Zhou	int i;
69e210c66dSTao Zhou	struct itimerval it = { .it_interval = { .tv_sec = 0, .tv_usec = 1 },
70e210c66dSTao Zhou				.it_value = { .tv_sec = 0, .tv_usec = 1 } };
71e210c66dSTao Zhou	sigset_t set;
72e210c66dSTao Zhou	unsigned long v[HIST];
73e210c66dSTao Zhou	double tmp = 0.0;
74e210c66dSTao Zhou	unsigned long n;
75e210c66dSTao Zhou	signal (SIGALRM, &sighandler);
76e210c66dSTao Zhou	setitimer (ITIMER_REAL, &it, NULL);
77e210c66dSTao Zhou
78e210c66dSTao Zhou	hog (ULONG_MAX);
79e210c66dSTao Zhou	for (i = 0; i < HIST; ++i) v[i] = ULONG_MAX - hog (ULONG_MAX);
80e210c66dSTao Zhou	for (i = 0; i < HIST; ++i) tmp += v[i];
81e210c66dSTao Zhou	tmp /= HIST;
82e210c66dSTao Zhou	n = tmp - (tmp / 3.0);
83e210c66dSTao Zhou
84e210c66dSTao Zhou	sigemptyset (&set);
85e210c66dSTao Zhou	sigaddset (&set, SIGALRM);
86e210c66dSTao Zhou
87e210c66dSTao Zhou	for (;;) {
88e210c66dSTao Zhou		hog (n);
89e210c66dSTao Zhou		sigwait (&set, &i);
90e210c66dSTao Zhou	}
91e210c66dSTao Zhou	return 0;
92e210c66dSTao Zhou	}
93e210c66dSTao Zhou
94e210c66dSTao Zhou
95e210c66dSTao Zhou参考
96e210c66dSTao Zhou---
97e210c66dSTao Zhou
98*05a5f51cSJoe Perches- https://lore.kernel.org/r/loom.20070212T063225-663@post.gmane.org
99e210c66dSTao Zhou- Documentation/filesystems/proc.rst (1.8)
100e210c66dSTao Zhou
101e210c66dSTao Zhou
102e210c66dSTao Zhou谢谢
103e210c66dSTao Zhou---
104e210c66dSTao Zhou
105e210c66dSTao ZhouCon Kolivas, Pavel Machek
106