176f1fc26SHu Haowen.. SPDX-License-Identifier: GPL-2.0
276f1fc26SHu Haowen
376f1fc26SHu Haowen.. include:: ../disclaimer-zh_TW.rst
476f1fc26SHu Haowen
576f1fc26SHu Haowen:Original: :doc:`../../../admin-guide/tainted-kernels`
676f1fc26SHu Haowen
776f1fc26SHu Haowen:譯者:
876f1fc26SHu Haowen
976f1fc26SHu Haowen 吳想成 Wu XiangCheng <bobwxc@email.cn>
10*44a54e25SHu Haowen 胡皓文 Hu Haowen <src.res.211@gmail.com>
1176f1fc26SHu Haowen
1276f1fc26SHu Haowen受汙染的內核
1376f1fc26SHu Haowen-------------
1476f1fc26SHu Haowen
1576f1fc26SHu Haowen當發生一些在稍後調查問題時可能相關的事件時,內核會將自己標記爲「受汙染
1676f1fc26SHu Haowen(tainted)」的。不用太過擔心,大多數情況下運行受汙染的內核沒有問題;這些信息
1776f1fc26SHu Haowen主要在有人想調查某個問題時才有意義的,因爲問題的真正原因可能是導致內核受汙染
1876f1fc26SHu Haowen的事件。這就是爲什麼來自受汙染內核的缺陷報告常常被開發人員忽略,因此請嘗試用
1976f1fc26SHu Haowen未受汙染的內核重現問題。
2076f1fc26SHu Haowen
2176f1fc26SHu Haowen請注意,即使在您消除導致汙染的原因(亦即卸載專有內核模塊)之後,內核仍將保持
2276f1fc26SHu Haowen汙染狀態,以表示內核仍然不可信。這也是爲什麼內核在注意到內部問題(「kernel
2376f1fc26SHu Haowenbug」)、可恢復錯誤(「kernel oops」)或不可恢復錯誤(「kernel panic」)時會列印
2476f1fc26SHu Haowen受汙染狀態,並將有關此的調試信息寫入日誌 ``dmesg`` 輸出。也可以通過
2576f1fc26SHu Haowen``/proc/`` 中的文件在運行時檢查受汙染的狀態。
2676f1fc26SHu Haowen
2776f1fc26SHu Haowen
2876f1fc26SHu HaowenBUG、Oops或Panics消息中的汙染標誌
2976f1fc26SHu Haowen~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
3076f1fc26SHu Haowen
3176f1fc26SHu Haowen在頂部以「CPU:」開頭的一行中可以找到受汙染的狀態;內核是否受到汙染和原因會顯示
3276f1fc26SHu Haowen在進程ID(「PID:」)和觸發事件命令的縮寫名稱(「Comm:」)之後::
3376f1fc26SHu Haowen
3476f1fc26SHu Haowen	BUG: unable to handle kernel NULL pointer dereference at 0000000000000000
3576f1fc26SHu Haowen	Oops: 0002 [#1] SMP PTI
3676f1fc26SHu Haowen	CPU: 0 PID: 4424 Comm: insmod Tainted: P        W  O      4.20.0-0.rc6.fc30 #1
3776f1fc26SHu Haowen	Hardware name: Red Hat KVM, BIOS 0.5.1 01/01/2011
3876f1fc26SHu Haowen	RIP: 0010:my_oops_init+0x13/0x1000 [kpanic]
3976f1fc26SHu Haowen	[...]
4076f1fc26SHu Haowen
4176f1fc26SHu Haowen如果內核在事件發生時沒有被汙染,您將在那裡看到「Not-tainted:」;如果被汙染,那
4276f1fc26SHu Haowen麼它將是「Tainted:」以及字母或空格。在上面的例子中,它看起來是這樣的::
4376f1fc26SHu Haowen
4476f1fc26SHu Haowen	Tainted: P        W  O
4576f1fc26SHu Haowen
4676f1fc26SHu Haowen下表解釋了這些字符的含義。在本例中,由於加載了專有模塊( ``P`` ),出現了
4776f1fc26SHu Haowen警告( ``W`` ),並且加載了外部構建的模塊( ``O`` ),所以內核早些時候受到
4876f1fc26SHu Haowen了汙染。要解碼其他字符,請使用下表。
4976f1fc26SHu Haowen
5076f1fc26SHu Haowen
5176f1fc26SHu Haowen解碼運行時的汙染狀態
5276f1fc26SHu Haowen~~~~~~~~~~~~~~~~~~~~~
5376f1fc26SHu Haowen
5476f1fc26SHu Haowen在運行時,您可以通過讀取 ``cat /proc/sys/kernel/tainted`` 來查詢受汙染狀態。
5576f1fc26SHu Haowen如果返回 ``0`` ,則內核沒有受到汙染;任何其他數字都表示受到汙染的原因。解碼
5676f1fc26SHu Haowen這個數字的最簡單方法是使用腳本  ``tools/debugging/kernel-chktaint`` ,您的
5776f1fc26SHu Haowen發行版可能會將其作爲名爲 ``linux-tools`` 或 ``kernel-tools`` 的包的一部分提
5876f1fc26SHu Haowen供;如果沒有,您可以從
5976f1fc26SHu Haowen`git.kernel.org <https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/plain/tools/debugging/kernel-chktaint>`_
6076f1fc26SHu Haowen網站下載此腳本並用 ``sh kernel-chktaint`` 執行,它會在上面引用的日誌中有類似
6176f1fc26SHu Haowen語句的機器上列印這樣的內容::
6276f1fc26SHu Haowen
6376f1fc26SHu Haowen	Kernel is Tainted for following reasons:
6476f1fc26SHu Haowen	 * Proprietary module was loaded (#0)
6576f1fc26SHu Haowen	 * Kernel issued warning (#9)
6676f1fc26SHu Haowen	 * Externally-built ('out-of-tree') module was loaded  (#12)
6776f1fc26SHu Haowen	See Documentation/admin-guide/tainted-kernels.rst in the Linux kernel or
6876f1fc26SHu Haowen	 https://www.kernel.org/doc/html/latest/admin-guide/tainted-kernels.html for
6976f1fc26SHu Haowen	 a more details explanation of the various taint flags.
7076f1fc26SHu Haowen	Raw taint value as int/string: 4609/'P        W  O     '
7176f1fc26SHu Haowen
7276f1fc26SHu Haowen你也可以試著自己解碼這個數字。如果內核被汙染的原因只有一個,那麼這很簡單,
7376f1fc26SHu Haowen在本例中您可以通過下表找到數字。如果你需要解碼有多個原因的數字,因爲它是一
7476f1fc26SHu Haowen個位域(bitfield),其中每個位表示一個特定類型的汙染的存在或不存在,最好讓
7576f1fc26SHu Haowen前面提到的腳本來處理。但是如果您需要快速看一下,可以使用這個shell命令來檢查
7676f1fc26SHu Haowen設置了哪些位::
7776f1fc26SHu Haowen
7876f1fc26SHu Haowen	$ for i in $(seq 18); do echo $(($i-1)) $(($(cat /proc/sys/kernel/tainted)>>($i-1)&1));done
7976f1fc26SHu Haowen
8076f1fc26SHu Haowen汙染狀態代碼表
8176f1fc26SHu Haowen~~~~~~~~~~~~~~~
8276f1fc26SHu Haowen
8376f1fc26SHu Haowen===  =====  ======  ========================================================
8476f1fc26SHu Haowen 位  日誌     數字  內核被汙染的原因
8576f1fc26SHu Haowen===  =====  ======  ========================================================
8676f1fc26SHu Haowen  0   G/P        1  已加載專用模塊
8776f1fc26SHu Haowen  1   _/F        2  模塊被強制加載
8876f1fc26SHu Haowen  2   _/S        4  內核運行在不合規範的系統上
8976f1fc26SHu Haowen  3   _/R        8  模塊被強制卸載
9076f1fc26SHu Haowen  4   _/M       16  處理器報告了機器檢測異常(MCE)
9176f1fc26SHu Haowen  5   _/B       32  引用了錯誤的頁或某些意外的頁標誌
9276f1fc26SHu Haowen  6   _/U       64  用戶空間應用程式請求的汙染
9376f1fc26SHu Haowen  7   _/D      128  內核最近死機了,即曾出現OOPS或BUG
9476f1fc26SHu Haowen  8   _/A      256  ACPI表被用戶覆蓋
9576f1fc26SHu Haowen  9   _/W      512  內核發出警告
9676f1fc26SHu Haowen 10   _/C     1024  已加載staging驅動程序
9776f1fc26SHu Haowen 11   _/I     2048  已應用平台固件缺陷的解決方案
9876f1fc26SHu Haowen 12   _/O     4096  已加載外部構建(「樹外」)模塊
9976f1fc26SHu Haowen 13   _/E     8192  已加載未簽名的模塊
10076f1fc26SHu Haowen 14   _/L    16384  發生軟鎖定
10176f1fc26SHu Haowen 15   _/K    32768  內核已實時打補丁
10276f1fc26SHu Haowen 16   _/X    65536  備用汙染,爲發行版定義並使用
10376f1fc26SHu Haowen 17   _/T   131072  內核是用結構隨機化插件構建的
10476f1fc26SHu Haowen===  =====  ======  ========================================================
10576f1fc26SHu Haowen
10676f1fc26SHu Haowen註:字符 ``_`` 表示空白,以便於閱讀表。
10776f1fc26SHu Haowen
10876f1fc26SHu Haowen汙染的更詳細解釋
10976f1fc26SHu Haowen~~~~~~~~~~~~~~~~~
11076f1fc26SHu Haowen
11176f1fc26SHu Haowen 0)  ``G`` 加載的所有模塊都有GPL或兼容許可證, ``P`` 加載了任何專有模塊。
11276f1fc26SHu Haowen     沒有MODULE_LICENSE(模塊許可證)或MODULE_LICENSE未被insmod認可爲GPL
11376f1fc26SHu Haowen     兼容的模塊被認爲是專有的。
11476f1fc26SHu Haowen
11576f1fc26SHu Haowen
11676f1fc26SHu Haowen 1)  ``F`` 任何模塊被 ``insmod -f`` 強制加載, ``' '`` 所有模塊正常加載。
11776f1fc26SHu Haowen
11876f1fc26SHu Haowen 2)  ``S`` 內核運行在不合規範的處理器或系統上:硬體已運行在不受支持的配置中,
11976f1fc26SHu Haowen     因此無法保證正確執行。內核將被汙染,例如:
12076f1fc26SHu Haowen
12176f1fc26SHu Haowen     - 在x86上:PAE是通過intel CPU(如Pentium M)上的forcepae強制執行的,這些
12276f1fc26SHu Haowen       CPU不報告PAE,但可能有功能實現,SMP內核在非官方支持的SMP Athlon CPU上
12376f1fc26SHu Haowen       運行,MSR被暴露到用戶空間中。
12476f1fc26SHu Haowen     - 在arm上:在某些CPU(如Keystone 2)上運行的內核,沒有啓用某些內核特性。
12576f1fc26SHu Haowen     - 在arm64上:CPU之間存在不匹配的硬體特性,引導加載程序以不同的模式引導CPU。
12676f1fc26SHu Haowen     - 某些驅動程序正在被用在不受支持的體系結構上(例如x86_64以外的其他系統
12776f1fc26SHu Haowen       上的scsi/snic,非x86/x86_64/itanium上的scsi/ips,已經損壞了arm64上
12876f1fc26SHu Haowen       irqchip/irq-gic的固件設置…)。
12976f1fc26SHu Haowen
13076f1fc26SHu Haowen 3)  ``R`` 模塊被 ``rmmod -f`` 強制卸載, ``' '`` 所有模塊都正常卸載。
13176f1fc26SHu Haowen
13276f1fc26SHu Haowen 4)  ``M`` 任何處理器報告了機器檢測異常, ``' '`` 未發生機器檢測異常。
13376f1fc26SHu Haowen
13476f1fc26SHu Haowen 5)  ``B`` 頁面釋放函數發現錯誤的頁面引用或某些意外的頁面標誌。這表示硬體問題
13576f1fc26SHu Haowen     或內核錯誤;日誌中應該有其他信息指示發生此汙染的原因。
13676f1fc26SHu Haowen
13776f1fc26SHu Haowen 6)  ``U`` 用戶或用戶應用程式特意請求設置受汙染標誌,否則應爲 ``' '`` 。
13876f1fc26SHu Haowen
13976f1fc26SHu Haowen 7)  ``D`` 內核最近死機了,即出現了OOPS或BUG。
14076f1fc26SHu Haowen
14176f1fc26SHu Haowen 8)  ``A`` ACPI表被重寫。
14276f1fc26SHu Haowen
14376f1fc26SHu Haowen 9)  ``W`` 內核之前已發出過警告(儘管有些警告可能會設置更具體的汙染標誌)。
14476f1fc26SHu Haowen
14576f1fc26SHu Haowen 10) ``C`` 已加載staging驅動程序。
14676f1fc26SHu Haowen
14776f1fc26SHu Haowen 11) ``I`` 內核正在處理平台固件(BIOS或類似軟體)中的嚴重錯誤。
14876f1fc26SHu Haowen
14976f1fc26SHu Haowen 12) ``O`` 已加載外部構建(「樹外」)模塊。
15076f1fc26SHu Haowen
15176f1fc26SHu Haowen 13) ``E`` 在支持模塊簽名的內核中加載了未簽名的模塊。
15276f1fc26SHu Haowen
15376f1fc26SHu Haowen 14) ``L`` 系統上先前發生過軟鎖定。
15476f1fc26SHu Haowen
15576f1fc26SHu Haowen 15) ``K`` 內核已經實時打了補丁。
15676f1fc26SHu Haowen
15776f1fc26SHu Haowen 16) ``X`` 備用汙染,由Linux發行版定義和使用。
15876f1fc26SHu Haowen
15976f1fc26SHu Haowen 17) ``T`` 內核構建時使用了randstruct插件,它可以有意生成非常不尋常的內核結構
16076f1fc26SHu Haowen     布局(甚至是性能病態的布局),這在調試時非常有用。於構建時設置。
16176f1fc26SHu Haowen
162