1Chinese translated version of Documentation/arch/arm64/booting.rst 2 3If you have any comment or update to the content, please contact the 4original document maintainer directly. However, if you have a problem 5communicating in English you can also ask the Chinese maintainer for 6help. Contact the Chinese maintainer if this translation is outdated 7or if there is a problem with the translation. 8 9M: Will Deacon <will.deacon@arm.com> 10zh_CN: Fu Wei <wefu@redhat.com> 11C: 55f058e7574c3615dea4615573a19bdb258696c6 12--------------------------------------------------------------------- 13Documentation/arch/arm64/booting.rst 的中文翻译 14 15如果想评论或更新本文的内容,请直接联系原文档的维护者。如果你使用英文 16交流有困难的话,也可以向中文版维护者求助。如果本翻译更新不及时或者翻 17译存在问题,请联系中文版维护者。 18 19英文版维护者: Will Deacon <will.deacon@arm.com> 20中文版维护者: 傅炜 Fu Wei <wefu@redhat.com> 21中文版翻译者: 傅炜 Fu Wei <wefu@redhat.com> 22中文版校译者: 傅炜 Fu Wei <wefu@redhat.com> 23本文翻译提交时的 Git 检出点为: 55f058e7574c3615dea4615573a19bdb258696c6 24 25以下为正文 26--------------------------------------------------------------------- 27 启动 AArch64 Linux 28 ================== 29 30作者: Will Deacon <will.deacon@arm.com> 31日期: 2012 年 09 月 07 日 32 33本文档基于 Russell King 的 ARM 启动文档,且适用于所有公开发布的 34AArch64 Linux 内核代码。 35 36AArch64 异常模型由多个异常级(EL0 - EL3)组成,对于 EL0 和 EL1 异常级 37有对应的安全和非安全模式。EL2 是系统管理级,且仅存在于非安全模式下。 38EL3 是最高特权级,且仅存在于安全模式下。 39 40基于本文档的目的,我们将简单地使用‘引导装载程序’(‘boot loader’) 41这个术语来定义在将控制权交给 Linux 内核前 CPU 上执行的所有软件。 42这可能包含安全监控和系统管理代码,或者它可能只是一些用于准备最小启动 43环境的指令。 44 45基本上,引导装载程序(至少)应实现以下操作: 46 471、设置和初始化 RAM 482、设置设备树数据 493、解压内核映像 504、调用内核映像 51 52 531、设置和初始化 RAM 54----------------- 55 56必要性: 强制 57 58引导装载程序应该找到并初始化系统中所有内核用于保持系统变量数据的 RAM。 59这个操作的执行方式因设备而异。(它可能使用内部算法来自动定位和计算所有 60RAM,或可能使用对这个设备已知的 RAM 信息,还可能是引导装载程序设计者 61想到的任何合适的方法。) 62 63 642、设置设备树数据 65--------------- 66 67必要性: 强制 68 69设备树数据块(dtb)必须 8 字节对齐,且大小不能超过 2MB。由于设备树 70数据块将在使能缓存的情况下以 2MB 粒度被映射,故其不能被置于必须以特定 71属性映射的2M区域内。 72 73注: v4.2 之前的版本同时要求设备树数据块被置于从内核映像以下 74text_offset 字节处算起第一个 512MB 内。 75 763、解压内核映像 77------------- 78 79必要性: 可选 80 81AArch64 内核当前没有提供自解压代码,因此如果使用了压缩内核映像文件 82(比如 Image.gz),则需要通过引导装载程序(使用 gzip 等)来进行解压。 83若引导装载程序没有实现这个功能,就要使用非压缩内核映像文件。 84 85 864、调用内核映像 87------------- 88 89必要性: 强制 90 91已解压的内核映像包含一个 64 字节的头,内容如下: 92 93 u32 code0; /* 可执行代码 */ 94 u32 code1; /* 可执行代码 */ 95 u64 text_offset; /* 映像装载偏移,小端模式 */ 96 u64 image_size; /* 映像实际大小, 小端模式 */ 97 u64 flags; /* 内核旗标, 小端模式 * 98 u64 res2 = 0; /* 保留 */ 99 u64 res3 = 0; /* 保留 */ 100 u64 res4 = 0; /* 保留 */ 101 u32 magic = 0x644d5241; /* 魔数, 小端, "ARM\x64" */ 102 u32 res5; /* 保留 (用于 PE COFF 偏移) */ 103 104 105映像头注释: 106 107- 自 v3.17 起,除非另有说明,所有域都是小端模式。 108 109- code0/code1 负责跳转到 stext. 110 111- 当通过 EFI 启动时, 最初 code0/code1 被跳过。 112 res5 是到 PE 文件头的偏移,而 PE 文件头含有 EFI 的启动入口点 113 (efi_stub_entry)。当 stub 代码完成了它的使命,它会跳转到 code0 114 继续正常的启动流程。 115 116- v3.17 之前,未明确指定 text_offset 的字节序。此时,image_size 为零, 117 且 text_offset 依照内核字节序为 0x80000。 118 当 image_size 非零,text_offset 为小端模式且是有效值,应被引导加载 119 程序使用。当 image_size 为零,text_offset 可假定为 0x80000。 120 121- flags 域 (v3.17 引入) 为 64 位小端模式,其编码如下: 122 位 0: 内核字节序。 1 表示大端模式,0 表示小端模式。 123 位 1-2: 内核页大小。 124 0 - 未指定。 125 1 - 4K 126 2 - 16K 127 3 - 64K 128 位 3: 内核物理位置 129 0 - 2MB 对齐基址应尽量靠近内存起始处,因为 130 其基址以下的内存无法通过线性映射访问 131 1 - 2MB 对齐基址可以在物理内存的任意位置 132 位 4-63: 保留。 133 134- 当 image_size 为零时,引导装载程序应试图在内核映像末尾之后尽可能 135 多地保留空闲内存供内核直接使用。对内存空间的需求量因所选定的内核 136 特性而异, 并无实际限制。 137 138内核映像必须被放置在任意一个可用系统内存 2MB 对齐基址的 text_offset 139字节处,并从该处被调用。2MB 对齐基址和内核映像起始地址之间的区域对于 140内核来说没有特殊意义,且可能被用于其他目的。 141从映像起始地址算起,最少必须准备 image_size 字节的空闲内存供内核使用。 142注: v4.6 之前的版本无法使用内核映像物理偏移以下的内存,所以当时建议 143将映像尽量放置在靠近系统内存起始的地方。 144 145任何提供给内核的内存(甚至在映像起始地址之前),若未从内核中标记为保留 146(如在设备树(dtb)的 memreserve 区域),都将被认为对内核是可用。 147 148在跳转入内核前,必须符合以下状态: 149 150- 停止所有 DMA 设备,这样内存数据就不会因为虚假网络包或磁盘数据而 151 被破坏。这可能可以节省你许多的调试时间。 152 153- 主 CPU 通用寄存器设置 154 x0 = 系统 RAM 中设备树数据块(dtb)的物理地址。 155 x1 = 0 (保留,将来可能使用) 156 x2 = 0 (保留,将来可能使用) 157 x3 = 0 (保留,将来可能使用) 158 159- CPU 模式 160 所有形式的中断必须在 PSTATE.DAIF 中被屏蔽(Debug、SError、IRQ 161 和 FIQ)。 162 CPU 必须处于 EL2(推荐,可访问虚拟化扩展)或非安全 EL1 模式下。 163 164- 高速缓存、MMU 165 MMU 必须关闭。 166 指令缓存开启或关闭皆可。 167 已载入的内核映像的相应内存区必须被清理,以达到缓存一致性点(PoC)。 168 当存在系统缓存或其他使能缓存的一致性主控器时,通常需使用虚拟地址 169 维护其缓存,而非 set/way 操作。 170 遵从通过虚拟地址操作维护构架缓存的系统缓存必须被配置,并可以被使能。 171 而不通过虚拟地址操作维护构架缓存的系统缓存(不推荐),必须被配置且 172 禁用。 173 174 *译者注:对于 PoC 以及缓存相关内容,请参考 ARMv8 构架参考手册 175 ARM DDI 0487A 176 177- 架构计时器 178 CNTFRQ 必须设定为计时器的频率,且 CNTVOFF 必须设定为对所有 CPU 179 都一致的值。如果在 EL1 模式下进入内核,则 CNTHCTL_EL2 中的 180 EL1PCTEN (bit 0) 必须置位。 181 182- 一致性 183 通过内核启动的所有 CPU 在内核入口地址上必须处于相同的一致性域中。 184 这可能要根据具体实现来定义初始化过程,以使能每个CPU上对维护操作的 185 接收。 186 187- 系统寄存器 188 在进入内核映像的异常级中,所有构架中可写的系统寄存器必须通过软件 189 在一个更高的异常级别下初始化,以防止在 未知 状态下运行。 190 191 对于拥有 GICv3 中断控制器并以 v3 模式运行的系统: 192 - 如果 EL3 存在: 193 ICC_SRE_EL3.Enable (位 3) 必须初始化为 0b1。 194 ICC_SRE_EL3.SRE (位 0) 必须初始化为 0b1。 195 - 若内核运行在 EL1: 196 ICC_SRE_EL2.Enable (位 3) 必须初始化为 0b1。 197 ICC_SRE_EL2.SRE (位 0) 必须初始化为 0b1。 198 - 设备树(DT)或 ACPI 表必须描述一个 GICv3 中断控制器。 199 200 对于拥有 GICv3 中断控制器并以兼容(v2)模式运行的系统: 201 - 如果 EL3 存在: 202 ICC_SRE_EL3.SRE (位 0) 必须初始化为 0b0。 203 - 若内核运行在 EL1: 204 ICC_SRE_EL2.SRE (位 0) 必须初始化为 0b0。 205 - 设备树(DT)或 ACPI 表必须描述一个 GICv2 中断控制器。 206 207以上对于 CPU 模式、高速缓存、MMU、架构计时器、一致性、系统寄存器的 208必要条件描述适用于所有 CPU。所有 CPU 必须在同一异常级别跳入内核。 209 210引导装载程序必须在每个 CPU 处于以下状态时跳入内核入口: 211 212- 主 CPU 必须直接跳入内核映像的第一条指令。通过此 CPU 传递的设备树 213 数据块必须在每个 CPU 节点中包含一个 ‘enable-method’ 属性,所 214 支持的 enable-method 请见下文。 215 216 引导装载程序必须生成这些设备树属性,并在跳入内核入口之前将其插入 217 数据块。 218 219- enable-method 为 “spin-table” 的 CPU 必须在它们的 CPU 220 节点中包含一个 ‘cpu-release-addr’ 属性。这个属性标识了一个 221 64 位自然对齐且初始化为零的内存位置。 222 223 这些 CPU 必须在内存保留区(通过设备树中的 /memreserve/ 域传递 224 给内核)中自旋于内核之外,轮询它们的 cpu-release-addr 位置(必须 225 包含在保留区中)。可通过插入 wfe 指令来降低忙循环开销,而主 CPU 将 226 发出 sev 指令。当对 cpu-release-addr 所指位置的读取操作返回非零值 227 时,CPU 必须跳入此值所指向的地址。此值为一个单独的 64 位小端值, 228 因此 CPU 须在跳转前将所读取的值转换为其本身的端模式。 229 230- enable-method 为 “psci” 的 CPU 保持在内核外(比如,在 231 memory 节点中描述为内核空间的内存区外,或在通过设备树 /memreserve/ 232 域中描述为内核保留区的空间中)。内核将会发起在 ARM 文档(编号 233 ARM DEN 0022A:用于 ARM 上的电源状态协调接口系统软件)中描述的 234 CPU_ON 调用来将 CPU 带入内核。 235 236 *译者注: ARM DEN 0022A 已更新到 ARM DEN 0022C。 237 238 设备树必须包含一个 ‘psci’ 节点,请参考以下文档: 239 Documentation/devicetree/bindings/arm/psci.yaml 240 241 242- 辅助 CPU 通用寄存器设置 243 x0 = 0 (保留,将来可能使用) 244 x1 = 0 (保留,将来可能使用) 245 x2 = 0 (保留,将来可能使用) 246 x3 = 0 (保留,将来可能使用) 247