1:Original: Documentation/mm/page_owner.rst 2 3:翻译: 4 5 司延腾 Yanteng Si <siyanteng@loongson.cn> 6 7:校译: 8 9 10================================ 11page owner: 跟踪谁分配的每个页面 12================================ 13 14概述 15==== 16 17page owner是用来追踪谁分配的每一个页面。它可以用来调试内存泄漏或找到内存占用者。 18当分配发生时,有关分配的信息,如调用堆栈和页面的顺序被存储到每个页面的特定存储中。 19当我们需要了解所有页面的状态时,我们可以获得并分析这些信息。 20 21尽管我们已经有了追踪页面分配/释放的tracepoint,但用它来分析谁分配的每个页面是 22相当复杂的。我们需要扩大跟踪缓冲区,以防止在用户空间程序启动前出现重叠。而且,启 23动的程序会不断地将跟踪缓冲区转出,供以后分析,这将会改变系统的行为,会产生更多的 24可能性,而不是仅仅保留在内存中,所以不利于调试。 25 26页面所有者也可以用于各种目的。例如,可以通过每个页面的gfp标志信息获得精确的碎片 27统计。如果启用了page owner,它就已经实现并激活了。我们非常欢迎其他用途。 28 29page owner在默认情况下是禁用的。所以,如果你想使用它,你需要在你的启动cmdline 30中加入"page_owner=on"。如果内核是用page owner构建的,并且由于没有启用启动 31选项而在运行时禁用page owner,那么运行时的开销是很小的。如果在运行时禁用,它不 32需要内存来存储所有者信息,所以没有运行时内存开销。而且,页面所有者在页面分配器的 33热路径中只插入了两个不可能的分支,如果不启用,那么分配就会像没有页面所有者的内核 34一样进行。这两个不可能的分支应该不会影响到分配的性能,特别是在静态键跳转标签修补 35功能可用的情况下。以下是由于这个功能而导致的内核代码大小的变化。 36 37- 没有page owner:: 38 39 text data bss dec hex filename 40 48392 2333 644 51369 c8a9 mm/page_alloc.o 41 42- 有page owner:: 43 44 text data bss dec hex filename 45 48800 2445 644 51889 cab1 mm/page_alloc.o 46 6662 108 29 6799 1a8f mm/page_owner.o 47 1025 8 8 1041 411 mm/page_ext.o 48 49虽然总共增加了8KB的代码,但page_alloc.o增加了520字节,其中不到一半是在hotpath 50中。构建带有page owner的内核,并在需要时打开它,将是调试内核内存问题的最佳选择。 51 52有一个问题是由实现细节引起的。页所有者将信息存储到struct page扩展的内存中。这 53个内存的初始化时间比稀疏内存系统中的页面分配器启动的时间要晚一些,所以,在初始化 54之前,许多页面可以被分配,但它们没有所有者信息。为了解决这个问题,这些早期分配的 55页面在初始化阶段被调查并标记为分配。虽然这并不意味着它们有正确的所有者信息,但至 56少,我们可以更准确地判断该页是否被分配。在2GB内存的x86-64虚拟机上,有13343 57个早期分配的页面被捕捉和标记,尽管它们大部分是由结构页扩展功能分配的。总之,在这 58之后,没有任何页面处于未追踪状态。 59 60使用方法 61======== 62 631) 构建用户空间的帮助:: 64 65 cd tools/vm 66 make page_owner_sort 67 682) 启用page owner: 添加 "page_owner=on" 到 boot cmdline. 69 703) 做你想调试的工作。 71 724) 分析来自页面所有者的信息:: 73 74 cat /sys/kernel/debug/page_owner > page_owner_full.txt 75 ./page_owner_sort page_owner_full.txt sorted_page_owner.txt 76 77 ``page_owner_full.txt`` 的一般输出情况如下:: 78 79 Page allocated via order XXX, ... 80 PFN XXX ... 81 // 栈详情 82 83 Page allocated via order XXX, ... 84 PFN XXX ... 85 // 栈详情 86 默认情况下,它将以一个给定的pfn开始,做完整的pfn转储,且page_owner支持fseek。 87 88 FILE *fp = fopen("/sys/kernel/debug/page_owner", "r"); 89 fseek(fp, pfn_start, SEEK_SET); 90 91 ``page_owner_sort`` 工具忽略了 ``PFN`` 行,将剩余的行放在buf中,使用regexp提 92 取页序值,计算buf的次数和页数,最后根据参数进行排序。 93 94 在 ``sorted_page_owner.txt`` 中可以看到关于谁分配了每个页面的结果。一般输出:: 95 96 XXX times, XXX pages: 97 Page allocated via order XXX, ... 98 // Detailed stack 99 100 默认情况下, ``page_owner_sort`` 是根据buf的时间来排序的。如果你想 101 按buf的页数排序,请使用-m参数。详细的参数是: 102 103 基本函数:: 104 105 排序: 106 -a 按内存分配时间排序 107 -m 按总内存排序 108 -p 按pid排序。 109 -P 按tgid排序。 110 -n 按任务命令名称排序。 111 -r 按内存释放时间排序。 112 -s 按堆栈跟踪排序。 113 -t 按时间排序(默认)。 114 --sort <order> 指定排序顺序。排序的语法是[+|-]key[,[+|-]key[,...]]。从 115 **标准格式指定器**那一节选择一个键。"+"是可选的,因为默认的方向是数字或 116 词法的增加。允许混合使用缩写和完整格式的键。 117 118 例子: 119 ./page_owner_sort <input> <output> --sort=n,+pid,-tgid 120 ./page_owner_sort <input> <output> --sort=at 121 122 其它函数:: 123 124 剔除: 125 --cull <rules> 126 指定剔除规则。剔除的语法是key[,key[,...]]。从**标准格式指定器** 127 部分选择一个多字母键。 128 <rules>是一个以逗号分隔的列表形式的单一参数,它提供了一种指定单个剔除规则的 129 方法。 识别的关键字在下面的**标准格式指定器**部分有描述。<规则>可以通过键的 130 序列k1,k2,...来指定,在下面的标准排序键部分有描述。允许混合使用简写和完整形 131 式的键。 132 133 Examples: 134 ./page_owner_sort <input> <output> --cull=stacktrace 135 ./page_owner_sort <input> <output> --cull=st,pid,name 136 ./page_owner_sort <input> <output> --cull=n,f 137 138 过滤: 139 -f 过滤掉内存已被释放的块的信息。 140 141 选择: 142 --pid <pidlist> 按pid选择。这将选择进程ID号出现在<pidlist>中的块。 143 --tgid <tgidlist> 按tgid选择。这将选择其线程组ID号出现在<tgidlist> 144 中的块。 145 --name <cmdlist> 按任务命令名称选择。这将选择其任务命令名称出现在 146 <cmdlist>中的区块。 147 148 <pidlist>, <tgidlist>, <cmdlist>是以逗号分隔的列表形式的单个参数, 149 它提供了一种指定单个选择规则的方法。 150 151 152 例子: 153 ./page_owner_sort <input> <output> --pid=1 154 ./page_owner_sort <input> <output> --tgid=1,2,3 155 ./page_owner_sort <input> <output> --name name1,name2 156 157标准格式指定器 158============== 159:: 160 161 --sort的选项: 162 163 短键 长键 描述 164 p pid 进程ID 165 tg tgid 线程组ID 166 n name 任务命令名称 167 st stacktrace 页面分配的堆栈跟踪 168 T txt 块的全文 169 ft free_ts 页面释放时的时间戳 170 at alloc_ts 页面被分配时的时间戳 171 ator allocator 页面的内存分配器 172 173 --curl的选项: 174 175 短键 长键 描述 176 p pid 进程ID 177 tg tgid 线程组ID 178 n name 任务命令名称 179 f free 该页是否已经释放 180 st stacktrace 页面分配的堆栈跟踪 181 ator allocator 页面的内存分配器 182