1a622d64eSAlex Bennée /*
2a622d64eSAlex Bennée * Copyright (C) 2020, Alex Bennée <alex.bennee@linaro.org>
3a622d64eSAlex Bennée *
4a622d64eSAlex Bennée * HW Profile - breakdown access patterns for IO to devices
5a622d64eSAlex Bennée *
6a622d64eSAlex Bennée * License: GNU GPL, version 2 or later.
7a622d64eSAlex Bennée * See the COPYING file in the top-level directory.
8a622d64eSAlex Bennée */
9a622d64eSAlex Bennée
10a622d64eSAlex Bennée #include <inttypes.h>
11a622d64eSAlex Bennée #include <assert.h>
12a622d64eSAlex Bennée #include <stdlib.h>
13a622d64eSAlex Bennée #include <inttypes.h>
14a622d64eSAlex Bennée #include <string.h>
15a622d64eSAlex Bennée #include <unistd.h>
16a622d64eSAlex Bennée #include <stdio.h>
17a622d64eSAlex Bennée #include <glib.h>
18a622d64eSAlex Bennée
19a622d64eSAlex Bennée #include <qemu-plugin.h>
20a622d64eSAlex Bennée
21a622d64eSAlex Bennée QEMU_PLUGIN_EXPORT int qemu_plugin_version = QEMU_PLUGIN_VERSION;
22a622d64eSAlex Bennée
23a622d64eSAlex Bennée #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
24a622d64eSAlex Bennée
25a622d64eSAlex Bennée typedef struct {
26a622d64eSAlex Bennée uint64_t cpu_read;
27a622d64eSAlex Bennée uint64_t cpu_write;
28a622d64eSAlex Bennée uint64_t reads;
29a622d64eSAlex Bennée uint64_t writes;
30a622d64eSAlex Bennée } IOCounts;
31a622d64eSAlex Bennée
32a622d64eSAlex Bennée typedef struct {
33a622d64eSAlex Bennée uint64_t off_or_pc;
34a622d64eSAlex Bennée IOCounts counts;
35a622d64eSAlex Bennée } IOLocationCounts;
36a622d64eSAlex Bennée
37a622d64eSAlex Bennée typedef struct {
38a622d64eSAlex Bennée const char *name;
39a622d64eSAlex Bennée uint64_t base;
40a622d64eSAlex Bennée IOCounts totals;
41a622d64eSAlex Bennée GHashTable *detail;
42a622d64eSAlex Bennée } DeviceCounts;
43a622d64eSAlex Bennée
44a622d64eSAlex Bennée static GMutex lock;
45a622d64eSAlex Bennée static GHashTable *devices;
46a622d64eSAlex Bennée
47a622d64eSAlex Bennée /* track the access pattern to a piece of HW */
48a622d64eSAlex Bennée static bool pattern;
49a622d64eSAlex Bennée /* track the source address of access to HW */
50a622d64eSAlex Bennée static bool source;
51a622d64eSAlex Bennée /* track only matched regions of HW */
52a622d64eSAlex Bennée static bool check_match;
53a622d64eSAlex Bennée static gchar **matches;
54a622d64eSAlex Bennée
55a622d64eSAlex Bennée static enum qemu_plugin_mem_rw rw = QEMU_PLUGIN_MEM_RW;
56a622d64eSAlex Bennée
track_reads(void)57a622d64eSAlex Bennée static inline bool track_reads(void)
58a622d64eSAlex Bennée {
59a622d64eSAlex Bennée return rw == QEMU_PLUGIN_MEM_RW || rw == QEMU_PLUGIN_MEM_R;
60a622d64eSAlex Bennée }
61a622d64eSAlex Bennée
track_writes(void)62a622d64eSAlex Bennée static inline bool track_writes(void)
63a622d64eSAlex Bennée {
64a622d64eSAlex Bennée return rw == QEMU_PLUGIN_MEM_RW || rw == QEMU_PLUGIN_MEM_W;
65a622d64eSAlex Bennée }
66a622d64eSAlex Bennée
plugin_init(void)67a622d64eSAlex Bennée static void plugin_init(void)
68a622d64eSAlex Bennée {
69a622d64eSAlex Bennée devices = g_hash_table_new(NULL, NULL);
70a622d64eSAlex Bennée }
71a622d64eSAlex Bennée
sort_cmp(gconstpointer a,gconstpointer b)72a622d64eSAlex Bennée static gint sort_cmp(gconstpointer a, gconstpointer b)
73a622d64eSAlex Bennée {
74a622d64eSAlex Bennée DeviceCounts *ea = (DeviceCounts *) a;
75a622d64eSAlex Bennée DeviceCounts *eb = (DeviceCounts *) b;
76a622d64eSAlex Bennée return ea->totals.reads + ea->totals.writes >
77a622d64eSAlex Bennée eb->totals.reads + eb->totals.writes ? -1 : 1;
78a622d64eSAlex Bennée }
79a622d64eSAlex Bennée
sort_loc(gconstpointer a,gconstpointer b)80a622d64eSAlex Bennée static gint sort_loc(gconstpointer a, gconstpointer b)
81a622d64eSAlex Bennée {
82a622d64eSAlex Bennée IOLocationCounts *ea = (IOLocationCounts *) a;
83a622d64eSAlex Bennée IOLocationCounts *eb = (IOLocationCounts *) b;
84a622d64eSAlex Bennée return ea->off_or_pc > eb->off_or_pc;
85a622d64eSAlex Bennée }
86a622d64eSAlex Bennée
fmt_iocount_record(GString * s,IOCounts * rec)87a622d64eSAlex Bennée static void fmt_iocount_record(GString *s, IOCounts *rec)
88a622d64eSAlex Bennée {
89a622d64eSAlex Bennée if (track_reads()) {
90a622d64eSAlex Bennée g_string_append_printf(s, ", %"PRIx64", %"PRId64,
91a622d64eSAlex Bennée rec->cpu_read, rec->reads);
92a622d64eSAlex Bennée }
93a622d64eSAlex Bennée if (track_writes()) {
94a622d64eSAlex Bennée g_string_append_printf(s, ", %"PRIx64", %"PRId64,
95a622d64eSAlex Bennée rec->cpu_write, rec->writes);
96a622d64eSAlex Bennée }
97a622d64eSAlex Bennée }
98a622d64eSAlex Bennée
fmt_dev_record(GString * s,DeviceCounts * rec)99a622d64eSAlex Bennée static void fmt_dev_record(GString *s, DeviceCounts *rec)
100a622d64eSAlex Bennée {
101a622d64eSAlex Bennée g_string_append_printf(s, "%s, 0x%"PRIx64,
102a622d64eSAlex Bennée rec->name, rec->base);
103a622d64eSAlex Bennée fmt_iocount_record(s, &rec->totals);
104a622d64eSAlex Bennée g_string_append_c(s, '\n');
105a622d64eSAlex Bennée }
106a622d64eSAlex Bennée
plugin_exit(qemu_plugin_id_t id,void * p)107a622d64eSAlex Bennée static void plugin_exit(qemu_plugin_id_t id, void *p)
108a622d64eSAlex Bennée {
109a622d64eSAlex Bennée g_autoptr(GString) report = g_string_new("");
110a622d64eSAlex Bennée GList *counts;
111a622d64eSAlex Bennée
112a622d64eSAlex Bennée if (!(pattern || source)) {
113a622d64eSAlex Bennée g_string_printf(report, "Device, Address");
114a622d64eSAlex Bennée if (track_reads()) {
115a622d64eSAlex Bennée g_string_append_printf(report, ", RCPUs, Reads");
116a622d64eSAlex Bennée }
117a622d64eSAlex Bennée if (track_writes()) {
118a622d64eSAlex Bennée g_string_append_printf(report, ", WCPUs, Writes");
119a622d64eSAlex Bennée }
120a622d64eSAlex Bennée g_string_append_c(report, '\n');
121a622d64eSAlex Bennée }
122a622d64eSAlex Bennée
123a622d64eSAlex Bennée counts = g_hash_table_get_values(devices);
124a622d64eSAlex Bennée if (counts && g_list_next(counts)) {
125a622d64eSAlex Bennée GList *it;
126a622d64eSAlex Bennée
127a622d64eSAlex Bennée it = g_list_sort(counts, sort_cmp);
128a622d64eSAlex Bennée
129a622d64eSAlex Bennée while (it) {
130a622d64eSAlex Bennée DeviceCounts *rec = (DeviceCounts *) it->data;
131a622d64eSAlex Bennée if (rec->detail) {
132a622d64eSAlex Bennée GList *accesses = g_hash_table_get_values(rec->detail);
133a622d64eSAlex Bennée GList *io_it = g_list_sort(accesses, sort_loc);
134a622d64eSAlex Bennée const char *prefix = pattern ? "off" : "pc";
135a622d64eSAlex Bennée g_string_append_printf(report, "%s @ 0x%"PRIx64"\n",
136a622d64eSAlex Bennée rec->name, rec->base);
137a622d64eSAlex Bennée while (io_it) {
138a622d64eSAlex Bennée IOLocationCounts *loc = (IOLocationCounts *) io_it->data;
139a622d64eSAlex Bennée g_string_append_printf(report, " %s:%08"PRIx64,
140a622d64eSAlex Bennée prefix, loc->off_or_pc);
141a622d64eSAlex Bennée fmt_iocount_record(report, &loc->counts);
142a622d64eSAlex Bennée g_string_append_c(report, '\n');
143a622d64eSAlex Bennée io_it = io_it->next;
144a622d64eSAlex Bennée }
145a622d64eSAlex Bennée } else {
146a622d64eSAlex Bennée fmt_dev_record(report, rec);
147a622d64eSAlex Bennée }
148a622d64eSAlex Bennée it = it->next;
149a622d64eSAlex Bennée };
150a622d64eSAlex Bennée g_list_free(it);
151a622d64eSAlex Bennée }
152a622d64eSAlex Bennée
153a622d64eSAlex Bennée qemu_plugin_outs(report->str);
154a622d64eSAlex Bennée }
155a622d64eSAlex Bennée
new_count(const char * name,uint64_t base)156a622d64eSAlex Bennée static DeviceCounts *new_count(const char *name, uint64_t base)
157a622d64eSAlex Bennée {
158a622d64eSAlex Bennée DeviceCounts *count = g_new0(DeviceCounts, 1);
159a622d64eSAlex Bennée count->name = name;
160a622d64eSAlex Bennée count->base = base;
161a622d64eSAlex Bennée if (pattern || source) {
162a622d64eSAlex Bennée count->detail = g_hash_table_new(NULL, NULL);
163a622d64eSAlex Bennée }
164a622d64eSAlex Bennée g_hash_table_insert(devices, (gpointer) name, count);
165a622d64eSAlex Bennée return count;
166a622d64eSAlex Bennée }
167a622d64eSAlex Bennée
new_location(GHashTable * table,uint64_t off_or_pc)168a622d64eSAlex Bennée static IOLocationCounts *new_location(GHashTable *table, uint64_t off_or_pc)
169a622d64eSAlex Bennée {
170a622d64eSAlex Bennée IOLocationCounts *loc = g_new0(IOLocationCounts, 1);
171a622d64eSAlex Bennée loc->off_or_pc = off_or_pc;
172a622d64eSAlex Bennée g_hash_table_insert(table, (gpointer) off_or_pc, loc);
173a622d64eSAlex Bennée return loc;
174a622d64eSAlex Bennée }
175a622d64eSAlex Bennée
hwprofile_match_hit(DeviceCounts * rec,uint64_t off)176a622d64eSAlex Bennée static void hwprofile_match_hit(DeviceCounts *rec, uint64_t off)
177a622d64eSAlex Bennée {
178a622d64eSAlex Bennée g_autoptr(GString) report = g_string_new("hwprofile: match @ offset");
179a622d64eSAlex Bennée g_string_append_printf(report, "%"PRIx64", previous hits\n", off);
180a622d64eSAlex Bennée fmt_dev_record(report, rec);
181a622d64eSAlex Bennée qemu_plugin_outs(report->str);
182a622d64eSAlex Bennée }
183a622d64eSAlex Bennée
inc_count(IOCounts * count,bool is_write,unsigned int cpu_index)184a622d64eSAlex Bennée static void inc_count(IOCounts *count, bool is_write, unsigned int cpu_index)
185a622d64eSAlex Bennée {
186a622d64eSAlex Bennée if (is_write) {
187a622d64eSAlex Bennée count->writes++;
188a622d64eSAlex Bennée count->cpu_write |= (1 << cpu_index);
189a622d64eSAlex Bennée } else {
190a622d64eSAlex Bennée count->reads++;
191a622d64eSAlex Bennée count->cpu_read |= (1 << cpu_index);
192a622d64eSAlex Bennée }
193a622d64eSAlex Bennée }
194a622d64eSAlex Bennée
vcpu_haddr(unsigned int cpu_index,qemu_plugin_meminfo_t meminfo,uint64_t vaddr,void * udata)195a622d64eSAlex Bennée static void vcpu_haddr(unsigned int cpu_index, qemu_plugin_meminfo_t meminfo,
196a622d64eSAlex Bennée uint64_t vaddr, void *udata)
197a622d64eSAlex Bennée {
198a622d64eSAlex Bennée struct qemu_plugin_hwaddr *hwaddr = qemu_plugin_get_hwaddr(meminfo, vaddr);
199a622d64eSAlex Bennée
200a622d64eSAlex Bennée if (!hwaddr || !qemu_plugin_hwaddr_is_io(hwaddr)) {
201a622d64eSAlex Bennée return;
202a622d64eSAlex Bennée } else {
203a622d64eSAlex Bennée const char *name = qemu_plugin_hwaddr_device_name(hwaddr);
204787148bfSAaron Lindsay uint64_t off = qemu_plugin_hwaddr_phys_addr(hwaddr);
205a622d64eSAlex Bennée bool is_write = qemu_plugin_mem_is_store(meminfo);
206a622d64eSAlex Bennée DeviceCounts *counts;
207a622d64eSAlex Bennée
208a622d64eSAlex Bennée g_mutex_lock(&lock);
209a622d64eSAlex Bennée counts = (DeviceCounts *) g_hash_table_lookup(devices, name);
210a622d64eSAlex Bennée
211a622d64eSAlex Bennée if (!counts) {
212a622d64eSAlex Bennée uint64_t base = vaddr - off;
213a622d64eSAlex Bennée counts = new_count(name, base);
214a622d64eSAlex Bennée }
215a622d64eSAlex Bennée
216a622d64eSAlex Bennée if (check_match) {
217a622d64eSAlex Bennée if (g_strv_contains((const char * const *)matches, counts->name)) {
218a622d64eSAlex Bennée hwprofile_match_hit(counts, off);
219a622d64eSAlex Bennée inc_count(&counts->totals, is_write, cpu_index);
220a622d64eSAlex Bennée }
221a622d64eSAlex Bennée } else {
222a622d64eSAlex Bennée inc_count(&counts->totals, is_write, cpu_index);
223a622d64eSAlex Bennée }
224a622d64eSAlex Bennée
225a622d64eSAlex Bennée /* either track offsets or source of access */
226a622d64eSAlex Bennée if (source) {
227a622d64eSAlex Bennée off = (uint64_t) udata;
228a622d64eSAlex Bennée }
229a622d64eSAlex Bennée
230a622d64eSAlex Bennée if (pattern || source) {
231a622d64eSAlex Bennée IOLocationCounts *io_count = g_hash_table_lookup(counts->detail,
232a622d64eSAlex Bennée (gpointer) off);
233a622d64eSAlex Bennée if (!io_count) {
234a622d64eSAlex Bennée io_count = new_location(counts->detail, off);
235a622d64eSAlex Bennée }
236a622d64eSAlex Bennée inc_count(&io_count->counts, is_write, cpu_index);
237a622d64eSAlex Bennée }
238a622d64eSAlex Bennée
239a622d64eSAlex Bennée g_mutex_unlock(&lock);
240a622d64eSAlex Bennée }
241a622d64eSAlex Bennée }
242a622d64eSAlex Bennée
vcpu_tb_trans(qemu_plugin_id_t id,struct qemu_plugin_tb * tb)243a622d64eSAlex Bennée static void vcpu_tb_trans(qemu_plugin_id_t id, struct qemu_plugin_tb *tb)
244a622d64eSAlex Bennée {
245a622d64eSAlex Bennée size_t n = qemu_plugin_tb_n_insns(tb);
246a622d64eSAlex Bennée size_t i;
247a622d64eSAlex Bennée
248a622d64eSAlex Bennée for (i = 0; i < n; i++) {
249a622d64eSAlex Bennée struct qemu_plugin_insn *insn = qemu_plugin_tb_get_insn(tb, i);
250a622d64eSAlex Bennée gpointer udata = (gpointer) (source ? qemu_plugin_insn_vaddr(insn) : 0);
251a622d64eSAlex Bennée qemu_plugin_register_vcpu_mem_cb(insn, vcpu_haddr,
252a622d64eSAlex Bennée QEMU_PLUGIN_CB_NO_REGS,
253a622d64eSAlex Bennée rw, udata);
254a622d64eSAlex Bennée }
255a622d64eSAlex Bennée }
256a622d64eSAlex Bennée
257a622d64eSAlex Bennée QEMU_PLUGIN_EXPORT
qemu_plugin_install(qemu_plugin_id_t id,const qemu_info_t * info,int argc,char ** argv)258a622d64eSAlex Bennée int qemu_plugin_install(qemu_plugin_id_t id, const qemu_info_t *info,
259a622d64eSAlex Bennée int argc, char **argv)
260a622d64eSAlex Bennée {
261a622d64eSAlex Bennée int i;
26260753843SMahmoud Mandour g_autoptr(GString) matches_raw = g_string_new("");
263a622d64eSAlex Bennée
264a622d64eSAlex Bennée for (i = 0; i < argc; i++) {
265a622d64eSAlex Bennée char *opt = argv[i];
266*40258741SAlex Bennée g_auto(GStrv) tokens = g_strsplit(opt, "=", 2);
26760753843SMahmoud Mandour
26860753843SMahmoud Mandour if (g_strcmp0(tokens[0], "track") == 0) {
26960753843SMahmoud Mandour if (g_strcmp0(tokens[1], "read") == 0) {
270a622d64eSAlex Bennée rw = QEMU_PLUGIN_MEM_R;
27160753843SMahmoud Mandour } else if (g_strcmp0(tokens[1], "write") == 0) {
272a622d64eSAlex Bennée rw = QEMU_PLUGIN_MEM_W;
27360753843SMahmoud Mandour } else {
27460753843SMahmoud Mandour fprintf(stderr, "invalid value for track: %s\n", tokens[1]);
27560753843SMahmoud Mandour return -1;
27660753843SMahmoud Mandour }
27760753843SMahmoud Mandour } else if (g_strcmp0(tokens[0], "pattern") == 0) {
27860753843SMahmoud Mandour if (!qemu_plugin_bool_parse(tokens[0], tokens[1], &pattern)) {
27960753843SMahmoud Mandour fprintf(stderr, "boolean argument parsing failed: %s\n", opt);
28060753843SMahmoud Mandour return -1;
28160753843SMahmoud Mandour }
28260753843SMahmoud Mandour } else if (g_strcmp0(tokens[0], "source") == 0) {
28360753843SMahmoud Mandour if (!qemu_plugin_bool_parse(tokens[0], tokens[1], &source)) {
28460753843SMahmoud Mandour fprintf(stderr, "boolean argument parsing failed: %s\n", opt);
28560753843SMahmoud Mandour return -1;
28660753843SMahmoud Mandour }
28760753843SMahmoud Mandour } else if (g_strcmp0(tokens[0], "match") == 0) {
288a622d64eSAlex Bennée check_match = true;
28960753843SMahmoud Mandour g_string_append_printf(matches_raw, "%s,", tokens[1]);
290a622d64eSAlex Bennée } else {
291a622d64eSAlex Bennée fprintf(stderr, "option parsing failed: %s\n", opt);
292a622d64eSAlex Bennée return -1;
293a622d64eSAlex Bennée }
294a622d64eSAlex Bennée }
29560753843SMahmoud Mandour if (check_match) {
29660753843SMahmoud Mandour matches = g_strsplit(matches_raw->str, ",", -1);
29760753843SMahmoud Mandour }
298a622d64eSAlex Bennée
299a622d64eSAlex Bennée if (source && pattern) {
300a622d64eSAlex Bennée fprintf(stderr, "can only currently track either source or pattern.\n");
301a622d64eSAlex Bennée return -1;
302a622d64eSAlex Bennée }
303a622d64eSAlex Bennée
304a622d64eSAlex Bennée if (!info->system_emulation) {
305a622d64eSAlex Bennée fprintf(stderr, "hwprofile: plugin only useful for system emulation\n");
306a622d64eSAlex Bennée return -1;
307a622d64eSAlex Bennée }
308a622d64eSAlex Bennée
309a622d64eSAlex Bennée /* Just warn about overflow */
310a622d64eSAlex Bennée if (info->system.smp_vcpus > 64 ||
311a622d64eSAlex Bennée info->system.max_vcpus > 64) {
312a622d64eSAlex Bennée fprintf(stderr, "hwprofile: can only track up to 64 CPUs\n");
313a622d64eSAlex Bennée }
314a622d64eSAlex Bennée
315a622d64eSAlex Bennée plugin_init();
316a622d64eSAlex Bennée
317a622d64eSAlex Bennée qemu_plugin_register_vcpu_tb_trans_cb(id, vcpu_tb_trans);
318a622d64eSAlex Bennée qemu_plugin_register_atexit_cb(id, plugin_exit, NULL);
319a622d64eSAlex Bennée return 0;
320a622d64eSAlex Bennée }
321