146a010ddSJoerg Roedel // SPDX-License-Identifier: GPL-2.0-only 246a010ddSJoerg Roedel /* 346a010ddSJoerg Roedel * KVM PMU support for AMD 446a010ddSJoerg Roedel * 546a010ddSJoerg Roedel * Copyright 2015, Red Hat, Inc. and/or its affiliates. 646a010ddSJoerg Roedel * 746a010ddSJoerg Roedel * Author: 846a010ddSJoerg Roedel * Wei Huang <wei@redhat.com> 946a010ddSJoerg Roedel * 1046a010ddSJoerg Roedel * Implementation is based on pmu_intel.c file 1146a010ddSJoerg Roedel */ 1246a010ddSJoerg Roedel #include <linux/types.h> 1346a010ddSJoerg Roedel #include <linux/kvm_host.h> 1446a010ddSJoerg Roedel #include <linux/perf_event.h> 1546a010ddSJoerg Roedel #include "x86.h" 1646a010ddSJoerg Roedel #include "cpuid.h" 1746a010ddSJoerg Roedel #include "lapic.h" 1846a010ddSJoerg Roedel #include "pmu.h" 1946a010ddSJoerg Roedel 2046a010ddSJoerg Roedel enum pmu_type { 2146a010ddSJoerg Roedel PMU_TYPE_COUNTER = 0, 2246a010ddSJoerg Roedel PMU_TYPE_EVNTSEL, 2346a010ddSJoerg Roedel }; 2446a010ddSJoerg Roedel 2546a010ddSJoerg Roedel enum index { 2646a010ddSJoerg Roedel INDEX_ZERO = 0, 2746a010ddSJoerg Roedel INDEX_ONE, 2846a010ddSJoerg Roedel INDEX_TWO, 2946a010ddSJoerg Roedel INDEX_THREE, 3046a010ddSJoerg Roedel INDEX_FOUR, 3146a010ddSJoerg Roedel INDEX_FIVE, 3246a010ddSJoerg Roedel INDEX_ERROR, 3346a010ddSJoerg Roedel }; 3446a010ddSJoerg Roedel 3546a010ddSJoerg Roedel /* duplicated from amd_perfmon_event_map, K7 and above should work. */ 3646a010ddSJoerg Roedel static struct kvm_event_hw_type_mapping amd_event_mapping[] = { 3746a010ddSJoerg Roedel [0] = { 0x76, 0x00, PERF_COUNT_HW_CPU_CYCLES }, 3846a010ddSJoerg Roedel [1] = { 0xc0, 0x00, PERF_COUNT_HW_INSTRUCTIONS }, 3946a010ddSJoerg Roedel [2] = { 0x7d, 0x07, PERF_COUNT_HW_CACHE_REFERENCES }, 4046a010ddSJoerg Roedel [3] = { 0x7e, 0x07, PERF_COUNT_HW_CACHE_MISSES }, 4146a010ddSJoerg Roedel [4] = { 0xc2, 0x00, PERF_COUNT_HW_BRANCH_INSTRUCTIONS }, 4246a010ddSJoerg Roedel [5] = { 0xc3, 0x00, PERF_COUNT_HW_BRANCH_MISSES }, 4346a010ddSJoerg Roedel [6] = { 0xd0, 0x00, PERF_COUNT_HW_STALLED_CYCLES_FRONTEND }, 4446a010ddSJoerg Roedel [7] = { 0xd1, 0x00, PERF_COUNT_HW_STALLED_CYCLES_BACKEND }, 4546a010ddSJoerg Roedel }; 4646a010ddSJoerg Roedel 4746a010ddSJoerg Roedel static unsigned int get_msr_base(struct kvm_pmu *pmu, enum pmu_type type) 4846a010ddSJoerg Roedel { 4946a010ddSJoerg Roedel struct kvm_vcpu *vcpu = pmu_to_vcpu(pmu); 5046a010ddSJoerg Roedel 5146a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) { 5246a010ddSJoerg Roedel if (type == PMU_TYPE_COUNTER) 5346a010ddSJoerg Roedel return MSR_F15H_PERF_CTR; 5446a010ddSJoerg Roedel else 5546a010ddSJoerg Roedel return MSR_F15H_PERF_CTL; 5646a010ddSJoerg Roedel } else { 5746a010ddSJoerg Roedel if (type == PMU_TYPE_COUNTER) 5846a010ddSJoerg Roedel return MSR_K7_PERFCTR0; 5946a010ddSJoerg Roedel else 6046a010ddSJoerg Roedel return MSR_K7_EVNTSEL0; 6146a010ddSJoerg Roedel } 6246a010ddSJoerg Roedel } 6346a010ddSJoerg Roedel 6446a010ddSJoerg Roedel static enum index msr_to_index(u32 msr) 6546a010ddSJoerg Roedel { 6646a010ddSJoerg Roedel switch (msr) { 6746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL0: 6846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR0: 6946a010ddSJoerg Roedel case MSR_K7_EVNTSEL0: 7046a010ddSJoerg Roedel case MSR_K7_PERFCTR0: 7146a010ddSJoerg Roedel return INDEX_ZERO; 7246a010ddSJoerg Roedel case MSR_F15H_PERF_CTL1: 7346a010ddSJoerg Roedel case MSR_F15H_PERF_CTR1: 7446a010ddSJoerg Roedel case MSR_K7_EVNTSEL1: 7546a010ddSJoerg Roedel case MSR_K7_PERFCTR1: 7646a010ddSJoerg Roedel return INDEX_ONE; 7746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL2: 7846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR2: 7946a010ddSJoerg Roedel case MSR_K7_EVNTSEL2: 8046a010ddSJoerg Roedel case MSR_K7_PERFCTR2: 8146a010ddSJoerg Roedel return INDEX_TWO; 8246a010ddSJoerg Roedel case MSR_F15H_PERF_CTL3: 8346a010ddSJoerg Roedel case MSR_F15H_PERF_CTR3: 8446a010ddSJoerg Roedel case MSR_K7_EVNTSEL3: 8546a010ddSJoerg Roedel case MSR_K7_PERFCTR3: 8646a010ddSJoerg Roedel return INDEX_THREE; 8746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL4: 8846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR4: 8946a010ddSJoerg Roedel return INDEX_FOUR; 9046a010ddSJoerg Roedel case MSR_F15H_PERF_CTL5: 9146a010ddSJoerg Roedel case MSR_F15H_PERF_CTR5: 9246a010ddSJoerg Roedel return INDEX_FIVE; 9346a010ddSJoerg Roedel default: 9446a010ddSJoerg Roedel return INDEX_ERROR; 9546a010ddSJoerg Roedel } 9646a010ddSJoerg Roedel } 9746a010ddSJoerg Roedel 9846a010ddSJoerg Roedel static inline struct kvm_pmc *get_gp_pmc_amd(struct kvm_pmu *pmu, u32 msr, 9946a010ddSJoerg Roedel enum pmu_type type) 10046a010ddSJoerg Roedel { 10146a010ddSJoerg Roedel switch (msr) { 10246a010ddSJoerg Roedel case MSR_F15H_PERF_CTL0: 10346a010ddSJoerg Roedel case MSR_F15H_PERF_CTL1: 10446a010ddSJoerg Roedel case MSR_F15H_PERF_CTL2: 10546a010ddSJoerg Roedel case MSR_F15H_PERF_CTL3: 10646a010ddSJoerg Roedel case MSR_F15H_PERF_CTL4: 10746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL5: 10846a010ddSJoerg Roedel case MSR_K7_EVNTSEL0 ... MSR_K7_EVNTSEL3: 10946a010ddSJoerg Roedel if (type != PMU_TYPE_EVNTSEL) 11046a010ddSJoerg Roedel return NULL; 11146a010ddSJoerg Roedel break; 11246a010ddSJoerg Roedel case MSR_F15H_PERF_CTR0: 11346a010ddSJoerg Roedel case MSR_F15H_PERF_CTR1: 11446a010ddSJoerg Roedel case MSR_F15H_PERF_CTR2: 11546a010ddSJoerg Roedel case MSR_F15H_PERF_CTR3: 11646a010ddSJoerg Roedel case MSR_F15H_PERF_CTR4: 11746a010ddSJoerg Roedel case MSR_F15H_PERF_CTR5: 11846a010ddSJoerg Roedel case MSR_K7_PERFCTR0 ... MSR_K7_PERFCTR3: 11946a010ddSJoerg Roedel if (type != PMU_TYPE_COUNTER) 12046a010ddSJoerg Roedel return NULL; 12146a010ddSJoerg Roedel break; 12246a010ddSJoerg Roedel default: 12346a010ddSJoerg Roedel return NULL; 12446a010ddSJoerg Roedel } 12546a010ddSJoerg Roedel 12646a010ddSJoerg Roedel return &pmu->gp_counters[msr_to_index(msr)]; 12746a010ddSJoerg Roedel } 12846a010ddSJoerg Roedel 12946a010ddSJoerg Roedel static unsigned amd_find_arch_event(struct kvm_pmu *pmu, 13046a010ddSJoerg Roedel u8 event_select, 13146a010ddSJoerg Roedel u8 unit_mask) 13246a010ddSJoerg Roedel { 13346a010ddSJoerg Roedel int i; 13446a010ddSJoerg Roedel 13546a010ddSJoerg Roedel for (i = 0; i < ARRAY_SIZE(amd_event_mapping); i++) 13646a010ddSJoerg Roedel if (amd_event_mapping[i].eventsel == event_select 13746a010ddSJoerg Roedel && amd_event_mapping[i].unit_mask == unit_mask) 13846a010ddSJoerg Roedel break; 13946a010ddSJoerg Roedel 14046a010ddSJoerg Roedel if (i == ARRAY_SIZE(amd_event_mapping)) 14146a010ddSJoerg Roedel return PERF_COUNT_HW_MAX; 14246a010ddSJoerg Roedel 14346a010ddSJoerg Roedel return amd_event_mapping[i].event_type; 14446a010ddSJoerg Roedel } 14546a010ddSJoerg Roedel 14646a010ddSJoerg Roedel /* return PERF_COUNT_HW_MAX as AMD doesn't have fixed events */ 14746a010ddSJoerg Roedel static unsigned amd_find_fixed_event(int idx) 14846a010ddSJoerg Roedel { 14946a010ddSJoerg Roedel return PERF_COUNT_HW_MAX; 15046a010ddSJoerg Roedel } 15146a010ddSJoerg Roedel 15246a010ddSJoerg Roedel /* check if a PMC is enabled by comparing it against global_ctrl bits. Because 15346a010ddSJoerg Roedel * AMD CPU doesn't have global_ctrl MSR, all PMCs are enabled (return TRUE). 15446a010ddSJoerg Roedel */ 15546a010ddSJoerg Roedel static bool amd_pmc_is_enabled(struct kvm_pmc *pmc) 15646a010ddSJoerg Roedel { 15746a010ddSJoerg Roedel return true; 15846a010ddSJoerg Roedel } 15946a010ddSJoerg Roedel 16046a010ddSJoerg Roedel static struct kvm_pmc *amd_pmc_idx_to_pmc(struct kvm_pmu *pmu, int pmc_idx) 16146a010ddSJoerg Roedel { 16246a010ddSJoerg Roedel unsigned int base = get_msr_base(pmu, PMU_TYPE_COUNTER); 16346a010ddSJoerg Roedel struct kvm_vcpu *vcpu = pmu_to_vcpu(pmu); 16446a010ddSJoerg Roedel 16546a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) { 16646a010ddSJoerg Roedel /* 16746a010ddSJoerg Roedel * The idx is contiguous. The MSRs are not. The counter MSRs 16846a010ddSJoerg Roedel * are interleaved with the event select MSRs. 16946a010ddSJoerg Roedel */ 17046a010ddSJoerg Roedel pmc_idx *= 2; 17146a010ddSJoerg Roedel } 17246a010ddSJoerg Roedel 17346a010ddSJoerg Roedel return get_gp_pmc_amd(pmu, base + pmc_idx, PMU_TYPE_COUNTER); 17446a010ddSJoerg Roedel } 17546a010ddSJoerg Roedel 17646a010ddSJoerg Roedel /* returns 0 if idx's corresponding MSR exists; otherwise returns 1. */ 17746a010ddSJoerg Roedel static int amd_is_valid_rdpmc_ecx(struct kvm_vcpu *vcpu, unsigned int idx) 17846a010ddSJoerg Roedel { 17946a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 18046a010ddSJoerg Roedel 18146a010ddSJoerg Roedel idx &= ~(3u << 30); 18246a010ddSJoerg Roedel 18346a010ddSJoerg Roedel return (idx >= pmu->nr_arch_gp_counters); 18446a010ddSJoerg Roedel } 18546a010ddSJoerg Roedel 18646a010ddSJoerg Roedel /* idx is the ECX register of RDPMC instruction */ 18746a010ddSJoerg Roedel static struct kvm_pmc *amd_rdpmc_ecx_to_pmc(struct kvm_vcpu *vcpu, 18846a010ddSJoerg Roedel unsigned int idx, u64 *mask) 18946a010ddSJoerg Roedel { 19046a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 19146a010ddSJoerg Roedel struct kvm_pmc *counters; 19246a010ddSJoerg Roedel 19346a010ddSJoerg Roedel idx &= ~(3u << 30); 19446a010ddSJoerg Roedel if (idx >= pmu->nr_arch_gp_counters) 19546a010ddSJoerg Roedel return NULL; 19646a010ddSJoerg Roedel counters = pmu->gp_counters; 19746a010ddSJoerg Roedel 19846a010ddSJoerg Roedel return &counters[idx]; 19946a010ddSJoerg Roedel } 20046a010ddSJoerg Roedel 20146a010ddSJoerg Roedel static bool amd_is_valid_msr(struct kvm_vcpu *vcpu, u32 msr) 20246a010ddSJoerg Roedel { 20346a010ddSJoerg Roedel /* All MSRs refer to exactly one PMC, so msr_idx_to_pmc is enough. */ 20446a010ddSJoerg Roedel return false; 20546a010ddSJoerg Roedel } 20646a010ddSJoerg Roedel 20746a010ddSJoerg Roedel static struct kvm_pmc *amd_msr_idx_to_pmc(struct kvm_vcpu *vcpu, u32 msr) 20846a010ddSJoerg Roedel { 20946a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 21046a010ddSJoerg Roedel struct kvm_pmc *pmc; 21146a010ddSJoerg Roedel 21246a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 21346a010ddSJoerg Roedel pmc = pmc ? pmc : get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 21446a010ddSJoerg Roedel 21546a010ddSJoerg Roedel return pmc; 21646a010ddSJoerg Roedel } 21746a010ddSJoerg Roedel 218*cbd71758SWei Wang static int amd_pmu_get_msr(struct kvm_vcpu *vcpu, struct msr_data *msr_info) 21946a010ddSJoerg Roedel { 22046a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 22146a010ddSJoerg Roedel struct kvm_pmc *pmc; 222*cbd71758SWei Wang u32 msr = msr_info->index; 22346a010ddSJoerg Roedel 22446a010ddSJoerg Roedel /* MSR_PERFCTRn */ 22546a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 22646a010ddSJoerg Roedel if (pmc) { 227*cbd71758SWei Wang msr_info->data = pmc_read_counter(pmc); 22846a010ddSJoerg Roedel return 0; 22946a010ddSJoerg Roedel } 23046a010ddSJoerg Roedel /* MSR_EVNTSELn */ 23146a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 23246a010ddSJoerg Roedel if (pmc) { 233*cbd71758SWei Wang msr_info->data = pmc->eventsel; 23446a010ddSJoerg Roedel return 0; 23546a010ddSJoerg Roedel } 23646a010ddSJoerg Roedel 23746a010ddSJoerg Roedel return 1; 23846a010ddSJoerg Roedel } 23946a010ddSJoerg Roedel 24046a010ddSJoerg Roedel static int amd_pmu_set_msr(struct kvm_vcpu *vcpu, struct msr_data *msr_info) 24146a010ddSJoerg Roedel { 24246a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 24346a010ddSJoerg Roedel struct kvm_pmc *pmc; 24446a010ddSJoerg Roedel u32 msr = msr_info->index; 24546a010ddSJoerg Roedel u64 data = msr_info->data; 24646a010ddSJoerg Roedel 24746a010ddSJoerg Roedel /* MSR_PERFCTRn */ 24846a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 24946a010ddSJoerg Roedel if (pmc) { 25046a010ddSJoerg Roedel pmc->counter += data - pmc_read_counter(pmc); 25146a010ddSJoerg Roedel return 0; 25246a010ddSJoerg Roedel } 25346a010ddSJoerg Roedel /* MSR_EVNTSELn */ 25446a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 25546a010ddSJoerg Roedel if (pmc) { 25646a010ddSJoerg Roedel if (data == pmc->eventsel) 25746a010ddSJoerg Roedel return 0; 25846a010ddSJoerg Roedel if (!(data & pmu->reserved_bits)) { 25946a010ddSJoerg Roedel reprogram_gp_counter(pmc, data); 26046a010ddSJoerg Roedel return 0; 26146a010ddSJoerg Roedel } 26246a010ddSJoerg Roedel } 26346a010ddSJoerg Roedel 26446a010ddSJoerg Roedel return 1; 26546a010ddSJoerg Roedel } 26646a010ddSJoerg Roedel 26746a010ddSJoerg Roedel static void amd_pmu_refresh(struct kvm_vcpu *vcpu) 26846a010ddSJoerg Roedel { 26946a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 27046a010ddSJoerg Roedel 27146a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) 27246a010ddSJoerg Roedel pmu->nr_arch_gp_counters = AMD64_NUM_COUNTERS_CORE; 27346a010ddSJoerg Roedel else 27446a010ddSJoerg Roedel pmu->nr_arch_gp_counters = AMD64_NUM_COUNTERS; 27546a010ddSJoerg Roedel 27646a010ddSJoerg Roedel pmu->counter_bitmask[KVM_PMC_GP] = ((u64)1 << 48) - 1; 27746a010ddSJoerg Roedel pmu->reserved_bits = 0xffffffff00200000ull; 27846a010ddSJoerg Roedel pmu->version = 1; 27946a010ddSJoerg Roedel /* not applicable to AMD; but clean them to prevent any fall out */ 28046a010ddSJoerg Roedel pmu->counter_bitmask[KVM_PMC_FIXED] = 0; 28146a010ddSJoerg Roedel pmu->nr_arch_fixed_counters = 0; 28246a010ddSJoerg Roedel pmu->global_status = 0; 28346a010ddSJoerg Roedel bitmap_set(pmu->all_valid_pmc_idx, 0, pmu->nr_arch_gp_counters); 28446a010ddSJoerg Roedel } 28546a010ddSJoerg Roedel 28646a010ddSJoerg Roedel static void amd_pmu_init(struct kvm_vcpu *vcpu) 28746a010ddSJoerg Roedel { 28846a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 28946a010ddSJoerg Roedel int i; 29046a010ddSJoerg Roedel 29146a010ddSJoerg Roedel BUILD_BUG_ON(AMD64_NUM_COUNTERS_CORE > INTEL_PMC_MAX_GENERIC); 29246a010ddSJoerg Roedel 29346a010ddSJoerg Roedel for (i = 0; i < AMD64_NUM_COUNTERS_CORE ; i++) { 29446a010ddSJoerg Roedel pmu->gp_counters[i].type = KVM_PMC_GP; 29546a010ddSJoerg Roedel pmu->gp_counters[i].vcpu = vcpu; 29646a010ddSJoerg Roedel pmu->gp_counters[i].idx = i; 29746a010ddSJoerg Roedel pmu->gp_counters[i].current_config = 0; 29846a010ddSJoerg Roedel } 29946a010ddSJoerg Roedel } 30046a010ddSJoerg Roedel 30146a010ddSJoerg Roedel static void amd_pmu_reset(struct kvm_vcpu *vcpu) 30246a010ddSJoerg Roedel { 30346a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 30446a010ddSJoerg Roedel int i; 30546a010ddSJoerg Roedel 30646a010ddSJoerg Roedel for (i = 0; i < AMD64_NUM_COUNTERS_CORE; i++) { 30746a010ddSJoerg Roedel struct kvm_pmc *pmc = &pmu->gp_counters[i]; 30846a010ddSJoerg Roedel 30946a010ddSJoerg Roedel pmc_stop_counter(pmc); 31046a010ddSJoerg Roedel pmc->counter = pmc->eventsel = 0; 31146a010ddSJoerg Roedel } 31246a010ddSJoerg Roedel } 31346a010ddSJoerg Roedel 31446a010ddSJoerg Roedel struct kvm_pmu_ops amd_pmu_ops = { 31546a010ddSJoerg Roedel .find_arch_event = amd_find_arch_event, 31646a010ddSJoerg Roedel .find_fixed_event = amd_find_fixed_event, 31746a010ddSJoerg Roedel .pmc_is_enabled = amd_pmc_is_enabled, 31846a010ddSJoerg Roedel .pmc_idx_to_pmc = amd_pmc_idx_to_pmc, 31946a010ddSJoerg Roedel .rdpmc_ecx_to_pmc = amd_rdpmc_ecx_to_pmc, 32046a010ddSJoerg Roedel .msr_idx_to_pmc = amd_msr_idx_to_pmc, 32146a010ddSJoerg Roedel .is_valid_rdpmc_ecx = amd_is_valid_rdpmc_ecx, 32246a010ddSJoerg Roedel .is_valid_msr = amd_is_valid_msr, 32346a010ddSJoerg Roedel .get_msr = amd_pmu_get_msr, 32446a010ddSJoerg Roedel .set_msr = amd_pmu_set_msr, 32546a010ddSJoerg Roedel .refresh = amd_pmu_refresh, 32646a010ddSJoerg Roedel .init = amd_pmu_init, 32746a010ddSJoerg Roedel .reset = amd_pmu_reset, 32846a010ddSJoerg Roedel }; 329