146a010ddSJoerg Roedel // SPDX-License-Identifier: GPL-2.0-only 246a010ddSJoerg Roedel /* 346a010ddSJoerg Roedel * KVM PMU support for AMD 446a010ddSJoerg Roedel * 546a010ddSJoerg Roedel * Copyright 2015, Red Hat, Inc. and/or its affiliates. 646a010ddSJoerg Roedel * 746a010ddSJoerg Roedel * Author: 846a010ddSJoerg Roedel * Wei Huang <wei@redhat.com> 946a010ddSJoerg Roedel * 1046a010ddSJoerg Roedel * Implementation is based on pmu_intel.c file 1146a010ddSJoerg Roedel */ 1246a010ddSJoerg Roedel #include <linux/types.h> 1346a010ddSJoerg Roedel #include <linux/kvm_host.h> 1446a010ddSJoerg Roedel #include <linux/perf_event.h> 1546a010ddSJoerg Roedel #include "x86.h" 1646a010ddSJoerg Roedel #include "cpuid.h" 1746a010ddSJoerg Roedel #include "lapic.h" 1846a010ddSJoerg Roedel #include "pmu.h" 1946a010ddSJoerg Roedel 2046a010ddSJoerg Roedel enum pmu_type { 2146a010ddSJoerg Roedel PMU_TYPE_COUNTER = 0, 2246a010ddSJoerg Roedel PMU_TYPE_EVNTSEL, 2346a010ddSJoerg Roedel }; 2446a010ddSJoerg Roedel 2546a010ddSJoerg Roedel enum index { 2646a010ddSJoerg Roedel INDEX_ZERO = 0, 2746a010ddSJoerg Roedel INDEX_ONE, 2846a010ddSJoerg Roedel INDEX_TWO, 2946a010ddSJoerg Roedel INDEX_THREE, 3046a010ddSJoerg Roedel INDEX_FOUR, 3146a010ddSJoerg Roedel INDEX_FIVE, 3246a010ddSJoerg Roedel INDEX_ERROR, 3346a010ddSJoerg Roedel }; 3446a010ddSJoerg Roedel 3546a010ddSJoerg Roedel /* duplicated from amd_perfmon_event_map, K7 and above should work. */ 3646a010ddSJoerg Roedel static struct kvm_event_hw_type_mapping amd_event_mapping[] = { 3746a010ddSJoerg Roedel [0] = { 0x76, 0x00, PERF_COUNT_HW_CPU_CYCLES }, 3846a010ddSJoerg Roedel [1] = { 0xc0, 0x00, PERF_COUNT_HW_INSTRUCTIONS }, 3946a010ddSJoerg Roedel [2] = { 0x7d, 0x07, PERF_COUNT_HW_CACHE_REFERENCES }, 4046a010ddSJoerg Roedel [3] = { 0x7e, 0x07, PERF_COUNT_HW_CACHE_MISSES }, 4146a010ddSJoerg Roedel [4] = { 0xc2, 0x00, PERF_COUNT_HW_BRANCH_INSTRUCTIONS }, 4246a010ddSJoerg Roedel [5] = { 0xc3, 0x00, PERF_COUNT_HW_BRANCH_MISSES }, 4346a010ddSJoerg Roedel [6] = { 0xd0, 0x00, PERF_COUNT_HW_STALLED_CYCLES_FRONTEND }, 4446a010ddSJoerg Roedel [7] = { 0xd1, 0x00, PERF_COUNT_HW_STALLED_CYCLES_BACKEND }, 4546a010ddSJoerg Roedel }; 4646a010ddSJoerg Roedel 4746a010ddSJoerg Roedel static unsigned int get_msr_base(struct kvm_pmu *pmu, enum pmu_type type) 4846a010ddSJoerg Roedel { 4946a010ddSJoerg Roedel struct kvm_vcpu *vcpu = pmu_to_vcpu(pmu); 5046a010ddSJoerg Roedel 5146a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) { 5246a010ddSJoerg Roedel if (type == PMU_TYPE_COUNTER) 5346a010ddSJoerg Roedel return MSR_F15H_PERF_CTR; 5446a010ddSJoerg Roedel else 5546a010ddSJoerg Roedel return MSR_F15H_PERF_CTL; 5646a010ddSJoerg Roedel } else { 5746a010ddSJoerg Roedel if (type == PMU_TYPE_COUNTER) 5846a010ddSJoerg Roedel return MSR_K7_PERFCTR0; 5946a010ddSJoerg Roedel else 6046a010ddSJoerg Roedel return MSR_K7_EVNTSEL0; 6146a010ddSJoerg Roedel } 6246a010ddSJoerg Roedel } 6346a010ddSJoerg Roedel 6446a010ddSJoerg Roedel static enum index msr_to_index(u32 msr) 6546a010ddSJoerg Roedel { 6646a010ddSJoerg Roedel switch (msr) { 6746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL0: 6846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR0: 6946a010ddSJoerg Roedel case MSR_K7_EVNTSEL0: 7046a010ddSJoerg Roedel case MSR_K7_PERFCTR0: 7146a010ddSJoerg Roedel return INDEX_ZERO; 7246a010ddSJoerg Roedel case MSR_F15H_PERF_CTL1: 7346a010ddSJoerg Roedel case MSR_F15H_PERF_CTR1: 7446a010ddSJoerg Roedel case MSR_K7_EVNTSEL1: 7546a010ddSJoerg Roedel case MSR_K7_PERFCTR1: 7646a010ddSJoerg Roedel return INDEX_ONE; 7746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL2: 7846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR2: 7946a010ddSJoerg Roedel case MSR_K7_EVNTSEL2: 8046a010ddSJoerg Roedel case MSR_K7_PERFCTR2: 8146a010ddSJoerg Roedel return INDEX_TWO; 8246a010ddSJoerg Roedel case MSR_F15H_PERF_CTL3: 8346a010ddSJoerg Roedel case MSR_F15H_PERF_CTR3: 8446a010ddSJoerg Roedel case MSR_K7_EVNTSEL3: 8546a010ddSJoerg Roedel case MSR_K7_PERFCTR3: 8646a010ddSJoerg Roedel return INDEX_THREE; 8746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL4: 8846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR4: 8946a010ddSJoerg Roedel return INDEX_FOUR; 9046a010ddSJoerg Roedel case MSR_F15H_PERF_CTL5: 9146a010ddSJoerg Roedel case MSR_F15H_PERF_CTR5: 9246a010ddSJoerg Roedel return INDEX_FIVE; 9346a010ddSJoerg Roedel default: 9446a010ddSJoerg Roedel return INDEX_ERROR; 9546a010ddSJoerg Roedel } 9646a010ddSJoerg Roedel } 9746a010ddSJoerg Roedel 9846a010ddSJoerg Roedel static inline struct kvm_pmc *get_gp_pmc_amd(struct kvm_pmu *pmu, u32 msr, 9946a010ddSJoerg Roedel enum pmu_type type) 10046a010ddSJoerg Roedel { 1011973caddSVitaly Kuznetsov struct kvm_vcpu *vcpu = pmu_to_vcpu(pmu); 1021973caddSVitaly Kuznetsov 10346a010ddSJoerg Roedel switch (msr) { 10446a010ddSJoerg Roedel case MSR_F15H_PERF_CTL0: 10546a010ddSJoerg Roedel case MSR_F15H_PERF_CTL1: 10646a010ddSJoerg Roedel case MSR_F15H_PERF_CTL2: 10746a010ddSJoerg Roedel case MSR_F15H_PERF_CTL3: 10846a010ddSJoerg Roedel case MSR_F15H_PERF_CTL4: 10946a010ddSJoerg Roedel case MSR_F15H_PERF_CTL5: 1101973caddSVitaly Kuznetsov if (!guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) 1111973caddSVitaly Kuznetsov return NULL; 1121973caddSVitaly Kuznetsov fallthrough; 11346a010ddSJoerg Roedel case MSR_K7_EVNTSEL0 ... MSR_K7_EVNTSEL3: 11446a010ddSJoerg Roedel if (type != PMU_TYPE_EVNTSEL) 11546a010ddSJoerg Roedel return NULL; 11646a010ddSJoerg Roedel break; 11746a010ddSJoerg Roedel case MSR_F15H_PERF_CTR0: 11846a010ddSJoerg Roedel case MSR_F15H_PERF_CTR1: 11946a010ddSJoerg Roedel case MSR_F15H_PERF_CTR2: 12046a010ddSJoerg Roedel case MSR_F15H_PERF_CTR3: 12146a010ddSJoerg Roedel case MSR_F15H_PERF_CTR4: 12246a010ddSJoerg Roedel case MSR_F15H_PERF_CTR5: 1231973caddSVitaly Kuznetsov if (!guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) 1241973caddSVitaly Kuznetsov return NULL; 1251973caddSVitaly Kuznetsov fallthrough; 12646a010ddSJoerg Roedel case MSR_K7_PERFCTR0 ... MSR_K7_PERFCTR3: 12746a010ddSJoerg Roedel if (type != PMU_TYPE_COUNTER) 12846a010ddSJoerg Roedel return NULL; 12946a010ddSJoerg Roedel break; 13046a010ddSJoerg Roedel default: 13146a010ddSJoerg Roedel return NULL; 13246a010ddSJoerg Roedel } 13346a010ddSJoerg Roedel 13446a010ddSJoerg Roedel return &pmu->gp_counters[msr_to_index(msr)]; 13546a010ddSJoerg Roedel } 13646a010ddSJoerg Roedel 13746a010ddSJoerg Roedel static unsigned amd_find_arch_event(struct kvm_pmu *pmu, 13846a010ddSJoerg Roedel u8 event_select, 13946a010ddSJoerg Roedel u8 unit_mask) 14046a010ddSJoerg Roedel { 14146a010ddSJoerg Roedel int i; 14246a010ddSJoerg Roedel 14346a010ddSJoerg Roedel for (i = 0; i < ARRAY_SIZE(amd_event_mapping); i++) 14446a010ddSJoerg Roedel if (amd_event_mapping[i].eventsel == event_select 14546a010ddSJoerg Roedel && amd_event_mapping[i].unit_mask == unit_mask) 14646a010ddSJoerg Roedel break; 14746a010ddSJoerg Roedel 14846a010ddSJoerg Roedel if (i == ARRAY_SIZE(amd_event_mapping)) 14946a010ddSJoerg Roedel return PERF_COUNT_HW_MAX; 15046a010ddSJoerg Roedel 15146a010ddSJoerg Roedel return amd_event_mapping[i].event_type; 15246a010ddSJoerg Roedel } 15346a010ddSJoerg Roedel 15446a010ddSJoerg Roedel /* return PERF_COUNT_HW_MAX as AMD doesn't have fixed events */ 15546a010ddSJoerg Roedel static unsigned amd_find_fixed_event(int idx) 15646a010ddSJoerg Roedel { 15746a010ddSJoerg Roedel return PERF_COUNT_HW_MAX; 15846a010ddSJoerg Roedel } 15946a010ddSJoerg Roedel 16046a010ddSJoerg Roedel /* check if a PMC is enabled by comparing it against global_ctrl bits. Because 16146a010ddSJoerg Roedel * AMD CPU doesn't have global_ctrl MSR, all PMCs are enabled (return TRUE). 16246a010ddSJoerg Roedel */ 16346a010ddSJoerg Roedel static bool amd_pmc_is_enabled(struct kvm_pmc *pmc) 16446a010ddSJoerg Roedel { 16546a010ddSJoerg Roedel return true; 16646a010ddSJoerg Roedel } 16746a010ddSJoerg Roedel 16846a010ddSJoerg Roedel static struct kvm_pmc *amd_pmc_idx_to_pmc(struct kvm_pmu *pmu, int pmc_idx) 16946a010ddSJoerg Roedel { 17046a010ddSJoerg Roedel unsigned int base = get_msr_base(pmu, PMU_TYPE_COUNTER); 17146a010ddSJoerg Roedel struct kvm_vcpu *vcpu = pmu_to_vcpu(pmu); 17246a010ddSJoerg Roedel 17346a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) { 17446a010ddSJoerg Roedel /* 17546a010ddSJoerg Roedel * The idx is contiguous. The MSRs are not. The counter MSRs 17646a010ddSJoerg Roedel * are interleaved with the event select MSRs. 17746a010ddSJoerg Roedel */ 17846a010ddSJoerg Roedel pmc_idx *= 2; 17946a010ddSJoerg Roedel } 18046a010ddSJoerg Roedel 18146a010ddSJoerg Roedel return get_gp_pmc_amd(pmu, base + pmc_idx, PMU_TYPE_COUNTER); 18246a010ddSJoerg Roedel } 18346a010ddSJoerg Roedel 184*e6cd31f1SJim Mattson static bool amd_is_valid_rdpmc_ecx(struct kvm_vcpu *vcpu, unsigned int idx) 18546a010ddSJoerg Roedel { 18646a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 18746a010ddSJoerg Roedel 18846a010ddSJoerg Roedel idx &= ~(3u << 30); 18946a010ddSJoerg Roedel 190*e6cd31f1SJim Mattson return idx < pmu->nr_arch_gp_counters; 19146a010ddSJoerg Roedel } 19246a010ddSJoerg Roedel 19346a010ddSJoerg Roedel /* idx is the ECX register of RDPMC instruction */ 19446a010ddSJoerg Roedel static struct kvm_pmc *amd_rdpmc_ecx_to_pmc(struct kvm_vcpu *vcpu, 19546a010ddSJoerg Roedel unsigned int idx, u64 *mask) 19646a010ddSJoerg Roedel { 19746a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 19846a010ddSJoerg Roedel struct kvm_pmc *counters; 19946a010ddSJoerg Roedel 20046a010ddSJoerg Roedel idx &= ~(3u << 30); 20146a010ddSJoerg Roedel if (idx >= pmu->nr_arch_gp_counters) 20246a010ddSJoerg Roedel return NULL; 20346a010ddSJoerg Roedel counters = pmu->gp_counters; 20446a010ddSJoerg Roedel 20546a010ddSJoerg Roedel return &counters[idx]; 20646a010ddSJoerg Roedel } 20746a010ddSJoerg Roedel 20846a010ddSJoerg Roedel static bool amd_is_valid_msr(struct kvm_vcpu *vcpu, u32 msr) 20946a010ddSJoerg Roedel { 21046a010ddSJoerg Roedel /* All MSRs refer to exactly one PMC, so msr_idx_to_pmc is enough. */ 21146a010ddSJoerg Roedel return false; 21246a010ddSJoerg Roedel } 21346a010ddSJoerg Roedel 21446a010ddSJoerg Roedel static struct kvm_pmc *amd_msr_idx_to_pmc(struct kvm_vcpu *vcpu, u32 msr) 21546a010ddSJoerg Roedel { 21646a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 21746a010ddSJoerg Roedel struct kvm_pmc *pmc; 21846a010ddSJoerg Roedel 21946a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 22046a010ddSJoerg Roedel pmc = pmc ? pmc : get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 22146a010ddSJoerg Roedel 22246a010ddSJoerg Roedel return pmc; 22346a010ddSJoerg Roedel } 22446a010ddSJoerg Roedel 225cbd71758SWei Wang static int amd_pmu_get_msr(struct kvm_vcpu *vcpu, struct msr_data *msr_info) 22646a010ddSJoerg Roedel { 22746a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 22846a010ddSJoerg Roedel struct kvm_pmc *pmc; 229cbd71758SWei Wang u32 msr = msr_info->index; 23046a010ddSJoerg Roedel 23146a010ddSJoerg Roedel /* MSR_PERFCTRn */ 23246a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 23346a010ddSJoerg Roedel if (pmc) { 234cbd71758SWei Wang msr_info->data = pmc_read_counter(pmc); 23546a010ddSJoerg Roedel return 0; 23646a010ddSJoerg Roedel } 23746a010ddSJoerg Roedel /* MSR_EVNTSELn */ 23846a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 23946a010ddSJoerg Roedel if (pmc) { 240cbd71758SWei Wang msr_info->data = pmc->eventsel; 24146a010ddSJoerg Roedel return 0; 24246a010ddSJoerg Roedel } 24346a010ddSJoerg Roedel 24446a010ddSJoerg Roedel return 1; 24546a010ddSJoerg Roedel } 24646a010ddSJoerg Roedel 24746a010ddSJoerg Roedel static int amd_pmu_set_msr(struct kvm_vcpu *vcpu, struct msr_data *msr_info) 24846a010ddSJoerg Roedel { 24946a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 25046a010ddSJoerg Roedel struct kvm_pmc *pmc; 25146a010ddSJoerg Roedel u32 msr = msr_info->index; 25246a010ddSJoerg Roedel u64 data = msr_info->data; 25346a010ddSJoerg Roedel 25446a010ddSJoerg Roedel /* MSR_PERFCTRn */ 25546a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_COUNTER); 25646a010ddSJoerg Roedel if (pmc) { 25746a010ddSJoerg Roedel pmc->counter += data - pmc_read_counter(pmc); 25846a010ddSJoerg Roedel return 0; 25946a010ddSJoerg Roedel } 26046a010ddSJoerg Roedel /* MSR_EVNTSELn */ 26146a010ddSJoerg Roedel pmc = get_gp_pmc_amd(pmu, msr, PMU_TYPE_EVNTSEL); 26246a010ddSJoerg Roedel if (pmc) { 26346a010ddSJoerg Roedel if (data == pmc->eventsel) 26446a010ddSJoerg Roedel return 0; 26546a010ddSJoerg Roedel if (!(data & pmu->reserved_bits)) { 26646a010ddSJoerg Roedel reprogram_gp_counter(pmc, data); 26746a010ddSJoerg Roedel return 0; 26846a010ddSJoerg Roedel } 26946a010ddSJoerg Roedel } 27046a010ddSJoerg Roedel 27146a010ddSJoerg Roedel return 1; 27246a010ddSJoerg Roedel } 27346a010ddSJoerg Roedel 27446a010ddSJoerg Roedel static void amd_pmu_refresh(struct kvm_vcpu *vcpu) 27546a010ddSJoerg Roedel { 27646a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 27746a010ddSJoerg Roedel 27846a010ddSJoerg Roedel if (guest_cpuid_has(vcpu, X86_FEATURE_PERFCTR_CORE)) 27946a010ddSJoerg Roedel pmu->nr_arch_gp_counters = AMD64_NUM_COUNTERS_CORE; 28046a010ddSJoerg Roedel else 28146a010ddSJoerg Roedel pmu->nr_arch_gp_counters = AMD64_NUM_COUNTERS; 28246a010ddSJoerg Roedel 28346a010ddSJoerg Roedel pmu->counter_bitmask[KVM_PMC_GP] = ((u64)1 << 48) - 1; 28446a010ddSJoerg Roedel pmu->reserved_bits = 0xffffffff00200000ull; 28546a010ddSJoerg Roedel pmu->version = 1; 28646a010ddSJoerg Roedel /* not applicable to AMD; but clean them to prevent any fall out */ 28746a010ddSJoerg Roedel pmu->counter_bitmask[KVM_PMC_FIXED] = 0; 28846a010ddSJoerg Roedel pmu->nr_arch_fixed_counters = 0; 28946a010ddSJoerg Roedel pmu->global_status = 0; 29046a010ddSJoerg Roedel bitmap_set(pmu->all_valid_pmc_idx, 0, pmu->nr_arch_gp_counters); 29146a010ddSJoerg Roedel } 29246a010ddSJoerg Roedel 29346a010ddSJoerg Roedel static void amd_pmu_init(struct kvm_vcpu *vcpu) 29446a010ddSJoerg Roedel { 29546a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 29646a010ddSJoerg Roedel int i; 29746a010ddSJoerg Roedel 29846a010ddSJoerg Roedel BUILD_BUG_ON(AMD64_NUM_COUNTERS_CORE > INTEL_PMC_MAX_GENERIC); 29946a010ddSJoerg Roedel 30046a010ddSJoerg Roedel for (i = 0; i < AMD64_NUM_COUNTERS_CORE ; i++) { 30146a010ddSJoerg Roedel pmu->gp_counters[i].type = KVM_PMC_GP; 30246a010ddSJoerg Roedel pmu->gp_counters[i].vcpu = vcpu; 30346a010ddSJoerg Roedel pmu->gp_counters[i].idx = i; 30446a010ddSJoerg Roedel pmu->gp_counters[i].current_config = 0; 30546a010ddSJoerg Roedel } 30646a010ddSJoerg Roedel } 30746a010ddSJoerg Roedel 30846a010ddSJoerg Roedel static void amd_pmu_reset(struct kvm_vcpu *vcpu) 30946a010ddSJoerg Roedel { 31046a010ddSJoerg Roedel struct kvm_pmu *pmu = vcpu_to_pmu(vcpu); 31146a010ddSJoerg Roedel int i; 31246a010ddSJoerg Roedel 31346a010ddSJoerg Roedel for (i = 0; i < AMD64_NUM_COUNTERS_CORE; i++) { 31446a010ddSJoerg Roedel struct kvm_pmc *pmc = &pmu->gp_counters[i]; 31546a010ddSJoerg Roedel 31646a010ddSJoerg Roedel pmc_stop_counter(pmc); 31746a010ddSJoerg Roedel pmc->counter = pmc->eventsel = 0; 31846a010ddSJoerg Roedel } 31946a010ddSJoerg Roedel } 32046a010ddSJoerg Roedel 32146a010ddSJoerg Roedel struct kvm_pmu_ops amd_pmu_ops = { 32246a010ddSJoerg Roedel .find_arch_event = amd_find_arch_event, 32346a010ddSJoerg Roedel .find_fixed_event = amd_find_fixed_event, 32446a010ddSJoerg Roedel .pmc_is_enabled = amd_pmc_is_enabled, 32546a010ddSJoerg Roedel .pmc_idx_to_pmc = amd_pmc_idx_to_pmc, 32646a010ddSJoerg Roedel .rdpmc_ecx_to_pmc = amd_rdpmc_ecx_to_pmc, 32746a010ddSJoerg Roedel .msr_idx_to_pmc = amd_msr_idx_to_pmc, 32846a010ddSJoerg Roedel .is_valid_rdpmc_ecx = amd_is_valid_rdpmc_ecx, 32946a010ddSJoerg Roedel .is_valid_msr = amd_is_valid_msr, 33046a010ddSJoerg Roedel .get_msr = amd_pmu_get_msr, 33146a010ddSJoerg Roedel .set_msr = amd_pmu_set_msr, 33246a010ddSJoerg Roedel .refresh = amd_pmu_refresh, 33346a010ddSJoerg Roedel .init = amd_pmu_init, 33446a010ddSJoerg Roedel .reset = amd_pmu_reset, 33546a010ddSJoerg Roedel }; 336