xref: /openbmc/linux/arch/arm/common/bL_switcher.c (revision 38c35d4f2e408c369e3030f0717d35ad443d9223)
11c33be57SNicolas Pitre /*
21c33be57SNicolas Pitre  * arch/arm/common/bL_switcher.c -- big.LITTLE cluster switcher core driver
31c33be57SNicolas Pitre  *
41c33be57SNicolas Pitre  * Created by:	Nicolas Pitre, March 2012
51c33be57SNicolas Pitre  * Copyright:	(C) 2012-2013  Linaro Limited
61c33be57SNicolas Pitre  *
71c33be57SNicolas Pitre  * This program is free software; you can redistribute it and/or modify
81c33be57SNicolas Pitre  * it under the terms of the GNU General Public License version 2 as
91c33be57SNicolas Pitre  * published by the Free Software Foundation.
101c33be57SNicolas Pitre  */
111c33be57SNicolas Pitre 
121c33be57SNicolas Pitre #include <linux/init.h>
131c33be57SNicolas Pitre #include <linux/kernel.h>
141c33be57SNicolas Pitre #include <linux/module.h>
151c33be57SNicolas Pitre #include <linux/sched.h>
161c33be57SNicolas Pitre #include <linux/interrupt.h>
171c33be57SNicolas Pitre #include <linux/cpu_pm.h>
1871ce1deeSNicolas Pitre #include <linux/cpu.h>
193f09d479SLorenzo Pieralisi #include <linux/cpumask.h>
2071ce1deeSNicolas Pitre #include <linux/kthread.h>
2171ce1deeSNicolas Pitre #include <linux/wait.h>
223f09d479SLorenzo Pieralisi #include <linux/clockchips.h>
233f09d479SLorenzo Pieralisi #include <linux/hrtimer.h>
243f09d479SLorenzo Pieralisi #include <linux/tick.h>
251c33be57SNicolas Pitre #include <linux/mm.h>
261c33be57SNicolas Pitre #include <linux/string.h>
276b7437aeSNicolas Pitre #include <linux/sysfs.h>
281c33be57SNicolas Pitre #include <linux/irqchip/arm-gic.h>
29c4821c05SNicolas Pitre #include <linux/moduleparam.h>
301c33be57SNicolas Pitre 
311c33be57SNicolas Pitre #include <asm/smp_plat.h>
321c33be57SNicolas Pitre #include <asm/suspend.h>
331c33be57SNicolas Pitre #include <asm/mcpm.h>
341c33be57SNicolas Pitre #include <asm/bL_switcher.h>
351c33be57SNicolas Pitre 
361c33be57SNicolas Pitre 
371c33be57SNicolas Pitre /*
381c33be57SNicolas Pitre  * Use our own MPIDR accessors as the generic ones in asm/cputype.h have
391c33be57SNicolas Pitre  * __attribute_const__ and we don't want the compiler to assume any
401c33be57SNicolas Pitre  * constness here as the value _does_ change along some code paths.
411c33be57SNicolas Pitre  */
421c33be57SNicolas Pitre 
431c33be57SNicolas Pitre static int read_mpidr(void)
441c33be57SNicolas Pitre {
451c33be57SNicolas Pitre 	unsigned int id;
461c33be57SNicolas Pitre 	asm volatile ("mrc p15, 0, %0, c0, c0, 5" : "=r" (id));
471c33be57SNicolas Pitre 	return id & MPIDR_HWID_BITMASK;
481c33be57SNicolas Pitre }
491c33be57SNicolas Pitre 
501c33be57SNicolas Pitre /*
511c33be57SNicolas Pitre  * bL switcher core code.
521c33be57SNicolas Pitre  */
531c33be57SNicolas Pitre 
541c33be57SNicolas Pitre static void bL_do_switch(void *_unused)
551c33be57SNicolas Pitre {
56*38c35d4fSNicolas Pitre 	unsigned ib_mpidr, ib_cpu, ib_cluster;
571c33be57SNicolas Pitre 
581c33be57SNicolas Pitre 	pr_debug("%s\n", __func__);
591c33be57SNicolas Pitre 
60*38c35d4fSNicolas Pitre 	ib_mpidr = cpu_logical_map(smp_processor_id());
61*38c35d4fSNicolas Pitre 	ib_cpu = MPIDR_AFFINITY_LEVEL(ib_mpidr, 0);
62*38c35d4fSNicolas Pitre 	ib_cluster = MPIDR_AFFINITY_LEVEL(ib_mpidr, 1);
631c33be57SNicolas Pitre 
641c33be57SNicolas Pitre 	/*
651c33be57SNicolas Pitre 	 * Our state has been saved at this point.  Let's release our
661c33be57SNicolas Pitre 	 * inbound CPU.
671c33be57SNicolas Pitre 	 */
68*38c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ib_cpu, ib_cluster, cpu_resume);
691c33be57SNicolas Pitre 	sev();
701c33be57SNicolas Pitre 
711c33be57SNicolas Pitre 	/*
721c33be57SNicolas Pitre 	 * From this point, we must assume that our counterpart CPU might
731c33be57SNicolas Pitre 	 * have taken over in its parallel world already, as if execution
741c33be57SNicolas Pitre 	 * just returned from cpu_suspend().  It is therefore important to
751c33be57SNicolas Pitre 	 * be very careful not to make any change the other guy is not
761c33be57SNicolas Pitre 	 * expecting.  This is why we need stack isolation.
771c33be57SNicolas Pitre 	 *
781c33be57SNicolas Pitre 	 * Fancy under cover tasks could be performed here.  For now
791c33be57SNicolas Pitre 	 * we have none.
801c33be57SNicolas Pitre 	 */
811c33be57SNicolas Pitre 
821c33be57SNicolas Pitre 	/* Let's put ourself down. */
831c33be57SNicolas Pitre 	mcpm_cpu_power_down();
841c33be57SNicolas Pitre 
851c33be57SNicolas Pitre 	/* should never get here */
861c33be57SNicolas Pitre 	BUG();
871c33be57SNicolas Pitre }
881c33be57SNicolas Pitre 
891c33be57SNicolas Pitre /*
90c052de26SNicolas Pitre  * Stack isolation.  To ensure 'current' remains valid, we just use another
91c052de26SNicolas Pitre  * piece of our thread's stack space which should be fairly lightly used.
92c052de26SNicolas Pitre  * The selected area starts just above the thread_info structure located
93c052de26SNicolas Pitre  * at the very bottom of the stack, aligned to a cache line, and indexed
94c052de26SNicolas Pitre  * with the cluster number.
951c33be57SNicolas Pitre  */
96c052de26SNicolas Pitre #define STACK_SIZE 512
971c33be57SNicolas Pitre extern void call_with_stack(void (*fn)(void *), void *arg, void *sp);
981c33be57SNicolas Pitre static int bL_switchpoint(unsigned long _arg)
991c33be57SNicolas Pitre {
1001c33be57SNicolas Pitre 	unsigned int mpidr = read_mpidr();
1011c33be57SNicolas Pitre 	unsigned int clusterid = MPIDR_AFFINITY_LEVEL(mpidr, 1);
102c052de26SNicolas Pitre 	void *stack = current_thread_info() + 1;
1031c33be57SNicolas Pitre 	stack = PTR_ALIGN(stack, L1_CACHE_BYTES);
104c052de26SNicolas Pitre 	stack += clusterid * STACK_SIZE + STACK_SIZE;
1051c33be57SNicolas Pitre 	call_with_stack(bL_do_switch, (void *)_arg, stack);
1061c33be57SNicolas Pitre 	BUG();
1071c33be57SNicolas Pitre }
1081c33be57SNicolas Pitre 
1091c33be57SNicolas Pitre /*
1101c33be57SNicolas Pitre  * Generic switcher interface
1111c33be57SNicolas Pitre  */
1121c33be57SNicolas Pitre 
113ed96762eSNicolas Pitre static unsigned int bL_gic_id[MAX_CPUS_PER_CLUSTER][MAX_NR_CLUSTERS];
114*38c35d4fSNicolas Pitre static int bL_switcher_cpu_pairing[NR_CPUS];
115ed96762eSNicolas Pitre 
1161c33be57SNicolas Pitre /*
1171c33be57SNicolas Pitre  * bL_switch_to - Switch to a specific cluster for the current CPU
1181c33be57SNicolas Pitre  * @new_cluster_id: the ID of the cluster to switch to.
1191c33be57SNicolas Pitre  *
1201c33be57SNicolas Pitre  * This function must be called on the CPU to be switched.
1211c33be57SNicolas Pitre  * Returns 0 on success, else a negative status code.
1221c33be57SNicolas Pitre  */
1231c33be57SNicolas Pitre static int bL_switch_to(unsigned int new_cluster_id)
1241c33be57SNicolas Pitre {
125*38c35d4fSNicolas Pitre 	unsigned int mpidr, this_cpu, that_cpu;
126*38c35d4fSNicolas Pitre 	unsigned int ob_mpidr, ob_cpu, ob_cluster, ib_mpidr, ib_cpu, ib_cluster;
1273f09d479SLorenzo Pieralisi 	struct tick_device *tdev;
1283f09d479SLorenzo Pieralisi 	enum clock_event_mode tdev_mode;
1291c33be57SNicolas Pitre 	int ret;
1301c33be57SNicolas Pitre 
131*38c35d4fSNicolas Pitre 	this_cpu = smp_processor_id();
132*38c35d4fSNicolas Pitre 	ob_mpidr = read_mpidr();
133*38c35d4fSNicolas Pitre 	ob_cpu = MPIDR_AFFINITY_LEVEL(ob_mpidr, 0);
134*38c35d4fSNicolas Pitre 	ob_cluster = MPIDR_AFFINITY_LEVEL(ob_mpidr, 1);
135*38c35d4fSNicolas Pitre 	BUG_ON(cpu_logical_map(this_cpu) != ob_mpidr);
1361c33be57SNicolas Pitre 
137*38c35d4fSNicolas Pitre 	if (new_cluster_id == ob_cluster)
1381c33be57SNicolas Pitre 		return 0;
1391c33be57SNicolas Pitre 
140*38c35d4fSNicolas Pitre 	that_cpu = bL_switcher_cpu_pairing[this_cpu];
141*38c35d4fSNicolas Pitre 	ib_mpidr = cpu_logical_map(that_cpu);
142*38c35d4fSNicolas Pitre 	ib_cpu = MPIDR_AFFINITY_LEVEL(ib_mpidr, 0);
143*38c35d4fSNicolas Pitre 	ib_cluster = MPIDR_AFFINITY_LEVEL(ib_mpidr, 1);
144*38c35d4fSNicolas Pitre 
145*38c35d4fSNicolas Pitre 	pr_debug("before switch: CPU %d MPIDR %#x -> %#x\n",
146*38c35d4fSNicolas Pitre 		 this_cpu, ob_mpidr, ib_mpidr);
1471c33be57SNicolas Pitre 
1481c33be57SNicolas Pitre 	/* Close the gate for our entry vectors */
149*38c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ob_cpu, ob_cluster, NULL);
150*38c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ib_cpu, ib_cluster, NULL);
1511c33be57SNicolas Pitre 
1521c33be57SNicolas Pitre 	/*
1531c33be57SNicolas Pitre 	 * Let's wake up the inbound CPU now in case it requires some delay
1541c33be57SNicolas Pitre 	 * to come online, but leave it gated in our entry vector code.
1551c33be57SNicolas Pitre 	 */
156*38c35d4fSNicolas Pitre 	ret = mcpm_cpu_power_up(ib_cpu, ib_cluster);
1571c33be57SNicolas Pitre 	if (ret) {
1581c33be57SNicolas Pitre 		pr_err("%s: mcpm_cpu_power_up() returned %d\n", __func__, ret);
1591c33be57SNicolas Pitre 		return ret;
1601c33be57SNicolas Pitre 	}
1611c33be57SNicolas Pitre 
1621c33be57SNicolas Pitre 	/*
1631c33be57SNicolas Pitre 	 * From this point we are entering the switch critical zone
1641c33be57SNicolas Pitre 	 * and can't take any interrupts anymore.
1651c33be57SNicolas Pitre 	 */
1661c33be57SNicolas Pitre 	local_irq_disable();
1671c33be57SNicolas Pitre 	local_fiq_disable();
1681c33be57SNicolas Pitre 
1691c33be57SNicolas Pitre 	/* redirect GIC's SGIs to our counterpart */
170*38c35d4fSNicolas Pitre 	gic_migrate_target(bL_gic_id[ib_cpu][ib_cluster]);
1711c33be57SNicolas Pitre 
1721c33be57SNicolas Pitre 	/*
1731c33be57SNicolas Pitre 	 * Raise a SGI on the inbound CPU to make sure it doesn't stall
1741c33be57SNicolas Pitre 	 * in a possible WFI, such as in mcpm_power_down().
1751c33be57SNicolas Pitre 	 */
1761c33be57SNicolas Pitre 	arch_send_wakeup_ipi_mask(cpumask_of(this_cpu));
1771c33be57SNicolas Pitre 
1783f09d479SLorenzo Pieralisi 	tdev = tick_get_device(this_cpu);
1793f09d479SLorenzo Pieralisi 	if (tdev && !cpumask_equal(tdev->evtdev->cpumask, cpumask_of(this_cpu)))
1803f09d479SLorenzo Pieralisi 		tdev = NULL;
1813f09d479SLorenzo Pieralisi 	if (tdev) {
1823f09d479SLorenzo Pieralisi 		tdev_mode = tdev->evtdev->mode;
1833f09d479SLorenzo Pieralisi 		clockevents_set_mode(tdev->evtdev, CLOCK_EVT_MODE_SHUTDOWN);
1843f09d479SLorenzo Pieralisi 	}
1853f09d479SLorenzo Pieralisi 
1861c33be57SNicolas Pitre 	ret = cpu_pm_enter();
1871c33be57SNicolas Pitre 
1881c33be57SNicolas Pitre 	/* we can not tolerate errors at this point */
1891c33be57SNicolas Pitre 	if (ret)
1901c33be57SNicolas Pitre 		panic("%s: cpu_pm_enter() returned %d\n", __func__, ret);
1911c33be57SNicolas Pitre 
192*38c35d4fSNicolas Pitre 	/* Swap the physical CPUs in the logical map for this logical CPU. */
193*38c35d4fSNicolas Pitre 	cpu_logical_map(this_cpu) = ib_mpidr;
194*38c35d4fSNicolas Pitre 	cpu_logical_map(that_cpu) = ob_mpidr;
1951c33be57SNicolas Pitre 
1961c33be57SNicolas Pitre 	/* Let's do the actual CPU switch. */
1971c33be57SNicolas Pitre 	ret = cpu_suspend(0, bL_switchpoint);
1981c33be57SNicolas Pitre 	if (ret > 0)
1991c33be57SNicolas Pitre 		panic("%s: cpu_suspend() returned %d\n", __func__, ret);
2001c33be57SNicolas Pitre 
2011c33be57SNicolas Pitre 	/* We are executing on the inbound CPU at this point */
2021c33be57SNicolas Pitre 	mpidr = read_mpidr();
203*38c35d4fSNicolas Pitre 	pr_debug("after switch: CPU %d MPIDR %#x\n", this_cpu, mpidr);
204*38c35d4fSNicolas Pitre 	BUG_ON(mpidr != ib_mpidr);
2051c33be57SNicolas Pitre 
2061c33be57SNicolas Pitre 	mcpm_cpu_powered_up();
2071c33be57SNicolas Pitre 
2081c33be57SNicolas Pitre 	ret = cpu_pm_exit();
2091c33be57SNicolas Pitre 
2103f09d479SLorenzo Pieralisi 	if (tdev) {
2113f09d479SLorenzo Pieralisi 		clockevents_set_mode(tdev->evtdev, tdev_mode);
2123f09d479SLorenzo Pieralisi 		clockevents_program_event(tdev->evtdev,
2133f09d479SLorenzo Pieralisi 					  tdev->evtdev->next_event, 1);
2143f09d479SLorenzo Pieralisi 	}
2153f09d479SLorenzo Pieralisi 
2161c33be57SNicolas Pitre 	local_fiq_enable();
2171c33be57SNicolas Pitre 	local_irq_enable();
2181c33be57SNicolas Pitre 
2191c33be57SNicolas Pitre 	if (ret)
2201c33be57SNicolas Pitre 		pr_err("%s exiting with error %d\n", __func__, ret);
2211c33be57SNicolas Pitre 	return ret;
2221c33be57SNicolas Pitre }
2231c33be57SNicolas Pitre 
22471ce1deeSNicolas Pitre struct bL_thread {
22571ce1deeSNicolas Pitre 	struct task_struct *task;
22671ce1deeSNicolas Pitre 	wait_queue_head_t wq;
22771ce1deeSNicolas Pitre 	int wanted_cluster;
2286b7437aeSNicolas Pitre 	struct completion started;
2291c33be57SNicolas Pitre };
2301c33be57SNicolas Pitre 
23171ce1deeSNicolas Pitre static struct bL_thread bL_threads[NR_CPUS];
23271ce1deeSNicolas Pitre 
23371ce1deeSNicolas Pitre static int bL_switcher_thread(void *arg)
2341c33be57SNicolas Pitre {
23571ce1deeSNicolas Pitre 	struct bL_thread *t = arg;
23671ce1deeSNicolas Pitre 	struct sched_param param = { .sched_priority = 1 };
23771ce1deeSNicolas Pitre 	int cluster;
23871ce1deeSNicolas Pitre 
23971ce1deeSNicolas Pitre 	sched_setscheduler_nocheck(current, SCHED_FIFO, &param);
2406b7437aeSNicolas Pitre 	complete(&t->started);
24171ce1deeSNicolas Pitre 
24271ce1deeSNicolas Pitre 	do {
24371ce1deeSNicolas Pitre 		if (signal_pending(current))
24471ce1deeSNicolas Pitre 			flush_signals(current);
24571ce1deeSNicolas Pitre 		wait_event_interruptible(t->wq,
24671ce1deeSNicolas Pitre 				t->wanted_cluster != -1 ||
24771ce1deeSNicolas Pitre 				kthread_should_stop());
24871ce1deeSNicolas Pitre 		cluster = xchg(&t->wanted_cluster, -1);
24971ce1deeSNicolas Pitre 		if (cluster != -1)
25071ce1deeSNicolas Pitre 			bL_switch_to(cluster);
25171ce1deeSNicolas Pitre 	} while (!kthread_should_stop());
25271ce1deeSNicolas Pitre 
25371ce1deeSNicolas Pitre 	return 0;
25471ce1deeSNicolas Pitre }
25571ce1deeSNicolas Pitre 
2566b7437aeSNicolas Pitre static struct task_struct *bL_switcher_thread_create(int cpu, void *arg)
25771ce1deeSNicolas Pitre {
25871ce1deeSNicolas Pitre 	struct task_struct *task;
25971ce1deeSNicolas Pitre 
26071ce1deeSNicolas Pitre 	task = kthread_create_on_node(bL_switcher_thread, arg,
26171ce1deeSNicolas Pitre 				      cpu_to_node(cpu), "kswitcher_%d", cpu);
26271ce1deeSNicolas Pitre 	if (!IS_ERR(task)) {
26371ce1deeSNicolas Pitre 		kthread_bind(task, cpu);
26471ce1deeSNicolas Pitre 		wake_up_process(task);
26571ce1deeSNicolas Pitre 	} else
26671ce1deeSNicolas Pitre 		pr_err("%s failed for CPU %d\n", __func__, cpu);
26771ce1deeSNicolas Pitre 	return task;
2681c33be57SNicolas Pitre }
2691c33be57SNicolas Pitre 
2701c33be57SNicolas Pitre /*
2711c33be57SNicolas Pitre  * bL_switch_request - Switch to a specific cluster for the given CPU
2721c33be57SNicolas Pitre  *
2731c33be57SNicolas Pitre  * @cpu: the CPU to switch
2741c33be57SNicolas Pitre  * @new_cluster_id: the ID of the cluster to switch to.
2751c33be57SNicolas Pitre  *
27671ce1deeSNicolas Pitre  * This function causes a cluster switch on the given CPU by waking up
27771ce1deeSNicolas Pitre  * the appropriate switcher thread.  This function may or may not return
27871ce1deeSNicolas Pitre  * before the switch has occurred.
2791c33be57SNicolas Pitre  */
28071ce1deeSNicolas Pitre int bL_switch_request(unsigned int cpu, unsigned int new_cluster_id)
2811c33be57SNicolas Pitre {
28271ce1deeSNicolas Pitre 	struct bL_thread *t;
2831c33be57SNicolas Pitre 
28471ce1deeSNicolas Pitre 	if (cpu >= ARRAY_SIZE(bL_threads)) {
28571ce1deeSNicolas Pitre 		pr_err("%s: cpu %d out of bounds\n", __func__, cpu);
28671ce1deeSNicolas Pitre 		return -EINVAL;
2871c33be57SNicolas Pitre 	}
2881c33be57SNicolas Pitre 
28971ce1deeSNicolas Pitre 	t = &bL_threads[cpu];
29071ce1deeSNicolas Pitre 	if (IS_ERR(t->task))
29171ce1deeSNicolas Pitre 		return PTR_ERR(t->task);
29271ce1deeSNicolas Pitre 	if (!t->task)
29371ce1deeSNicolas Pitre 		return -ESRCH;
29471ce1deeSNicolas Pitre 
29571ce1deeSNicolas Pitre 	t->wanted_cluster = new_cluster_id;
29671ce1deeSNicolas Pitre 	wake_up(&t->wq);
29771ce1deeSNicolas Pitre 	return 0;
2981c33be57SNicolas Pitre }
2991c33be57SNicolas Pitre EXPORT_SYMBOL_GPL(bL_switch_request);
30071ce1deeSNicolas Pitre 
3019797a0e9SNicolas Pitre /*
3029797a0e9SNicolas Pitre  * Activation and configuration code.
3039797a0e9SNicolas Pitre  */
3049797a0e9SNicolas Pitre 
3056b7437aeSNicolas Pitre static unsigned int bL_switcher_active;
306*38c35d4fSNicolas Pitre static unsigned int bL_switcher_cpu_original_cluster[NR_CPUS];
3079797a0e9SNicolas Pitre static cpumask_t bL_switcher_removed_logical_cpus;
3089797a0e9SNicolas Pitre 
3096b7437aeSNicolas Pitre static void bL_switcher_restore_cpus(void)
3109797a0e9SNicolas Pitre {
3119797a0e9SNicolas Pitre 	int i;
3129797a0e9SNicolas Pitre 
3139797a0e9SNicolas Pitre 	for_each_cpu(i, &bL_switcher_removed_logical_cpus)
3149797a0e9SNicolas Pitre 		cpu_up(i);
3159797a0e9SNicolas Pitre }
3169797a0e9SNicolas Pitre 
3176b7437aeSNicolas Pitre static int bL_switcher_halve_cpus(void)
3189797a0e9SNicolas Pitre {
319*38c35d4fSNicolas Pitre 	int i, j, cluster_0, gic_id, ret;
320*38c35d4fSNicolas Pitre 	unsigned int cpu, cluster, mask;
321*38c35d4fSNicolas Pitre 	cpumask_t available_cpus;
3229797a0e9SNicolas Pitre 
323*38c35d4fSNicolas Pitre 	/* First pass to validate what we have */
324*38c35d4fSNicolas Pitre 	mask = 0;
3259797a0e9SNicolas Pitre 	for_each_online_cpu(i) {
326*38c35d4fSNicolas Pitre 		cpu = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 0);
327*38c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
3289797a0e9SNicolas Pitre 		if (cluster >= 2) {
3299797a0e9SNicolas Pitre 			pr_err("%s: only dual cluster systems are supported\n", __func__);
3309797a0e9SNicolas Pitre 			return -EINVAL;
3319797a0e9SNicolas Pitre 		}
332*38c35d4fSNicolas Pitre 		if (WARN_ON(cpu >= MAX_CPUS_PER_CLUSTER))
333*38c35d4fSNicolas Pitre 			return -EINVAL;
334*38c35d4fSNicolas Pitre 		mask |= (1 << cluster);
3359797a0e9SNicolas Pitre 	}
336*38c35d4fSNicolas Pitre 	if (mask != 3) {
337*38c35d4fSNicolas Pitre 		pr_err("%s: no CPU pairing possible\n", __func__);
3389797a0e9SNicolas Pitre 		return -EINVAL;
3399797a0e9SNicolas Pitre 	}
3409797a0e9SNicolas Pitre 
341*38c35d4fSNicolas Pitre 	/*
342*38c35d4fSNicolas Pitre 	 * Now let's do the pairing.  We match each CPU with another CPU
343*38c35d4fSNicolas Pitre 	 * from a different cluster.  To get a uniform scheduling behavior
344*38c35d4fSNicolas Pitre 	 * without fiddling with CPU topology and compute capacity data,
345*38c35d4fSNicolas Pitre 	 * we'll use logical CPUs initially belonging to the same cluster.
346*38c35d4fSNicolas Pitre 	 */
347*38c35d4fSNicolas Pitre 	memset(bL_switcher_cpu_pairing, -1, sizeof(bL_switcher_cpu_pairing));
348*38c35d4fSNicolas Pitre 	cpumask_copy(&available_cpus, cpu_online_mask);
349*38c35d4fSNicolas Pitre 	cluster_0 = -1;
350*38c35d4fSNicolas Pitre 	for_each_cpu(i, &available_cpus) {
351*38c35d4fSNicolas Pitre 		int match = -1;
352*38c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
353*38c35d4fSNicolas Pitre 		if (cluster_0 == -1)
354*38c35d4fSNicolas Pitre 			cluster_0 = cluster;
355*38c35d4fSNicolas Pitre 		if (cluster != cluster_0)
356*38c35d4fSNicolas Pitre 			continue;
357*38c35d4fSNicolas Pitre 		cpumask_clear_cpu(i, &available_cpus);
358*38c35d4fSNicolas Pitre 		for_each_cpu(j, &available_cpus) {
359*38c35d4fSNicolas Pitre 			cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(j), 1);
360*38c35d4fSNicolas Pitre 			/*
361*38c35d4fSNicolas Pitre 			 * Let's remember the last match to create "odd"
362*38c35d4fSNicolas Pitre 			 * pairings on purpose in order for other code not
363*38c35d4fSNicolas Pitre 			 * to assume any relation between physical and
364*38c35d4fSNicolas Pitre 			 * logical CPU numbers.
365*38c35d4fSNicolas Pitre 			 */
366*38c35d4fSNicolas Pitre 			if (cluster != cluster_0)
367*38c35d4fSNicolas Pitre 				match = j;
368*38c35d4fSNicolas Pitre 		}
369*38c35d4fSNicolas Pitre 		if (match != -1) {
370*38c35d4fSNicolas Pitre 			bL_switcher_cpu_pairing[i] = match;
371*38c35d4fSNicolas Pitre 			cpumask_clear_cpu(match, &available_cpus);
372*38c35d4fSNicolas Pitre 			pr_info("CPU%d paired with CPU%d\n", i, match);
373*38c35d4fSNicolas Pitre 		}
374*38c35d4fSNicolas Pitre 	}
3759797a0e9SNicolas Pitre 
376*38c35d4fSNicolas Pitre 	/*
377*38c35d4fSNicolas Pitre 	 * Now we disable the unwanted CPUs i.e. everything that has no
378*38c35d4fSNicolas Pitre 	 * pairing information (that includes the pairing counterparts).
379*38c35d4fSNicolas Pitre 	 */
380*38c35d4fSNicolas Pitre 	cpumask_clear(&bL_switcher_removed_logical_cpus);
381*38c35d4fSNicolas Pitre 	for_each_online_cpu(i) {
382*38c35d4fSNicolas Pitre 		cpu = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 0);
383*38c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
384*38c35d4fSNicolas Pitre 
385ed96762eSNicolas Pitre 		/* Let's take note of the GIC ID for this CPU */
386*38c35d4fSNicolas Pitre 		gic_id = gic_get_cpu_id(i);
387ed96762eSNicolas Pitre 		if (gic_id < 0) {
388ed96762eSNicolas Pitre 			pr_err("%s: bad GIC ID for CPU %d\n", __func__, i);
389*38c35d4fSNicolas Pitre 			bL_switcher_restore_cpus();
390ed96762eSNicolas Pitre 			return -EINVAL;
391ed96762eSNicolas Pitre 		}
392ed96762eSNicolas Pitre 		bL_gic_id[cpu][cluster] = gic_id;
393ed96762eSNicolas Pitre 		pr_info("GIC ID for CPU %u cluster %u is %u\n",
394ed96762eSNicolas Pitre 			cpu, cluster, gic_id);
395ed96762eSNicolas Pitre 
396*38c35d4fSNicolas Pitre 		if (bL_switcher_cpu_pairing[i] != -1) {
397*38c35d4fSNicolas Pitre 			bL_switcher_cpu_original_cluster[i] = cluster;
3989797a0e9SNicolas Pitre 			continue;
3999797a0e9SNicolas Pitre 		}
4009797a0e9SNicolas Pitre 
4019797a0e9SNicolas Pitre 		ret = cpu_down(i);
4029797a0e9SNicolas Pitre 		if (ret) {
4039797a0e9SNicolas Pitre 			bL_switcher_restore_cpus();
4049797a0e9SNicolas Pitre 			return ret;
4059797a0e9SNicolas Pitre 		}
4069797a0e9SNicolas Pitre 		cpumask_set_cpu(i, &bL_switcher_removed_logical_cpus);
4079797a0e9SNicolas Pitre 	}
4089797a0e9SNicolas Pitre 
4099797a0e9SNicolas Pitre 	return 0;
4109797a0e9SNicolas Pitre }
4119797a0e9SNicolas Pitre 
4126b7437aeSNicolas Pitre static int bL_switcher_enable(void)
41371ce1deeSNicolas Pitre {
4149797a0e9SNicolas Pitre 	int cpu, ret;
41571ce1deeSNicolas Pitre 
4166b7437aeSNicolas Pitre 	cpu_hotplug_driver_lock();
4176b7437aeSNicolas Pitre 	if (bL_switcher_active) {
4186b7437aeSNicolas Pitre 		cpu_hotplug_driver_unlock();
4196b7437aeSNicolas Pitre 		return 0;
4209797a0e9SNicolas Pitre 	}
4219797a0e9SNicolas Pitre 
4226b7437aeSNicolas Pitre 	pr_info("big.LITTLE switcher initializing\n");
4236b7437aeSNicolas Pitre 
4249797a0e9SNicolas Pitre 	ret = bL_switcher_halve_cpus();
4259797a0e9SNicolas Pitre 	if (ret) {
4269797a0e9SNicolas Pitre 		cpu_hotplug_driver_unlock();
4279797a0e9SNicolas Pitre 		return ret;
4289797a0e9SNicolas Pitre 	}
4299797a0e9SNicolas Pitre 
43071ce1deeSNicolas Pitre 	for_each_online_cpu(cpu) {
43171ce1deeSNicolas Pitre 		struct bL_thread *t = &bL_threads[cpu];
43271ce1deeSNicolas Pitre 		init_waitqueue_head(&t->wq);
4336b7437aeSNicolas Pitre 		init_completion(&t->started);
43471ce1deeSNicolas Pitre 		t->wanted_cluster = -1;
43571ce1deeSNicolas Pitre 		t->task = bL_switcher_thread_create(cpu, t);
43671ce1deeSNicolas Pitre 	}
4376b7437aeSNicolas Pitre 
4386b7437aeSNicolas Pitre 	bL_switcher_active = 1;
4399797a0e9SNicolas Pitre 	cpu_hotplug_driver_unlock();
44071ce1deeSNicolas Pitre 
44171ce1deeSNicolas Pitre 	pr_info("big.LITTLE switcher initialized\n");
44271ce1deeSNicolas Pitre 	return 0;
44371ce1deeSNicolas Pitre }
44471ce1deeSNicolas Pitre 
4456b7437aeSNicolas Pitre #ifdef CONFIG_SYSFS
4466b7437aeSNicolas Pitre 
4476b7437aeSNicolas Pitre static void bL_switcher_disable(void)
4486b7437aeSNicolas Pitre {
449*38c35d4fSNicolas Pitre 	unsigned int cpu, cluster;
4506b7437aeSNicolas Pitre 	struct bL_thread *t;
4516b7437aeSNicolas Pitre 	struct task_struct *task;
4526b7437aeSNicolas Pitre 
4536b7437aeSNicolas Pitre 	cpu_hotplug_driver_lock();
4546b7437aeSNicolas Pitre 	if (!bL_switcher_active) {
4556b7437aeSNicolas Pitre 		cpu_hotplug_driver_unlock();
4566b7437aeSNicolas Pitre 		return;
4576b7437aeSNicolas Pitre 	}
4586b7437aeSNicolas Pitre 	bL_switcher_active = 0;
4596b7437aeSNicolas Pitre 
4606b7437aeSNicolas Pitre 	/*
4616b7437aeSNicolas Pitre 	 * To deactivate the switcher, we must shut down the switcher
4626b7437aeSNicolas Pitre 	 * threads to prevent any other requests from being accepted.
4636b7437aeSNicolas Pitre 	 * Then, if the final cluster for given logical CPU is not the
4646b7437aeSNicolas Pitre 	 * same as the original one, we'll recreate a switcher thread
4656b7437aeSNicolas Pitre 	 * just for the purpose of switching the CPU back without any
4666b7437aeSNicolas Pitre 	 * possibility for interference from external requests.
4676b7437aeSNicolas Pitre 	 */
4686b7437aeSNicolas Pitre 	for_each_online_cpu(cpu) {
4696b7437aeSNicolas Pitre 		t = &bL_threads[cpu];
4706b7437aeSNicolas Pitre 		task = t->task;
4716b7437aeSNicolas Pitre 		t->task = NULL;
4726b7437aeSNicolas Pitre 		if (!task || IS_ERR(task))
4736b7437aeSNicolas Pitre 			continue;
4746b7437aeSNicolas Pitre 		kthread_stop(task);
4756b7437aeSNicolas Pitre 		/* no more switch may happen on this CPU at this point */
4766b7437aeSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(cpu), 1);
4776b7437aeSNicolas Pitre 		if (cluster == bL_switcher_cpu_original_cluster[cpu])
4786b7437aeSNicolas Pitre 			continue;
4796b7437aeSNicolas Pitre 		init_completion(&t->started);
4806b7437aeSNicolas Pitre 		t->wanted_cluster = bL_switcher_cpu_original_cluster[cpu];
4816b7437aeSNicolas Pitre 		task = bL_switcher_thread_create(cpu, t);
4826b7437aeSNicolas Pitre 		if (!IS_ERR(task)) {
4836b7437aeSNicolas Pitre 			wait_for_completion(&t->started);
4846b7437aeSNicolas Pitre 			kthread_stop(task);
4856b7437aeSNicolas Pitre 			cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(cpu), 1);
4866b7437aeSNicolas Pitre 			if (cluster == bL_switcher_cpu_original_cluster[cpu])
4876b7437aeSNicolas Pitre 				continue;
4886b7437aeSNicolas Pitre 		}
4896b7437aeSNicolas Pitre 		/* If execution gets here, we're in trouble. */
4906b7437aeSNicolas Pitre 		pr_crit("%s: unable to restore original cluster for CPU %d\n",
4916b7437aeSNicolas Pitre 			__func__, cpu);
4926b7437aeSNicolas Pitre 		pr_crit("%s: CPU %d can't be restored\n",
493*38c35d4fSNicolas Pitre 			__func__, bL_switcher_cpu_pairing[cpu]);
494*38c35d4fSNicolas Pitre 		cpumask_clear_cpu(bL_switcher_cpu_pairing[cpu],
495*38c35d4fSNicolas Pitre 				  &bL_switcher_removed_logical_cpus);
4966b7437aeSNicolas Pitre 	}
4976b7437aeSNicolas Pitre 
4986b7437aeSNicolas Pitre 	bL_switcher_restore_cpus();
4996b7437aeSNicolas Pitre 	cpu_hotplug_driver_unlock();
5006b7437aeSNicolas Pitre }
5016b7437aeSNicolas Pitre 
5026b7437aeSNicolas Pitre static ssize_t bL_switcher_active_show(struct kobject *kobj,
5036b7437aeSNicolas Pitre 		struct kobj_attribute *attr, char *buf)
5046b7437aeSNicolas Pitre {
5056b7437aeSNicolas Pitre 	return sprintf(buf, "%u\n", bL_switcher_active);
5066b7437aeSNicolas Pitre }
5076b7437aeSNicolas Pitre 
5086b7437aeSNicolas Pitre static ssize_t bL_switcher_active_store(struct kobject *kobj,
5096b7437aeSNicolas Pitre 		struct kobj_attribute *attr, const char *buf, size_t count)
5106b7437aeSNicolas Pitre {
5116b7437aeSNicolas Pitre 	int ret;
5126b7437aeSNicolas Pitre 
5136b7437aeSNicolas Pitre 	switch (buf[0]) {
5146b7437aeSNicolas Pitre 	case '0':
5156b7437aeSNicolas Pitre 		bL_switcher_disable();
5166b7437aeSNicolas Pitre 		ret = 0;
5176b7437aeSNicolas Pitre 		break;
5186b7437aeSNicolas Pitre 	case '1':
5196b7437aeSNicolas Pitre 		ret = bL_switcher_enable();
5206b7437aeSNicolas Pitre 		break;
5216b7437aeSNicolas Pitre 	default:
5226b7437aeSNicolas Pitre 		ret = -EINVAL;
5236b7437aeSNicolas Pitre 	}
5246b7437aeSNicolas Pitre 
5256b7437aeSNicolas Pitre 	return (ret >= 0) ? count : ret;
5266b7437aeSNicolas Pitre }
5276b7437aeSNicolas Pitre 
5286b7437aeSNicolas Pitre static struct kobj_attribute bL_switcher_active_attr =
5296b7437aeSNicolas Pitre 	__ATTR(active, 0644, bL_switcher_active_show, bL_switcher_active_store);
5306b7437aeSNicolas Pitre 
5316b7437aeSNicolas Pitre static struct attribute *bL_switcher_attrs[] = {
5326b7437aeSNicolas Pitre 	&bL_switcher_active_attr.attr,
5336b7437aeSNicolas Pitre 	NULL,
5346b7437aeSNicolas Pitre };
5356b7437aeSNicolas Pitre 
5366b7437aeSNicolas Pitre static struct attribute_group bL_switcher_attr_group = {
5376b7437aeSNicolas Pitre 	.attrs = bL_switcher_attrs,
5386b7437aeSNicolas Pitre };
5396b7437aeSNicolas Pitre 
5406b7437aeSNicolas Pitre static struct kobject *bL_switcher_kobj;
5416b7437aeSNicolas Pitre 
5426b7437aeSNicolas Pitre static int __init bL_switcher_sysfs_init(void)
5436b7437aeSNicolas Pitre {
5446b7437aeSNicolas Pitre 	int ret;
5456b7437aeSNicolas Pitre 
5466b7437aeSNicolas Pitre 	bL_switcher_kobj = kobject_create_and_add("bL_switcher", kernel_kobj);
5476b7437aeSNicolas Pitre 	if (!bL_switcher_kobj)
5486b7437aeSNicolas Pitre 		return -ENOMEM;
5496b7437aeSNicolas Pitre 	ret = sysfs_create_group(bL_switcher_kobj, &bL_switcher_attr_group);
5506b7437aeSNicolas Pitre 	if (ret)
5516b7437aeSNicolas Pitre 		kobject_put(bL_switcher_kobj);
5526b7437aeSNicolas Pitre 	return ret;
5536b7437aeSNicolas Pitre }
5546b7437aeSNicolas Pitre 
5556b7437aeSNicolas Pitre #endif  /* CONFIG_SYSFS */
5566b7437aeSNicolas Pitre 
557c4821c05SNicolas Pitre static bool no_bL_switcher;
558c4821c05SNicolas Pitre core_param(no_bL_switcher, no_bL_switcher, bool, 0644);
559c4821c05SNicolas Pitre 
5606b7437aeSNicolas Pitre static int __init bL_switcher_init(void)
5616b7437aeSNicolas Pitre {
5626b7437aeSNicolas Pitre 	int ret;
5636b7437aeSNicolas Pitre 
5646b7437aeSNicolas Pitre 	if (MAX_NR_CLUSTERS != 2) {
5656b7437aeSNicolas Pitre 		pr_err("%s: only dual cluster systems are supported\n", __func__);
5666b7437aeSNicolas Pitre 		return -EINVAL;
5676b7437aeSNicolas Pitre 	}
5686b7437aeSNicolas Pitre 
569c4821c05SNicolas Pitre 	if (!no_bL_switcher) {
5706b7437aeSNicolas Pitre 		ret = bL_switcher_enable();
5716b7437aeSNicolas Pitre 		if (ret)
5726b7437aeSNicolas Pitre 			return ret;
573c4821c05SNicolas Pitre 	}
5746b7437aeSNicolas Pitre 
5756b7437aeSNicolas Pitre #ifdef CONFIG_SYSFS
5766b7437aeSNicolas Pitre 	ret = bL_switcher_sysfs_init();
5776b7437aeSNicolas Pitre 	if (ret)
5786b7437aeSNicolas Pitre 		pr_err("%s: unable to create sysfs entry\n", __func__);
5796b7437aeSNicolas Pitre #endif
5806b7437aeSNicolas Pitre 
5816b7437aeSNicolas Pitre 	return 0;
5826b7437aeSNicolas Pitre }
5836b7437aeSNicolas Pitre 
58471ce1deeSNicolas Pitre late_initcall(bL_switcher_init);
585