xref: /openbmc/linux/arch/arm/common/bL_switcher.c (revision 491990e29f5d285a1b75e74785e3160716b79040)
11c33be57SNicolas Pitre /*
21c33be57SNicolas Pitre  * arch/arm/common/bL_switcher.c -- big.LITTLE cluster switcher core driver
31c33be57SNicolas Pitre  *
41c33be57SNicolas Pitre  * Created by:	Nicolas Pitre, March 2012
51c33be57SNicolas Pitre  * Copyright:	(C) 2012-2013  Linaro Limited
61c33be57SNicolas Pitre  *
71c33be57SNicolas Pitre  * This program is free software; you can redistribute it and/or modify
81c33be57SNicolas Pitre  * it under the terms of the GNU General Public License version 2 as
91c33be57SNicolas Pitre  * published by the Free Software Foundation.
101c33be57SNicolas Pitre  */
111c33be57SNicolas Pitre 
121c33be57SNicolas Pitre #include <linux/init.h>
131c33be57SNicolas Pitre #include <linux/kernel.h>
141c33be57SNicolas Pitre #include <linux/module.h>
151c33be57SNicolas Pitre #include <linux/sched.h>
161c33be57SNicolas Pitre #include <linux/interrupt.h>
171c33be57SNicolas Pitre #include <linux/cpu_pm.h>
1871ce1deeSNicolas Pitre #include <linux/cpu.h>
193f09d479SLorenzo Pieralisi #include <linux/cpumask.h>
2071ce1deeSNicolas Pitre #include <linux/kthread.h>
2171ce1deeSNicolas Pitre #include <linux/wait.h>
223f09d479SLorenzo Pieralisi #include <linux/clockchips.h>
233f09d479SLorenzo Pieralisi #include <linux/hrtimer.h>
243f09d479SLorenzo Pieralisi #include <linux/tick.h>
25*491990e2SDave Martin #include <linux/notifier.h>
261c33be57SNicolas Pitre #include <linux/mm.h>
27c0f43751SDave Martin #include <linux/mutex.h>
281c33be57SNicolas Pitre #include <linux/string.h>
296b7437aeSNicolas Pitre #include <linux/sysfs.h>
301c33be57SNicolas Pitre #include <linux/irqchip/arm-gic.h>
31c4821c05SNicolas Pitre #include <linux/moduleparam.h>
321c33be57SNicolas Pitre 
331c33be57SNicolas Pitre #include <asm/smp_plat.h>
341c33be57SNicolas Pitre #include <asm/suspend.h>
351c33be57SNicolas Pitre #include <asm/mcpm.h>
361c33be57SNicolas Pitre #include <asm/bL_switcher.h>
371c33be57SNicolas Pitre 
381c33be57SNicolas Pitre 
391c33be57SNicolas Pitre /*
401c33be57SNicolas Pitre  * Use our own MPIDR accessors as the generic ones in asm/cputype.h have
411c33be57SNicolas Pitre  * __attribute_const__ and we don't want the compiler to assume any
421c33be57SNicolas Pitre  * constness here as the value _does_ change along some code paths.
431c33be57SNicolas Pitre  */
441c33be57SNicolas Pitre 
451c33be57SNicolas Pitre static int read_mpidr(void)
461c33be57SNicolas Pitre {
471c33be57SNicolas Pitre 	unsigned int id;
481c33be57SNicolas Pitre 	asm volatile ("mrc p15, 0, %0, c0, c0, 5" : "=r" (id));
491c33be57SNicolas Pitre 	return id & MPIDR_HWID_BITMASK;
501c33be57SNicolas Pitre }
511c33be57SNicolas Pitre 
521c33be57SNicolas Pitre /*
531c33be57SNicolas Pitre  * bL switcher core code.
541c33be57SNicolas Pitre  */
551c33be57SNicolas Pitre 
561c33be57SNicolas Pitre static void bL_do_switch(void *_unused)
571c33be57SNicolas Pitre {
5838c35d4fSNicolas Pitre 	unsigned ib_mpidr, ib_cpu, ib_cluster;
591c33be57SNicolas Pitre 
601c33be57SNicolas Pitre 	pr_debug("%s\n", __func__);
611c33be57SNicolas Pitre 
6238c35d4fSNicolas Pitre 	ib_mpidr = cpu_logical_map(smp_processor_id());
6338c35d4fSNicolas Pitre 	ib_cpu = MPIDR_AFFINITY_LEVEL(ib_mpidr, 0);
6438c35d4fSNicolas Pitre 	ib_cluster = MPIDR_AFFINITY_LEVEL(ib_mpidr, 1);
651c33be57SNicolas Pitre 
661c33be57SNicolas Pitre 	/*
671c33be57SNicolas Pitre 	 * Our state has been saved at this point.  Let's release our
681c33be57SNicolas Pitre 	 * inbound CPU.
691c33be57SNicolas Pitre 	 */
7038c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ib_cpu, ib_cluster, cpu_resume);
711c33be57SNicolas Pitre 	sev();
721c33be57SNicolas Pitre 
731c33be57SNicolas Pitre 	/*
741c33be57SNicolas Pitre 	 * From this point, we must assume that our counterpart CPU might
751c33be57SNicolas Pitre 	 * have taken over in its parallel world already, as if execution
761c33be57SNicolas Pitre 	 * just returned from cpu_suspend().  It is therefore important to
771c33be57SNicolas Pitre 	 * be very careful not to make any change the other guy is not
781c33be57SNicolas Pitre 	 * expecting.  This is why we need stack isolation.
791c33be57SNicolas Pitre 	 *
801c33be57SNicolas Pitre 	 * Fancy under cover tasks could be performed here.  For now
811c33be57SNicolas Pitre 	 * we have none.
821c33be57SNicolas Pitre 	 */
831c33be57SNicolas Pitre 
841c33be57SNicolas Pitre 	/* Let's put ourself down. */
851c33be57SNicolas Pitre 	mcpm_cpu_power_down();
861c33be57SNicolas Pitre 
871c33be57SNicolas Pitre 	/* should never get here */
881c33be57SNicolas Pitre 	BUG();
891c33be57SNicolas Pitre }
901c33be57SNicolas Pitre 
911c33be57SNicolas Pitre /*
92c052de26SNicolas Pitre  * Stack isolation.  To ensure 'current' remains valid, we just use another
93c052de26SNicolas Pitre  * piece of our thread's stack space which should be fairly lightly used.
94c052de26SNicolas Pitre  * The selected area starts just above the thread_info structure located
95c052de26SNicolas Pitre  * at the very bottom of the stack, aligned to a cache line, and indexed
96c052de26SNicolas Pitre  * with the cluster number.
971c33be57SNicolas Pitre  */
98c052de26SNicolas Pitre #define STACK_SIZE 512
991c33be57SNicolas Pitre extern void call_with_stack(void (*fn)(void *), void *arg, void *sp);
1001c33be57SNicolas Pitre static int bL_switchpoint(unsigned long _arg)
1011c33be57SNicolas Pitre {
1021c33be57SNicolas Pitre 	unsigned int mpidr = read_mpidr();
1031c33be57SNicolas Pitre 	unsigned int clusterid = MPIDR_AFFINITY_LEVEL(mpidr, 1);
104c052de26SNicolas Pitre 	void *stack = current_thread_info() + 1;
1051c33be57SNicolas Pitre 	stack = PTR_ALIGN(stack, L1_CACHE_BYTES);
106c052de26SNicolas Pitre 	stack += clusterid * STACK_SIZE + STACK_SIZE;
1071c33be57SNicolas Pitre 	call_with_stack(bL_do_switch, (void *)_arg, stack);
1081c33be57SNicolas Pitre 	BUG();
1091c33be57SNicolas Pitre }
1101c33be57SNicolas Pitre 
1111c33be57SNicolas Pitre /*
1121c33be57SNicolas Pitre  * Generic switcher interface
1131c33be57SNicolas Pitre  */
1141c33be57SNicolas Pitre 
115ed96762eSNicolas Pitre static unsigned int bL_gic_id[MAX_CPUS_PER_CLUSTER][MAX_NR_CLUSTERS];
11638c35d4fSNicolas Pitre static int bL_switcher_cpu_pairing[NR_CPUS];
117ed96762eSNicolas Pitre 
1181c33be57SNicolas Pitre /*
1191c33be57SNicolas Pitre  * bL_switch_to - Switch to a specific cluster for the current CPU
1201c33be57SNicolas Pitre  * @new_cluster_id: the ID of the cluster to switch to.
1211c33be57SNicolas Pitre  *
1221c33be57SNicolas Pitre  * This function must be called on the CPU to be switched.
1231c33be57SNicolas Pitre  * Returns 0 on success, else a negative status code.
1241c33be57SNicolas Pitre  */
1251c33be57SNicolas Pitre static int bL_switch_to(unsigned int new_cluster_id)
1261c33be57SNicolas Pitre {
12738c35d4fSNicolas Pitre 	unsigned int mpidr, this_cpu, that_cpu;
12838c35d4fSNicolas Pitre 	unsigned int ob_mpidr, ob_cpu, ob_cluster, ib_mpidr, ib_cpu, ib_cluster;
1293f09d479SLorenzo Pieralisi 	struct tick_device *tdev;
1303f09d479SLorenzo Pieralisi 	enum clock_event_mode tdev_mode;
1311c33be57SNicolas Pitre 	int ret;
1321c33be57SNicolas Pitre 
13338c35d4fSNicolas Pitre 	this_cpu = smp_processor_id();
13438c35d4fSNicolas Pitre 	ob_mpidr = read_mpidr();
13538c35d4fSNicolas Pitre 	ob_cpu = MPIDR_AFFINITY_LEVEL(ob_mpidr, 0);
13638c35d4fSNicolas Pitre 	ob_cluster = MPIDR_AFFINITY_LEVEL(ob_mpidr, 1);
13738c35d4fSNicolas Pitre 	BUG_ON(cpu_logical_map(this_cpu) != ob_mpidr);
1381c33be57SNicolas Pitre 
13938c35d4fSNicolas Pitre 	if (new_cluster_id == ob_cluster)
1401c33be57SNicolas Pitre 		return 0;
1411c33be57SNicolas Pitre 
14238c35d4fSNicolas Pitre 	that_cpu = bL_switcher_cpu_pairing[this_cpu];
14338c35d4fSNicolas Pitre 	ib_mpidr = cpu_logical_map(that_cpu);
14438c35d4fSNicolas Pitre 	ib_cpu = MPIDR_AFFINITY_LEVEL(ib_mpidr, 0);
14538c35d4fSNicolas Pitre 	ib_cluster = MPIDR_AFFINITY_LEVEL(ib_mpidr, 1);
14638c35d4fSNicolas Pitre 
14738c35d4fSNicolas Pitre 	pr_debug("before switch: CPU %d MPIDR %#x -> %#x\n",
14838c35d4fSNicolas Pitre 		 this_cpu, ob_mpidr, ib_mpidr);
1491c33be57SNicolas Pitre 
1501c33be57SNicolas Pitre 	/* Close the gate for our entry vectors */
15138c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ob_cpu, ob_cluster, NULL);
15238c35d4fSNicolas Pitre 	mcpm_set_entry_vector(ib_cpu, ib_cluster, NULL);
1531c33be57SNicolas Pitre 
1541c33be57SNicolas Pitre 	/*
1551c33be57SNicolas Pitre 	 * Let's wake up the inbound CPU now in case it requires some delay
1561c33be57SNicolas Pitre 	 * to come online, but leave it gated in our entry vector code.
1571c33be57SNicolas Pitre 	 */
15838c35d4fSNicolas Pitre 	ret = mcpm_cpu_power_up(ib_cpu, ib_cluster);
1591c33be57SNicolas Pitre 	if (ret) {
1601c33be57SNicolas Pitre 		pr_err("%s: mcpm_cpu_power_up() returned %d\n", __func__, ret);
1611c33be57SNicolas Pitre 		return ret;
1621c33be57SNicolas Pitre 	}
1631c33be57SNicolas Pitre 
1641c33be57SNicolas Pitre 	/*
1651c33be57SNicolas Pitre 	 * From this point we are entering the switch critical zone
1661c33be57SNicolas Pitre 	 * and can't take any interrupts anymore.
1671c33be57SNicolas Pitre 	 */
1681c33be57SNicolas Pitre 	local_irq_disable();
1691c33be57SNicolas Pitre 	local_fiq_disable();
1701c33be57SNicolas Pitre 
1711c33be57SNicolas Pitre 	/* redirect GIC's SGIs to our counterpart */
17238c35d4fSNicolas Pitre 	gic_migrate_target(bL_gic_id[ib_cpu][ib_cluster]);
1731c33be57SNicolas Pitre 
1741c33be57SNicolas Pitre 	/*
1751c33be57SNicolas Pitre 	 * Raise a SGI on the inbound CPU to make sure it doesn't stall
1761c33be57SNicolas Pitre 	 * in a possible WFI, such as in mcpm_power_down().
1771c33be57SNicolas Pitre 	 */
1781c33be57SNicolas Pitre 	arch_send_wakeup_ipi_mask(cpumask_of(this_cpu));
1791c33be57SNicolas Pitre 
1803f09d479SLorenzo Pieralisi 	tdev = tick_get_device(this_cpu);
1813f09d479SLorenzo Pieralisi 	if (tdev && !cpumask_equal(tdev->evtdev->cpumask, cpumask_of(this_cpu)))
1823f09d479SLorenzo Pieralisi 		tdev = NULL;
1833f09d479SLorenzo Pieralisi 	if (tdev) {
1843f09d479SLorenzo Pieralisi 		tdev_mode = tdev->evtdev->mode;
1853f09d479SLorenzo Pieralisi 		clockevents_set_mode(tdev->evtdev, CLOCK_EVT_MODE_SHUTDOWN);
1863f09d479SLorenzo Pieralisi 	}
1873f09d479SLorenzo Pieralisi 
1881c33be57SNicolas Pitre 	ret = cpu_pm_enter();
1891c33be57SNicolas Pitre 
1901c33be57SNicolas Pitre 	/* we can not tolerate errors at this point */
1911c33be57SNicolas Pitre 	if (ret)
1921c33be57SNicolas Pitre 		panic("%s: cpu_pm_enter() returned %d\n", __func__, ret);
1931c33be57SNicolas Pitre 
19438c35d4fSNicolas Pitre 	/* Swap the physical CPUs in the logical map for this logical CPU. */
19538c35d4fSNicolas Pitre 	cpu_logical_map(this_cpu) = ib_mpidr;
19638c35d4fSNicolas Pitre 	cpu_logical_map(that_cpu) = ob_mpidr;
1971c33be57SNicolas Pitre 
1981c33be57SNicolas Pitre 	/* Let's do the actual CPU switch. */
1991c33be57SNicolas Pitre 	ret = cpu_suspend(0, bL_switchpoint);
2001c33be57SNicolas Pitre 	if (ret > 0)
2011c33be57SNicolas Pitre 		panic("%s: cpu_suspend() returned %d\n", __func__, ret);
2021c33be57SNicolas Pitre 
2031c33be57SNicolas Pitre 	/* We are executing on the inbound CPU at this point */
2041c33be57SNicolas Pitre 	mpidr = read_mpidr();
20538c35d4fSNicolas Pitre 	pr_debug("after switch: CPU %d MPIDR %#x\n", this_cpu, mpidr);
20638c35d4fSNicolas Pitre 	BUG_ON(mpidr != ib_mpidr);
2071c33be57SNicolas Pitre 
2081c33be57SNicolas Pitre 	mcpm_cpu_powered_up();
2091c33be57SNicolas Pitre 
2101c33be57SNicolas Pitre 	ret = cpu_pm_exit();
2111c33be57SNicolas Pitre 
2123f09d479SLorenzo Pieralisi 	if (tdev) {
2133f09d479SLorenzo Pieralisi 		clockevents_set_mode(tdev->evtdev, tdev_mode);
2143f09d479SLorenzo Pieralisi 		clockevents_program_event(tdev->evtdev,
2153f09d479SLorenzo Pieralisi 					  tdev->evtdev->next_event, 1);
2163f09d479SLorenzo Pieralisi 	}
2173f09d479SLorenzo Pieralisi 
2181c33be57SNicolas Pitre 	local_fiq_enable();
2191c33be57SNicolas Pitre 	local_irq_enable();
2201c33be57SNicolas Pitre 
2211c33be57SNicolas Pitre 	if (ret)
2221c33be57SNicolas Pitre 		pr_err("%s exiting with error %d\n", __func__, ret);
2231c33be57SNicolas Pitre 	return ret;
2241c33be57SNicolas Pitre }
2251c33be57SNicolas Pitre 
22671ce1deeSNicolas Pitre struct bL_thread {
22771ce1deeSNicolas Pitre 	struct task_struct *task;
22871ce1deeSNicolas Pitre 	wait_queue_head_t wq;
22971ce1deeSNicolas Pitre 	int wanted_cluster;
2306b7437aeSNicolas Pitre 	struct completion started;
2311c33be57SNicolas Pitre };
2321c33be57SNicolas Pitre 
23371ce1deeSNicolas Pitre static struct bL_thread bL_threads[NR_CPUS];
23471ce1deeSNicolas Pitre 
23571ce1deeSNicolas Pitre static int bL_switcher_thread(void *arg)
2361c33be57SNicolas Pitre {
23771ce1deeSNicolas Pitre 	struct bL_thread *t = arg;
23871ce1deeSNicolas Pitre 	struct sched_param param = { .sched_priority = 1 };
23971ce1deeSNicolas Pitre 	int cluster;
24071ce1deeSNicolas Pitre 
24171ce1deeSNicolas Pitre 	sched_setscheduler_nocheck(current, SCHED_FIFO, &param);
2426b7437aeSNicolas Pitre 	complete(&t->started);
24371ce1deeSNicolas Pitre 
24471ce1deeSNicolas Pitre 	do {
24571ce1deeSNicolas Pitre 		if (signal_pending(current))
24671ce1deeSNicolas Pitre 			flush_signals(current);
24771ce1deeSNicolas Pitre 		wait_event_interruptible(t->wq,
24871ce1deeSNicolas Pitre 				t->wanted_cluster != -1 ||
24971ce1deeSNicolas Pitre 				kthread_should_stop());
25071ce1deeSNicolas Pitre 		cluster = xchg(&t->wanted_cluster, -1);
25171ce1deeSNicolas Pitre 		if (cluster != -1)
25271ce1deeSNicolas Pitre 			bL_switch_to(cluster);
25371ce1deeSNicolas Pitre 	} while (!kthread_should_stop());
25471ce1deeSNicolas Pitre 
25571ce1deeSNicolas Pitre 	return 0;
25671ce1deeSNicolas Pitre }
25771ce1deeSNicolas Pitre 
2586b7437aeSNicolas Pitre static struct task_struct *bL_switcher_thread_create(int cpu, void *arg)
25971ce1deeSNicolas Pitre {
26071ce1deeSNicolas Pitre 	struct task_struct *task;
26171ce1deeSNicolas Pitre 
26271ce1deeSNicolas Pitre 	task = kthread_create_on_node(bL_switcher_thread, arg,
26371ce1deeSNicolas Pitre 				      cpu_to_node(cpu), "kswitcher_%d", cpu);
26471ce1deeSNicolas Pitre 	if (!IS_ERR(task)) {
26571ce1deeSNicolas Pitre 		kthread_bind(task, cpu);
26671ce1deeSNicolas Pitre 		wake_up_process(task);
26771ce1deeSNicolas Pitre 	} else
26871ce1deeSNicolas Pitre 		pr_err("%s failed for CPU %d\n", __func__, cpu);
26971ce1deeSNicolas Pitre 	return task;
2701c33be57SNicolas Pitre }
2711c33be57SNicolas Pitre 
2721c33be57SNicolas Pitre /*
2731c33be57SNicolas Pitre  * bL_switch_request - Switch to a specific cluster for the given CPU
2741c33be57SNicolas Pitre  *
2751c33be57SNicolas Pitre  * @cpu: the CPU to switch
2761c33be57SNicolas Pitre  * @new_cluster_id: the ID of the cluster to switch to.
2771c33be57SNicolas Pitre  *
27871ce1deeSNicolas Pitre  * This function causes a cluster switch on the given CPU by waking up
27971ce1deeSNicolas Pitre  * the appropriate switcher thread.  This function may or may not return
28071ce1deeSNicolas Pitre  * before the switch has occurred.
2811c33be57SNicolas Pitre  */
28271ce1deeSNicolas Pitre int bL_switch_request(unsigned int cpu, unsigned int new_cluster_id)
2831c33be57SNicolas Pitre {
28471ce1deeSNicolas Pitre 	struct bL_thread *t;
2851c33be57SNicolas Pitre 
28671ce1deeSNicolas Pitre 	if (cpu >= ARRAY_SIZE(bL_threads)) {
28771ce1deeSNicolas Pitre 		pr_err("%s: cpu %d out of bounds\n", __func__, cpu);
28871ce1deeSNicolas Pitre 		return -EINVAL;
2891c33be57SNicolas Pitre 	}
2901c33be57SNicolas Pitre 
29171ce1deeSNicolas Pitre 	t = &bL_threads[cpu];
29271ce1deeSNicolas Pitre 	if (IS_ERR(t->task))
29371ce1deeSNicolas Pitre 		return PTR_ERR(t->task);
29471ce1deeSNicolas Pitre 	if (!t->task)
29571ce1deeSNicolas Pitre 		return -ESRCH;
29671ce1deeSNicolas Pitre 
29771ce1deeSNicolas Pitre 	t->wanted_cluster = new_cluster_id;
29871ce1deeSNicolas Pitre 	wake_up(&t->wq);
29971ce1deeSNicolas Pitre 	return 0;
3001c33be57SNicolas Pitre }
3011c33be57SNicolas Pitre EXPORT_SYMBOL_GPL(bL_switch_request);
30271ce1deeSNicolas Pitre 
3039797a0e9SNicolas Pitre /*
3049797a0e9SNicolas Pitre  * Activation and configuration code.
3059797a0e9SNicolas Pitre  */
3069797a0e9SNicolas Pitre 
307c0f43751SDave Martin static DEFINE_MUTEX(bL_switcher_activation_lock);
308*491990e2SDave Martin static BLOCKING_NOTIFIER_HEAD(bL_activation_notifier);
3096b7437aeSNicolas Pitre static unsigned int bL_switcher_active;
31038c35d4fSNicolas Pitre static unsigned int bL_switcher_cpu_original_cluster[NR_CPUS];
3119797a0e9SNicolas Pitre static cpumask_t bL_switcher_removed_logical_cpus;
3129797a0e9SNicolas Pitre 
313*491990e2SDave Martin int bL_switcher_register_notifier(struct notifier_block *nb)
314*491990e2SDave Martin {
315*491990e2SDave Martin 	return blocking_notifier_chain_register(&bL_activation_notifier, nb);
316*491990e2SDave Martin }
317*491990e2SDave Martin EXPORT_SYMBOL_GPL(bL_switcher_register_notifier);
318*491990e2SDave Martin 
319*491990e2SDave Martin int bL_switcher_unregister_notifier(struct notifier_block *nb)
320*491990e2SDave Martin {
321*491990e2SDave Martin 	return blocking_notifier_chain_unregister(&bL_activation_notifier, nb);
322*491990e2SDave Martin }
323*491990e2SDave Martin EXPORT_SYMBOL_GPL(bL_switcher_unregister_notifier);
324*491990e2SDave Martin 
325*491990e2SDave Martin static int bL_activation_notify(unsigned long val)
326*491990e2SDave Martin {
327*491990e2SDave Martin 	int ret;
328*491990e2SDave Martin 
329*491990e2SDave Martin 	ret = blocking_notifier_call_chain(&bL_activation_notifier, val, NULL);
330*491990e2SDave Martin 	if (ret & NOTIFY_STOP_MASK)
331*491990e2SDave Martin 		pr_err("%s: notifier chain failed with status 0x%x\n",
332*491990e2SDave Martin 			__func__, ret);
333*491990e2SDave Martin 	return notifier_to_errno(ret);
334*491990e2SDave Martin }
335*491990e2SDave Martin 
3366b7437aeSNicolas Pitre static void bL_switcher_restore_cpus(void)
3379797a0e9SNicolas Pitre {
3389797a0e9SNicolas Pitre 	int i;
3399797a0e9SNicolas Pitre 
3409797a0e9SNicolas Pitre 	for_each_cpu(i, &bL_switcher_removed_logical_cpus)
3419797a0e9SNicolas Pitre 		cpu_up(i);
3429797a0e9SNicolas Pitre }
3439797a0e9SNicolas Pitre 
3446b7437aeSNicolas Pitre static int bL_switcher_halve_cpus(void)
3459797a0e9SNicolas Pitre {
34638c35d4fSNicolas Pitre 	int i, j, cluster_0, gic_id, ret;
34738c35d4fSNicolas Pitre 	unsigned int cpu, cluster, mask;
34838c35d4fSNicolas Pitre 	cpumask_t available_cpus;
3499797a0e9SNicolas Pitre 
35038c35d4fSNicolas Pitre 	/* First pass to validate what we have */
35138c35d4fSNicolas Pitre 	mask = 0;
3529797a0e9SNicolas Pitre 	for_each_online_cpu(i) {
35338c35d4fSNicolas Pitre 		cpu = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 0);
35438c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
3559797a0e9SNicolas Pitre 		if (cluster >= 2) {
3569797a0e9SNicolas Pitre 			pr_err("%s: only dual cluster systems are supported\n", __func__);
3579797a0e9SNicolas Pitre 			return -EINVAL;
3589797a0e9SNicolas Pitre 		}
35938c35d4fSNicolas Pitre 		if (WARN_ON(cpu >= MAX_CPUS_PER_CLUSTER))
36038c35d4fSNicolas Pitre 			return -EINVAL;
36138c35d4fSNicolas Pitre 		mask |= (1 << cluster);
3629797a0e9SNicolas Pitre 	}
36338c35d4fSNicolas Pitre 	if (mask != 3) {
36438c35d4fSNicolas Pitre 		pr_err("%s: no CPU pairing possible\n", __func__);
3659797a0e9SNicolas Pitre 		return -EINVAL;
3669797a0e9SNicolas Pitre 	}
3679797a0e9SNicolas Pitre 
36838c35d4fSNicolas Pitre 	/*
36938c35d4fSNicolas Pitre 	 * Now let's do the pairing.  We match each CPU with another CPU
37038c35d4fSNicolas Pitre 	 * from a different cluster.  To get a uniform scheduling behavior
37138c35d4fSNicolas Pitre 	 * without fiddling with CPU topology and compute capacity data,
37238c35d4fSNicolas Pitre 	 * we'll use logical CPUs initially belonging to the same cluster.
37338c35d4fSNicolas Pitre 	 */
37438c35d4fSNicolas Pitre 	memset(bL_switcher_cpu_pairing, -1, sizeof(bL_switcher_cpu_pairing));
37538c35d4fSNicolas Pitre 	cpumask_copy(&available_cpus, cpu_online_mask);
37638c35d4fSNicolas Pitre 	cluster_0 = -1;
37738c35d4fSNicolas Pitre 	for_each_cpu(i, &available_cpus) {
37838c35d4fSNicolas Pitre 		int match = -1;
37938c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
38038c35d4fSNicolas Pitre 		if (cluster_0 == -1)
38138c35d4fSNicolas Pitre 			cluster_0 = cluster;
38238c35d4fSNicolas Pitre 		if (cluster != cluster_0)
38338c35d4fSNicolas Pitre 			continue;
38438c35d4fSNicolas Pitre 		cpumask_clear_cpu(i, &available_cpus);
38538c35d4fSNicolas Pitre 		for_each_cpu(j, &available_cpus) {
38638c35d4fSNicolas Pitre 			cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(j), 1);
38738c35d4fSNicolas Pitre 			/*
38838c35d4fSNicolas Pitre 			 * Let's remember the last match to create "odd"
38938c35d4fSNicolas Pitre 			 * pairings on purpose in order for other code not
39038c35d4fSNicolas Pitre 			 * to assume any relation between physical and
39138c35d4fSNicolas Pitre 			 * logical CPU numbers.
39238c35d4fSNicolas Pitre 			 */
39338c35d4fSNicolas Pitre 			if (cluster != cluster_0)
39438c35d4fSNicolas Pitre 				match = j;
39538c35d4fSNicolas Pitre 		}
39638c35d4fSNicolas Pitre 		if (match != -1) {
39738c35d4fSNicolas Pitre 			bL_switcher_cpu_pairing[i] = match;
39838c35d4fSNicolas Pitre 			cpumask_clear_cpu(match, &available_cpus);
39938c35d4fSNicolas Pitre 			pr_info("CPU%d paired with CPU%d\n", i, match);
40038c35d4fSNicolas Pitre 		}
40138c35d4fSNicolas Pitre 	}
4029797a0e9SNicolas Pitre 
40338c35d4fSNicolas Pitre 	/*
40438c35d4fSNicolas Pitre 	 * Now we disable the unwanted CPUs i.e. everything that has no
40538c35d4fSNicolas Pitre 	 * pairing information (that includes the pairing counterparts).
40638c35d4fSNicolas Pitre 	 */
40738c35d4fSNicolas Pitre 	cpumask_clear(&bL_switcher_removed_logical_cpus);
40838c35d4fSNicolas Pitre 	for_each_online_cpu(i) {
40938c35d4fSNicolas Pitre 		cpu = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 0);
41038c35d4fSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(i), 1);
41138c35d4fSNicolas Pitre 
412ed96762eSNicolas Pitre 		/* Let's take note of the GIC ID for this CPU */
41338c35d4fSNicolas Pitre 		gic_id = gic_get_cpu_id(i);
414ed96762eSNicolas Pitre 		if (gic_id < 0) {
415ed96762eSNicolas Pitre 			pr_err("%s: bad GIC ID for CPU %d\n", __func__, i);
41638c35d4fSNicolas Pitre 			bL_switcher_restore_cpus();
417ed96762eSNicolas Pitre 			return -EINVAL;
418ed96762eSNicolas Pitre 		}
419ed96762eSNicolas Pitre 		bL_gic_id[cpu][cluster] = gic_id;
420ed96762eSNicolas Pitre 		pr_info("GIC ID for CPU %u cluster %u is %u\n",
421ed96762eSNicolas Pitre 			cpu, cluster, gic_id);
422ed96762eSNicolas Pitre 
42338c35d4fSNicolas Pitre 		if (bL_switcher_cpu_pairing[i] != -1) {
42438c35d4fSNicolas Pitre 			bL_switcher_cpu_original_cluster[i] = cluster;
4259797a0e9SNicolas Pitre 			continue;
4269797a0e9SNicolas Pitre 		}
4279797a0e9SNicolas Pitre 
4289797a0e9SNicolas Pitre 		ret = cpu_down(i);
4299797a0e9SNicolas Pitre 		if (ret) {
4309797a0e9SNicolas Pitre 			bL_switcher_restore_cpus();
4319797a0e9SNicolas Pitre 			return ret;
4329797a0e9SNicolas Pitre 		}
4339797a0e9SNicolas Pitre 		cpumask_set_cpu(i, &bL_switcher_removed_logical_cpus);
4349797a0e9SNicolas Pitre 	}
4359797a0e9SNicolas Pitre 
4369797a0e9SNicolas Pitre 	return 0;
4379797a0e9SNicolas Pitre }
4389797a0e9SNicolas Pitre 
4396b7437aeSNicolas Pitre static int bL_switcher_enable(void)
44071ce1deeSNicolas Pitre {
4419797a0e9SNicolas Pitre 	int cpu, ret;
44271ce1deeSNicolas Pitre 
443c0f43751SDave Martin 	mutex_lock(&bL_switcher_activation_lock);
4446b7437aeSNicolas Pitre 	cpu_hotplug_driver_lock();
4456b7437aeSNicolas Pitre 	if (bL_switcher_active) {
4466b7437aeSNicolas Pitre 		cpu_hotplug_driver_unlock();
447c0f43751SDave Martin 		mutex_unlock(&bL_switcher_activation_lock);
4486b7437aeSNicolas Pitre 		return 0;
4499797a0e9SNicolas Pitre 	}
4509797a0e9SNicolas Pitre 
4516b7437aeSNicolas Pitre 	pr_info("big.LITTLE switcher initializing\n");
4526b7437aeSNicolas Pitre 
453*491990e2SDave Martin 	ret = bL_activation_notify(BL_NOTIFY_PRE_ENABLE);
454*491990e2SDave Martin 	if (ret)
455*491990e2SDave Martin 		goto error;
456*491990e2SDave Martin 
4579797a0e9SNicolas Pitre 	ret = bL_switcher_halve_cpus();
458*491990e2SDave Martin 	if (ret)
459*491990e2SDave Martin 		goto error;
4609797a0e9SNicolas Pitre 
46171ce1deeSNicolas Pitre 	for_each_online_cpu(cpu) {
46271ce1deeSNicolas Pitre 		struct bL_thread *t = &bL_threads[cpu];
46371ce1deeSNicolas Pitre 		init_waitqueue_head(&t->wq);
4646b7437aeSNicolas Pitre 		init_completion(&t->started);
46571ce1deeSNicolas Pitre 		t->wanted_cluster = -1;
46671ce1deeSNicolas Pitre 		t->task = bL_switcher_thread_create(cpu, t);
46771ce1deeSNicolas Pitre 	}
4686b7437aeSNicolas Pitre 
4696b7437aeSNicolas Pitre 	bL_switcher_active = 1;
470*491990e2SDave Martin 	bL_activation_notify(BL_NOTIFY_POST_ENABLE);
47171ce1deeSNicolas Pitre 	pr_info("big.LITTLE switcher initialized\n");
472*491990e2SDave Martin 	goto out;
473c0f43751SDave Martin 
474*491990e2SDave Martin error:
475*491990e2SDave Martin 	pr_warn("big.LITTLE switcher initialization failed\n");
476*491990e2SDave Martin 	bL_activation_notify(BL_NOTIFY_POST_DISABLE);
477*491990e2SDave Martin 
478*491990e2SDave Martin out:
479c0f43751SDave Martin 	cpu_hotplug_driver_unlock();
480c0f43751SDave Martin 	mutex_unlock(&bL_switcher_activation_lock);
481*491990e2SDave Martin 	return ret;
48271ce1deeSNicolas Pitre }
48371ce1deeSNicolas Pitre 
4846b7437aeSNicolas Pitre #ifdef CONFIG_SYSFS
4856b7437aeSNicolas Pitre 
4866b7437aeSNicolas Pitre static void bL_switcher_disable(void)
4876b7437aeSNicolas Pitre {
48838c35d4fSNicolas Pitre 	unsigned int cpu, cluster;
4896b7437aeSNicolas Pitre 	struct bL_thread *t;
4906b7437aeSNicolas Pitre 	struct task_struct *task;
4916b7437aeSNicolas Pitre 
492c0f43751SDave Martin 	mutex_lock(&bL_switcher_activation_lock);
4936b7437aeSNicolas Pitre 	cpu_hotplug_driver_lock();
494*491990e2SDave Martin 
495*491990e2SDave Martin 	if (!bL_switcher_active)
496*491990e2SDave Martin 		goto out;
497*491990e2SDave Martin 
498*491990e2SDave Martin 	if (bL_activation_notify(BL_NOTIFY_PRE_DISABLE) != 0) {
499*491990e2SDave Martin 		bL_activation_notify(BL_NOTIFY_POST_ENABLE);
500*491990e2SDave Martin 		goto out;
5016b7437aeSNicolas Pitre 	}
502*491990e2SDave Martin 
5036b7437aeSNicolas Pitre 	bL_switcher_active = 0;
5046b7437aeSNicolas Pitre 
5056b7437aeSNicolas Pitre 	/*
5066b7437aeSNicolas Pitre 	 * To deactivate the switcher, we must shut down the switcher
5076b7437aeSNicolas Pitre 	 * threads to prevent any other requests from being accepted.
5086b7437aeSNicolas Pitre 	 * Then, if the final cluster for given logical CPU is not the
5096b7437aeSNicolas Pitre 	 * same as the original one, we'll recreate a switcher thread
5106b7437aeSNicolas Pitre 	 * just for the purpose of switching the CPU back without any
5116b7437aeSNicolas Pitre 	 * possibility for interference from external requests.
5126b7437aeSNicolas Pitre 	 */
5136b7437aeSNicolas Pitre 	for_each_online_cpu(cpu) {
5146b7437aeSNicolas Pitre 		t = &bL_threads[cpu];
5156b7437aeSNicolas Pitre 		task = t->task;
5166b7437aeSNicolas Pitre 		t->task = NULL;
5176b7437aeSNicolas Pitre 		if (!task || IS_ERR(task))
5186b7437aeSNicolas Pitre 			continue;
5196b7437aeSNicolas Pitre 		kthread_stop(task);
5206b7437aeSNicolas Pitre 		/* no more switch may happen on this CPU at this point */
5216b7437aeSNicolas Pitre 		cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(cpu), 1);
5226b7437aeSNicolas Pitre 		if (cluster == bL_switcher_cpu_original_cluster[cpu])
5236b7437aeSNicolas Pitre 			continue;
5246b7437aeSNicolas Pitre 		init_completion(&t->started);
5256b7437aeSNicolas Pitre 		t->wanted_cluster = bL_switcher_cpu_original_cluster[cpu];
5266b7437aeSNicolas Pitre 		task = bL_switcher_thread_create(cpu, t);
5276b7437aeSNicolas Pitre 		if (!IS_ERR(task)) {
5286b7437aeSNicolas Pitre 			wait_for_completion(&t->started);
5296b7437aeSNicolas Pitre 			kthread_stop(task);
5306b7437aeSNicolas Pitre 			cluster = MPIDR_AFFINITY_LEVEL(cpu_logical_map(cpu), 1);
5316b7437aeSNicolas Pitre 			if (cluster == bL_switcher_cpu_original_cluster[cpu])
5326b7437aeSNicolas Pitre 				continue;
5336b7437aeSNicolas Pitre 		}
5346b7437aeSNicolas Pitre 		/* If execution gets here, we're in trouble. */
5356b7437aeSNicolas Pitre 		pr_crit("%s: unable to restore original cluster for CPU %d\n",
5366b7437aeSNicolas Pitre 			__func__, cpu);
5376b7437aeSNicolas Pitre 		pr_crit("%s: CPU %d can't be restored\n",
53838c35d4fSNicolas Pitre 			__func__, bL_switcher_cpu_pairing[cpu]);
53938c35d4fSNicolas Pitre 		cpumask_clear_cpu(bL_switcher_cpu_pairing[cpu],
54038c35d4fSNicolas Pitre 				  &bL_switcher_removed_logical_cpus);
5416b7437aeSNicolas Pitre 	}
5426b7437aeSNicolas Pitre 
5436b7437aeSNicolas Pitre 	bL_switcher_restore_cpus();
544*491990e2SDave Martin 	bL_activation_notify(BL_NOTIFY_POST_DISABLE);
545*491990e2SDave Martin 
546*491990e2SDave Martin out:
5476b7437aeSNicolas Pitre 	cpu_hotplug_driver_unlock();
548c0f43751SDave Martin 	mutex_unlock(&bL_switcher_activation_lock);
5496b7437aeSNicolas Pitre }
5506b7437aeSNicolas Pitre 
5516b7437aeSNicolas Pitre static ssize_t bL_switcher_active_show(struct kobject *kobj,
5526b7437aeSNicolas Pitre 		struct kobj_attribute *attr, char *buf)
5536b7437aeSNicolas Pitre {
5546b7437aeSNicolas Pitre 	return sprintf(buf, "%u\n", bL_switcher_active);
5556b7437aeSNicolas Pitre }
5566b7437aeSNicolas Pitre 
5576b7437aeSNicolas Pitre static ssize_t bL_switcher_active_store(struct kobject *kobj,
5586b7437aeSNicolas Pitre 		struct kobj_attribute *attr, const char *buf, size_t count)
5596b7437aeSNicolas Pitre {
5606b7437aeSNicolas Pitre 	int ret;
5616b7437aeSNicolas Pitre 
5626b7437aeSNicolas Pitre 	switch (buf[0]) {
5636b7437aeSNicolas Pitre 	case '0':
5646b7437aeSNicolas Pitre 		bL_switcher_disable();
5656b7437aeSNicolas Pitre 		ret = 0;
5666b7437aeSNicolas Pitre 		break;
5676b7437aeSNicolas Pitre 	case '1':
5686b7437aeSNicolas Pitre 		ret = bL_switcher_enable();
5696b7437aeSNicolas Pitre 		break;
5706b7437aeSNicolas Pitre 	default:
5716b7437aeSNicolas Pitre 		ret = -EINVAL;
5726b7437aeSNicolas Pitre 	}
5736b7437aeSNicolas Pitre 
5746b7437aeSNicolas Pitre 	return (ret >= 0) ? count : ret;
5756b7437aeSNicolas Pitre }
5766b7437aeSNicolas Pitre 
5776b7437aeSNicolas Pitre static struct kobj_attribute bL_switcher_active_attr =
5786b7437aeSNicolas Pitre 	__ATTR(active, 0644, bL_switcher_active_show, bL_switcher_active_store);
5796b7437aeSNicolas Pitre 
5806b7437aeSNicolas Pitre static struct attribute *bL_switcher_attrs[] = {
5816b7437aeSNicolas Pitre 	&bL_switcher_active_attr.attr,
5826b7437aeSNicolas Pitre 	NULL,
5836b7437aeSNicolas Pitre };
5846b7437aeSNicolas Pitre 
5856b7437aeSNicolas Pitre static struct attribute_group bL_switcher_attr_group = {
5866b7437aeSNicolas Pitre 	.attrs = bL_switcher_attrs,
5876b7437aeSNicolas Pitre };
5886b7437aeSNicolas Pitre 
5896b7437aeSNicolas Pitre static struct kobject *bL_switcher_kobj;
5906b7437aeSNicolas Pitre 
5916b7437aeSNicolas Pitre static int __init bL_switcher_sysfs_init(void)
5926b7437aeSNicolas Pitre {
5936b7437aeSNicolas Pitre 	int ret;
5946b7437aeSNicolas Pitre 
5956b7437aeSNicolas Pitre 	bL_switcher_kobj = kobject_create_and_add("bL_switcher", kernel_kobj);
5966b7437aeSNicolas Pitre 	if (!bL_switcher_kobj)
5976b7437aeSNicolas Pitre 		return -ENOMEM;
5986b7437aeSNicolas Pitre 	ret = sysfs_create_group(bL_switcher_kobj, &bL_switcher_attr_group);
5996b7437aeSNicolas Pitre 	if (ret)
6006b7437aeSNicolas Pitre 		kobject_put(bL_switcher_kobj);
6016b7437aeSNicolas Pitre 	return ret;
6026b7437aeSNicolas Pitre }
6036b7437aeSNicolas Pitre 
6046b7437aeSNicolas Pitre #endif  /* CONFIG_SYSFS */
6056b7437aeSNicolas Pitre 
606c0f43751SDave Martin bool bL_switcher_get_enabled(void)
607c0f43751SDave Martin {
608c0f43751SDave Martin 	mutex_lock(&bL_switcher_activation_lock);
609c0f43751SDave Martin 
610c0f43751SDave Martin 	return bL_switcher_active;
611c0f43751SDave Martin }
612c0f43751SDave Martin EXPORT_SYMBOL_GPL(bL_switcher_get_enabled);
613c0f43751SDave Martin 
614c0f43751SDave Martin void bL_switcher_put_enabled(void)
615c0f43751SDave Martin {
616c0f43751SDave Martin 	mutex_unlock(&bL_switcher_activation_lock);
617c0f43751SDave Martin }
618c0f43751SDave Martin EXPORT_SYMBOL_GPL(bL_switcher_put_enabled);
619c0f43751SDave Martin 
62027261435SNicolas Pitre /*
62127261435SNicolas Pitre  * Veto any CPU hotplug operation on those CPUs we've removed
62227261435SNicolas Pitre  * while the switcher is active.
62327261435SNicolas Pitre  * We're just not ready to deal with that given the trickery involved.
62427261435SNicolas Pitre  */
62527261435SNicolas Pitre static int bL_switcher_hotplug_callback(struct notifier_block *nfb,
62627261435SNicolas Pitre 					unsigned long action, void *hcpu)
62727261435SNicolas Pitre {
62827261435SNicolas Pitre 	if (bL_switcher_active) {
62927261435SNicolas Pitre 		int pairing = bL_switcher_cpu_pairing[(unsigned long)hcpu];
63027261435SNicolas Pitre 		switch (action & 0xf) {
63127261435SNicolas Pitre 		case CPU_UP_PREPARE:
63227261435SNicolas Pitre 		case CPU_DOWN_PREPARE:
63327261435SNicolas Pitre 			if (pairing == -1)
63427261435SNicolas Pitre 				return NOTIFY_BAD;
63527261435SNicolas Pitre 		}
63627261435SNicolas Pitre 	}
63727261435SNicolas Pitre 	return NOTIFY_DONE;
63827261435SNicolas Pitre }
63927261435SNicolas Pitre 
640c4821c05SNicolas Pitre static bool no_bL_switcher;
641c4821c05SNicolas Pitre core_param(no_bL_switcher, no_bL_switcher, bool, 0644);
642c4821c05SNicolas Pitre 
6436b7437aeSNicolas Pitre static int __init bL_switcher_init(void)
6446b7437aeSNicolas Pitre {
6456b7437aeSNicolas Pitre 	int ret;
6466b7437aeSNicolas Pitre 
6476b7437aeSNicolas Pitre 	if (MAX_NR_CLUSTERS != 2) {
6486b7437aeSNicolas Pitre 		pr_err("%s: only dual cluster systems are supported\n", __func__);
6496b7437aeSNicolas Pitre 		return -EINVAL;
6506b7437aeSNicolas Pitre 	}
6516b7437aeSNicolas Pitre 
65227261435SNicolas Pitre 	cpu_notifier(bL_switcher_hotplug_callback, 0);
65327261435SNicolas Pitre 
654c4821c05SNicolas Pitre 	if (!no_bL_switcher) {
6556b7437aeSNicolas Pitre 		ret = bL_switcher_enable();
6566b7437aeSNicolas Pitre 		if (ret)
6576b7437aeSNicolas Pitre 			return ret;
658c4821c05SNicolas Pitre 	}
6596b7437aeSNicolas Pitre 
6606b7437aeSNicolas Pitre #ifdef CONFIG_SYSFS
6616b7437aeSNicolas Pitre 	ret = bL_switcher_sysfs_init();
6626b7437aeSNicolas Pitre 	if (ret)
6636b7437aeSNicolas Pitre 		pr_err("%s: unable to create sysfs entry\n", __func__);
6646b7437aeSNicolas Pitre #endif
6656b7437aeSNicolas Pitre 
6666b7437aeSNicolas Pitre 	return 0;
6676b7437aeSNicolas Pitre }
6686b7437aeSNicolas Pitre 
66971ce1deeSNicolas Pitre late_initcall(bL_switcher_init);
670