include/asm-generic/spinlock.h

b2441318SGreg Kroah-Hartman/* SPDX-License-Identifier: GPL-2.0 */
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra/*
*1bce1112SPeter Zijlstra * 'Generic' ticket-lock implementation.
*1bce1112SPeter Zijlstra *
*1bce1112SPeter Zijlstra * It relies on atomic_fetch_add() having well defined forward progress
*1bce1112SPeter Zijlstra * guarantees under contention. If your architecture cannot provide this, stick
*1bce1112SPeter Zijlstra * to a test-and-set lock.
*1bce1112SPeter Zijlstra *
*1bce1112SPeter Zijlstra * It also relies on atomic_fetch_add() being safe vs smp_store_release() on a
*1bce1112SPeter Zijlstra * sub-word of the value. This is generally true for anything LL/SC although
*1bce1112SPeter Zijlstra * you'd be hard pressed to find anything useful in architecture specifications
*1bce1112SPeter Zijlstra * about this. If your architecture cannot do this you might be better off with
*1bce1112SPeter Zijlstra * a test-and-set.
*1bce1112SPeter Zijlstra *
*1bce1112SPeter Zijlstra * It further assumes atomic_*_release() + atomic_*_acquire() is RCpc and hence
*1bce1112SPeter Zijlstra * uses atomic_fetch_add() which is RCsc to create an RCsc hot path, along with
*1bce1112SPeter Zijlstra * a full fence after the spin to upgrade the otherwise-RCpc
*1bce1112SPeter Zijlstra * atomic_cond_read_acquire().
*1bce1112SPeter Zijlstra *
*1bce1112SPeter Zijlstra * The implementation uses smp_cond_load_acquire() to spin, so if the
*1bce1112SPeter Zijlstra * architecture has WFE like instructions to sleep instead of poll for word
*1bce1112SPeter Zijlstra * modifications be sure to implement that (see ARM64 for example).
*1bce1112SPeter Zijlstra *
*1bce1112SPeter Zijlstra */
*1bce1112SPeter Zijlstra
aafe4dbeSArnd Bergmann#ifndef __ASM_GENERIC_SPINLOCK_H
aafe4dbeSArnd Bergmann#define __ASM_GENERIC_SPINLOCK_H
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra#include <linux/atomic.h>
*1bce1112SPeter Zijlstra#include <asm-generic/spinlock_types.h>
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline void arch_spin_lock(arch_spinlock_t *lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	u32 val = atomic_fetch_add(1<<16, lock);
*1bce1112SPeter Zijlstra	u16 ticket = val >> 16;
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	if (ticket == (u16)val)
*1bce1112SPeter Zijlstra		return;
*1bce1112SPeter Zijlstra
aafe4dbeSArnd Bergmann	/*
*1bce1112SPeter Zijlstra	 * atomic_cond_read_acquire() is RCpc, but rather than defining a
*1bce1112SPeter Zijlstra	 * custom cond_read_rcsc() here we just emit a full fence.  We only
*1bce1112SPeter Zijlstra	 * need the prior reads before subsequent writes ordering from
*1bce1112SPeter Zijlstra	 * smb_mb(), but as atomic_cond_read_acquire() just emits reads and we
*1bce1112SPeter Zijlstra	 * have no outstanding writes due to the atomic_fetch_add() the extra
*1bce1112SPeter Zijlstra	 * orderings are free.
aafe4dbeSArnd Bergmann	 */
*1bce1112SPeter Zijlstra	atomic_cond_read_acquire(lock, ticket == (u16)VAL);
*1bce1112SPeter Zijlstra	smp_mb();
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline bool arch_spin_trylock(arch_spinlock_t *lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	u32 old = atomic_read(lock);
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	if ((old >> 16) != (old & 0xffff))
*1bce1112SPeter Zijlstra		return false;
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	return atomic_try_cmpxchg(lock, &old, old + (1<<16)); /* SC, for RCsc */
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline void arch_spin_unlock(arch_spinlock_t *lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	u16 *ptr = (u16 *)lock + IS_ENABLED(CONFIG_CPU_BIG_ENDIAN);
*1bce1112SPeter Zijlstra	u32 val = atomic_read(lock);
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	smp_store_release(ptr, (u16)val + 1);
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline int arch_spin_is_locked(arch_spinlock_t *lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	u32 val = atomic_read(lock);
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	return ((val >> 16) != (val & 0xffff));
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline int arch_spin_is_contended(arch_spinlock_t *lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	u32 val = atomic_read(lock);
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra	return (s16)((val >> 16) - (val & 0xffff)) > 1;
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstrastatic __always_inline int arch_spin_value_unlocked(arch_spinlock_t lock)
*1bce1112SPeter Zijlstra{
*1bce1112SPeter Zijlstra	return !arch_spin_is_locked(&lock);
*1bce1112SPeter Zijlstra}
*1bce1112SPeter Zijlstra
*1bce1112SPeter Zijlstra#include <asm/qrwlock.h>
aafe4dbeSArnd Bergmann
aafe4dbeSArnd Bergmann#endif /* __ASM_GENERIC_SPINLOCK_H */