include/asm/sfp-machine.h

d2b194edSKumar Gala/* Machine-dependent software floating-point definitions.  PPC version.
d2b194edSKumar Gala   Copyright (C) 1997 Free Software Foundation, Inc.
d2b194edSKumar Gala   This file is part of the GNU C Library.
d2b194edSKumar Gala
d2b194edSKumar Gala   The GNU C Library is free software; you can redistribute it and/or
d2b194edSKumar Gala   modify it under the terms of the GNU Library General Public License as
d2b194edSKumar Gala   published by the Free Software Foundation; either version 2 of the
d2b194edSKumar Gala   License, or (at your option) any later version.
d2b194edSKumar Gala
d2b194edSKumar Gala   The GNU C Library is distributed in the hope that it will be useful,
d2b194edSKumar Gala   but WITHOUT ANY WARRANTY; without even the implied warranty of
d2b194edSKumar Gala   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
d2b194edSKumar Gala   Library General Public License for more details.
d2b194edSKumar Gala
d2b194edSKumar Gala   You should have received a copy of the GNU Library General Public
d2b194edSKumar Gala   License along with the GNU C Library; see the file COPYING.LIB.  If
d2b194edSKumar Gala   not, write to the Free Software Foundation, Inc.,
d2b194edSKumar Gala   59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.
d2b194edSKumar Gala
d2b194edSKumar Gala   Actually, this is a PPC (32bit) version, written based on the
d2b194edSKumar Gala   i386, sparc, and sparc64 versions, by me,
d2b194edSKumar Gala   Peter Maydell (pmaydell@chiark.greenend.org.uk).
d2b194edSKumar Gala   Comments are by and large also mine, although they may be inaccurate.
d2b194edSKumar Gala
d2b194edSKumar Gala   In picking out asm fragments I've gone with the lowest common
d2b194edSKumar Gala   denominator, which also happens to be the hardware I have :->
d2b194edSKumar Gala   That is, a SPARC without hardware multiply and divide.
d2b194edSKumar Gala */
d2b194edSKumar Gala
d2b194edSKumar Gala/* basic word size definitions */
d2b194edSKumar Gala#define _FP_W_TYPE_SIZE		32
e60f57f5SKumar Gala#define _FP_W_TYPE		unsigned int
e60f57f5SKumar Gala#define _FP_WS_TYPE		signed int
e60f57f5SKumar Gala#define _FP_I_TYPE		int
d2b194edSKumar Gala
d2b194edSKumar Gala#define __ll_B			((UWtype) 1 << (W_TYPE_SIZE / 2))
d2b194edSKumar Gala#define __ll_lowpart(t)		((UWtype) (t) & (__ll_B - 1))
d2b194edSKumar Gala#define __ll_highpart(t)	((UWtype) (t) >> (W_TYPE_SIZE / 2))
d2b194edSKumar Gala
d2b194edSKumar Gala/* You can optionally code some things like addition in asm. For
d2b194edSKumar Gala * example, i386 defines __FP_FRAC_ADD_2 as asm. If you don't
d2b194edSKumar Gala * then you get a fragment of C code [if you change an #ifdef 0
d2b194edSKumar Gala * in op-2.h] or a call to add_ssaaaa (see below).
d2b194edSKumar Gala * Good places to look for asm fragments to use are gcc and glibc.
d2b194edSKumar Gala * gcc's longlong.h is useful.
d2b194edSKumar Gala */
d2b194edSKumar Gala
d2b194edSKumar Gala/* We need to know how to multiply and divide. If the host word size
d2b194edSKumar Gala * is >= 2*fracbits you can use FP_MUL_MEAT_n_imm(t,R,X,Y) which
d2b194edSKumar Gala * codes the multiply with whatever gcc does to 'a * b'.
d2b194edSKumar Gala * _FP_MUL_MEAT_n_wide(t,R,X,Y,f) is used when you have an asm
d2b194edSKumar Gala * function that can multiply two 1W values and get a 2W result.
d2b194edSKumar Gala * Otherwise you're stuck with _FP_MUL_MEAT_n_hard(t,R,X,Y) which
d2b194edSKumar Gala * does bitshifting to avoid overflow.
d2b194edSKumar Gala * For division there is FP_DIV_MEAT_n_imm(t,R,X,Y,f) for word size
d2b194edSKumar Gala * >= 2*fracbits, where f is either _FP_DIV_HELP_imm or
d2b194edSKumar Gala * _FP_DIV_HELP_ldiv (see op-1.h).
d2b194edSKumar Gala * _FP_DIV_MEAT_udiv() is if you have asm to do 2W/1W => (1W, 1W).
d2b194edSKumar Gala * [GCC and glibc have longlong.h which has the asm macro udiv_qrnnd
d2b194edSKumar Gala * to do this.]
d2b194edSKumar Gala * In general, 'n' is the number of words required to hold the type,
d2b194edSKumar Gala * and 't' is either S, D or Q for single/double/quad.
d2b194edSKumar Gala *           -- PMM
d2b194edSKumar Gala */
d2b194edSKumar Gala/* Example: SPARC64:
d2b194edSKumar Gala * #define _FP_MUL_MEAT_S(R,X,Y)	_FP_MUL_MEAT_1_imm(S,R,X,Y)
d2b194edSKumar Gala * #define _FP_MUL_MEAT_D(R,X,Y)	_FP_MUL_MEAT_1_wide(D,R,X,Y,umul_ppmm)
d2b194edSKumar Gala * #define _FP_MUL_MEAT_Q(R,X,Y)	_FP_MUL_MEAT_2_wide(Q,R,X,Y,umul_ppmm)
d2b194edSKumar Gala *
d2b194edSKumar Gala * #define _FP_DIV_MEAT_S(R,X,Y)	_FP_DIV_MEAT_1_imm(S,R,X,Y,_FP_DIV_HELP_imm)
d2b194edSKumar Gala * #define _FP_DIV_MEAT_D(R,X,Y)	_FP_DIV_MEAT_1_udiv(D,R,X,Y)
d2b194edSKumar Gala * #define _FP_DIV_MEAT_Q(R,X,Y)	_FP_DIV_MEAT_2_udiv_64(Q,R,X,Y)
d2b194edSKumar Gala *
d2b194edSKumar Gala * Example: i386:
d2b194edSKumar Gala * #define _FP_MUL_MEAT_S(R,X,Y)   _FP_MUL_MEAT_1_wide(S,R,X,Y,_i386_mul_32_64)
d2b194edSKumar Gala * #define _FP_MUL_MEAT_D(R,X,Y)   _FP_MUL_MEAT_2_wide(D,R,X,Y,_i386_mul_32_64)
d2b194edSKumar Gala *
d2b194edSKumar Gala * #define _FP_DIV_MEAT_S(R,X,Y)   _FP_DIV_MEAT_1_udiv(S,R,X,Y,_i386_div_64_32)
d2b194edSKumar Gala * #define _FP_DIV_MEAT_D(R,X,Y)   _FP_DIV_MEAT_2_udiv_64(D,R,X,Y)
d2b194edSKumar Gala */
d2b194edSKumar Gala
d2b194edSKumar Gala#define _FP_MUL_MEAT_S(R,X,Y)   _FP_MUL_MEAT_1_wide(_FP_WFRACBITS_S,R,X,Y,umul_ppmm)
d2b194edSKumar Gala#define _FP_MUL_MEAT_D(R,X,Y)   _FP_MUL_MEAT_2_wide(_FP_WFRACBITS_D,R,X,Y,umul_ppmm)
d2b194edSKumar Gala
cf030336SLiu Yu#define _FP_DIV_MEAT_S(R,X,Y)	_FP_DIV_MEAT_1_udiv_norm(S,R,X,Y)
d2b194edSKumar Gala#define _FP_DIV_MEAT_D(R,X,Y)	_FP_DIV_MEAT_2_udiv(D,R,X,Y)
d2b194edSKumar Gala
d2b194edSKumar Gala/* These macros define what NaN looks like. They're supposed to expand to
d2b194edSKumar Gala * a comma-separated set of 32bit unsigned ints that encode NaN.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define _FP_NANFRAC_S		((_FP_QNANBIT_S << 1) - 1)
d2b194edSKumar Gala#define _FP_NANFRAC_D		((_FP_QNANBIT_D << 1) - 1), -1
d2b194edSKumar Gala#define _FP_NANFRAC_Q		((_FP_QNANBIT_Q << 1) - 1), -1, -1, -1
d2b194edSKumar Gala#define _FP_NANSIGN_S		0
d2b194edSKumar Gala#define _FP_NANSIGN_D		0
d2b194edSKumar Gala#define _FP_NANSIGN_Q		0
d2b194edSKumar Gala
d2b194edSKumar Gala#define _FP_KEEPNANFRACP 1
d2b194edSKumar Gala
6a800f36SLiu Yu#ifdef FP_EX_BOOKE_E500_SPE
6a800f36SLiu Yu#define FP_EX_INEXACT		(1 << 21)
6a800f36SLiu Yu#define FP_EX_INVALID		(1 << 20)
6a800f36SLiu Yu#define FP_EX_DIVZERO		(1 << 19)
6a800f36SLiu Yu#define FP_EX_UNDERFLOW		(1 << 18)
6a800f36SLiu Yu#define FP_EX_OVERFLOW		(1 << 17)
6a800f36SLiu Yu#define FP_INHIBIT_RESULTS	0
6a800f36SLiu Yu
6a800f36SLiu Yu#define __FPU_FPSCR	(current->thread.spefscr)
6a800f36SLiu Yu#define __FPU_ENABLED_EXC		\
6a800f36SLiu Yu({					\
6a800f36SLiu Yu	(__FPU_FPSCR >> 2) & 0x1f;	\
6a800f36SLiu Yu})
6a800f36SLiu Yu#else
d2b194edSKumar Gala/* Exception flags.  We use the bit positions of the appropriate bits
d2b194edSKumar Gala   in the FPSCR, which also correspond to the FE_* bits.  This makes
d2b194edSKumar Gala   everything easier ;-).  */
d2b194edSKumar Gala#define FP_EX_INVALID         (1 << (31 - 2))
d2b194edSKumar Gala#define FP_EX_INVALID_SNAN	EFLAG_VXSNAN
d2b194edSKumar Gala#define FP_EX_INVALID_ISI	EFLAG_VXISI
d2b194edSKumar Gala#define FP_EX_INVALID_IDI	EFLAG_VXIDI
d2b194edSKumar Gala#define FP_EX_INVALID_ZDZ	EFLAG_VXZDZ
d2b194edSKumar Gala#define FP_EX_INVALID_IMZ	EFLAG_VXIMZ
d2b194edSKumar Gala#define FP_EX_OVERFLOW        (1 << (31 - 3))
d2b194edSKumar Gala#define FP_EX_UNDERFLOW       (1 << (31 - 4))
d2b194edSKumar Gala#define FP_EX_DIVZERO         (1 << (31 - 5))
d2b194edSKumar Gala#define FP_EX_INEXACT         (1 << (31 - 6))
d2b194edSKumar Gala
de79f7b9SPaul Mackerras#define __FPU_FPSCR	(current->thread.fp_state.fpscr)
6a800f36SLiu Yu
6a800f36SLiu Yu/* We only actually write to the destination register
6a800f36SLiu Yu * if exceptions signalled (if any) will not trap.
6a800f36SLiu Yu */
6a800f36SLiu Yu#define __FPU_ENABLED_EXC \
6a800f36SLiu Yu({						\
6a800f36SLiu Yu	(__FPU_FPSCR >> 3) & 0x1f;	\
6a800f36SLiu Yu})
6a800f36SLiu Yu
6a800f36SLiu Yu#endif
6a800f36SLiu Yu
463a8c01SLiu Yu/*
463a8c01SLiu Yu * If one NaN is signaling and the other is not,
463a8c01SLiu Yu * we choose that one, otherwise we choose X.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define _FP_CHOOSENAN(fs, wc, R, X, Y, OP)			\
d2b194edSKumar Gala  do {								\
463a8c01SLiu Yu    if ((_FP_FRAC_HIGH_RAW_##fs(Y) & _FP_QNANBIT_##fs)		\
463a8c01SLiu Yu	&& !(_FP_FRAC_HIGH_RAW_##fs(X) & _FP_QNANBIT_##fs))	\
463a8c01SLiu Yu      {								\
463a8c01SLiu Yu	R##_s = X##_s;						\
463a8c01SLiu Yu	_FP_FRAC_COPY_##wc(R,X);				\
463a8c01SLiu Yu      }								\
463a8c01SLiu Yu    else							\
463a8c01SLiu Yu      {								\
d2b194edSKumar Gala	R##_s = Y##_s;						\
d2b194edSKumar Gala	_FP_FRAC_COPY_##wc(R,Y);				\
463a8c01SLiu Yu      }								\
d2b194edSKumar Gala    R##_c = FP_CLS_NAN;						\
d2b194edSKumar Gala  } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala
d2b194edSKumar Gala#include <linux/kernel.h>
d2b194edSKumar Gala#include <linux/sched.h>
d2b194edSKumar Gala
d2b194edSKumar Gala#define __FPU_TRAP_P(bits) \
d2b194edSKumar Gala	((__FPU_ENABLED_EXC & (bits)) != 0)
d2b194edSKumar Gala
d2b194edSKumar Gala#define __FP_PACK_S(val,X)			\
d2b194edSKumar Gala({  int __exc = _FP_PACK_CANONICAL(S,1,X);	\
d2b194edSKumar Gala    if(!__exc || !__FPU_TRAP_P(__exc))		\
d2b194edSKumar Gala        _FP_PACK_RAW_1_P(S,val,X);		\
d2b194edSKumar Gala    __exc;					\
d2b194edSKumar Gala})
d2b194edSKumar Gala
d2b194edSKumar Gala#define __FP_PACK_D(val,X)			\
d2b194edSKumar Gala   do {									\
d2b194edSKumar Gala	_FP_PACK_CANONICAL(D, 2, X);					\
d2b194edSKumar Gala	if (!FP_CUR_EXCEPTIONS || !__FPU_TRAP_P(FP_CUR_EXCEPTIONS))	\
d2b194edSKumar Gala		_FP_PACK_RAW_2_P(D, val, X);				\
d2b194edSKumar Gala   } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala#define __FP_PACK_DS(val,X)							\
d2b194edSKumar Gala   do {										\
d2b194edSKumar Gala	   FP_DECL_S(__X);							\
d2b194edSKumar Gala	   FP_CONV(S, D, 1, 2, __X, X);						\
d2b194edSKumar Gala	   _FP_PACK_CANONICAL(S, 1, __X);					\
d2b194edSKumar Gala	   if (!FP_CUR_EXCEPTIONS || !__FPU_TRAP_P(FP_CUR_EXCEPTIONS)) {	\
d2b194edSKumar Gala		   _FP_UNPACK_CANONICAL(S, 1, __X);				\
d2b194edSKumar Gala		   FP_CONV(D, S, 2, 1, X, __X);					\
d2b194edSKumar Gala		   _FP_PACK_CANONICAL(D, 2, X);					\
d2b194edSKumar Gala		   if (!FP_CUR_EXCEPTIONS || !__FPU_TRAP_P(FP_CUR_EXCEPTIONS))	\
d2b194edSKumar Gala		   _FP_PACK_RAW_2_P(D, val, X);					\
d2b194edSKumar Gala	   }									\
d2b194edSKumar Gala   } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala/* Obtain the current rounding mode. */
d2b194edSKumar Gala#define FP_ROUNDMODE			\
d2b194edSKumar Gala({					\
d2b194edSKumar Gala	__FPU_FPSCR & 0x3;		\
d2b194edSKumar Gala})
d2b194edSKumar Gala
d2b194edSKumar Gala/* the asm fragments go here: all these are taken from glibc-2.0.5's
d2b194edSKumar Gala * stdlib/longlong.h
d2b194edSKumar Gala */
d2b194edSKumar Gala
d2b194edSKumar Gala#include <linux/types.h>
d2b194edSKumar Gala#include <asm/byteorder.h>
d2b194edSKumar Gala
d2b194edSKumar Gala/* add_ssaaaa is used in op-2.h and should be equivalent to
d2b194edSKumar Gala * #define add_ssaaaa(sh,sl,ah,al,bh,bl) (sh = ah+bh+ (( sl = al+bl) < al))
d2b194edSKumar Gala * add_ssaaaa(high_sum, low_sum, high_addend_1, low_addend_1,
d2b194edSKumar Gala * high_addend_2, low_addend_2) adds two UWtype integers, composed by
d2b194edSKumar Gala * HIGH_ADDEND_1 and LOW_ADDEND_1, and HIGH_ADDEND_2 and LOW_ADDEND_2
d2b194edSKumar Gala * respectively.  The result is placed in HIGH_SUM and LOW_SUM.  Overflow
d2b194edSKumar Gala * (i.e. carry out) is not stored anywhere, and is lost.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define add_ssaaaa(sh, sl, ah, al, bh, bl) \
d2b194edSKumar Gala  do {									\
d2b194edSKumar Gala    if (__builtin_constant_p (bh) && (bh) == 0)				\
b682c869SJoel Stanley      __asm__ ("add%I4c %1,%3,%4\n\taddze %0,%2"		\
b682c869SJoel Stanley	     : "=r" (sh), "=&r" (sl) : "r" (ah), "%r" (al), "rI" (bl));\
d2b194edSKumar Gala    else if (__builtin_constant_p (bh) && (bh) == ~(USItype) 0)		\
b682c869SJoel Stanley      __asm__ ("add%I4c %1,%3,%4\n\taddme %0,%2"		\
b682c869SJoel Stanley	     : "=r" (sh), "=&r" (sl) : "r" (ah), "%r" (al), "rI" (bl));\
d2b194edSKumar Gala    else								\
b682c869SJoel Stanley      __asm__ ("add%I5c %1,%4,%5\n\tadde %0,%2,%3"		\
b682c869SJoel Stanley	     : "=r" (sh), "=&r" (sl)					\
b682c869SJoel Stanley	     : "%r" (ah), "r" (bh), "%r" (al), "rI" (bl));		\
d2b194edSKumar Gala  } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala/* sub_ddmmss is used in op-2.h and udivmodti4.c and should be equivalent to
d2b194edSKumar Gala * #define sub_ddmmss(sh, sl, ah, al, bh, bl) (sh = ah-bh - ((sl = al-bl) > al))
d2b194edSKumar Gala * sub_ddmmss(high_difference, low_difference, high_minuend, low_minuend,
d2b194edSKumar Gala * high_subtrahend, low_subtrahend) subtracts two two-word UWtype integers,
d2b194edSKumar Gala * composed by HIGH_MINUEND_1 and LOW_MINUEND_1, and HIGH_SUBTRAHEND_2 and
d2b194edSKumar Gala * LOW_SUBTRAHEND_2 respectively.  The result is placed in HIGH_DIFFERENCE
d2b194edSKumar Gala * and LOW_DIFFERENCE.  Overflow (i.e. carry out) is not stored anywhere,
d2b194edSKumar Gala * and is lost.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define sub_ddmmss(sh, sl, ah, al, bh, bl) \
d2b194edSKumar Gala  do {									\
d2b194edSKumar Gala    if (__builtin_constant_p (ah) && (ah) == 0)				\
b682c869SJoel Stanley      __asm__ ("subf%I3c %1,%4,%3\n\tsubfze %0,%2"	\
b682c869SJoel Stanley	       : "=r" (sh), "=&r" (sl) : "r" (bh), "rI" (al), "r" (bl));\
d2b194edSKumar Gala    else if (__builtin_constant_p (ah) && (ah) == ~(USItype) 0)		\
b682c869SJoel Stanley      __asm__ ("subf%I3c %1,%4,%3\n\tsubfme %0,%2"	\
b682c869SJoel Stanley	       : "=r" (sh), "=&r" (sl) : "r" (bh), "rI" (al), "r" (bl));\
d2b194edSKumar Gala    else if (__builtin_constant_p (bh) && (bh) == 0)			\
b682c869SJoel Stanley      __asm__ ("subf%I3c %1,%4,%3\n\taddme %0,%2"		\
b682c869SJoel Stanley	       : "=r" (sh), "=&r" (sl) : "r" (ah), "rI" (al), "r" (bl));\
d2b194edSKumar Gala    else if (__builtin_constant_p (bh) && (bh) == ~(USItype) 0)		\
b682c869SJoel Stanley      __asm__ ("subf%I3c %1,%4,%3\n\taddze %0,%2"		\
b682c869SJoel Stanley	       : "=r" (sh), "=&r" (sl) : "r" (ah), "rI" (al), "r" (bl));\
d2b194edSKumar Gala    else								\
b682c869SJoel Stanley      __asm__ ("subf%I4c %1,%5,%4\n\tsubfe %0,%3,%2"	\
b682c869SJoel Stanley	       : "=r" (sh), "=&r" (sl)					\
b682c869SJoel Stanley	       : "r" (ah), "r" (bh), "rI" (al), "r" (bl));		\
d2b194edSKumar Gala  } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala/* asm fragments for mul and div */
d2b194edSKumar Gala
d2b194edSKumar Gala/* umul_ppmm(high_prod, low_prod, multipler, multiplicand) multiplies two
d2b194edSKumar Gala * UWtype integers MULTIPLER and MULTIPLICAND, and generates a two UWtype
d2b194edSKumar Gala * word product in HIGH_PROD and LOW_PROD.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define umul_ppmm(ph, pl, m0, m1) \
d2b194edSKumar Gala  do {									\
d2b194edSKumar Gala    USItype __m0 = (m0), __m1 = (m1);					\
b682c869SJoel Stanley    __asm__ ("mulhwu %0,%1,%2" : "=r" (ph) : "%r" (m0), "r" (m1));	\
d2b194edSKumar Gala    (pl) = __m0 * __m1;							\
d2b194edSKumar Gala  } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala/* udiv_qrnnd(quotient, remainder, high_numerator, low_numerator,
d2b194edSKumar Gala * denominator) divides a UDWtype, composed by the UWtype integers
d2b194edSKumar Gala * HIGH_NUMERATOR and LOW_NUMERATOR, by DENOMINATOR and places the quotient
d2b194edSKumar Gala * in QUOTIENT and the remainder in REMAINDER.  HIGH_NUMERATOR must be less
d2b194edSKumar Gala * than DENOMINATOR for correct operation.  If, in addition, the most
d2b194edSKumar Gala * significant bit of DENOMINATOR must be 1, then the pre-processor symbol
d2b194edSKumar Gala * UDIV_NEEDS_NORMALIZATION is defined to 1.
d2b194edSKumar Gala */
d2b194edSKumar Gala#define udiv_qrnnd(q, r, n1, n0, d) \
d2b194edSKumar Gala  do {									\
b682c869SJoel Stanley    UWtype __d1, __d0, __q1, __q0;					\
b682c869SJoel Stanley    UWtype __r1, __r0, __m;						\
d2b194edSKumar Gala    __d1 = __ll_highpart (d);						\
d2b194edSKumar Gala    __d0 = __ll_lowpart (d);						\
d2b194edSKumar Gala									\
d2b194edSKumar Gala    __r1 = (n1) % __d1;							\
d2b194edSKumar Gala    __q1 = (n1) / __d1;							\
d2b194edSKumar Gala    __m = (UWtype) __q1 * __d0;						\
d2b194edSKumar Gala    __r1 = __r1 * __ll_B | __ll_highpart (n0);				\
d2b194edSKumar Gala    if (__r1 < __m)							\
d2b194edSKumar Gala      {									\
d2b194edSKumar Gala	__q1--, __r1 += (d);						\
b682c869SJoel Stanley	if (__r1 >= (d)) /* i.e. we didn't get carry when adding to __r1 */\
d2b194edSKumar Gala	  if (__r1 < __m)						\
d2b194edSKumar Gala	    __q1--, __r1 += (d);					\
d2b194edSKumar Gala      }									\
d2b194edSKumar Gala    __r1 -= __m;							\
d2b194edSKumar Gala									\
d2b194edSKumar Gala    __r0 = __r1 % __d1;							\
d2b194edSKumar Gala    __q0 = __r1 / __d1;							\
d2b194edSKumar Gala    __m = (UWtype) __q0 * __d0;						\
d2b194edSKumar Gala    __r0 = __r0 * __ll_B | __ll_lowpart (n0);				\
d2b194edSKumar Gala    if (__r0 < __m)							\
d2b194edSKumar Gala      {									\
d2b194edSKumar Gala	__q0--, __r0 += (d);						\
d2b194edSKumar Gala	if (__r0 >= (d))						\
d2b194edSKumar Gala	  if (__r0 < __m)						\
d2b194edSKumar Gala	    __q0--, __r0 += (d);					\
d2b194edSKumar Gala      }									\
d2b194edSKumar Gala    __r0 -= __m;							\
d2b194edSKumar Gala									\
d2b194edSKumar Gala    (q) = (UWtype) __q1 * __ll_B | __q0;				\
d2b194edSKumar Gala    (r) = __r0;								\
d2b194edSKumar Gala  } while (0)
d2b194edSKumar Gala
d2b194edSKumar Gala#define UDIV_NEEDS_NORMALIZATION 1
d2b194edSKumar Gala
d2b194edSKumar Gala#define abort()								\
d2b194edSKumar Gala	return 0
d2b194edSKumar Gala
13da9e20SLinus Torvalds#ifdef __BIG_ENDIAN
13da9e20SLinus Torvalds#define __BYTE_ORDER __BIG_ENDIAN
13da9e20SLinus Torvalds#else
13da9e20SLinus Torvalds#define __BYTE_ORDER __LITTLE_ENDIAN
13da9e20SLinus Torvalds#endif
13da9e20SLinus Torvalds
d2b194edSKumar Gala/* Exception flags. */
d2b194edSKumar Gala#define EFLAG_INVALID		(1 << (31 - 2))
d2b194edSKumar Gala#define EFLAG_OVERFLOW		(1 << (31 - 3))
d2b194edSKumar Gala#define EFLAG_UNDERFLOW		(1 << (31 - 4))
d2b194edSKumar Gala#define EFLAG_DIVZERO		(1 << (31 - 5))
d2b194edSKumar Gala#define EFLAG_INEXACT		(1 << (31 - 6))
d2b194edSKumar Gala
d2b194edSKumar Gala#define EFLAG_VXSNAN		(1 << (31 - 7))
d2b194edSKumar Gala#define EFLAG_VXISI		(1 << (31 - 8))
d2b194edSKumar Gala#define EFLAG_VXIDI		(1 << (31 - 9))
d2b194edSKumar Gala#define EFLAG_VXZDZ		(1 << (31 - 10))
d2b194edSKumar Gala#define EFLAG_VXIMZ		(1 << (31 - 11))
d2b194edSKumar Gala#define EFLAG_VXVC		(1 << (31 - 12))
d2b194edSKumar Gala#define EFLAG_VXSOFT		(1 << (31 - 21))
d2b194edSKumar Gala#define EFLAG_VXSQRT		(1 << (31 - 22))
d2b194edSKumar Gala#define EFLAG_VXCVI		(1 << (31 - 23))