include/math-emu/op-2.h

1da177e4SLinus Torvalds/* Software floating-point emulation.
1da177e4SLinus Torvalds   Basic two-word fraction declaration and manipulation.
1da177e4SLinus Torvalds   Copyright (C) 1997,1998,1999 Free Software Foundation, Inc.
1da177e4SLinus Torvalds   This file is part of the GNU C Library.
1da177e4SLinus Torvalds   Contributed by Richard Henderson (rth@cygnus.com),
1da177e4SLinus Torvalds		  Jakub Jelinek (jj@ultra.linux.cz),
1da177e4SLinus Torvalds		  David S. Miller (davem@redhat.com) and
1da177e4SLinus Torvalds		  Peter Maydell (pmaydell@chiark.greenend.org.uk).
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   The GNU C Library is free software; you can redistribute it and/or
1da177e4SLinus Torvalds   modify it under the terms of the GNU Library General Public License as
1da177e4SLinus Torvalds   published by the Free Software Foundation; either version 2 of the
1da177e4SLinus Torvalds   License, or (at your option) any later version.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   The GNU C Library is distributed in the hope that it will be useful,
1da177e4SLinus Torvalds   but WITHOUT ANY WARRANTY; without even the implied warranty of
1da177e4SLinus Torvalds   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
1da177e4SLinus Torvalds   Library General Public License for more details.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   You should have received a copy of the GNU Library General Public
1da177e4SLinus Torvalds   License along with the GNU C Library; see the file COPYING.LIB.  If
1da177e4SLinus Torvalds   not, write to the Free Software Foundation, Inc.,
1da177e4SLinus Torvalds   59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.  */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#ifndef __MATH_EMU_OP_2_H__
1da177e4SLinus Torvalds#define __MATH_EMU_OP_2_H__
1da177e4SLinus Torvalds
40d3057aSKumar Gala#define _FP_FRAC_DECL_2(X)	_FP_W_TYPE X##_f0 = 0, X##_f1 = 0
1da177e4SLinus Torvalds#define _FP_FRAC_COPY_2(D,S)	(D##_f0 = S##_f0, D##_f1 = S##_f1)
1da177e4SLinus Torvalds#define _FP_FRAC_SET_2(X,I)	__FP_FRAC_SET_2(X, I)
1da177e4SLinus Torvalds#define _FP_FRAC_HIGH_2(X)	(X##_f1)
1da177e4SLinus Torvalds#define _FP_FRAC_LOW_2(X)	(X##_f0)
1da177e4SLinus Torvalds#define _FP_FRAC_WORD_2(X,w)	(X##_f##w)
7adb3e99SVincent Chen#define _FP_FRAC_SLL_2(X, N) (						       \
7adb3e99SVincent Chen	(void) (((N) < _FP_W_TYPE_SIZE)					       \
7adb3e99SVincent Chen	  ? ({								       \
7adb3e99SVincent Chen		if (__builtin_constant_p(N) && (N) == 1) {		       \
7adb3e99SVincent Chen			X##_f1 = X##_f1 + X##_f1 +			       \
7adb3e99SVincent Chen				(((_FP_WS_TYPE) (X##_f0)) < 0);		       \
1da177e4SLinus Torvalds			X##_f0 += X##_f0;				       \
7adb3e99SVincent Chen		} else {						       \
7adb3e99SVincent Chen			X##_f1 = X##_f1 << (N) | X##_f0 >>		       \
7adb3e99SVincent Chen						(_FP_W_TYPE_SIZE - (N));       \
1da177e4SLinus Torvalds			X##_f0 <<= (N);					       \
1da177e4SLinus Torvalds		}							       \
7adb3e99SVincent Chen		0;							       \
7adb3e99SVincent Chen	    })								       \
7adb3e99SVincent Chen	  : ({								       \
1da177e4SLinus Torvalds	      X##_f1 = X##_f0 << ((N) - _FP_W_TYPE_SIZE);		       \
1da177e4SLinus Torvalds	      X##_f0 = 0;						       \
7adb3e99SVincent Chen	  })))
1da177e4SLinus Torvalds
7adb3e99SVincent Chen
7adb3e99SVincent Chen#define _FP_FRAC_SRL_2(X, N) (						       \
7adb3e99SVincent Chen	(void) (((N) < _FP_W_TYPE_SIZE)					       \
7adb3e99SVincent Chen	  ? ({								       \
1da177e4SLinus Torvalds	      X##_f0 = X##_f0 >> (N) | X##_f1 << (_FP_W_TYPE_SIZE - (N));      \
1da177e4SLinus Torvalds	      X##_f1 >>= (N);						       \
7adb3e99SVincent Chen	    })								       \
7adb3e99SVincent Chen	  : ({								       \
1da177e4SLinus Torvalds	      X##_f0 = X##_f1 >> ((N) - _FP_W_TYPE_SIZE);		       \
1da177e4SLinus Torvalds	      X##_f1 = 0;						       \
7adb3e99SVincent Chen	    })))
7adb3e99SVincent Chen
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Right shift with sticky-lsb.  */
7adb3e99SVincent Chen#define _FP_FRAC_SRS_2(X, N, sz) (					       \
7adb3e99SVincent Chen	(void) (((N) < _FP_W_TYPE_SIZE)					       \
7adb3e99SVincent Chen	  ? ({								       \
7adb3e99SVincent Chen	      X##_f0 = (X##_f1 << (_FP_W_TYPE_SIZE - (N)) | X##_f0 >> (N)      \
7adb3e99SVincent Chen			| (__builtin_constant_p(N) && (N) == 1		       \
1da177e4SLinus Torvalds			   ? X##_f0 & 1					       \
1da177e4SLinus Torvalds			   : (X##_f0 << (_FP_W_TYPE_SIZE - (N))) != 0));       \
1da177e4SLinus Torvalds		X##_f1 >>= (N);						       \
7adb3e99SVincent Chen	    })								       \
7adb3e99SVincent Chen	  : ({								       \
7adb3e99SVincent Chen	      X##_f0 = (X##_f1 >> ((N) - _FP_W_TYPE_SIZE)		       \
7adb3e99SVincent Chen			| ((((N) == _FP_W_TYPE_SIZE			       \
7adb3e99SVincent Chen			     ? 0					       \
7adb3e99SVincent Chen			     : (X##_f1 << (2*_FP_W_TYPE_SIZE - (N))))          \
7adb3e99SVincent Chen			    | X##_f0) != 0));				       \
1da177e4SLinus Torvalds	      X##_f1 = 0;						       \
7adb3e99SVincent Chen	    })))
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_ADDI_2(X,I)	\
1da177e4SLinus Torvalds  __FP_FRAC_ADDI_2(X##_f1, X##_f0, I)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_ADD_2(R,X,Y)	\
1da177e4SLinus Torvalds  __FP_FRAC_ADD_2(R##_f1, R##_f0, X##_f1, X##_f0, Y##_f1, Y##_f0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_SUB_2(R,X,Y)	\
1da177e4SLinus Torvalds  __FP_FRAC_SUB_2(R##_f1, R##_f0, X##_f1, X##_f0, Y##_f1, Y##_f0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_DEC_2(X,Y)	\
1da177e4SLinus Torvalds  __FP_FRAC_DEC_2(X##_f1, X##_f0, Y##_f1, Y##_f0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_CLZ_2(R,X)	\
1da177e4SLinus Torvalds  do {				\
1da177e4SLinus Torvalds    if (X##_f1)			\
1da177e4SLinus Torvalds      __FP_CLZ(R,X##_f1);	\
1da177e4SLinus Torvalds    else 			\
1da177e4SLinus Torvalds    {				\
1da177e4SLinus Torvalds      __FP_CLZ(R,X##_f0);	\
1da177e4SLinus Torvalds      R += _FP_W_TYPE_SIZE;	\
1da177e4SLinus Torvalds    }				\
1da177e4SLinus Torvalds  } while(0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Predicates */
1da177e4SLinus Torvalds#define _FP_FRAC_NEGP_2(X)	((_FP_WS_TYPE)X##_f1 < 0)
1da177e4SLinus Torvalds#define _FP_FRAC_ZEROP_2(X)	((X##_f1 | X##_f0) == 0)
1da177e4SLinus Torvalds#define _FP_FRAC_OVERP_2(fs,X)	(_FP_FRAC_HIGH_##fs(X) & _FP_OVERFLOW_##fs)
1da177e4SLinus Torvalds#define _FP_FRAC_CLEAR_OVERP_2(fs,X)	(_FP_FRAC_HIGH_##fs(X) &= ~_FP_OVERFLOW_##fs)
1da177e4SLinus Torvalds#define _FP_FRAC_EQ_2(X, Y)	(X##_f1 == Y##_f1 && X##_f0 == Y##_f0)
1da177e4SLinus Torvalds#define _FP_FRAC_GT_2(X, Y)	\
1da177e4SLinus Torvalds  (X##_f1 > Y##_f1 || (X##_f1 == Y##_f1 && X##_f0 > Y##_f0))
1da177e4SLinus Torvalds#define _FP_FRAC_GE_2(X, Y)	\
1da177e4SLinus Torvalds  (X##_f1 > Y##_f1 || (X##_f1 == Y##_f1 && X##_f0 >= Y##_f0))
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_ZEROFRAC_2		0, 0
1da177e4SLinus Torvalds#define _FP_MINFRAC_2		0, 1
1da177e4SLinus Torvalds#define _FP_MAXFRAC_2		(~(_FP_WS_TYPE)0), (~(_FP_WS_TYPE)0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Internals
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define __FP_FRAC_SET_2(X,I1,I0)	(X##_f0 = I0, X##_f1 = I1)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define __FP_CLZ_2(R, xh, xl)	\
1da177e4SLinus Torvalds  do {				\
1da177e4SLinus Torvalds    if (xh)			\
1da177e4SLinus Torvalds      __FP_CLZ(R,xh);		\
1da177e4SLinus Torvalds    else 			\
1da177e4SLinus Torvalds    {				\
1da177e4SLinus Torvalds      __FP_CLZ(R,xl);		\
1da177e4SLinus Torvalds      R += _FP_W_TYPE_SIZE;	\
1da177e4SLinus Torvalds    }				\
1da177e4SLinus Torvalds  } while(0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#if 0
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#ifndef __FP_FRAC_ADDI_2
1da177e4SLinus Torvalds#define __FP_FRAC_ADDI_2(xh, xl, i)	\
1da177e4SLinus Torvalds  (xh += ((xl += i) < i))
1da177e4SLinus Torvalds#endif
1da177e4SLinus Torvalds#ifndef __FP_FRAC_ADD_2
1da177e4SLinus Torvalds#define __FP_FRAC_ADD_2(rh, rl, xh, xl, yh, yl)	\
1da177e4SLinus Torvalds  (rh = xh + yh + ((rl = xl + yl) < xl))
1da177e4SLinus Torvalds#endif
1da177e4SLinus Torvalds#ifndef __FP_FRAC_SUB_2
1da177e4SLinus Torvalds#define __FP_FRAC_SUB_2(rh, rl, xh, xl, yh, yl)	\
1da177e4SLinus Torvalds  (rh = xh - yh - ((rl = xl - yl) > xl))
1da177e4SLinus Torvalds#endif
1da177e4SLinus Torvalds#ifndef __FP_FRAC_DEC_2
1da177e4SLinus Torvalds#define __FP_FRAC_DEC_2(xh, xl, yh, yl)	\
1da177e4SLinus Torvalds  do {					\
1da177e4SLinus Torvalds    UWtype _t = xl;			\
1da177e4SLinus Torvalds    xh -= yh + ((xl -= yl) > _t);	\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds#endif
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#else
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#undef __FP_FRAC_ADDI_2
1da177e4SLinus Torvalds#define __FP_FRAC_ADDI_2(xh, xl, i)	add_ssaaaa(xh, xl, xh, xl, 0, i)
1da177e4SLinus Torvalds#undef __FP_FRAC_ADD_2
1da177e4SLinus Torvalds#define __FP_FRAC_ADD_2			add_ssaaaa
1da177e4SLinus Torvalds#undef __FP_FRAC_SUB_2
1da177e4SLinus Torvalds#define __FP_FRAC_SUB_2			sub_ddmmss
1da177e4SLinus Torvalds#undef __FP_FRAC_DEC_2
1da177e4SLinus Torvalds#define __FP_FRAC_DEC_2(xh, xl, yh, yl)	sub_ddmmss(xh, xl, xh, xl, yh, yl)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#endif
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Unpack the raw bits of a native fp value.  Do not classify or
1da177e4SLinus Torvalds * normalize the data.
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_UNPACK_RAW_2(fs, X, val)			\
1da177e4SLinus Torvalds  do {							\
1da177e4SLinus Torvalds    union _FP_UNION_##fs _flo; _flo.flt = (val);	\
1da177e4SLinus Torvalds							\
1da177e4SLinus Torvalds    X##_f0 = _flo.bits.frac0;				\
1da177e4SLinus Torvalds    X##_f1 = _flo.bits.frac1;				\
1da177e4SLinus Torvalds    X##_e  = _flo.bits.exp;				\
1da177e4SLinus Torvalds    X##_s  = _flo.bits.sign;				\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_UNPACK_RAW_2_P(fs, X, val)			\
1da177e4SLinus Torvalds  do {							\
1da177e4SLinus Torvalds    union _FP_UNION_##fs *_flo =			\
1da177e4SLinus Torvalds      (union _FP_UNION_##fs *)(val);			\
1da177e4SLinus Torvalds							\
1da177e4SLinus Torvalds    X##_f0 = _flo->bits.frac0;				\
1da177e4SLinus Torvalds    X##_f1 = _flo->bits.frac1;				\
1da177e4SLinus Torvalds    X##_e  = _flo->bits.exp;				\
1da177e4SLinus Torvalds    X##_s  = _flo->bits.sign;				\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Repack the raw bits of a native fp value.
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_PACK_RAW_2(fs, val, X)			\
1da177e4SLinus Torvalds  do {							\
1da177e4SLinus Torvalds    union _FP_UNION_##fs _flo;				\
1da177e4SLinus Torvalds							\
1da177e4SLinus Torvalds    _flo.bits.frac0 = X##_f0;				\
1da177e4SLinus Torvalds    _flo.bits.frac1 = X##_f1;				\
1da177e4SLinus Torvalds    _flo.bits.exp   = X##_e;				\
1da177e4SLinus Torvalds    _flo.bits.sign  = X##_s;				\
1da177e4SLinus Torvalds							\
1da177e4SLinus Torvalds    (val) = _flo.flt;					\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_PACK_RAW_2_P(fs, val, X)			\
1da177e4SLinus Torvalds  do {							\
1da177e4SLinus Torvalds    union _FP_UNION_##fs *_flo =			\
1da177e4SLinus Torvalds      (union _FP_UNION_##fs *)(val);			\
1da177e4SLinus Torvalds							\
1da177e4SLinus Torvalds    _flo->bits.frac0 = X##_f0;				\
1da177e4SLinus Torvalds    _flo->bits.frac1 = X##_f1;				\
1da177e4SLinus Torvalds    _flo->bits.exp   = X##_e;				\
1da177e4SLinus Torvalds    _flo->bits.sign  = X##_s;				\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Multiplication algorithms:
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Given a 1W * 1W => 2W primitive, do the extended multiplication.  */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_MUL_MEAT_2_wide(wfracbits, R, X, Y, doit)			\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    _FP_FRAC_DECL_4(_z); _FP_FRAC_DECL_2(_b); _FP_FRAC_DECL_2(_c);	\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    doit(_FP_FRAC_WORD_4(_z,1), _FP_FRAC_WORD_4(_z,0), X##_f0, Y##_f0);	\
1da177e4SLinus Torvalds    doit(_b_f1, _b_f0, X##_f0, Y##_f1);					\
1da177e4SLinus Torvalds    doit(_c_f1, _c_f0, X##_f1, Y##_f0);					\
1da177e4SLinus Torvalds    doit(_FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2), X##_f1, Y##_f1);	\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1), 0, _b_f1, _b_f0,		\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1));				\
1da177e4SLinus Torvalds    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1), 0, _c_f1, _c_f0,		\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1));				\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    /* Normalize since we know where the msb of the multiplicands	\
1da177e4SLinus Torvalds       were (bit B), we know that the msb of the of the product is	\
1da177e4SLinus Torvalds       at either 2B or 2B-1.  */					\
1da177e4SLinus Torvalds    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
1da177e4SLinus Torvalds    R##_f0 = _FP_FRAC_WORD_4(_z,0);					\
1da177e4SLinus Torvalds    R##_f1 = _FP_FRAC_WORD_4(_z,1);					\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Given a 1W * 1W => 2W primitive, do the extended multiplication.
1da177e4SLinus Torvalds   Do only 3 multiplications instead of four. This one is for machines
1da177e4SLinus Torvalds   where multiplication is much more expensive than subtraction.  */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_MUL_MEAT_2_wide_3mul(wfracbits, R, X, Y, doit)		\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    _FP_FRAC_DECL_4(_z); _FP_FRAC_DECL_2(_b); _FP_FRAC_DECL_2(_c);	\
1da177e4SLinus Torvalds    _FP_W_TYPE _d;							\
1da177e4SLinus Torvalds    int _c1, _c2;							\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    _b_f0 = X##_f0 + X##_f1;						\
1da177e4SLinus Torvalds    _c1 = _b_f0 < X##_f0;						\
1da177e4SLinus Torvalds    _b_f1 = Y##_f0 + Y##_f1;						\
1da177e4SLinus Torvalds    _c2 = _b_f1 < Y##_f0;						\
1da177e4SLinus Torvalds    doit(_d, _FP_FRAC_WORD_4(_z,0), X##_f0, Y##_f0);			\
1da177e4SLinus Torvalds    doit(_FP_FRAC_WORD_4(_z,2), _FP_FRAC_WORD_4(_z,1), _b_f0, _b_f1);	\
1da177e4SLinus Torvalds    doit(_c_f1, _c_f0, X##_f1, Y##_f1);					\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    _b_f0 &= -_c2;							\
1da177e4SLinus Torvalds    _b_f1 &= -_c1;							\
1da177e4SLinus Torvalds    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1), (_c1 & _c2), 0, _d,		\
1da177e4SLinus Torvalds		    0, _FP_FRAC_WORD_4(_z,2), _FP_FRAC_WORD_4(_z,1));	\
1da177e4SLinus Torvalds    __FP_FRAC_ADDI_2(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		     _b_f0);						\
1da177e4SLinus Torvalds    __FP_FRAC_ADDI_2(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		     _b_f1);						\
1da177e4SLinus Torvalds    __FP_FRAC_DEC_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1),				\
1da177e4SLinus Torvalds		    0, _d, _FP_FRAC_WORD_4(_z,0));			\
1da177e4SLinus Torvalds    __FP_FRAC_DEC_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,1), 0, _c_f1, _c_f0);		\
1da177e4SLinus Torvalds    __FP_FRAC_ADD_2(_FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2),	\
1da177e4SLinus Torvalds		    _c_f1, _c_f0,					\
1da177e4SLinus Torvalds		    _FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2));	\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    /* Normalize since we know where the msb of the multiplicands	\
1da177e4SLinus Torvalds       were (bit B), we know that the msb of the of the product is	\
1da177e4SLinus Torvalds       at either 2B or 2B-1.  */					\
1da177e4SLinus Torvalds    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
1da177e4SLinus Torvalds    R##_f0 = _FP_FRAC_WORD_4(_z,0);					\
1da177e4SLinus Torvalds    R##_f1 = _FP_FRAC_WORD_4(_z,1);					\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_MUL_MEAT_2_gmp(wfracbits, R, X, Y)				\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    _FP_FRAC_DECL_4(_z);						\
1da177e4SLinus Torvalds    _FP_W_TYPE _x[2], _y[2];						\
1da177e4SLinus Torvalds    _x[0] = X##_f0; _x[1] = X##_f1;					\
1da177e4SLinus Torvalds    _y[0] = Y##_f0; _y[1] = Y##_f1;					\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    mpn_mul_n(_z_f, _x, _y, 2);						\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    /* Normalize since we know where the msb of the multiplicands	\
1da177e4SLinus Torvalds       were (bit B), we know that the msb of the of the product is	\
1da177e4SLinus Torvalds       at either 2B or 2B-1.  */					\
1da177e4SLinus Torvalds    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
1da177e4SLinus Torvalds    R##_f0 = _z_f[0];							\
1da177e4SLinus Torvalds    R##_f1 = _z_f[1];							\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Do at most 120x120=240 bits multiplication using double floating
1da177e4SLinus Torvalds   point multiplication.  This is useful if floating point
1da177e4SLinus Torvalds   multiplication has much bigger throughput than integer multiply.
1da177e4SLinus Torvalds   It is supposed to work for _FP_W_TYPE_SIZE 64 and wfracbits
1da177e4SLinus Torvalds   between 106 and 120 only.
1da177e4SLinus Torvalds   Caller guarantees that X and Y has (1LLL << (wfracbits - 1)) set.
1da177e4SLinus Torvalds   SETFETZ is a macro which will disable all FPU exceptions and set rounding
1da177e4SLinus Torvalds   towards zero,  RESETFE should optionally reset it back.  */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_MUL_MEAT_2_120_240_double(wfracbits, R, X, Y, setfetz, resetfe)	\
1da177e4SLinus Torvalds  do {										\
1da177e4SLinus Torvalds    static const double _const[] = {						\
1da177e4SLinus Torvalds      /* 2^-24 */ 5.9604644775390625e-08,					\
1da177e4SLinus Torvalds      /* 2^-48 */ 3.5527136788005009e-15,					\
1da177e4SLinus Torvalds      /* 2^-72 */ 2.1175823681357508e-22,					\
1da177e4SLinus Torvalds      /* 2^-96 */ 1.2621774483536189e-29,					\
1da177e4SLinus Torvalds      /* 2^28 */ 2.68435456e+08,						\
1da177e4SLinus Torvalds      /* 2^4 */ 1.600000e+01,							\
1da177e4SLinus Torvalds      /* 2^-20 */ 9.5367431640625e-07,						\
1da177e4SLinus Torvalds      /* 2^-44 */ 5.6843418860808015e-14,					\
1da177e4SLinus Torvalds      /* 2^-68 */ 3.3881317890172014e-21,					\
1da177e4SLinus Torvalds      /* 2^-92 */ 2.0194839173657902e-28,					\
1da177e4SLinus Torvalds      /* 2^-116 */ 1.2037062152420224e-35};					\
1da177e4SLinus Torvalds    double _a240, _b240, _c240, _d240, _e240, _f240, 				\
1da177e4SLinus Torvalds	   _g240, _h240, _i240, _j240, _k240;					\
1da177e4SLinus Torvalds    union { double d; UDItype i; } _l240, _m240, _n240, _o240,			\
1da177e4SLinus Torvalds				   _p240, _q240, _r240, _s240;			\
1da177e4SLinus Torvalds    UDItype _t240, _u240, _v240, _w240, _x240, _y240 = 0;			\
1da177e4SLinus Torvalds										\
1da177e4SLinus Torvalds    if (wfracbits < 106 || wfracbits > 120)					\
1da177e4SLinus Torvalds      abort();									\
1da177e4SLinus Torvalds										\
1da177e4SLinus Torvalds    setfetz;									\
1da177e4SLinus Torvalds										\
1da177e4SLinus Torvalds    _e240 = (double)(long)(X##_f0 & 0xffffff);					\
1da177e4SLinus Torvalds    _j240 = (double)(long)(Y##_f0 & 0xffffff);					\
1da177e4SLinus Torvalds    _d240 = (double)(long)((X##_f0 >> 24) & 0xffffff);				\
1da177e4SLinus Torvalds    _i240 = (double)(long)((Y##_f0 >> 24) & 0xffffff);				\
1da177e4SLinus Torvalds    _c240 = (double)(long)(((X##_f1 << 16) & 0xffffff) | (X##_f0 >> 48));	\
1da177e4SLinus Torvalds    _h240 = (double)(long)(((Y##_f1 << 16) & 0xffffff) | (Y##_f0 >> 48));	\
1da177e4SLinus Torvalds    _b240 = (double)(long)((X##_f1 >> 8) & 0xffffff);				\
1da177e4SLinus Torvalds    _g240 = (double)(long)((Y##_f1 >> 8) & 0xffffff);				\
1da177e4SLinus Torvalds    _a240 = (double)(long)(X##_f1 >> 32);					\
1da177e4SLinus Torvalds    _f240 = (double)(long)(Y##_f1 >> 32);					\
1da177e4SLinus Torvalds    _e240 *= _const[3];								\
1da177e4SLinus Torvalds    _j240 *= _const[3];								\
1da177e4SLinus Torvalds    _d240 *= _const[2];								\
1da177e4SLinus Torvalds    _i240 *= _const[2];								\
1da177e4SLinus Torvalds    _c240 *= _const[1];								\
1da177e4SLinus Torvalds    _h240 *= _const[1];								\
1da177e4SLinus Torvalds    _b240 *= _const[0];								\
1da177e4SLinus Torvalds    _g240 *= _const[0];								\
1da177e4SLinus Torvalds    _s240.d =							      _e240*_j240;\
1da177e4SLinus Torvalds    _r240.d =						_d240*_j240 + _e240*_i240;\
1da177e4SLinus Torvalds    _q240.d =				  _c240*_j240 + _d240*_i240 + _e240*_h240;\
1da177e4SLinus Torvalds    _p240.d =		    _b240*_j240 + _c240*_i240 + _d240*_h240 + _e240*_g240;\
1da177e4SLinus Torvalds    _o240.d = _a240*_j240 + _b240*_i240 + _c240*_h240 + _d240*_g240 + _e240*_f240;\
1da177e4SLinus Torvalds    _n240.d = _a240*_i240 + _b240*_h240 + _c240*_g240 + _d240*_f240;		\
1da177e4SLinus Torvalds    _m240.d = _a240*_h240 + _b240*_g240 + _c240*_f240;				\
1da177e4SLinus Torvalds    _l240.d = _a240*_g240 + _b240*_f240;					\
1da177e4SLinus Torvalds    _k240 =   _a240*_f240;							\
1da177e4SLinus Torvalds    _r240.d += _s240.d;								\
1da177e4SLinus Torvalds    _q240.d += _r240.d;								\
1da177e4SLinus Torvalds    _p240.d += _q240.d;								\
1da177e4SLinus Torvalds    _o240.d += _p240.d;								\
1da177e4SLinus Torvalds    _n240.d += _o240.d;								\
1da177e4SLinus Torvalds    _m240.d += _n240.d;								\
1da177e4SLinus Torvalds    _l240.d += _m240.d;								\
1da177e4SLinus Torvalds    _k240 += _l240.d;								\
1da177e4SLinus Torvalds    _s240.d -= ((_const[10]+_s240.d)-_const[10]);				\
1da177e4SLinus Torvalds    _r240.d -= ((_const[9]+_r240.d)-_const[9]);					\
1da177e4SLinus Torvalds    _q240.d -= ((_const[8]+_q240.d)-_const[8]);					\
1da177e4SLinus Torvalds    _p240.d -= ((_const[7]+_p240.d)-_const[7]);					\
1da177e4SLinus Torvalds    _o240.d += _const[7];							\
1da177e4SLinus Torvalds    _n240.d += _const[6];							\
1da177e4SLinus Torvalds    _m240.d += _const[5];							\
1da177e4SLinus Torvalds    _l240.d += _const[4];							\
1da177e4SLinus Torvalds    if (_s240.d != 0.0) _y240 = 1;						\
1da177e4SLinus Torvalds    if (_r240.d != 0.0) _y240 = 1;						\
1da177e4SLinus Torvalds    if (_q240.d != 0.0) _y240 = 1;						\
1da177e4SLinus Torvalds    if (_p240.d != 0.0) _y240 = 1;						\
1da177e4SLinus Torvalds    _t240 = (DItype)_k240;							\
1da177e4SLinus Torvalds    _u240 = _l240.i;								\
1da177e4SLinus Torvalds    _v240 = _m240.i;								\
1da177e4SLinus Torvalds    _w240 = _n240.i;								\
1da177e4SLinus Torvalds    _x240 = _o240.i;								\
1da177e4SLinus Torvalds    R##_f1 = (_t240 << (128 - (wfracbits - 1)))					\
1da177e4SLinus Torvalds	     | ((_u240 & 0xffffff) >> ((wfracbits - 1) - 104));			\
1da177e4SLinus Torvalds    R##_f0 = ((_u240 & 0xffffff) << (168 - (wfracbits - 1)))			\
1da177e4SLinus Torvalds    	     | ((_v240 & 0xffffff) << (144 - (wfracbits - 1)))			\
1da177e4SLinus Torvalds    	     | ((_w240 & 0xffffff) << (120 - (wfracbits - 1)))			\
1da177e4SLinus Torvalds    	     | ((_x240 & 0xffffff) >> ((wfracbits - 1) - 96))			\
1da177e4SLinus Torvalds    	     | _y240;								\
1da177e4SLinus Torvalds    resetfe;									\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Division algorithms:
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_DIV_MEAT_2_udiv(fs, R, X, Y)				\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    _FP_W_TYPE _n_f2, _n_f1, _n_f0, _r_f1, _r_f0, _m_f1, _m_f0;		\
1da177e4SLinus Torvalds    if (_FP_FRAC_GT_2(X, Y))						\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	_n_f2 = X##_f1 >> 1;						\
1da177e4SLinus Torvalds	_n_f1 = X##_f1 << (_FP_W_TYPE_SIZE - 1) | X##_f0 >> 1;		\
1da177e4SLinus Torvalds	_n_f0 = X##_f0 << (_FP_W_TYPE_SIZE - 1);			\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds    else								\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	R##_e--;							\
1da177e4SLinus Torvalds	_n_f2 = X##_f1;							\
1da177e4SLinus Torvalds	_n_f1 = X##_f0;							\
1da177e4SLinus Torvalds	_n_f0 = 0;							\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    /* Normalize, i.e. make the most significant bit of the 		\
1da177e4SLinus Torvalds       denominator set. */						\
1da177e4SLinus Torvalds    _FP_FRAC_SLL_2(Y, _FP_WFRACXBITS_##fs);				\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    udiv_qrnnd(R##_f1, _r_f1, _n_f2, _n_f1, Y##_f1);			\
1da177e4SLinus Torvalds    umul_ppmm(_m_f1, _m_f0, R##_f1, Y##_f0);				\
1da177e4SLinus Torvalds    _r_f0 = _n_f0;							\
1da177e4SLinus Torvalds    if (_FP_FRAC_GT_2(_m, _r))						\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	R##_f1--;							\
1da177e4SLinus Torvalds	_FP_FRAC_ADD_2(_r, Y, _r);					\
1da177e4SLinus Torvalds	if (_FP_FRAC_GE_2(_r, Y) && _FP_FRAC_GT_2(_m, _r))		\
1da177e4SLinus Torvalds	  {								\
1da177e4SLinus Torvalds	    R##_f1--;							\
1da177e4SLinus Torvalds	    _FP_FRAC_ADD_2(_r, Y, _r);					\
1da177e4SLinus Torvalds	  }								\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds    _FP_FRAC_DEC_2(_r, _m);						\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    if (_r_f1 == Y##_f1)						\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	/* This is a special case, not an optimization			\
1da177e4SLinus Torvalds	   (_r/Y##_f1 would not fit into UWtype).			\
1da177e4SLinus Torvalds	   As _r is guaranteed to be < Y,  R##_f0 can be either		\
1da177e4SLinus Torvalds	   (UWtype)-1 or (UWtype)-2.  But as we know what kind		\
1da177e4SLinus Torvalds	   of bits it is (sticky, guard, round),  we don't care.	\
1da177e4SLinus Torvalds	   We also don't care what the reminder is,  because the	\
1da177e4SLinus Torvalds	   guard bit will be set anyway.  -jj */			\
1da177e4SLinus Torvalds	R##_f0 = -1;							\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds    else								\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	udiv_qrnnd(R##_f0, _r_f1, _r_f1, _r_f0, Y##_f1);		\
1da177e4SLinus Torvalds	umul_ppmm(_m_f1, _m_f0, R##_f0, Y##_f0);			\
1da177e4SLinus Torvalds	_r_f0 = 0;							\
1da177e4SLinus Torvalds	if (_FP_FRAC_GT_2(_m, _r))					\
1da177e4SLinus Torvalds	  {								\
1da177e4SLinus Torvalds	    R##_f0--;							\
1da177e4SLinus Torvalds	    _FP_FRAC_ADD_2(_r, Y, _r);					\
1da177e4SLinus Torvalds	    if (_FP_FRAC_GE_2(_r, Y) && _FP_FRAC_GT_2(_m, _r))		\
1da177e4SLinus Torvalds	      {								\
1da177e4SLinus Torvalds		R##_f0--;						\
1da177e4SLinus Torvalds		_FP_FRAC_ADD_2(_r, Y, _r);				\
1da177e4SLinus Torvalds	      }								\
1da177e4SLinus Torvalds	  }								\
1da177e4SLinus Torvalds	if (!_FP_FRAC_EQ_2(_r, _m))					\
1da177e4SLinus Torvalds	  R##_f0 |= _FP_WORK_STICKY;					\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_DIV_MEAT_2_gmp(fs, R, X, Y)					\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    _FP_W_TYPE _x[4], _y[2], _z[4];					\
1da177e4SLinus Torvalds    _y[0] = Y##_f0; _y[1] = Y##_f1;					\
1da177e4SLinus Torvalds    _x[0] = _x[3] = 0;							\
1da177e4SLinus Torvalds    if (_FP_FRAC_GT_2(X, Y))						\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	R##_e++;							\
1da177e4SLinus Torvalds	_x[1] = (X##_f0 << (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE) |	\
1da177e4SLinus Torvalds		 X##_f1 >> (_FP_W_TYPE_SIZE -				\
1da177e4SLinus Torvalds			    (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE)));	\
1da177e4SLinus Torvalds	_x[2] = X##_f1 << (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE);	\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds    else								\
1da177e4SLinus Torvalds      {									\
1da177e4SLinus Torvalds	_x[1] = (X##_f0 << (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE) |	\
1da177e4SLinus Torvalds		 X##_f1 >> (_FP_W_TYPE_SIZE -				\
1da177e4SLinus Torvalds			    (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE)));	\
1da177e4SLinus Torvalds	_x[2] = X##_f1 << (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE);	\
1da177e4SLinus Torvalds      }									\
1da177e4SLinus Torvalds									\
1da177e4SLinus Torvalds    (void) mpn_divrem (_z, 0, _x, 4, _y, 2);				\
1da177e4SLinus Torvalds    R##_f1 = _z[1];							\
1da177e4SLinus Torvalds    R##_f0 = _z[0] | ((_x[0] | _x[1]) != 0);				\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Square root algorithms:
1da177e4SLinus Torvalds * We have just one right now, maybe Newton approximation
1da177e4SLinus Torvalds * should be added for those machines where division is fast.
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_SQRT_MEAT_2(R, S, T, X, q)			\
1da177e4SLinus Torvalds  do {							\
1da177e4SLinus Torvalds    while (q)						\
1da177e4SLinus Torvalds      {							\
1da177e4SLinus Torvalds	T##_f1 = S##_f1 + q;				\
1da177e4SLinus Torvalds	if (T##_f1 <= X##_f1)				\
1da177e4SLinus Torvalds	  {						\
1da177e4SLinus Torvalds	    S##_f1 = T##_f1 + q;			\
1da177e4SLinus Torvalds	    X##_f1 -= T##_f1;				\
1da177e4SLinus Torvalds	    R##_f1 += q;				\
1da177e4SLinus Torvalds	  }						\
1da177e4SLinus Torvalds	_FP_FRAC_SLL_2(X, 1);				\
1da177e4SLinus Torvalds	q >>= 1;					\
1da177e4SLinus Torvalds      }							\
1da177e4SLinus Torvalds    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);		\
1da177e4SLinus Torvalds    while (q != _FP_WORK_ROUND)				\
1da177e4SLinus Torvalds      {							\
1da177e4SLinus Torvalds	T##_f0 = S##_f0 + q;				\
1da177e4SLinus Torvalds	T##_f1 = S##_f1;				\
1da177e4SLinus Torvalds	if (T##_f1 < X##_f1 || 				\
1da177e4SLinus Torvalds	    (T##_f1 == X##_f1 && T##_f0 <= X##_f0))	\
1da177e4SLinus Torvalds	  {						\
1da177e4SLinus Torvalds	    S##_f0 = T##_f0 + q;			\
1da177e4SLinus Torvalds	    S##_f1 += (T##_f0 > S##_f0);		\
1da177e4SLinus Torvalds	    _FP_FRAC_DEC_2(X, T);			\
1da177e4SLinus Torvalds	    R##_f0 += q;				\
1da177e4SLinus Torvalds	  }						\
1da177e4SLinus Torvalds	_FP_FRAC_SLL_2(X, 1);				\
1da177e4SLinus Torvalds	q >>= 1;					\
1da177e4SLinus Torvalds      }							\
1da177e4SLinus Torvalds    if (X##_f0 | X##_f1)				\
1da177e4SLinus Torvalds      {							\
1da177e4SLinus Torvalds	if (S##_f1 < X##_f1 || 				\
1da177e4SLinus Torvalds	    (S##_f1 == X##_f1 && S##_f0 < X##_f0))	\
1da177e4SLinus Torvalds	  R##_f0 |= _FP_WORK_ROUND;			\
1da177e4SLinus Torvalds	R##_f0 |= _FP_WORK_STICKY;			\
1da177e4SLinus Torvalds      }							\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Assembly/disassembly for converting to/from integral types.
1da177e4SLinus Torvalds * No shifting or overflow handled here.
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_ASSEMBLE_2(r, X, rsize)	\
*8183db10SVincent Chen	(void) (((rsize) <= _FP_W_TYPE_SIZE)	\
*8183db10SVincent Chen		? ({ (r) = X##_f0; })		\
*8183db10SVincent Chen		: ({				\
*8183db10SVincent Chen		     (r) = X##_f1;		\
*8183db10SVincent Chen		     (r) <<= _FP_W_TYPE_SIZE;	\
*8183db10SVincent Chen		     (r) += X##_f0;		\
*8183db10SVincent Chen		    }))
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_DISASSEMBLE_2(X, r, rsize)				\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    X##_f0 = r;								\
1da177e4SLinus Torvalds    X##_f1 = (rsize <= _FP_W_TYPE_SIZE ? 0 : r >> _FP_W_TYPE_SIZE);	\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Convert FP values between word sizes
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_CONV_1_2(dfs, sfs, D, S)				\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    if (S##_c != FP_CLS_NAN)						\
1da177e4SLinus Torvalds      _FP_FRAC_SRS_2(S, (_FP_WFRACBITS_##sfs - _FP_WFRACBITS_##dfs),	\
1da177e4SLinus Torvalds		     _FP_WFRACBITS_##sfs);				\
1da177e4SLinus Torvalds    else								\
1da177e4SLinus Torvalds      _FP_FRAC_SRL_2(S, (_FP_WFRACBITS_##sfs - _FP_WFRACBITS_##dfs));	\
1da177e4SLinus Torvalds    D##_f = S##_f0;							\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#define _FP_FRAC_CONV_2_1(dfs, sfs, D, S)				\
1da177e4SLinus Torvalds  do {									\
1da177e4SLinus Torvalds    D##_f0 = S##_f;							\
1da177e4SLinus Torvalds    D##_f1 = 0;								\
1da177e4SLinus Torvalds    _FP_FRAC_SLL_2(D, (_FP_WFRACBITS_##dfs - _FP_WFRACBITS_##sfs));	\
1da177e4SLinus Torvalds  } while (0)
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#endif