mips/math-emu/ieee754dp.c

9d5a6349SThomas Gleixner// SPDX-License-Identifier: GPL-2.0-only
1da177e4SLinus Torvalds/* IEEE754 floating point arithmetic
1da177e4SLinus Torvalds * double precision: common utilities
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * MIPS floating point support
1da177e4SLinus Torvalds * Copyright (C) 1994-2000 Algorithmics Ltd.
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
cae55066SRalf Baechle#include <linux/compiler.h>
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#include "ieee754dp.h"
1da177e4SLinus Torvalds
2209bcb1SRalf Baechleint ieee754dp_class(union ieee754dp x)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	COMPXDP;
1da177e4SLinus Torvalds	EXPLODEXDP;
1da177e4SLinus Torvalds	return xc;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
e06b530bSMaciej W. Rozyckistatic inline int ieee754dp_isnan(union ieee754dp x)
1da177e4SLinus Torvalds{
c9a10845SMaciej W. Rozycki	return ieee754_class_nan(ieee754dp_class(x));
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
f71baa11SRalf Baechlestatic inline int ieee754dp_issnan(union ieee754dp x)
1da177e4SLinus Torvalds{
90d53a91SMaciej W. Rozycki	int qbit;
90d53a91SMaciej W. Rozycki
1da177e4SLinus Torvalds	assert(ieee754dp_isnan(x));
90d53a91SMaciej W. Rozycki	qbit = (DPMANT(x) & DP_MBIT(DP_FBITS - 1)) == DP_MBIT(DP_FBITS - 1);
90d53a91SMaciej W. Rozycki	return ieee754_csr.nan2008 ^ qbit;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
d5afa7e9SMaciej W. Rozycki/*
d5afa7e9SMaciej W. Rozycki * Raise the Invalid Operation IEEE 754 exception
d5afa7e9SMaciej W. Rozycki * and convert the signaling NaN supplied to a quiet NaN.
d5afa7e9SMaciej W. Rozycki */
90efba36SRalf Baechleunion ieee754dp __cold ieee754dp_nanxcpt(union ieee754dp r)
1da177e4SLinus Torvalds{
d5afa7e9SMaciej W. Rozycki	assert(ieee754dp_issnan(r));
1da177e4SLinus Torvalds
d5afa7e9SMaciej W. Rozycki	ieee754_setcx(IEEE754_INVALID_OPERATION);
acd9e20cSMaciej W. Rozycki	if (ieee754_csr.nan2008) {
90d53a91SMaciej W. Rozycki		DPMANT(r) |= DP_MBIT(DP_FBITS - 1);
acd9e20cSMaciej W. Rozycki	} else {
acd9e20cSMaciej W. Rozycki		DPMANT(r) &= ~DP_MBIT(DP_FBITS - 1);
acd9e20cSMaciej W. Rozycki		if (!ieee754dp_isnan(r))
acd9e20cSMaciej W. Rozycki			DPMANT(r) |= DP_MBIT(DP_FBITS - 2);
acd9e20cSMaciej W. Rozycki	}
90d53a91SMaciej W. Rozycki
90d53a91SMaciej W. Rozycki	return r;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
de2fc342SRalf Baechlestatic u64 ieee754dp_get_rounding(int sn, u64 xm)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	/* inexact must round of 3 bits
1da177e4SLinus Torvalds	 */
1da177e4SLinus Torvalds	if (xm & (DP_MBIT(3) - 1)) {
1da177e4SLinus Torvalds		switch (ieee754_csr.rm) {
56a64733SRalf Baechle		case FPU_CSR_RZ:
1da177e4SLinus Torvalds			break;
56a64733SRalf Baechle		case FPU_CSR_RN:
1da177e4SLinus Torvalds			xm += 0x3 + ((xm >> 3) & 1);
1da177e4SLinus Torvalds			/* xm += (xm&0x8)?0x4:0x3 */
1da177e4SLinus Torvalds			break;
56a64733SRalf Baechle		case FPU_CSR_RU:	/* toward +Infinity */
1da177e4SLinus Torvalds			if (!sn)	/* ?? */
1da177e4SLinus Torvalds				xm += 0x8;
1da177e4SLinus Torvalds			break;
56a64733SRalf Baechle		case FPU_CSR_RD:	/* toward -Infinity */
1da177e4SLinus Torvalds			if (sn) /* ?? */
1da177e4SLinus Torvalds				xm += 0x8;
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	return xm;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* generate a normal/denormal number with over,under handling
1da177e4SLinus Torvalds * sn is sign
1da177e4SLinus Torvalds * xe is an unbiased exponent
1da177e4SLinus Torvalds * xm is 3bit extended precision value.
1da177e4SLinus Torvalds */
2209bcb1SRalf Baechleunion ieee754dp ieee754dp_format(int sn, int xe, u64 xm)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	assert(xm);		/* we don't gen exact zeros (probably should) */
1da177e4SLinus Torvalds
92a76f6dSAdam Buchbinder	assert((xm >> (DP_FBITS + 1 + 3)) == 0);	/* no excess */
1da177e4SLinus Torvalds	assert(xm & (DP_HIDDEN_BIT << 3));
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (xe < DP_EMIN) {
1da177e4SLinus Torvalds		/* strip lower bits */
1da177e4SLinus Torvalds		int es = DP_EMIN - xe;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		if (ieee754_csr.nod) {
9e8bad1fSRalf Baechle			ieee754_setcx(IEEE754_UNDERFLOW);
9e8bad1fSRalf Baechle			ieee754_setcx(IEEE754_INEXACT);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds			switch(ieee754_csr.rm) {
56a64733SRalf Baechle			case FPU_CSR_RN:
56a64733SRalf Baechle			case FPU_CSR_RZ:
1da177e4SLinus Torvalds				return ieee754dp_zero(sn);
56a64733SRalf Baechle			case FPU_CSR_RU:    /* toward +Infinity */
1da177e4SLinus Torvalds				if (sn == 0)
1da177e4SLinus Torvalds					return ieee754dp_min(0);
1da177e4SLinus Torvalds				else
1da177e4SLinus Torvalds					return ieee754dp_zero(1);
56a64733SRalf Baechle			case FPU_CSR_RD:    /* toward -Infinity */
1da177e4SLinus Torvalds				if (sn == 0)
1da177e4SLinus Torvalds					return ieee754dp_zero(0);
1da177e4SLinus Torvalds				else
1da177e4SLinus Torvalds					return ieee754dp_min(1);
1da177e4SLinus Torvalds			}
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds
de2fc342SRalf Baechle		if (xe == DP_EMIN - 1 &&
de2fc342SRalf Baechle		    ieee754dp_get_rounding(sn, xm) >> (DP_FBITS + 1 + 3))
1da177e4SLinus Torvalds		{
1da177e4SLinus Torvalds			/* Not tiny after rounding */
9e8bad1fSRalf Baechle			ieee754_setcx(IEEE754_INEXACT);
de2fc342SRalf Baechle			xm = ieee754dp_get_rounding(sn, xm);
1da177e4SLinus Torvalds			xm >>= 1;
1da177e4SLinus Torvalds			/* Clear grs bits */
1da177e4SLinus Torvalds			xm &= ~(DP_MBIT(3) - 1);
1da177e4SLinus Torvalds			xe++;
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		else {
1da177e4SLinus Torvalds			/* sticky right shift es bits
1da177e4SLinus Torvalds			 */
1da177e4SLinus Torvalds			xm = XDPSRS(xm, es);
1da177e4SLinus Torvalds			xe += es;
1da177e4SLinus Torvalds			assert((xm & (DP_HIDDEN_BIT << 3)) == 0);
1da177e4SLinus Torvalds			assert(xe == DP_EMIN);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (xm & (DP_MBIT(3) - 1)) {
9e8bad1fSRalf Baechle		ieee754_setcx(IEEE754_INEXACT);
1da177e4SLinus Torvalds		if ((xm & (DP_HIDDEN_BIT << 3)) == 0) {
9e8bad1fSRalf Baechle			ieee754_setcx(IEEE754_UNDERFLOW);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		/* inexact must round of 3 bits
1da177e4SLinus Torvalds		 */
de2fc342SRalf Baechle		xm = ieee754dp_get_rounding(sn, xm);
1da177e4SLinus Torvalds		/* adjust exponent for rounding add overflowing
1da177e4SLinus Torvalds		 */
ad8fb553SRalf Baechle		if (xm >> (DP_FBITS + 3 + 1)) {
1da177e4SLinus Torvalds			/* add causes mantissa overflow */
1da177e4SLinus Torvalds			xm >>= 1;
1da177e4SLinus Torvalds			xe++;
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	/* strip grs bits */
1da177e4SLinus Torvalds	xm >>= 3;
1da177e4SLinus Torvalds
92a76f6dSAdam Buchbinder	assert((xm >> (DP_FBITS + 1)) == 0);	/* no excess */
1da177e4SLinus Torvalds	assert(xe >= DP_EMIN);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (xe > DP_EMAX) {
9e8bad1fSRalf Baechle		ieee754_setcx(IEEE754_OVERFLOW);
9e8bad1fSRalf Baechle		ieee754_setcx(IEEE754_INEXACT);
1da177e4SLinus Torvalds		/* -O can be table indexed by (rm,sn) */
1da177e4SLinus Torvalds		switch (ieee754_csr.rm) {
56a64733SRalf Baechle		case FPU_CSR_RN:
1da177e4SLinus Torvalds			return ieee754dp_inf(sn);
56a64733SRalf Baechle		case FPU_CSR_RZ:
1da177e4SLinus Torvalds			return ieee754dp_max(sn);
56a64733SRalf Baechle		case FPU_CSR_RU:	/* toward +Infinity */
1da177e4SLinus Torvalds			if (sn == 0)
1da177e4SLinus Torvalds				return ieee754dp_inf(0);
1da177e4SLinus Torvalds			else
1da177e4SLinus Torvalds				return ieee754dp_max(1);
56a64733SRalf Baechle		case FPU_CSR_RD:	/* toward -Infinity */
1da177e4SLinus Torvalds			if (sn == 0)
1da177e4SLinus Torvalds				return ieee754dp_max(0);
1da177e4SLinus Torvalds			else
1da177e4SLinus Torvalds				return ieee754dp_inf(1);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	/* gen norm/denorm/zero */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if ((xm & DP_HIDDEN_BIT) == 0) {
1da177e4SLinus Torvalds		/* we underflow (tiny/zero) */
1da177e4SLinus Torvalds		assert(xe == DP_EMIN);
1da177e4SLinus Torvalds		if (ieee754_csr.mx & IEEE754_UNDERFLOW)
9e8bad1fSRalf Baechle			ieee754_setcx(IEEE754_UNDERFLOW);
1da177e4SLinus Torvalds		return builddp(sn, DP_EMIN - 1 + DP_EBIAS, xm);
1da177e4SLinus Torvalds	} else {
92a76f6dSAdam Buchbinder		assert((xm >> (DP_FBITS + 1)) == 0);	/* no excess */
1da177e4SLinus Torvalds		assert(xm & DP_HIDDEN_BIT);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return builddp(sn, xe + DP_EBIAS, xm & ~DP_HIDDEN_BIT);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds}