m68k/math-emu/fp_arith.c

*1da177e4SLinus Torvalds/*
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   fp_arith.c: floating-point math routines for the Linux-m68k
*1da177e4SLinus Torvalds   floating point emulator.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   Copyright (c) 1998-1999 David Huggins-Daines.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   Somewhat based on the AlphaLinux floating point emulator, by David
*1da177e4SLinus Torvalds   Mosberger-Tang.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   You may copy, modify, and redistribute this file under the terms of
*1da177e4SLinus Torvalds   the GNU General Public License, version 2, or any later version, at
*1da177e4SLinus Torvalds   your convenience.
*1da177e4SLinus Torvalds */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds#include "fp_emu.h"
*1da177e4SLinus Torvalds#include "multi_arith.h"
*1da177e4SLinus Torvalds#include "fp_arith.h"
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsconst struct fp_ext fp_QNaN =
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	.exp = 0x7fff,
*1da177e4SLinus Torvalds	.mant = { .m64 = ~0 }
*1da177e4SLinus Torvalds};
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsconst struct fp_ext fp_Inf =
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	.exp = 0x7fff,
*1da177e4SLinus Torvalds};
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* let's start with the easy ones */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fabs(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fabs\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_monadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dest->sign = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fneg(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fneg\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_monadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dest->sign = !dest->sign;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* Now, the slightly harder ones */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_fadd: Implements the kernel of the FADD, FSADD, FDADD, FSUB,
*1da177e4SLinus Torvalds   FDSUB, and FCMP instructions. */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fadd(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	int diff;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fadd\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (IS_INF(dest)) {
*1da177e4SLinus Torvalds		/* infinity - infinity == NaN */
*1da177e4SLinus Torvalds		if (IS_INF(src) && (src->sign != dest->sign))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
*1da177e4SLinus Torvalds		if (IS_ZERO(src)) {
*1da177e4SLinus Torvalds			if (src->sign != dest->sign) {
*1da177e4SLinus Torvalds				if (FPDATA->rnd == FPCR_ROUND_RM)
*1da177e4SLinus Torvalds					dest->sign = 1;
*1da177e4SLinus Torvalds				else
*1da177e4SLinus Torvalds					dest->sign = 0;
*1da177e4SLinus Torvalds			}
*1da177e4SLinus Torvalds		} else
*1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dest->lowmant = src->lowmant = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if ((diff = dest->exp - src->exp) > 0)
*1da177e4SLinus Torvalds		fp_denormalize(src, diff);
*1da177e4SLinus Torvalds	else if ((diff = -diff) > 0)
*1da177e4SLinus Torvalds		fp_denormalize(dest, diff);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (dest->sign == src->sign) {
*1da177e4SLinus Torvalds		if (fp_addmant(dest, src))
*1da177e4SLinus Torvalds			if (!fp_addcarry(dest))
*1da177e4SLinus Torvalds				return dest;
*1da177e4SLinus Torvalds	} else {
*1da177e4SLinus Torvalds		if (dest->mant.m64 < src->mant.m64) {
*1da177e4SLinus Torvalds			fp_submant(dest, src, dest);
*1da177e4SLinus Torvalds			dest->sign = !dest->sign;
*1da177e4SLinus Torvalds		} else
*1da177e4SLinus Torvalds			fp_submant(dest, dest, src);
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_fsub: Implements the kernel of the FSUB, FSSUB, and FDSUB
*1da177e4SLinus Torvalds   instructions.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   Remember that the arguments are in assembler-syntax order! */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fsub(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fsub ");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	src->sign = !src->sign;
*1da177e4SLinus Torvalds	return fp_fadd(dest, src);
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fcmp(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fcmp ");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	FPDATA->temp[1] = *dest;
*1da177e4SLinus Torvalds	src->sign = !src->sign;
*1da177e4SLinus Torvalds	return fp_fadd(&FPDATA->temp[1], src);
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_ftst(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "ftst\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	(void)dest;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return src;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fmul(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	union fp_mant128 temp;
*1da177e4SLinus Torvalds	int exp;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fmul\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
*1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Handle infinities */
*1da177e4SLinus Torvalds	if (IS_INF(dest)) {
*1da177e4SLinus Torvalds		if (IS_ZERO(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		if (IS_ZERO(dest))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		else
*1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Of course, as we all know, zero * anything = zero.  You may
*1da177e4SLinus Torvalds	   not have known that it might be a positive or negative
*1da177e4SLinus Torvalds	   zero... */
*1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_ZERO(src)) {
*1da177e4SLinus Torvalds		dest->exp = 0;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds		dest->lowmant = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	exp = dest->exp + src->exp - 0x3ffe;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* shift up the mantissa for denormalized numbers,
*1da177e4SLinus Torvalds	   so that the highest bit is set, this makes the
*1da177e4SLinus Torvalds	   shift of the result below easier */
*1da177e4SLinus Torvalds	if ((long)dest->mant.m32[0] >= 0)
*1da177e4SLinus Torvalds		exp -= fp_overnormalize(dest);
*1da177e4SLinus Torvalds	if ((long)src->mant.m32[0] >= 0)
*1da177e4SLinus Torvalds		exp -= fp_overnormalize(src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* now, do a 64-bit multiply with expansion */
*1da177e4SLinus Torvalds	fp_multiplymant(&temp, dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* normalize it back to 64 bits and stuff it back into the
*1da177e4SLinus Torvalds	   destination struct */
*1da177e4SLinus Torvalds	if ((long)temp.m32[0] > 0) {
*1da177e4SLinus Torvalds		exp--;
*1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 1);
*1da177e4SLinus Torvalds	} else
*1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 0);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	dest->exp = exp;
*1da177e4SLinus Torvalds	if (exp < 0) {
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
*1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_fdiv: Implements the "kernel" of the FDIV, FSDIV, FDDIV and
*1da177e4SLinus Torvalds   FSGLDIV instructions.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   Note that the order of the operands is counter-intuitive: instead
*1da177e4SLinus Torvalds   of src / dest, the result is actually dest / src. */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fdiv(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	union fp_mant128 temp;
*1da177e4SLinus Torvalds	int exp;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fdiv\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
*1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Handle infinities */
*1da177e4SLinus Torvalds	if (IS_INF(dest)) {
*1da177e4SLinus Torvalds		/* infinity / infinity = NaN (quiet, as always) */
*1da177e4SLinus Torvalds		if (IS_INF(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		/* infinity / anything else = infinity (with approprate sign) */
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		/* anything / infinity = zero (with appropriate sign) */
*1da177e4SLinus Torvalds		dest->exp = 0;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds		dest->lowmant = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* zeroes */
*1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
*1da177e4SLinus Torvalds		/* zero / zero = NaN */
*1da177e4SLinus Torvalds		if (IS_ZERO(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		/* zero / anything else = zero */
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_ZERO(src)) {
*1da177e4SLinus Torvalds		/* anything / zero = infinity (with appropriate sign) */
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_DZ);
*1da177e4SLinus Torvalds		dest->exp = 0x7fff;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	exp = dest->exp - src->exp + 0x3fff;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* shift up the mantissa for denormalized numbers,
*1da177e4SLinus Torvalds	   so that the highest bit is set, this makes lots
*1da177e4SLinus Torvalds	   of things below easier */
*1da177e4SLinus Torvalds	if ((long)dest->mant.m32[0] >= 0)
*1da177e4SLinus Torvalds		exp -= fp_overnormalize(dest);
*1da177e4SLinus Torvalds	if ((long)src->mant.m32[0] >= 0)
*1da177e4SLinus Torvalds		exp -= fp_overnormalize(src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* now, do the 64-bit divide */
*1da177e4SLinus Torvalds	fp_dividemant(&temp, dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* normalize it back to 64 bits and stuff it back into the
*1da177e4SLinus Torvalds	   destination struct */
*1da177e4SLinus Torvalds	if (!temp.m32[0]) {
*1da177e4SLinus Torvalds		exp--;
*1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 32);
*1da177e4SLinus Torvalds	} else
*1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 31);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	dest->exp = exp;
*1da177e4SLinus Torvalds	if (exp < 0) {
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
*1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fsglmul(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	int exp;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fsglmul\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
*1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Handle infinities */
*1da177e4SLinus Torvalds	if (IS_INF(dest)) {
*1da177e4SLinus Torvalds		if (IS_ZERO(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		if (IS_ZERO(dest))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		else
*1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Of course, as we all know, zero * anything = zero.  You may
*1da177e4SLinus Torvalds	   not have known that it might be a positive or negative
*1da177e4SLinus Torvalds	   zero... */
*1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_ZERO(src)) {
*1da177e4SLinus Torvalds		dest->exp = 0;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds		dest->lowmant = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	exp = dest->exp + src->exp - 0x3ffe;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* do a 32-bit multiply */
*1da177e4SLinus Torvalds	fp_mul64(dest->mant.m32[0], dest->mant.m32[1],
*1da177e4SLinus Torvalds		 dest->mant.m32[0] & 0xffffff00,
*1da177e4SLinus Torvalds		 src->mant.m32[0] & 0xffffff00);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	dest->exp = exp;
*1da177e4SLinus Torvalds	if (exp < 0) {
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
*1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fsgldiv(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	int exp;
*1da177e4SLinus Torvalds	unsigned long quot, rem;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fsgldiv\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
*1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Handle infinities */
*1da177e4SLinus Torvalds	if (IS_INF(dest)) {
*1da177e4SLinus Torvalds		/* infinity / infinity = NaN (quiet, as always) */
*1da177e4SLinus Torvalds		if (IS_INF(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		/* infinity / anything else = infinity (with approprate sign) */
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		/* anything / infinity = zero (with appropriate sign) */
*1da177e4SLinus Torvalds		dest->exp = 0;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds		dest->lowmant = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* zeroes */
*1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
*1da177e4SLinus Torvalds		/* zero / zero = NaN */
*1da177e4SLinus Torvalds		if (IS_ZERO(src))
*1da177e4SLinus Torvalds			fp_set_nan(dest);
*1da177e4SLinus Torvalds		/* zero / anything else = zero */
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_ZERO(src)) {
*1da177e4SLinus Torvalds		/* anything / zero = infinity (with appropriate sign) */
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_DZ);
*1da177e4SLinus Torvalds		dest->exp = 0x7fff;
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	exp = dest->exp - src->exp + 0x3fff;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dest->mant.m32[0] &= 0xffffff00;
*1da177e4SLinus Torvalds	src->mant.m32[0] &= 0xffffff00;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* do the 32-bit divide */
*1da177e4SLinus Torvalds	if (dest->mant.m32[0] >= src->mant.m32[0]) {
*1da177e4SLinus Torvalds		fp_sub64(dest->mant, src->mant);
*1da177e4SLinus Torvalds		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
*1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000 | (quot >> 1);
*1da177e4SLinus Torvalds		dest->mant.m32[1] = (quot & 1) | rem;	/* only for rounding */
*1da177e4SLinus Torvalds	} else {
*1da177e4SLinus Torvalds		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
*1da177e4SLinus Torvalds		dest->mant.m32[0] = quot;
*1da177e4SLinus Torvalds		dest->mant.m32[1] = rem;		/* only for rounding */
*1da177e4SLinus Torvalds		exp--;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	dest->exp = exp;
*1da177e4SLinus Torvalds	if (exp < 0) {
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
*1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_roundint: Internal rounding function for use by several of these
*1da177e4SLinus Torvalds   emulated instructions.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   This one rounds off the fractional part using the rounding mode
*1da177e4SLinus Torvalds   specified. */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstatic void fp_roundint(struct fp_ext *dest, int mode)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	union fp_mant64 oldmant;
*1da177e4SLinus Torvalds	unsigned long mask;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (!fp_normalize_ext(dest))
*1da177e4SLinus Torvalds		return;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* infinities and zeroes */
*1da177e4SLinus Torvalds	if (IS_INF(dest) || IS_ZERO(dest))
*1da177e4SLinus Torvalds		return;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* first truncate the lower bits */
*1da177e4SLinus Torvalds	oldmant = dest->mant;
*1da177e4SLinus Torvalds	switch (dest->exp) {
*1da177e4SLinus Torvalds	case 0 ... 0x3ffe:
*1da177e4SLinus Torvalds		dest->mant.m64 = 0;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	case 0x3fff ... 0x401e:
*1da177e4SLinus Torvalds		dest->mant.m32[0] &= 0xffffffffU << (0x401e - dest->exp);
*1da177e4SLinus Torvalds		dest->mant.m32[1] = 0;
*1da177e4SLinus Torvalds		if (oldmant.m64 == dest->mant.m64)
*1da177e4SLinus Torvalds			return;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	case 0x401f ... 0x403e:
*1da177e4SLinus Torvalds		dest->mant.m32[1] &= 0xffffffffU << (0x403e - dest->exp);
*1da177e4SLinus Torvalds		if (oldmant.m32[1] == dest->mant.m32[1])
*1da177e4SLinus Torvalds			return;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	default:
*1da177e4SLinus Torvalds		return;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	fp_set_sr(FPSR_EXC_INEX2);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* We might want to normalize upwards here... however, since
*1da177e4SLinus Torvalds	   we know that this is only called on the output of fp_fdiv,
*1da177e4SLinus Torvalds	   or with the input to fp_fint or fp_fintrz, and the inputs
*1da177e4SLinus Torvalds	   to all these functions are either normal or denormalized
*1da177e4SLinus Torvalds	   (no subnormals allowed!), there's really no need.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	   In the case of fp_fdiv, observe that 0x80000000 / 0xffff =
*1da177e4SLinus Torvalds	   0xffff8000, and the same holds for 128-bit / 64-bit. (i.e. the
*1da177e4SLinus Torvalds	   smallest possible normal dividend and the largest possible normal
*1da177e4SLinus Torvalds	   divisor will still produce a normal quotient, therefore, (normal
*1da177e4SLinus Torvalds	   << 64) / normal is normal in all cases) */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	switch (mode) {
*1da177e4SLinus Torvalds	case FPCR_ROUND_RN:
*1da177e4SLinus Torvalds		switch (dest->exp) {
*1da177e4SLinus Torvalds		case 0 ... 0x3ffd:
*1da177e4SLinus Torvalds			return;
*1da177e4SLinus Torvalds		case 0x3ffe:
*1da177e4SLinus Torvalds			/* As noted above, the input is always normal, so the
*1da177e4SLinus Torvalds			   guard bit (bit 63) is always set.  therefore, the
*1da177e4SLinus Torvalds			   only case in which we will NOT round to 1.0 is when
*1da177e4SLinus Torvalds			   the input is exactly 0.5. */
*1da177e4SLinus Torvalds			if (oldmant.m64 == (1ULL << 63))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		case 0x3fff ... 0x401d:
*1da177e4SLinus Torvalds			mask = 1 << (0x401d - dest->exp);
*1da177e4SLinus Torvalds			if (!(oldmant.m32[0] & mask))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			if (oldmant.m32[0] & (mask << 1))
*1da177e4SLinus Torvalds				break;
*1da177e4SLinus Torvalds			if (!(oldmant.m32[0] << (dest->exp - 0x3ffd)) &&
*1da177e4SLinus Torvalds					!oldmant.m32[1])
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		case 0x401e:
*1da177e4SLinus Torvalds			if (!(oldmant.m32[1] >= 0))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			if (oldmant.m32[0] & 1)
*1da177e4SLinus Torvalds				break;
*1da177e4SLinus Torvalds			if (!(oldmant.m32[1] << 1))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		case 0x401f ... 0x403d:
*1da177e4SLinus Torvalds			mask = 1 << (0x403d - dest->exp);
*1da177e4SLinus Torvalds			if (!(oldmant.m32[1] & mask))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			if (oldmant.m32[1] & (mask << 1))
*1da177e4SLinus Torvalds				break;
*1da177e4SLinus Torvalds			if (!(oldmant.m32[1] << (dest->exp - 0x401d)))
*1da177e4SLinus Torvalds				return;
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		default:
*1da177e4SLinus Torvalds			return;
*1da177e4SLinus Torvalds		}
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	case FPCR_ROUND_RZ:
*1da177e4SLinus Torvalds		return;
*1da177e4SLinus Torvalds	default:
*1da177e4SLinus Torvalds		if (dest->sign ^ (mode - FPCR_ROUND_RM))
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		return;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	switch (dest->exp) {
*1da177e4SLinus Torvalds	case 0 ... 0x3ffe:
*1da177e4SLinus Torvalds		dest->exp = 0x3fff;
*1da177e4SLinus Torvalds		dest->mant.m64 = 1ULL << 63;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	case 0x3fff ... 0x401e:
*1da177e4SLinus Torvalds		mask = 1 << (0x401e - dest->exp);
*1da177e4SLinus Torvalds		if (dest->mant.m32[0] += mask)
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000;
*1da177e4SLinus Torvalds		dest->exp++;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	case 0x401f ... 0x403e:
*1da177e4SLinus Torvalds		mask = 1 << (0x403e - dest->exp);
*1da177e4SLinus Torvalds		if (dest->mant.m32[1] += mask)
*1da177e4SLinus Torvalds			break;
*1da177e4SLinus Torvalds		if (dest->mant.m32[0] += 1)
*1da177e4SLinus Torvalds                        break;
*1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000;
*1da177e4SLinus Torvalds                dest->exp++;
*1da177e4SLinus Torvalds		break;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* modrem_kernel: Implementation of the FREM and FMOD instructions
*1da177e4SLinus Torvalds   (which are exactly the same, except for the rounding used on the
*1da177e4SLinus Torvalds   intermediate value) */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstatic struct fp_ext *
*1da177e4SLinus Torvaldsmodrem_kernel(struct fp_ext *dest, struct fp_ext *src, int mode)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	struct fp_ext tmp;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Infinities and zeros */
*1da177e4SLinus Torvalds	if (IS_INF(dest) || IS_ZERO(src)) {
*1da177e4SLinus Torvalds		fp_set_nan(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_INF(src))
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* FIXME: there is almost certainly a smarter way to do this */
*1da177e4SLinus Torvalds	fp_copy_ext(&tmp, dest);
*1da177e4SLinus Torvalds	fp_fdiv(&tmp, src);		/* NOTE: src might be modified */
*1da177e4SLinus Torvalds	fp_roundint(&tmp, mode);
*1da177e4SLinus Torvalds	fp_fmul(&tmp, src);
*1da177e4SLinus Torvalds	fp_fsub(dest, &tmp);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* set the quotient byte */
*1da177e4SLinus Torvalds	fp_set_quotient((dest->mant.m64 & 0x7f) | (dest->sign << 7));
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_fmod: Implements the kernel of the FMOD instruction.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   Again, the argument order is backwards.  The result, as defined in
*1da177e4SLinus Torvalds   the Motorola manuals, is:
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   fmod(src,dest) = (dest - (src * floor(dest / src))) */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fmod(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fmod\n");
*1da177e4SLinus Torvalds	return modrem_kernel(dest, src, FPCR_ROUND_RZ);
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds/* fp_frem: Implements the kernel of the FREM instruction.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds   frem(src,dest) = (dest - (src * round(dest / src)))
*1da177e4SLinus Torvalds */
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_frem(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "frem\n");
*1da177e4SLinus Torvalds	return modrem_kernel(dest, src, FPCR_ROUND_RN);
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fint(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fint\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_roundint(dest, FPDATA->rnd);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fintrz(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	dprint(PINSTR, "fintrz\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_copy_ext(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_roundint(dest, FPCR_ROUND_RZ);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsstruct fp_ext *
*1da177e4SLinus Torvaldsfp_fscale(struct fp_ext *dest, struct fp_ext *src)
*1da177e4SLinus Torvalds{
*1da177e4SLinus Torvalds	int scale, oldround;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	dprint(PINSTR, "fscale\n");
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Infinities */
*1da177e4SLinus Torvalds	if (IS_INF(src)) {
*1da177e4SLinus Torvalds		fp_set_nan(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds	if (IS_INF(dest))
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* zeroes */
*1da177e4SLinus Torvalds	if (IS_ZERO(src) || IS_ZERO(dest))
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* Source exponent out of range */
*1da177e4SLinus Torvalds	if (src->exp >= 0x400c) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds		return dest;
*1da177e4SLinus Torvalds	}
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* src must be rounded with round to zero. */
*1da177e4SLinus Torvalds	oldround = FPDATA->rnd;
*1da177e4SLinus Torvalds	FPDATA->rnd = FPCR_ROUND_RZ;
*1da177e4SLinus Torvalds	scale = fp_conv_ext2long(src);
*1da177e4SLinus Torvalds	FPDATA->rnd = oldround;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	/* new exponent */
*1da177e4SLinus Torvalds	scale += dest->exp;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	if (scale >= 0x7fff) {
*1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
*1da177e4SLinus Torvalds	} else if (scale <= 0) {
*1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
*1da177e4SLinus Torvalds		fp_denormalize(dest, -scale);
*1da177e4SLinus Torvalds	} else
*1da177e4SLinus Torvalds		dest->exp = scale;
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	return dest;
*1da177e4SLinus Torvalds}
*1da177e4SLinus Torvalds