m68k/math-emu/fp_arith.c

6253c22eSThomas Gleixner// SPDX-License-Identifier: GPL-2.0-or-later
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   fp_arith.c: floating-point math routines for the Linux-m68k
1da177e4SLinus Torvalds   floating point emulator.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   Copyright (c) 1998-1999 David Huggins-Daines.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   Somewhat based on the AlphaLinux floating point emulator, by David
1da177e4SLinus Torvalds   Mosberger-Tang.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#include "fp_emu.h"
1da177e4SLinus Torvalds#include "multi_arith.h"
1da177e4SLinus Torvalds#include "fp_arith.h"
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsconst struct fp_ext fp_QNaN =
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	.exp = 0x7fff,
1da177e4SLinus Torvalds	.mant = { .m64 = ~0 }
1da177e4SLinus Torvalds};
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsconst struct fp_ext fp_Inf =
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	.exp = 0x7fff,
1da177e4SLinus Torvalds};
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* let's start with the easy ones */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fabs(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fabs\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_monadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dest->sign = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fneg(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fneg\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_monadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dest->sign = !dest->sign;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* Now, the slightly harder ones */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_fadd: Implements the kernel of the FADD, FSADD, FDADD, FSUB,
1da177e4SLinus Torvalds   FDSUB, and FCMP instructions. */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fadd(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	int diff;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fadd\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (IS_INF(dest)) {
1da177e4SLinus Torvalds		/* infinity - infinity == NaN */
1da177e4SLinus Torvalds		if (IS_INF(src) && (src->sign != dest->sign))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		fp_copy_ext(dest, src);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
1da177e4SLinus Torvalds		if (IS_ZERO(src)) {
1da177e4SLinus Torvalds			if (src->sign != dest->sign) {
1da177e4SLinus Torvalds				if (FPDATA->rnd == FPCR_ROUND_RM)
1da177e4SLinus Torvalds					dest->sign = 1;
1da177e4SLinus Torvalds				else
1da177e4SLinus Torvalds					dest->sign = 0;
1da177e4SLinus Torvalds			}
1da177e4SLinus Torvalds		} else
1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dest->lowmant = src->lowmant = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if ((diff = dest->exp - src->exp) > 0)
1da177e4SLinus Torvalds		fp_denormalize(src, diff);
1da177e4SLinus Torvalds	else if ((diff = -diff) > 0)
1da177e4SLinus Torvalds		fp_denormalize(dest, diff);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (dest->sign == src->sign) {
1da177e4SLinus Torvalds		if (fp_addmant(dest, src))
1da177e4SLinus Torvalds			if (!fp_addcarry(dest))
1da177e4SLinus Torvalds				return dest;
1da177e4SLinus Torvalds	} else {
1da177e4SLinus Torvalds		if (dest->mant.m64 < src->mant.m64) {
1da177e4SLinus Torvalds			fp_submant(dest, src, dest);
1da177e4SLinus Torvalds			dest->sign = !dest->sign;
1da177e4SLinus Torvalds		} else
1da177e4SLinus Torvalds			fp_submant(dest, dest, src);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_fsub: Implements the kernel of the FSUB, FSSUB, and FDSUB
1da177e4SLinus Torvalds   instructions.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   Remember that the arguments are in assembler-syntax order! */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fsub(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fsub ");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	src->sign = !src->sign;
1da177e4SLinus Torvalds	return fp_fadd(dest, src);
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fcmp(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fcmp ");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	FPDATA->temp[1] = *dest;
1da177e4SLinus Torvalds	src->sign = !src->sign;
1da177e4SLinus Torvalds	return fp_fadd(&FPDATA->temp[1], src);
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_ftst(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "ftst\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	(void)dest;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return src;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fmul(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	union fp_mant128 temp;
1da177e4SLinus Torvalds	int exp;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fmul\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Handle infinities */
1da177e4SLinus Torvalds	if (IS_INF(dest)) {
1da177e4SLinus Torvalds		if (IS_ZERO(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		if (IS_ZERO(dest))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		else
1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Of course, as we all know, zero * anything = zero.  You may
1da177e4SLinus Torvalds	   not have known that it might be a positive or negative
1da177e4SLinus Torvalds	   zero... */
1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_ZERO(src)) {
1da177e4SLinus Torvalds		dest->exp = 0;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds		dest->lowmant = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	exp = dest->exp + src->exp - 0x3ffe;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* shift up the mantissa for denormalized numbers,
1da177e4SLinus Torvalds	   so that the highest bit is set, this makes the
1da177e4SLinus Torvalds	   shift of the result below easier */
1da177e4SLinus Torvalds	if ((long)dest->mant.m32[0] >= 0)
1da177e4SLinus Torvalds		exp -= fp_overnormalize(dest);
1da177e4SLinus Torvalds	if ((long)src->mant.m32[0] >= 0)
1da177e4SLinus Torvalds		exp -= fp_overnormalize(src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* now, do a 64-bit multiply with expansion */
1da177e4SLinus Torvalds	fp_multiplymant(&temp, dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* normalize it back to 64 bits and stuff it back into the
1da177e4SLinus Torvalds	   destination struct */
1da177e4SLinus Torvalds	if ((long)temp.m32[0] > 0) {
1da177e4SLinus Torvalds		exp--;
1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 1);
1da177e4SLinus Torvalds	} else
1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 0);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	dest->exp = exp;
1da177e4SLinus Torvalds	if (exp < 0) {
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_fdiv: Implements the "kernel" of the FDIV, FSDIV, FDDIV and
1da177e4SLinus Torvalds   FSGLDIV instructions.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   Note that the order of the operands is counter-intuitive: instead
1da177e4SLinus Torvalds   of src / dest, the result is actually dest / src. */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fdiv(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	union fp_mant128 temp;
1da177e4SLinus Torvalds	int exp;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fdiv\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Handle infinities */
1da177e4SLinus Torvalds	if (IS_INF(dest)) {
1da177e4SLinus Torvalds		/* infinity / infinity = NaN (quiet, as always) */
1da177e4SLinus Torvalds		if (IS_INF(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
*4fbdb1a9SJulia Lawall		/* infinity / anything else = infinity (with appropriate sign) */
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		/* anything / infinity = zero (with appropriate sign) */
1da177e4SLinus Torvalds		dest->exp = 0;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds		dest->lowmant = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* zeroes */
1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
1da177e4SLinus Torvalds		/* zero / zero = NaN */
1da177e4SLinus Torvalds		if (IS_ZERO(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		/* zero / anything else = zero */
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_ZERO(src)) {
1da177e4SLinus Torvalds		/* anything / zero = infinity (with appropriate sign) */
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_DZ);
1da177e4SLinus Torvalds		dest->exp = 0x7fff;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	exp = dest->exp - src->exp + 0x3fff;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* shift up the mantissa for denormalized numbers,
1da177e4SLinus Torvalds	   so that the highest bit is set, this makes lots
1da177e4SLinus Torvalds	   of things below easier */
1da177e4SLinus Torvalds	if ((long)dest->mant.m32[0] >= 0)
1da177e4SLinus Torvalds		exp -= fp_overnormalize(dest);
1da177e4SLinus Torvalds	if ((long)src->mant.m32[0] >= 0)
1da177e4SLinus Torvalds		exp -= fp_overnormalize(src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* now, do the 64-bit divide */
1da177e4SLinus Torvalds	fp_dividemant(&temp, dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* normalize it back to 64 bits and stuff it back into the
1da177e4SLinus Torvalds	   destination struct */
1da177e4SLinus Torvalds	if (!temp.m32[0]) {
1da177e4SLinus Torvalds		exp--;
1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 32);
1da177e4SLinus Torvalds	} else
1da177e4SLinus Torvalds		fp_putmant128(dest, &temp, 31);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	dest->exp = exp;
1da177e4SLinus Torvalds	if (exp < 0) {
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fsglmul(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	int exp;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fsglmul\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Handle infinities */
1da177e4SLinus Torvalds	if (IS_INF(dest)) {
1da177e4SLinus Torvalds		if (IS_ZERO(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		if (IS_ZERO(dest))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		else
1da177e4SLinus Torvalds			fp_copy_ext(dest, src);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Of course, as we all know, zero * anything = zero.  You may
1da177e4SLinus Torvalds	   not have known that it might be a positive or negative
1da177e4SLinus Torvalds	   zero... */
1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_ZERO(src)) {
1da177e4SLinus Torvalds		dest->exp = 0;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds		dest->lowmant = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	exp = dest->exp + src->exp - 0x3ffe;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* do a 32-bit multiply */
1da177e4SLinus Torvalds	fp_mul64(dest->mant.m32[0], dest->mant.m32[1],
1da177e4SLinus Torvalds		 dest->mant.m32[0] & 0xffffff00,
1da177e4SLinus Torvalds		 src->mant.m32[0] & 0xffffff00);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	dest->exp = exp;
1da177e4SLinus Torvalds	if (exp < 0) {
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fsgldiv(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	int exp;
1da177e4SLinus Torvalds	unsigned long quot, rem;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fsgldiv\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* calculate the correct sign now, as it's necessary for infinities */
1da177e4SLinus Torvalds	dest->sign = src->sign ^ dest->sign;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Handle infinities */
1da177e4SLinus Torvalds	if (IS_INF(dest)) {
1da177e4SLinus Torvalds		/* infinity / infinity = NaN (quiet, as always) */
1da177e4SLinus Torvalds		if (IS_INF(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		/* infinity / anything else = infinity (with approprate sign) */
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		/* anything / infinity = zero (with appropriate sign) */
1da177e4SLinus Torvalds		dest->exp = 0;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds		dest->lowmant = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* zeroes */
1da177e4SLinus Torvalds	if (IS_ZERO(dest)) {
1da177e4SLinus Torvalds		/* zero / zero = NaN */
1da177e4SLinus Torvalds		if (IS_ZERO(src))
1da177e4SLinus Torvalds			fp_set_nan(dest);
1da177e4SLinus Torvalds		/* zero / anything else = zero */
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_ZERO(src)) {
1da177e4SLinus Torvalds		/* anything / zero = infinity (with appropriate sign) */
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_DZ);
1da177e4SLinus Torvalds		dest->exp = 0x7fff;
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	exp = dest->exp - src->exp + 0x3fff;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dest->mant.m32[0] &= 0xffffff00;
1da177e4SLinus Torvalds	src->mant.m32[0] &= 0xffffff00;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* do the 32-bit divide */
1da177e4SLinus Torvalds	if (dest->mant.m32[0] >= src->mant.m32[0]) {
1da177e4SLinus Torvalds		fp_sub64(dest->mant, src->mant);
1da177e4SLinus Torvalds		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000 | (quot >> 1);
1da177e4SLinus Torvalds		dest->mant.m32[1] = (quot & 1) | rem;	/* only for rounding */
1da177e4SLinus Torvalds	} else {
1da177e4SLinus Torvalds		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
1da177e4SLinus Torvalds		dest->mant.m32[0] = quot;
1da177e4SLinus Torvalds		dest->mant.m32[1] = rem;		/* only for rounding */
1da177e4SLinus Torvalds		exp--;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (exp >= 0x7fff) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	dest->exp = exp;
1da177e4SLinus Torvalds	if (exp < 0) {
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
1da177e4SLinus Torvalds		fp_denormalize(dest, -exp);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_roundint: Internal rounding function for use by several of these
1da177e4SLinus Torvalds   emulated instructions.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   This one rounds off the fractional part using the rounding mode
1da177e4SLinus Torvalds   specified. */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstatic void fp_roundint(struct fp_ext *dest, int mode)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	union fp_mant64 oldmant;
1da177e4SLinus Torvalds	unsigned long mask;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (!fp_normalize_ext(dest))
1da177e4SLinus Torvalds		return;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* infinities and zeroes */
1da177e4SLinus Torvalds	if (IS_INF(dest) || IS_ZERO(dest))
1da177e4SLinus Torvalds		return;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* first truncate the lower bits */
1da177e4SLinus Torvalds	oldmant = dest->mant;
1da177e4SLinus Torvalds	switch (dest->exp) {
1da177e4SLinus Torvalds	case 0 ... 0x3ffe:
1da177e4SLinus Torvalds		dest->mant.m64 = 0;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	case 0x3fff ... 0x401e:
1da177e4SLinus Torvalds		dest->mant.m32[0] &= 0xffffffffU << (0x401e - dest->exp);
1da177e4SLinus Torvalds		dest->mant.m32[1] = 0;
1da177e4SLinus Torvalds		if (oldmant.m64 == dest->mant.m64)
1da177e4SLinus Torvalds			return;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	case 0x401f ... 0x403e:
1da177e4SLinus Torvalds		dest->mant.m32[1] &= 0xffffffffU << (0x403e - dest->exp);
1da177e4SLinus Torvalds		if (oldmant.m32[1] == dest->mant.m32[1])
1da177e4SLinus Torvalds			return;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	default:
1da177e4SLinus Torvalds		return;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	fp_set_sr(FPSR_EXC_INEX2);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* We might want to normalize upwards here... however, since
1da177e4SLinus Torvalds	   we know that this is only called on the output of fp_fdiv,
1da177e4SLinus Torvalds	   or with the input to fp_fint or fp_fintrz, and the inputs
1da177e4SLinus Torvalds	   to all these functions are either normal or denormalized
1da177e4SLinus Torvalds	   (no subnormals allowed!), there's really no need.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	   In the case of fp_fdiv, observe that 0x80000000 / 0xffff =
1da177e4SLinus Torvalds	   0xffff8000, and the same holds for 128-bit / 64-bit. (i.e. the
1da177e4SLinus Torvalds	   smallest possible normal dividend and the largest possible normal
1da177e4SLinus Torvalds	   divisor will still produce a normal quotient, therefore, (normal
1da177e4SLinus Torvalds	   << 64) / normal is normal in all cases) */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	switch (mode) {
1da177e4SLinus Torvalds	case FPCR_ROUND_RN:
1da177e4SLinus Torvalds		switch (dest->exp) {
1da177e4SLinus Torvalds		case 0 ... 0x3ffd:
1da177e4SLinus Torvalds			return;
1da177e4SLinus Torvalds		case 0x3ffe:
1da177e4SLinus Torvalds			/* As noted above, the input is always normal, so the
1da177e4SLinus Torvalds			   guard bit (bit 63) is always set.  therefore, the
1da177e4SLinus Torvalds			   only case in which we will NOT round to 1.0 is when
1da177e4SLinus Torvalds			   the input is exactly 0.5. */
1da177e4SLinus Torvalds			if (oldmant.m64 == (1ULL << 63))
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		case 0x3fff ... 0x401d:
1da177e4SLinus Torvalds			mask = 1 << (0x401d - dest->exp);
1da177e4SLinus Torvalds			if (!(oldmant.m32[0] & mask))
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			if (oldmant.m32[0] & (mask << 1))
1da177e4SLinus Torvalds				break;
1da177e4SLinus Torvalds			if (!(oldmant.m32[0] << (dest->exp - 0x3ffd)) &&
1da177e4SLinus Torvalds					!oldmant.m32[1])
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		case 0x401e:
ddc2fc2cSChen Gang			if (oldmant.m32[1] & 0x80000000)
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			if (oldmant.m32[0] & 1)
1da177e4SLinus Torvalds				break;
1da177e4SLinus Torvalds			if (!(oldmant.m32[1] << 1))
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		case 0x401f ... 0x403d:
1da177e4SLinus Torvalds			mask = 1 << (0x403d - dest->exp);
1da177e4SLinus Torvalds			if (!(oldmant.m32[1] & mask))
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			if (oldmant.m32[1] & (mask << 1))
1da177e4SLinus Torvalds				break;
1da177e4SLinus Torvalds			if (!(oldmant.m32[1] << (dest->exp - 0x401d)))
1da177e4SLinus Torvalds				return;
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		default:
1da177e4SLinus Torvalds			return;
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	case FPCR_ROUND_RZ:
1da177e4SLinus Torvalds		return;
1da177e4SLinus Torvalds	default:
1da177e4SLinus Torvalds		if (dest->sign ^ (mode - FPCR_ROUND_RM))
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		return;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	switch (dest->exp) {
1da177e4SLinus Torvalds	case 0 ... 0x3ffe:
1da177e4SLinus Torvalds		dest->exp = 0x3fff;
1da177e4SLinus Torvalds		dest->mant.m64 = 1ULL << 63;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	case 0x3fff ... 0x401e:
1da177e4SLinus Torvalds		mask = 1 << (0x401e - dest->exp);
1da177e4SLinus Torvalds		if (dest->mant.m32[0] += mask)
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000;
1da177e4SLinus Torvalds		dest->exp++;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	case 0x401f ... 0x403e:
1da177e4SLinus Torvalds		mask = 1 << (0x403e - dest->exp);
1da177e4SLinus Torvalds		if (dest->mant.m32[1] += mask)
1da177e4SLinus Torvalds			break;
1da177e4SLinus Torvalds		if (dest->mant.m32[0] += 1)
1da177e4SLinus Torvalds                        break;
1da177e4SLinus Torvalds		dest->mant.m32[0] = 0x80000000;
1da177e4SLinus Torvalds                dest->exp++;
1da177e4SLinus Torvalds		break;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* modrem_kernel: Implementation of the FREM and FMOD instructions
1da177e4SLinus Torvalds   (which are exactly the same, except for the rounding used on the
1da177e4SLinus Torvalds   intermediate value) */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstatic struct fp_ext *
1da177e4SLinus Torvaldsmodrem_kernel(struct fp_ext *dest, struct fp_ext *src, int mode)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	struct fp_ext tmp;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Infinities and zeros */
1da177e4SLinus Torvalds	if (IS_INF(dest) || IS_ZERO(src)) {
1da177e4SLinus Torvalds		fp_set_nan(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_ZERO(dest) || IS_INF(src))
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* FIXME: there is almost certainly a smarter way to do this */
1da177e4SLinus Torvalds	fp_copy_ext(&tmp, dest);
1da177e4SLinus Torvalds	fp_fdiv(&tmp, src);		/* NOTE: src might be modified */
1da177e4SLinus Torvalds	fp_roundint(&tmp, mode);
1da177e4SLinus Torvalds	fp_fmul(&tmp, src);
1da177e4SLinus Torvalds	fp_fsub(dest, &tmp);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* set the quotient byte */
1da177e4SLinus Torvalds	fp_set_quotient((dest->mant.m64 & 0x7f) | (dest->sign << 7));
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_fmod: Implements the kernel of the FMOD instruction.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   Again, the argument order is backwards.  The result, as defined in
1da177e4SLinus Torvalds   the Motorola manuals, is:
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   fmod(src,dest) = (dest - (src * floor(dest / src))) */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fmod(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fmod\n");
1da177e4SLinus Torvalds	return modrem_kernel(dest, src, FPCR_ROUND_RZ);
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/* fp_frem: Implements the kernel of the FREM instruction.
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds   frem(src,dest) = (dest - (src * round(dest / src)))
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_frem(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "frem\n");
1da177e4SLinus Torvalds	return modrem_kernel(dest, src, FPCR_ROUND_RN);
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fint(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fint\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_copy_ext(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_roundint(dest, FPDATA->rnd);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fintrz(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	dprint(PINSTR, "fintrz\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_copy_ext(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_roundint(dest, FPCR_ROUND_RZ);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds
1da177e4SLinus Torvaldsstruct fp_ext *
1da177e4SLinus Torvaldsfp_fscale(struct fp_ext *dest, struct fp_ext *src)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	int scale, oldround;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	dprint(PINSTR, "fscale\n");
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	fp_dyadic_check(dest, src);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Infinities */
1da177e4SLinus Torvalds	if (IS_INF(src)) {
1da177e4SLinus Torvalds		fp_set_nan(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (IS_INF(dest))
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* zeroes */
1da177e4SLinus Torvalds	if (IS_ZERO(src) || IS_ZERO(dest))
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* Source exponent out of range */
1da177e4SLinus Torvalds	if (src->exp >= 0x400c) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds		return dest;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* src must be rounded with round to zero. */
1da177e4SLinus Torvalds	oldround = FPDATA->rnd;
1da177e4SLinus Torvalds	FPDATA->rnd = FPCR_ROUND_RZ;
1da177e4SLinus Torvalds	scale = fp_conv_ext2long(src);
1da177e4SLinus Torvalds	FPDATA->rnd = oldround;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* new exponent */
1da177e4SLinus Torvalds	scale += dest->exp;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	if (scale >= 0x7fff) {
1da177e4SLinus Torvalds		fp_set_ovrflw(dest);
1da177e4SLinus Torvalds	} else if (scale <= 0) {
1da177e4SLinus Torvalds		fp_set_sr(FPSR_EXC_UNFL);
1da177e4SLinus Torvalds		fp_denormalize(dest, -scale);
1da177e4SLinus Torvalds	} else
1da177e4SLinus Torvalds		dest->exp = scale;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	return dest;
1da177e4SLinus Torvalds}
1da177e4SLinus Torvalds