parisc/math-emu/dfsqrt.c

1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * Linux/PA-RISC Project (http://www.parisc-linux.org/)
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds * Floating-point emulation code
1da177e4SLinus Torvalds *  Copyright (C) 2001 Hewlett-Packard (Paul Bame) <bame@debian.org>
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *    This program is free software; you can redistribute it and/or modify
1da177e4SLinus Torvalds *    it under the terms of the GNU General Public License as published by
1da177e4SLinus Torvalds *    the Free Software Foundation; either version 2, or (at your option)
1da177e4SLinus Torvalds *    any later version.
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *    This program is distributed in the hope that it will be useful,
1da177e4SLinus Torvalds *    but WITHOUT ANY WARRANTY; without even the implied warranty of
1da177e4SLinus Torvalds *    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
1da177e4SLinus Torvalds *    GNU General Public License for more details.
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *    You should have received a copy of the GNU General Public License
1da177e4SLinus Torvalds *    along with this program; if not, write to the Free Software
1da177e4SLinus Torvalds *    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds * BEGIN_DESC
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *  File:
1da177e4SLinus Torvalds *	@(#)	pa/spmath/dfsqrt.c		$Revision: 1.1 $
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *  Purpose:
1da177e4SLinus Torvalds *	Double Floating-point Square Root
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *  External Interfaces:
1da177e4SLinus Torvalds *	dbl_fsqrt(srcptr,nullptr,dstptr,status)
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *  Internal Interfaces:
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds *  Theory:
1da177e4SLinus Torvalds *	<<please update with a overview of the operation of this file>>
1da177e4SLinus Torvalds *
1da177e4SLinus Torvalds * END_DESC
1da177e4SLinus Torvalds*/
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds#include "float.h"
1da177e4SLinus Torvalds#include "dbl_float.h"
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*
1da177e4SLinus Torvalds *  Double Floating-point Square Root
1da177e4SLinus Torvalds */
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds/*ARGSUSED*/
1da177e4SLinus Torvaldsunsigned int
1da177e4SLinus Torvaldsdbl_fsqrt(
1da177e4SLinus Torvalds	    dbl_floating_point *srcptr,
1da177e4SLinus Torvalds	    unsigned int *nullptr,
1da177e4SLinus Torvalds	    dbl_floating_point *dstptr,
1da177e4SLinus Torvalds	    unsigned int *status)
1da177e4SLinus Torvalds{
1da177e4SLinus Torvalds	register unsigned int srcp1, srcp2, resultp1, resultp2;
1da177e4SLinus Torvalds	register unsigned int newbitp1, newbitp2, sump1, sump2;
1da177e4SLinus Torvalds	register int src_exponent;
1da177e4SLinus Torvalds	register boolean guardbit = FALSE, even_exponent;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	Dbl_copyfromptr(srcptr,srcp1,srcp2);
1da177e4SLinus Torvalds        /*
1da177e4SLinus Torvalds         * check source operand for NaN or infinity
1da177e4SLinus Torvalds         */
1da177e4SLinus Torvalds        if ((src_exponent = Dbl_exponent(srcp1)) == DBL_INFINITY_EXPONENT) {
1da177e4SLinus Torvalds                /*
1da177e4SLinus Torvalds                 * is signaling NaN?
1da177e4SLinus Torvalds                 */
1da177e4SLinus Torvalds                if (Dbl_isone_signaling(srcp1)) {
1da177e4SLinus Torvalds                        /* trap if INVALIDTRAP enabled */
1da177e4SLinus Torvalds                        if (Is_invalidtrap_enabled()) return(INVALIDEXCEPTION);
1da177e4SLinus Torvalds                        /* make NaN quiet */
1da177e4SLinus Torvalds                        Set_invalidflag();
1da177e4SLinus Torvalds                        Dbl_set_quiet(srcp1);
1da177e4SLinus Torvalds                }
1da177e4SLinus Torvalds                /*
1da177e4SLinus Torvalds                 * Return quiet NaN or positive infinity.
7022672eSSimon Arlott		 *  Fall through to negative test if negative infinity.
1da177e4SLinus Torvalds                 */
1da177e4SLinus Torvalds		if (Dbl_iszero_sign(srcp1) ||
1da177e4SLinus Torvalds		    Dbl_isnotzero_mantissa(srcp1,srcp2)) {
1da177e4SLinus Torvalds                	Dbl_copytoptr(srcp1,srcp2,dstptr);
1da177e4SLinus Torvalds                	return(NOEXCEPTION);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds        }
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds        /*
1da177e4SLinus Torvalds         * check for zero source operand
1da177e4SLinus Torvalds         */
1da177e4SLinus Torvalds	if (Dbl_iszero_exponentmantissa(srcp1,srcp2)) {
1da177e4SLinus Torvalds		Dbl_copytoptr(srcp1,srcp2,dstptr);
1da177e4SLinus Torvalds		return(NOEXCEPTION);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds        /*
1da177e4SLinus Torvalds         * check for negative source operand
1da177e4SLinus Torvalds         */
1da177e4SLinus Torvalds	if (Dbl_isone_sign(srcp1)) {
1da177e4SLinus Torvalds		/* trap if INVALIDTRAP enabled */
1da177e4SLinus Torvalds		if (Is_invalidtrap_enabled()) return(INVALIDEXCEPTION);
1da177e4SLinus Torvalds		/* make NaN quiet */
1da177e4SLinus Torvalds		Set_invalidflag();
1da177e4SLinus Torvalds		Dbl_makequietnan(srcp1,srcp2);
1da177e4SLinus Torvalds		Dbl_copytoptr(srcp1,srcp2,dstptr);
1da177e4SLinus Torvalds		return(NOEXCEPTION);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/*
1da177e4SLinus Torvalds	 * Generate result
1da177e4SLinus Torvalds	 */
1da177e4SLinus Torvalds	if (src_exponent > 0) {
1da177e4SLinus Torvalds		even_exponent = Dbl_hidden(srcp1);
1da177e4SLinus Torvalds		Dbl_clear_signexponent_set_hidden(srcp1);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	else {
1da177e4SLinus Torvalds		/* normalize operand */
1da177e4SLinus Torvalds		Dbl_clear_signexponent(srcp1);
1da177e4SLinus Torvalds		src_exponent++;
1da177e4SLinus Torvalds		Dbl_normalize(srcp1,srcp2,src_exponent);
1da177e4SLinus Torvalds		even_exponent = src_exponent & 1;
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	if (even_exponent) {
1da177e4SLinus Torvalds		/* exponent is even */
1da177e4SLinus Torvalds		/* Add comment here.  Explain why odd exponent needs correction */
1da177e4SLinus Torvalds		Dbl_leftshiftby1(srcp1,srcp2);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	/*
1da177e4SLinus Torvalds	 * Add comment here.  Explain following algorithm.
1da177e4SLinus Torvalds	 *
1da177e4SLinus Torvalds	 * Trust me, it works.
1da177e4SLinus Torvalds	 *
1da177e4SLinus Torvalds	 */
1da177e4SLinus Torvalds	Dbl_setzero(resultp1,resultp2);
1da177e4SLinus Torvalds	Dbl_allp1(newbitp1) = 1 << (DBL_P - 32);
1da177e4SLinus Torvalds	Dbl_setzero_mantissap2(newbitp2);
1da177e4SLinus Torvalds	while (Dbl_isnotzero(newbitp1,newbitp2) && Dbl_isnotzero(srcp1,srcp2)) {
1da177e4SLinus Torvalds		Dbl_addition(resultp1,resultp2,newbitp1,newbitp2,sump1,sump2);
1da177e4SLinus Torvalds		if(Dbl_isnotgreaterthan(sump1,sump2,srcp1,srcp2)) {
1da177e4SLinus Torvalds			Dbl_leftshiftby1(newbitp1,newbitp2);
1da177e4SLinus Torvalds			/* update result */
1da177e4SLinus Torvalds			Dbl_addition(resultp1,resultp2,newbitp1,newbitp2,
1da177e4SLinus Torvalds			 resultp1,resultp2);
1da177e4SLinus Torvalds			Dbl_subtract(srcp1,srcp2,sump1,sump2,srcp1,srcp2);
1da177e4SLinus Torvalds			Dbl_rightshiftby2(newbitp1,newbitp2);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		else {
1da177e4SLinus Torvalds			Dbl_rightshiftby1(newbitp1,newbitp2);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		Dbl_leftshiftby1(srcp1,srcp2);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	/* correct exponent for pre-shift */
1da177e4SLinus Torvalds	if (even_exponent) {
1da177e4SLinus Torvalds		Dbl_rightshiftby1(resultp1,resultp2);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds	/* check for inexact */
1da177e4SLinus Torvalds	if (Dbl_isnotzero(srcp1,srcp2)) {
1da177e4SLinus Torvalds		if (!even_exponent && Dbl_islessthan(resultp1,resultp2,srcp1,srcp2)) {
1da177e4SLinus Torvalds			Dbl_increment(resultp1,resultp2);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		guardbit = Dbl_lowmantissap2(resultp2);
1da177e4SLinus Torvalds		Dbl_rightshiftby1(resultp1,resultp2);
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		/*  now round result  */
1da177e4SLinus Torvalds		switch (Rounding_mode()) {
1da177e4SLinus Torvalds		case ROUNDPLUS:
1da177e4SLinus Torvalds		     Dbl_increment(resultp1,resultp2);
1da177e4SLinus Torvalds		     break;
1da177e4SLinus Torvalds		case ROUNDNEAREST:
1da177e4SLinus Torvalds		     /* stickybit is always true, so guardbit
1da177e4SLinus Torvalds		      * is enough to determine rounding */
1da177e4SLinus Torvalds		     if (guardbit) {
1da177e4SLinus Torvalds			    Dbl_increment(resultp1,resultp2);
1da177e4SLinus Torvalds		     }
1da177e4SLinus Torvalds		     break;
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		/* increment result exponent by 1 if mantissa overflowed */
1da177e4SLinus Torvalds		if (Dbl_isone_hiddenoverflow(resultp1)) src_exponent+=2;
1da177e4SLinus Torvalds
1da177e4SLinus Torvalds		if (Is_inexacttrap_enabled()) {
1da177e4SLinus Torvalds			Dbl_set_exponent(resultp1,
1da177e4SLinus Torvalds			 ((src_exponent-DBL_BIAS)>>1)+DBL_BIAS);
1da177e4SLinus Torvalds			Dbl_copytoptr(resultp1,resultp2,dstptr);
1da177e4SLinus Torvalds			return(INEXACTEXCEPTION);
1da177e4SLinus Torvalds		}
1da177e4SLinus Torvalds		else Set_inexactflag();
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	else {
1da177e4SLinus Torvalds		Dbl_rightshiftby1(resultp1,resultp2);
1da177e4SLinus Torvalds	}
1da177e4SLinus Torvalds	Dbl_set_exponent(resultp1,((src_exponent-DBL_BIAS)>>1)+DBL_BIAS);
1da177e4SLinus Torvalds	Dbl_copytoptr(resultp1,resultp2,dstptr);
1da177e4SLinus Torvalds	return(NOEXCEPTION);
1da177e4SLinus Torvalds}