m68k/fpsp040/sint.S

*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	sint.sa 3.1 12/10/90
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	The entry point sINT computes the rounded integer
*1da177e4SLinus Torvalds|	equivalent of the input argument, sINTRZ computes
*1da177e4SLinus Torvalds|	the integer rounded to zero of the input argument.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Entry points sint and sintrz are called from do_func
*1da177e4SLinus Torvalds|	to emulate the fint and fintrz unimplemented instructions,
*1da177e4SLinus Torvalds|	respectively.  Entry point sintdo is used by bindec.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Input: (Entry points sint and sintrz) Double-extended
*1da177e4SLinus Torvalds|		number X in the ETEMP space in the floating-point
*1da177e4SLinus Torvalds|		save stack.
*1da177e4SLinus Torvalds|	       (Entry point sintdo) Double-extended number X in
*1da177e4SLinus Torvalds|		location pointed to by the address register a0.
*1da177e4SLinus Torvalds|	       (Entry point sintd) Double-extended denormalized
*1da177e4SLinus Torvalds|		number X in the ETEMP space in the floating-point
*1da177e4SLinus Torvalds|		save stack.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Output: The function returns int(X) or intrz(X) in fp0.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Modifies: fp0.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Algorithm: (sint and sintrz)
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	1. If exp(X) >= 63, return X.
*1da177e4SLinus Torvalds|	   If exp(X) < 0, return +/- 0 or +/- 1, according to
*1da177e4SLinus Torvalds|	   the rounding mode.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	2. (X is in range) set rsc = 63 - exp(X). Unnormalize the
*1da177e4SLinus Torvalds|	   result to the exponent $403e.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	3. Round the result in the mode given in USER_FPCR. For
*1da177e4SLinus Torvalds|	   sintrz, force round-to-zero mode.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	4. Normalize the rounded result; store in fp0.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	For the denormalized cases, force the correct result
*1da177e4SLinus Torvalds|	for the given sign and rounding mode.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|		        Sign(X)
*1da177e4SLinus Torvalds|		RMODE   +    -
*1da177e4SLinus Torvalds|		-----  --------
*1da177e4SLinus Torvalds|		 RN    +0   -0
*1da177e4SLinus Torvalds|		 RZ    +0   -0
*1da177e4SLinus Torvalds|		 RM    +0   -1
*1da177e4SLinus Torvalds|		 RP    +1   -0
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|		Copyright (C) Motorola, Inc. 1990
*1da177e4SLinus Torvalds|			All Rights Reserved
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	THIS IS UNPUBLISHED PROPRIETARY SOURCE CODE OF MOTOROLA
*1da177e4SLinus Torvalds|	The copyright notice above does not evidence any
*1da177e4SLinus Torvalds|	actual or intended publication of such source code.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|SINT    idnt    2,1 | Motorola 040 Floating Point Software Package
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|section	8
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds#include "fpsp.h"
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|xref	dnrm_lp
*1da177e4SLinus Torvalds	|xref	nrm_set
*1da177e4SLinus Torvalds	|xref	round
*1da177e4SLinus Torvalds	|xref	t_inx2
*1da177e4SLinus Torvalds	|xref	ld_pone
*1da177e4SLinus Torvalds	|xref	ld_mone
*1da177e4SLinus Torvalds	|xref	ld_pzero
*1da177e4SLinus Torvalds	|xref	ld_mzero
*1da177e4SLinus Torvalds	|xref	snzrinx
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	FINT
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	.global	sint
*1da177e4SLinus Torvaldssint:
*1da177e4SLinus Torvalds	bfextu	FPCR_MODE(%a6){#2:#2},%d1	|use user's mode for rounding
*1da177e4SLinus Torvalds|					;implicitly has extend precision
*1da177e4SLinus Torvalds|					;in upper word.
*1da177e4SLinus Torvalds	movel	%d1,L_SCR1(%a6)		|save mode bits
*1da177e4SLinus Torvalds	bras	sintexc
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	FINT with extended denorm inputs.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	.global	sintd
*1da177e4SLinus Torvaldssintd:
*1da177e4SLinus Torvalds	btstb	#5,FPCR_MODE(%a6)
*1da177e4SLinus Torvalds	beq	snzrinx		|if round nearest or round zero, +/- 0
*1da177e4SLinus Torvalds	btstb	#4,FPCR_MODE(%a6)
*1da177e4SLinus Torvalds	beqs	rnd_mns
*1da177e4SLinus Torvaldsrnd_pls:
*1da177e4SLinus Torvalds	btstb	#sign_bit,LOCAL_EX(%a0)
*1da177e4SLinus Torvalds	bnes	sintmz
*1da177e4SLinus Torvalds	bsr	ld_pone		|if round plus inf and pos, answer is +1
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldsrnd_mns:
*1da177e4SLinus Torvalds	btstb	#sign_bit,LOCAL_EX(%a0)
*1da177e4SLinus Torvalds	beqs	sintpz
*1da177e4SLinus Torvalds	bsr	ld_mone		|if round mns inf and neg, answer is -1
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldssintpz:
*1da177e4SLinus Torvalds	bsr	ld_pzero
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldssintmz:
*1da177e4SLinus Torvalds	bsr	ld_mzero
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	FINTRZ
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	.global	sintrz
*1da177e4SLinus Torvaldssintrz:
*1da177e4SLinus Torvalds	movel	#1,L_SCR1(%a6)		|use rz mode for rounding
*1da177e4SLinus Torvalds|					;implicitly has extend precision
*1da177e4SLinus Torvalds|					;in upper word.
*1da177e4SLinus Torvalds	bras	sintexc
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	SINTDO
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	Input:	a0 points to an IEEE extended format operand
*1da177e4SLinus Torvalds|	Output:	fp0 has the result
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Exceptions:
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| If the subroutine results in an inexact operation, the inx2 and
*1da177e4SLinus Torvalds| ainx bits in the USER_FPSR are set.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	.global	sintdo
*1da177e4SLinus Torvaldssintdo:
*1da177e4SLinus Torvalds	bfextu	FPCR_MODE(%a6){#2:#2},%d1	|use user's mode for rounding
*1da177e4SLinus Torvalds|					;implicitly has ext precision
*1da177e4SLinus Torvalds|					;in upper word.
*1da177e4SLinus Torvalds	movel	%d1,L_SCR1(%a6)		|save mode bits
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Real work of sint is in sintexc
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvaldssintexc:
*1da177e4SLinus Torvalds	bclrb	#sign_bit,LOCAL_EX(%a0)	|convert to internal extended
*1da177e4SLinus Torvalds|					;format
*1da177e4SLinus Torvalds	sne	LOCAL_SGN(%a0)
*1da177e4SLinus Torvalds	cmpw	#0x403e,LOCAL_EX(%a0)	|check if (unbiased) exp > 63
*1da177e4SLinus Torvalds	bgts	out_rnge			|branch if exp < 63
*1da177e4SLinus Torvalds	cmpw	#0x3ffd,LOCAL_EX(%a0)	|check if (unbiased) exp < 0
*1da177e4SLinus Torvalds	bgt	in_rnge			|if 63 >= exp > 0, do calc
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Input is less than zero.  Restore sign, and check for directed
*1da177e4SLinus Torvalds| rounding modes.  L_SCR1 contains the rmode in the lower byte.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvaldsun_rnge:
*1da177e4SLinus Torvalds	btstb	#1,L_SCR1+3(%a6)		|check for rn and rz
*1da177e4SLinus Torvalds	beqs	un_rnrz
*1da177e4SLinus Torvalds	tstb	LOCAL_SGN(%a0)		|check for sign
*1da177e4SLinus Torvalds	bnes	un_rmrp_neg
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Sign is +.  If rp, load +1.0, if rm, load +0.0
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	cmpib	#3,L_SCR1+3(%a6)		|check for rp
*1da177e4SLinus Torvalds	beqs	un_ldpone		|if rp, load +1.0
*1da177e4SLinus Torvalds	bsr	ld_pzero		|if rm, load +0.0
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldsun_ldpone:
*1da177e4SLinus Torvalds	bsr	ld_pone
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Sign is -.  If rm, load -1.0, if rp, load -0.0
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvaldsun_rmrp_neg:
*1da177e4SLinus Torvalds	cmpib	#2,L_SCR1+3(%a6)		|check for rm
*1da177e4SLinus Torvalds	beqs	un_ldmone		|if rm, load -1.0
*1da177e4SLinus Torvalds	bsr	ld_mzero		|if rp, load -0.0
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldsun_ldmone:
*1da177e4SLinus Torvalds	bsr	ld_mone
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Rmode is rn or rz; return signed zero
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvaldsun_rnrz:
*1da177e4SLinus Torvalds	tstb	LOCAL_SGN(%a0)		|check for sign
*1da177e4SLinus Torvalds	bnes	un_rnrz_neg
*1da177e4SLinus Torvalds	bsr	ld_pzero
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvaldsun_rnrz_neg:
*1da177e4SLinus Torvalds	bsr	ld_mzero
*1da177e4SLinus Torvalds	bra	t_inx2
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| Input is greater than 2^63.  All bits are significant.  Return
*1da177e4SLinus Torvalds| the input.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvaldsout_rnge:
*1da177e4SLinus Torvalds	bfclr	LOCAL_SGN(%a0){#0:#8}	|change back to IEEE ext format
*1da177e4SLinus Torvalds	beqs	intps
*1da177e4SLinus Torvalds	bsetb	#sign_bit,LOCAL_EX(%a0)
*1da177e4SLinus Torvaldsintps:
*1da177e4SLinus Torvalds	fmovel	%fpcr,-(%sp)
*1da177e4SLinus Torvalds	fmovel	#0,%fpcr
*1da177e4SLinus Torvalds	fmovex LOCAL_EX(%a0),%fp0	|if exp > 63
*1da177e4SLinus Torvalds|					;then return X to the user
*1da177e4SLinus Torvalds|					;there are no fraction bits
*1da177e4SLinus Torvalds	fmovel	(%sp)+,%fpcr
*1da177e4SLinus Torvalds	rts
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvaldsin_rnge:
*1da177e4SLinus Torvalds|					;shift off fraction bits
*1da177e4SLinus Torvalds	clrl	%d0			|clear d0 - initial g,r,s for
*1da177e4SLinus Torvalds|					;dnrm_lp
*1da177e4SLinus Torvalds	movel	#0x403e,%d1		|set threshold for dnrm_lp
*1da177e4SLinus Torvalds|					;assumes a0 points to operand
*1da177e4SLinus Torvalds	bsr	dnrm_lp
*1da177e4SLinus Torvalds|					;returns unnormalized number
*1da177e4SLinus Torvalds|					;pointed by a0
*1da177e4SLinus Torvalds|					;output d0 supplies g,r,s
*1da177e4SLinus Torvalds|					;used by round
*1da177e4SLinus Torvalds	movel	L_SCR1(%a6),%d1		|use selected rounding mode
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	bsr	round			|round the unnorm based on users
*1da177e4SLinus Torvalds|					;input	a0 ptr to ext X
*1da177e4SLinus Torvalds|					;	d0 g,r,s bits
*1da177e4SLinus Torvalds|					;	d1 PREC/MODE info
*1da177e4SLinus Torvalds|					;output a0 ptr to rounded result
*1da177e4SLinus Torvalds|					;inexact flag set in USER_FPSR
*1da177e4SLinus Torvalds|					;if initial grs set
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds| normalize the rounded result and store value in fp0
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds	bsr	nrm_set			|normalize the unnorm
*1da177e4SLinus Torvalds|					;Input: a0 points to operand to
*1da177e4SLinus Torvalds|					;be normalized
*1da177e4SLinus Torvalds|					;Output: a0 points to normalized
*1da177e4SLinus Torvalds|					;result
*1da177e4SLinus Torvalds	bfclr	LOCAL_SGN(%a0){#0:#8}
*1da177e4SLinus Torvalds	beqs	nrmrndp
*1da177e4SLinus Torvalds	bsetb	#sign_bit,LOCAL_EX(%a0)	|return to IEEE extended format
*1da177e4SLinus Torvaldsnrmrndp:
*1da177e4SLinus Torvalds	fmovel	%fpcr,-(%sp)
*1da177e4SLinus Torvalds	fmovel	#0,%fpcr
*1da177e4SLinus Torvalds	fmovex LOCAL_EX(%a0),%fp0	|move result to fp0
*1da177e4SLinus Torvalds	fmovel	(%sp)+,%fpcr
*1da177e4SLinus Torvalds	rts
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|end