m68k/fpsp040/ssinh.S

*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	ssinh.sa 3.1 12/10/90
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       The entry point sSinh computes the hyperbolic sine of
*1da177e4SLinus Torvalds|       an input argument; sSinhd does the same except for denormalized
*1da177e4SLinus Torvalds|       input.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       Input: Double-extended number X in location pointed to
*1da177e4SLinus Torvalds|		by address register a0.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       Output: The value sinh(X) returned in floating-point register Fp0.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       Accuracy and Monotonicity: The returned result is within 3 ulps in
*1da177e4SLinus Torvalds|               64 significant bit, i.e. within 0.5001 ulp to 53 bits if the
*1da177e4SLinus Torvalds|               result is subsequently rounded to double precision. The
*1da177e4SLinus Torvalds|               result is provably monotonic in double precision.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       Speed: The program sSINH takes approximately 280 cycles.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       Algorithm:
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       SINH
*1da177e4SLinus Torvalds|       1. If |X| > 16380 log2, go to 3.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       2. (|X| <= 16380 log2) Sinh(X) is obtained by the formulae
*1da177e4SLinus Torvalds|               y = |X|, sgn = sign(X), and z = expm1(Y),
*1da177e4SLinus Torvalds|               sinh(X) = sgn*(1/2)*( z + z/(1+z) ).
*1da177e4SLinus Torvalds|          Exit.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       3. If |X| > 16480 log2, go to 5.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       4. (16380 log2 < |X| <= 16480 log2)
*1da177e4SLinus Torvalds|               sinh(X) = sign(X) * exp(|X|)/2.
*1da177e4SLinus Torvalds|          However, invoking exp(|X|) may cause premature overflow.
*1da177e4SLinus Torvalds|          Thus, we calculate sinh(X) as follows:
*1da177e4SLinus Torvalds|             Y       := |X|
*1da177e4SLinus Torvalds|             sgn     := sign(X)
*1da177e4SLinus Torvalds|             sgnFact := sgn * 2**(16380)
*1da177e4SLinus Torvalds|             Y'      := Y - 16381 log2
*1da177e4SLinus Torvalds|             sinh(X) := sgnFact * exp(Y').
*1da177e4SLinus Torvalds|          Exit.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|       5. (|X| > 16480 log2) sinh(X) must overflow. Return
*1da177e4SLinus Torvalds|          sign(X)*Huge*Huge to generate overflow and an infinity with
*1da177e4SLinus Torvalds|          the appropriate sign. Huge is the largest finite number in
*1da177e4SLinus Torvalds|          extended format. Exit.
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|		Copyright (C) Motorola, Inc. 1990
*1da177e4SLinus Torvalds|			All Rights Reserved
*1da177e4SLinus Torvalds|
*1da177e4SLinus Torvalds|	THIS IS UNPUBLISHED PROPRIETARY SOURCE CODE OF MOTOROLA
*1da177e4SLinus Torvalds|	The copyright notice above does not evidence any
*1da177e4SLinus Torvalds|	actual or intended publication of such source code.
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|SSINH	idnt	2,1 | Motorola 040 Floating Point Software Package
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|section	8
*1da177e4SLinus Torvalds
*1da177e4SLinus TorvaldsT1:	.long 0x40C62D38,0xD3D64634 | ... 16381 LOG2 LEAD
*1da177e4SLinus TorvaldsT2:	.long 0x3D6F90AE,0xB1E75CC7 | ... 16381 LOG2 TRAIL
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|xref	t_frcinx
*1da177e4SLinus Torvalds	|xref	t_ovfl
*1da177e4SLinus Torvalds	|xref	t_extdnrm
*1da177e4SLinus Torvalds	|xref	setox
*1da177e4SLinus Torvalds	|xref	setoxm1
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	.global	ssinhd
*1da177e4SLinus Torvaldsssinhd:
*1da177e4SLinus Torvalds|--SINH(X) = X FOR DENORMALIZED X
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	bra	t_extdnrm
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	.global	ssinh
*1da177e4SLinus Torvaldsssinh:
*1da177e4SLinus Torvalds	fmovex	(%a0),%fp0	| ...LOAD INPUT
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	movel	(%a0),%d0
*1da177e4SLinus Torvalds	movew	4(%a0),%d0
*1da177e4SLinus Torvalds	movel	%d0,%a1		| save a copy of original (compacted) operand
*1da177e4SLinus Torvalds	andl	#0x7FFFFFFF,%d0
*1da177e4SLinus Torvalds	cmpl	#0x400CB167,%d0
*1da177e4SLinus Torvalds	bgts	SINHBIG
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds|--THIS IS THE USUAL CASE, |X| < 16380 LOG2
*1da177e4SLinus Torvalds|--Y = |X|, Z = EXPM1(Y), SINH(X) = SIGN(X)*(1/2)*( Z + Z/(1+Z) )
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fabsx	%fp0		| ...Y = |X|
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	moveml	%a1/%d1,-(%sp)
*1da177e4SLinus Torvalds	fmovemx %fp0-%fp0,(%a0)
*1da177e4SLinus Torvalds	clrl	%d1
*1da177e4SLinus Torvalds	bsr	setoxm1		| ...FP0 IS Z = EXPM1(Y)
*1da177e4SLinus Torvalds	fmovel	#0,%fpcr
*1da177e4SLinus Torvalds	moveml	(%sp)+,%a1/%d1
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fmovex	%fp0,%fp1
*1da177e4SLinus Torvalds	fadds	#0x3F800000,%fp1	| ...1+Z
*1da177e4SLinus Torvalds	fmovex	%fp0,-(%sp)
*1da177e4SLinus Torvalds	fdivx	%fp1,%fp0		| ...Z/(1+Z)
*1da177e4SLinus Torvalds	movel	%a1,%d0
*1da177e4SLinus Torvalds	andl	#0x80000000,%d0
*1da177e4SLinus Torvalds	orl	#0x3F000000,%d0
*1da177e4SLinus Torvalds	faddx	(%sp)+,%fp0
*1da177e4SLinus Torvalds	movel	%d0,-(%sp)
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fmovel	%d1,%fpcr
*1da177e4SLinus Torvalds	fmuls	(%sp)+,%fp0	|last fp inst - possible exceptions set
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	bra	t_frcinx
*1da177e4SLinus Torvalds
*1da177e4SLinus TorvaldsSINHBIG:
*1da177e4SLinus Torvalds	cmpl	#0x400CB2B3,%d0
*1da177e4SLinus Torvalds	bgt	t_ovfl
*1da177e4SLinus Torvalds	fabsx	%fp0
*1da177e4SLinus Torvalds	fsubd	T1(%pc),%fp0	| ...(|X|-16381LOG2_LEAD)
*1da177e4SLinus Torvalds	movel	#0,-(%sp)
*1da177e4SLinus Torvalds	movel	#0x80000000,-(%sp)
*1da177e4SLinus Torvalds	movel	%a1,%d0
*1da177e4SLinus Torvalds	andl	#0x80000000,%d0
*1da177e4SLinus Torvalds	orl	#0x7FFB0000,%d0
*1da177e4SLinus Torvalds	movel	%d0,-(%sp)	| ...EXTENDED FMT
*1da177e4SLinus Torvalds	fsubd	T2(%pc),%fp0	| ...|X| - 16381 LOG2, ACCURATE
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	movel	%d1,-(%sp)
*1da177e4SLinus Torvalds	clrl	%d1
*1da177e4SLinus Torvalds	fmovemx %fp0-%fp0,(%a0)
*1da177e4SLinus Torvalds	bsr	setox
*1da177e4SLinus Torvalds	fmovel	(%sp)+,%fpcr
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	fmulx	(%sp)+,%fp0	|possible exception
*1da177e4SLinus Torvalds	bra	t_frcinx
*1da177e4SLinus Torvalds
*1da177e4SLinus Torvalds	|end