x86/math-emu/reg_round.S

da957e11SThomas Gleixner	.file "reg_round.S"
da957e11SThomas Gleixner/*---------------------------------------------------------------------------+
da957e11SThomas Gleixner |  reg_round.S                                                              |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | Rounding/truncation/etc for FPU basic arithmetic functions.               |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | Copyright (C) 1993,1995,1997                                              |
da957e11SThomas Gleixner |                       W. Metzenthen, 22 Parker St, Ormond, Vic 3163,      |
da957e11SThomas Gleixner |                       Australia.  E-mail billm@suburbia.net               |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | This code has four possible entry points.                                 |
da957e11SThomas Gleixner | The following must be entered by a jmp instruction:                       |
da957e11SThomas Gleixner |   fpu_reg_round, fpu_reg_round_sqrt, and fpu_Arith_exit.                  |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | The FPU_round entry point is intended to be used by C code.               |
da957e11SThomas Gleixner | From C, call as:                                                          |
da957e11SThomas Gleixner |  int FPU_round(FPU_REG *arg, unsigned int extent, unsigned int control_w) |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner |    Return value is the tag of the answer, or-ed with FPU_Exception if     |
da957e11SThomas Gleixner |    one was raised, or -1 on internal error.                               |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | For correct "up" and "down" rounding, the argument must have the correct  |
da957e11SThomas Gleixner | sign.                                                                     |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner +---------------------------------------------------------------------------*/
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*---------------------------------------------------------------------------+
da957e11SThomas Gleixner | Four entry points.                                                        |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | Needed by both the fpu_reg_round and fpu_reg_round_sqrt entry points:     |
da957e11SThomas Gleixner |  %eax:%ebx  64 bit significand                                            |
da957e11SThomas Gleixner |  %edx       32 bit extension of the significand                           |
da957e11SThomas Gleixner |  %edi       pointer to an FPU_REG for the result to be stored             |
da957e11SThomas Gleixner |  stack      calling function must have set up a C stack frame and         |
da957e11SThomas Gleixner |             pushed %esi, %edi, and %ebx                                   |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | Needed just for the fpu_reg_round_sqrt entry point:                       |
da957e11SThomas Gleixner |  %cx  A control word in the same format as the FPU control word.          |
da957e11SThomas Gleixner | Otherwise, PARAM4 must give such a value.                                 |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner | The significand and its extension are assumed to be exact in the          |
da957e11SThomas Gleixner | following sense:                                                          |
da957e11SThomas Gleixner |   If the significand by itself is the exact result then the significand   |
da957e11SThomas Gleixner |   extension (%edx) must contain 0, otherwise the significand extension    |
da957e11SThomas Gleixner |   must be non-zero.                                                       |
da957e11SThomas Gleixner |   If the significand extension is non-zero then the significand is        |
da957e11SThomas Gleixner |   smaller than the magnitude of the correct exact result by an amount     |
da957e11SThomas Gleixner |   greater than zero and less than one ls bit of the significand.          |
da957e11SThomas Gleixner |   The significand extension is only required to have three possible       |
da957e11SThomas Gleixner |   non-zero values:                                                        |
da957e11SThomas Gleixner |       less than 0x80000000  <=> the significand is less than 1/2 an ls    |
da957e11SThomas Gleixner |                                 bit smaller than the magnitude of the     |
da957e11SThomas Gleixner |                                 true exact result.                        |
da957e11SThomas Gleixner |         exactly 0x80000000  <=> the significand is exactly 1/2 an ls bit  |
da957e11SThomas Gleixner |                                 smaller than the magnitude of the true    |
da957e11SThomas Gleixner |                                 exact result.                             |
da957e11SThomas Gleixner |    greater than 0x80000000  <=> the significand is more than 1/2 an ls    |
da957e11SThomas Gleixner |                                 bit smaller than the magnitude of the     |
da957e11SThomas Gleixner |                                 true exact result.                        |
da957e11SThomas Gleixner |                                                                           |
da957e11SThomas Gleixner +---------------------------------------------------------------------------*/
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*---------------------------------------------------------------------------+
da957e11SThomas Gleixner |  The code in this module has become quite complex, but it should handle   |
da957e11SThomas Gleixner |  all of the FPU flags which are set at this stage of the basic arithmetic |
da957e11SThomas Gleixner |  computations.                                                            |
da957e11SThomas Gleixner |  There are a few rare cases where the results are not set identically to  |
da957e11SThomas Gleixner |  a real FPU. These require a bit more thought because at this stage the   |
da957e11SThomas Gleixner |  results of the code here appear to be more consistent...                 |
da957e11SThomas Gleixner |  This may be changed in a future version.                                 |
da957e11SThomas Gleixner +---------------------------------------------------------------------------*/
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner#include "fpu_emu.h"
da957e11SThomas Gleixner#include "exception.h"
da957e11SThomas Gleixner#include "control_w.h"
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Flags for FPU_bits_lost */
da957e11SThomas Gleixner#define	LOST_DOWN	$1
da957e11SThomas Gleixner#define	LOST_UP		$2
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Flags for FPU_denormal */
da957e11SThomas Gleixner#define	DENORMAL	$1
da957e11SThomas Gleixner#define	UNMASKED_UNDERFLOW $2
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifndef NON_REENTRANT_FPU
da957e11SThomas Gleixner/*	Make the code re-entrant by putting
da957e11SThomas Gleixner	local storage on the stack: */
da957e11SThomas Gleixner#define FPU_bits_lost	(%esp)
da957e11SThomas Gleixner#define FPU_denormal	1(%esp)
da957e11SThomas Gleixner
da957e11SThomas Gleixner#else
da957e11SThomas Gleixner/*	Not re-entrant, so we can gain speed by putting
da957e11SThomas Gleixner	local storage in a static area: */
da957e11SThomas Gleixner.data
da957e11SThomas Gleixner	.align 4,0
da957e11SThomas GleixnerFPU_bits_lost:
da957e11SThomas Gleixner	.byte	0
da957e11SThomas GleixnerFPU_denormal:
da957e11SThomas Gleixner	.byte	0
da957e11SThomas Gleixner#endif /* NON_REENTRANT_FPU */
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner.text
da957e11SThomas Gleixner.globl fpu_reg_round
da957e11SThomas Gleixner.globl fpu_Arith_exit
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Entry point when called from C */
da957e11SThomas GleixnerENTRY(FPU_round)
da957e11SThomas Gleixner	pushl	%ebp
da957e11SThomas Gleixner	movl	%esp,%ebp
da957e11SThomas Gleixner	pushl	%esi
da957e11SThomas Gleixner	pushl	%edi
da957e11SThomas Gleixner	pushl	%ebx
da957e11SThomas Gleixner
da957e11SThomas Gleixner	movl	PARAM1,%edi
da957e11SThomas Gleixner	movl	SIGH(%edi),%eax
da957e11SThomas Gleixner	movl	SIGL(%edi),%ebx
da957e11SThomas Gleixner	movl	PARAM2,%edx
da957e11SThomas Gleixner
da957e11SThomas Gleixnerfpu_reg_round:			/* Normal entry point */
da957e11SThomas Gleixner	movl	PARAM4,%ecx
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifndef NON_REENTRANT_FPU
da957e11SThomas Gleixner	pushl	%ebx		/* adjust the stack pointer */
da957e11SThomas Gleixner#endif /* NON_REENTRANT_FPU */
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner/* Cannot use this here yet */
da957e11SThomas Gleixner/*	orl	%eax,%eax */
da957e11SThomas Gleixner/*	jns	L_entry_bugged */
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpw	EXP_UNDER,EXP(%edi)
da957e11SThomas Gleixner	jle	L_Make_denorm			/* The number is a de-normal */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	movb	$0,FPU_denormal			/* 0 -> not a de-normal */
da957e11SThomas Gleixner
da957e11SThomas GleixnerDenorm_done:
da957e11SThomas Gleixner	movb	$0,FPU_bits_lost		/* No bits yet lost in rounding */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	movl	%ecx,%esi
da957e11SThomas Gleixner	andl	CW_PC,%ecx
da957e11SThomas Gleixner	cmpl	PR_64_BITS,%ecx
da957e11SThomas Gleixner	je	LRound_To_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	PR_53_BITS,%ecx
da957e11SThomas Gleixner	je	LRound_To_53
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	PR_24_BITS,%ecx
da957e11SThomas Gleixner	je	LRound_To_24
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PECULIAR_486
da957e11SThomas Gleixner/* With the precision control bits set to 01 "(reserved)", a real 80486
da957e11SThomas Gleixner   behaves as if the precision control bits were set to 11 "64 bits" */
da957e11SThomas Gleixner	cmpl	PR_RESERVED_BITS,%ecx
da957e11SThomas Gleixner	je	LRound_To_64
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	jmp	L_bugged_denorm_486
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner#else
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	jmp	L_bugged_denorm	/* There is no bug, just a bad control word */
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner#endif /* PECULIAR_486 */
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Round etc to 24 bit precision */
da957e11SThomas GleixnerLRound_To_24:
da957e11SThomas Gleixner	movl	%esi,%ecx
da957e11SThomas Gleixner	andl	CW_RC,%ecx
da957e11SThomas Gleixner	cmpl	RC_RND,%ecx
da957e11SThomas Gleixner	je	LRound_nearest_24
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_CHOP,%ecx
da957e11SThomas Gleixner	je	LCheck_truncate_24
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_UP,%ecx		/* Towards +infinity */
da957e11SThomas Gleixner	je	LUp_24
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_DOWN,%ecx		/* Towards -infinity */
da957e11SThomas Gleixner	je	LDown_24
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	jmp	L_bugged_round24
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLUp_24:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	jne	LCheck_truncate_24	/* If negative then  up==truncate */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jmp	LCheck_24_round_up
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDown_24:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	je	LCheck_truncate_24	/* If positive then  down==truncate */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_24_round_up:
da957e11SThomas Gleixner	movl	%eax,%ecx
da957e11SThomas Gleixner	andl	$0x000000ff,%ecx
da957e11SThomas Gleixner	orl	%ebx,%ecx
da957e11SThomas Gleixner	orl	%edx,%ecx
da957e11SThomas Gleixner	jnz	LDo_24_round_up
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLRound_nearest_24:
da957e11SThomas Gleixner	/* Do rounding of the 24th bit if needed (nearest or even) */
da957e11SThomas Gleixner	movl	%eax,%ecx
da957e11SThomas Gleixner	andl	$0x000000ff,%ecx
da957e11SThomas Gleixner	cmpl	$0x00000080,%ecx
da957e11SThomas Gleixner	jc	LCheck_truncate_24	/* less than half, no increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jne	LGreater_Half_24	/* greater than half, increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Possibly half, we need to check the ls bits */
da957e11SThomas Gleixner	orl	%ebx,%ebx
da957e11SThomas Gleixner	jnz	LGreater_Half_24	/* greater than half, increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	jnz	LGreater_Half_24	/* greater than half, increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Exactly half, increment only if 24th bit is 1 (round to even) */
da957e11SThomas Gleixner	testl	$0x00000100,%eax
da957e11SThomas Gleixner	jz	LDo_truncate_24
da957e11SThomas Gleixner
da957e11SThomas GleixnerLGreater_Half_24:			/* Rounding: increment at the 24th bit */
da957e11SThomas GleixnerLDo_24_round_up:
da957e11SThomas Gleixner	andl	$0xffffff00,%eax	/* Truncate to 24 bits */
da957e11SThomas Gleixner	xorl	%ebx,%ebx
da957e11SThomas Gleixner	movb	LOST_UP,FPU_bits_lost
da957e11SThomas Gleixner	addl	$0x00000100,%eax
da957e11SThomas Gleixner	jmp	LCheck_Round_Overflow
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_truncate_24:
da957e11SThomas Gleixner	movl	%eax,%ecx
da957e11SThomas Gleixner	andl	$0x000000ff,%ecx
da957e11SThomas Gleixner	orl	%ebx,%ecx
da957e11SThomas Gleixner	orl	%edx,%ecx
da957e11SThomas Gleixner	jz	L_Re_normalise		/* No truncation needed */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDo_truncate_24:
da957e11SThomas Gleixner	andl	$0xffffff00,%eax	/* Truncate to 24 bits */
da957e11SThomas Gleixner	xorl	%ebx,%ebx
da957e11SThomas Gleixner	movb	LOST_DOWN,FPU_bits_lost
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Round etc to 53 bit precision */
da957e11SThomas GleixnerLRound_To_53:
da957e11SThomas Gleixner	movl	%esi,%ecx
da957e11SThomas Gleixner	andl	CW_RC,%ecx
da957e11SThomas Gleixner	cmpl	RC_RND,%ecx
da957e11SThomas Gleixner	je	LRound_nearest_53
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_CHOP,%ecx
da957e11SThomas Gleixner	je	LCheck_truncate_53
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_UP,%ecx		/* Towards +infinity */
da957e11SThomas Gleixner	je	LUp_53
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_DOWN,%ecx		/* Towards -infinity */
da957e11SThomas Gleixner	je	LDown_53
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	jmp	L_bugged_round53
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLUp_53:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	jne	LCheck_truncate_53	/* If negative then  up==truncate */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jmp	LCheck_53_round_up
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDown_53:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	je	LCheck_truncate_53	/* If positive then  down==truncate */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_53_round_up:
da957e11SThomas Gleixner	movl	%ebx,%ecx
da957e11SThomas Gleixner	andl	$0x000007ff,%ecx
da957e11SThomas Gleixner	orl	%edx,%ecx
da957e11SThomas Gleixner	jnz	LDo_53_round_up
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLRound_nearest_53:
da957e11SThomas Gleixner	/* Do rounding of the 53rd bit if needed (nearest or even) */
da957e11SThomas Gleixner	movl	%ebx,%ecx
da957e11SThomas Gleixner	andl	$0x000007ff,%ecx
da957e11SThomas Gleixner	cmpl	$0x00000400,%ecx
da957e11SThomas Gleixner	jc	LCheck_truncate_53	/* less than half, no increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jnz	LGreater_Half_53	/* greater than half, increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Possibly half, we need to check the ls bits */
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	jnz	LGreater_Half_53	/* greater than half, increment needed */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Exactly half, increment only if 53rd bit is 1 (round to even) */
da957e11SThomas Gleixner	testl	$0x00000800,%ebx
da957e11SThomas Gleixner	jz	LTruncate_53
da957e11SThomas Gleixner
da957e11SThomas GleixnerLGreater_Half_53:			/* Rounding: increment at the 53rd bit */
da957e11SThomas GleixnerLDo_53_round_up:
da957e11SThomas Gleixner	movb	LOST_UP,FPU_bits_lost
da957e11SThomas Gleixner	andl	$0xfffff800,%ebx	/* Truncate to 53 bits */
da957e11SThomas Gleixner	addl	$0x00000800,%ebx
da957e11SThomas Gleixner	adcl	$0,%eax
da957e11SThomas Gleixner	jmp	LCheck_Round_Overflow
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_truncate_53:
da957e11SThomas Gleixner	movl	%ebx,%ecx
da957e11SThomas Gleixner	andl	$0x000007ff,%ecx
da957e11SThomas Gleixner	orl	%edx,%ecx
da957e11SThomas Gleixner	jz	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLTruncate_53:
da957e11SThomas Gleixner	movb	LOST_DOWN,FPU_bits_lost
da957e11SThomas Gleixner	andl	$0xfffff800,%ebx	/* Truncate to 53 bits */
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Round etc to 64 bit precision */
da957e11SThomas GleixnerLRound_To_64:
da957e11SThomas Gleixner	movl	%esi,%ecx
da957e11SThomas Gleixner	andl	CW_RC,%ecx
da957e11SThomas Gleixner	cmpl	RC_RND,%ecx
da957e11SThomas Gleixner	je	LRound_nearest_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_CHOP,%ecx
da957e11SThomas Gleixner	je	LCheck_truncate_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_UP,%ecx		/* Towards +infinity */
da957e11SThomas Gleixner	je	LUp_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpl	RC_DOWN,%ecx		/* Towards -infinity */
da957e11SThomas Gleixner	je	LDown_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	jmp	L_bugged_round64
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLUp_64:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	jne	LCheck_truncate_64	/* If negative then  up==truncate */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	jnz	LDo_64_round_up
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDown_64:
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	je	LCheck_truncate_64	/* If positive then  down==truncate */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	jnz	LDo_64_round_up
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLRound_nearest_64:
da957e11SThomas Gleixner	cmpl	$0x80000000,%edx
da957e11SThomas Gleixner	jc	LCheck_truncate_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jne	LDo_64_round_up
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Now test for round-to-even */
da957e11SThomas Gleixner	testb	$1,%bl
da957e11SThomas Gleixner	jz	LCheck_truncate_64
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDo_64_round_up:
da957e11SThomas Gleixner	movb	LOST_UP,FPU_bits_lost
da957e11SThomas Gleixner	addl	$1,%ebx
da957e11SThomas Gleixner	adcl	$0,%eax
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_Round_Overflow:
da957e11SThomas Gleixner	jnc	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Overflow, adjust the result (significand to 1.0) */
da957e11SThomas Gleixner	rcrl	$1,%eax
da957e11SThomas Gleixner	rcrl	$1,%ebx
da957e11SThomas Gleixner	incw	EXP(%edi)
da957e11SThomas Gleixner	jmp	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLCheck_truncate_64:
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	jz	L_Re_normalise
da957e11SThomas Gleixner
da957e11SThomas GleixnerLTruncate_64:
da957e11SThomas Gleixner	movb	LOST_DOWN,FPU_bits_lost
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_Re_normalise:
da957e11SThomas Gleixner	testb	$0xff,FPU_denormal
da957e11SThomas Gleixner	jnz	Normalise_result
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_Normalised:
da957e11SThomas Gleixner	movl	TAG_Valid,%edx
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_deNormalised:
da957e11SThomas Gleixner	cmpb	LOST_UP,FPU_bits_lost
da957e11SThomas Gleixner	je	L_precision_lost_up
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpb	LOST_DOWN,FPU_bits_lost
da957e11SThomas Gleixner	je	L_precision_lost_down
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_no_precision_loss:
da957e11SThomas Gleixner	/* store the result */
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_Store_significand:
da957e11SThomas Gleixner	movl	%eax,SIGH(%edi)
da957e11SThomas Gleixner	movl	%ebx,SIGL(%edi)
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpw	EXP_OVER,EXP(%edi)
da957e11SThomas Gleixner	jge	L_overflow
da957e11SThomas Gleixner
da957e11SThomas Gleixner	movl	%edx,%eax
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* Convert the exponent to 80x87 form. */
da957e11SThomas Gleixner	addw	EXTENDED_Ebias,EXP(%edi)
da957e11SThomas Gleixner	andw	$0x7fff,EXP(%edi)
da957e11SThomas Gleixner
da957e11SThomas Gleixnerfpu_reg_round_signed_special_exit:
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpb	SIGN_POS,PARAM5
da957e11SThomas Gleixner	je	fpu_reg_round_special_exit
da957e11SThomas Gleixner
da957e11SThomas Gleixner	orw	$0x8000,EXP(%edi)	/* Negative sign for the result. */
da957e11SThomas Gleixner
da957e11SThomas Gleixnerfpu_reg_round_special_exit:
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifndef NON_REENTRANT_FPU
da957e11SThomas Gleixner	popl	%ebx		/* adjust the stack pointer */
da957e11SThomas Gleixner#endif /* NON_REENTRANT_FPU */
da957e11SThomas Gleixner
da957e11SThomas Gleixnerfpu_Arith_exit:
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	popl	%edi
da957e11SThomas Gleixner	popl	%esi
da957e11SThomas Gleixner	leave
da957e11SThomas Gleixner	ret
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*
da957e11SThomas Gleixner * Set the FPU status flags to represent precision loss due to
da957e11SThomas Gleixner * round-up.
da957e11SThomas Gleixner */
da957e11SThomas GleixnerL_precision_lost_up:
da957e11SThomas Gleixner	push	%edx
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	call	set_precision_flag_up
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	popl	%edx
da957e11SThomas Gleixner	jmp	L_no_precision_loss
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*
da957e11SThomas Gleixner * Set the FPU status flags to represent precision loss due to
da957e11SThomas Gleixner * truncation.
da957e11SThomas Gleixner */
da957e11SThomas GleixnerL_precision_lost_down:
da957e11SThomas Gleixner	push	%edx
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	call	set_precision_flag_down
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	popl	%edx
da957e11SThomas Gleixner	jmp	L_no_precision_loss
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*
da957e11SThomas Gleixner * The number is a denormal (which might get rounded up to a normal)
da957e11SThomas Gleixner * Shift the number right the required number of bits, which will
da957e11SThomas Gleixner * have to be undone later...
da957e11SThomas Gleixner */
da957e11SThomas GleixnerL_Make_denorm:
da957e11SThomas Gleixner	/* The action to be taken depends upon whether the underflow
da957e11SThomas Gleixner	   exception is masked */
da957e11SThomas Gleixner	testb	CW_Underflow,%cl		/* Underflow mask. */
da957e11SThomas Gleixner	jz	Unmasked_underflow		/* Do not make a denormal. */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	movb	DENORMAL,FPU_denormal
da957e11SThomas Gleixner
da957e11SThomas Gleixner	pushl	%ecx		/* Save */
da957e11SThomas Gleixner	movw	EXP_UNDER+1,%cx
da957e11SThomas Gleixner	subw	EXP(%edi),%cx
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpw	$64,%cx	/* shrd only works for 0..31 bits */
da957e11SThomas Gleixner	jnc	Denorm_shift_more_than_63
da957e11SThomas Gleixner
da957e11SThomas Gleixner	cmpw	$32,%cx	/* shrd only works for 0..31 bits */
da957e11SThomas Gleixner	jnc	Denorm_shift_more_than_32
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*
da957e11SThomas Gleixner * We got here without jumps by assuming that the most common requirement
da957e11SThomas Gleixner *   is for a small de-normalising shift.
da957e11SThomas Gleixner * Shift by [1..31] bits
da957e11SThomas Gleixner */
da957e11SThomas Gleixner	addw	%cx,EXP(%edi)
da957e11SThomas Gleixner	orl	%edx,%edx	/* extension */
da957e11SThomas Gleixner	setne	%ch		/* Save whether %edx is non-zero */
da957e11SThomas Gleixner	xorl	%edx,%edx
da957e11SThomas Gleixner	shrd	%cl,%ebx,%edx
da957e11SThomas Gleixner	shrd	%cl,%eax,%ebx
da957e11SThomas Gleixner	shr	%cl,%eax
da957e11SThomas Gleixner	orb	%ch,%dl
da957e11SThomas Gleixner	popl	%ecx
da957e11SThomas Gleixner	jmp	Denorm_done
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Shift by [32..63] bits */
da957e11SThomas GleixnerDenorm_shift_more_than_32:
da957e11SThomas Gleixner	addw	%cx,EXP(%edi)
da957e11SThomas Gleixner	subb	$32,%cl
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	setne	%ch
da957e11SThomas Gleixner	orb	%ch,%bl
da957e11SThomas Gleixner	xorl	%edx,%edx
da957e11SThomas Gleixner	shrd	%cl,%ebx,%edx
da957e11SThomas Gleixner	shrd	%cl,%eax,%ebx
da957e11SThomas Gleixner	shr	%cl,%eax
da957e11SThomas Gleixner	orl	%edx,%edx		/* test these 32 bits */
da957e11SThomas Gleixner	setne	%cl
da957e11SThomas Gleixner	orb	%ch,%bl
da957e11SThomas Gleixner	orb	%cl,%bl
da957e11SThomas Gleixner	movl	%ebx,%edx
da957e11SThomas Gleixner	movl	%eax,%ebx
da957e11SThomas Gleixner	xorl	%eax,%eax
da957e11SThomas Gleixner	popl	%ecx
da957e11SThomas Gleixner	jmp	Denorm_done
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Shift by [64..) bits */
da957e11SThomas GleixnerDenorm_shift_more_than_63:
da957e11SThomas Gleixner	cmpw	$64,%cx
da957e11SThomas Gleixner	jne	Denorm_shift_more_than_64
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Exactly 64 bit shift */
da957e11SThomas Gleixner	addw	%cx,EXP(%edi)
da957e11SThomas Gleixner	xorl	%ecx,%ecx
da957e11SThomas Gleixner	orl	%edx,%edx
da957e11SThomas Gleixner	setne	%cl
da957e11SThomas Gleixner	orl	%ebx,%ebx
da957e11SThomas Gleixner	setne	%ch
da957e11SThomas Gleixner	orb	%ch,%cl
da957e11SThomas Gleixner	orb	%cl,%al
da957e11SThomas Gleixner	movl	%eax,%edx
da957e11SThomas Gleixner	xorl	%eax,%eax
da957e11SThomas Gleixner	xorl	%ebx,%ebx
da957e11SThomas Gleixner	popl	%ecx
da957e11SThomas Gleixner	jmp	Denorm_done
da957e11SThomas Gleixner
da957e11SThomas GleixnerDenorm_shift_more_than_64:
da957e11SThomas Gleixner	movw	EXP_UNDER+1,EXP(%edi)
da957e11SThomas Gleixner/* This is easy, %eax must be non-zero, so.. */
da957e11SThomas Gleixner	movl	$1,%edx
da957e11SThomas Gleixner	xorl	%eax,%eax
da957e11SThomas Gleixner	xorl	%ebx,%ebx
da957e11SThomas Gleixner	popl	%ecx
da957e11SThomas Gleixner	jmp	Denorm_done
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas GleixnerUnmasked_underflow:
da957e11SThomas Gleixner	movb	UNMASKED_UNDERFLOW,FPU_denormal
da957e11SThomas Gleixner	jmp	Denorm_done
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Undo the de-normalisation. */
da957e11SThomas GleixnerNormalise_result:
da957e11SThomas Gleixner	cmpb	UNMASKED_UNDERFLOW,FPU_denormal
da957e11SThomas Gleixner	je	Signal_underflow
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* The number must be a denormal if we got here. */
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner	/* But check it... just in case. */
da957e11SThomas Gleixner	cmpw	EXP_UNDER+1,EXP(%edi)
da957e11SThomas Gleixner	jne	L_norm_bugged
da957e11SThomas Gleixner#endif /* PARANOID */
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PECULIAR_486
da957e11SThomas Gleixner	/*
da957e11SThomas Gleixner	 * This implements a special feature of 80486 behaviour.
da957e11SThomas Gleixner	 * Underflow will be signalled even if the number is
da957e11SThomas Gleixner	 * not a denormal after rounding.
da957e11SThomas Gleixner	 * This difference occurs only for masked underflow, and not
da957e11SThomas Gleixner	 * in the unmasked case.
da957e11SThomas Gleixner	 * Actual 80486 behaviour differs from this in some circumstances.
da957e11SThomas Gleixner	 */
da957e11SThomas Gleixner	orl	%eax,%eax		/* ms bits */
da957e11SThomas Gleixner	js	LPseudoDenormal		/* Will be masked underflow */
da957e11SThomas Gleixner#else
da957e11SThomas Gleixner	orl	%eax,%eax		/* ms bits */
da957e11SThomas Gleixner	js	L_Normalised		/* No longer a denormal */
da957e11SThomas Gleixner#endif /* PECULIAR_486 */
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jnz	LDenormal_adj_exponent
da957e11SThomas Gleixner
da957e11SThomas Gleixner	orl	%ebx,%ebx
da957e11SThomas Gleixner	jz	L_underflow_to_zero	/* The contents are zero */
da957e11SThomas Gleixner
da957e11SThomas GleixnerLDenormal_adj_exponent:
da957e11SThomas Gleixner	decw	EXP(%edi)
da957e11SThomas Gleixner
da957e11SThomas GleixnerLPseudoDenormal:
da957e11SThomas Gleixner	testb	$0xff,FPU_bits_lost	/* bits lost == underflow */
da957e11SThomas Gleixner	movl	TAG_Special,%edx
da957e11SThomas Gleixner	jz	L_deNormalised
da957e11SThomas Gleixner
da957e11SThomas Gleixner	/* There must be a masked underflow */
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	pushl	EX_Underflow
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	movl	TAG_Special,%edx
da957e11SThomas Gleixner	jmp	L_deNormalised
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/*
da957e11SThomas Gleixner * The operations resulted in a number too small to represent.
da957e11SThomas Gleixner * Masked response.
da957e11SThomas Gleixner */
da957e11SThomas GleixnerL_underflow_to_zero:
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	call	set_precision_flag_down
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	pushl	EX_Underflow
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* Reduce the exponent to EXP_UNDER */
da957e11SThomas Gleixner	movw	EXP_UNDER,EXP(%edi)
da957e11SThomas Gleixner	movl	TAG_Zero,%edx
da957e11SThomas Gleixner	jmp	L_Store_significand
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner/* The operations resulted in a number too large to represent. */
da957e11SThomas GleixnerL_overflow:
da957e11SThomas Gleixner	addw	EXTENDED_Ebias,EXP(%edi)	/* Set for unmasked response. */
da957e11SThomas Gleixner	push	%edi
da957e11SThomas Gleixner	call	arith_overflow
da957e11SThomas Gleixner	pop	%edi
da957e11SThomas Gleixner	jmp	fpu_reg_round_signed_special_exit
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas GleixnerSignal_underflow:
da957e11SThomas Gleixner	/* The number may have been changed to a non-denormal */
da957e11SThomas Gleixner	/* by the rounding operations. */
da957e11SThomas Gleixner	cmpw	EXP_UNDER,EXP(%edi)
da957e11SThomas Gleixner	jle	Do_unmasked_underflow
da957e11SThomas Gleixner
da957e11SThomas Gleixner	jmp	L_Normalised
da957e11SThomas Gleixner
da957e11SThomas GleixnerDo_unmasked_underflow:
da957e11SThomas Gleixner	/* Increase the exponent by the magic number */
da957e11SThomas Gleixner	addw	$(3*(1<<13)),EXP(%edi)
da957e11SThomas Gleixner	push	%eax
da957e11SThomas Gleixner	pushl	EX_Underflow
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	popl	%eax
da957e11SThomas Gleixner	jmp	L_Normalised
da957e11SThomas Gleixner
da957e11SThomas Gleixner
da957e11SThomas Gleixner#ifdef PARANOID
da957e11SThomas Gleixner#ifdef PECULIAR_486
da957e11SThomas GleixnerL_bugged_denorm_486:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x236
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner#else
da957e11SThomas GleixnerL_bugged_denorm:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x230
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner#endif /* PECULIAR_486 */
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_bugged_round24:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x231
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_bugged_round53:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x232
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_bugged_round64:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x233
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_norm_bugged:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x234
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas Gleixner	jmp	L_exception_exit
da957e11SThomas Gleixner
da957e11SThomas GleixnerL_entry_bugged:
da957e11SThomas Gleixner	pushl	EX_INTERNAL|0x235
da957e11SThomas Gleixner	call	EXCEPTION
da957e11SThomas Gleixner	popl	%ebx
da957e11SThomas GleixnerL_exception_exit:
da957e11SThomas Gleixner	mov	$-1,%eax
da957e11SThomas Gleixner	jmp	fpu_reg_round_special_exit
da957e11SThomas Gleixner#endif /* PARANOID */
*bd6be579SJiri Slaby
*bd6be579SJiri SlabyENDPROC(FPU_round)