arm/insts/vfp.hh

7375Sgblack@eecs.umich.edu/*
7375Sgblack@eecs.umich.edu * Copyright (c) 2010 ARM Limited
7375Sgblack@eecs.umich.edu * All rights reserved
7375Sgblack@eecs.umich.edu *
7375Sgblack@eecs.umich.edu * The license below extends only to copyright in the software and shall
7375Sgblack@eecs.umich.edu * not be construed as granting a license to any other intellectual
7375Sgblack@eecs.umich.edu * property including but not limited to intellectual property relating
7375Sgblack@eecs.umich.edu * to a hardware implementation of the functionality of the software
7375Sgblack@eecs.umich.edu * licensed hereunder.  You may use the software subject to the license
7375Sgblack@eecs.umich.edu * terms below provided that you ensure that this notice is replicated
7375Sgblack@eecs.umich.edu * unmodified and in its entirety in all distributions of the software,
7375Sgblack@eecs.umich.edu * modified or unmodified, in source code or in binary form.
7375Sgblack@eecs.umich.edu *
7375Sgblack@eecs.umich.edu * Redistribution and use in source and binary forms, with or without
7375Sgblack@eecs.umich.edu * modification, are permitted provided that the following conditions are
7375Sgblack@eecs.umich.edu * met: redistributions of source code must retain the above copyright
7375Sgblack@eecs.umich.edu * notice, this list of conditions and the following disclaimer;
7375Sgblack@eecs.umich.edu * redistributions in binary form must reproduce the above copyright
7375Sgblack@eecs.umich.edu * notice, this list of conditions and the following disclaimer in the
7375Sgblack@eecs.umich.edu * documentation and/or other materials provided with the distribution;
7375Sgblack@eecs.umich.edu * neither the name of the copyright holders nor the names of its
7375Sgblack@eecs.umich.edu * contributors may be used to endorse or promote products derived from
7375Sgblack@eecs.umich.edu * this software without specific prior written permission.
7375Sgblack@eecs.umich.edu *
7375Sgblack@eecs.umich.edu * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
7375Sgblack@eecs.umich.edu * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
7375Sgblack@eecs.umich.edu * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
7375Sgblack@eecs.umich.edu * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
7375Sgblack@eecs.umich.edu * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
7375Sgblack@eecs.umich.edu * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
7375Sgblack@eecs.umich.edu * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
7375Sgblack@eecs.umich.edu * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
7375Sgblack@eecs.umich.edu * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
7375Sgblack@eecs.umich.edu * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
7375Sgblack@eecs.umich.edu * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
7375Sgblack@eecs.umich.edu *
7375Sgblack@eecs.umich.edu * Authors: Gabe Black
7375Sgblack@eecs.umich.edu */
7375Sgblack@eecs.umich.edu
7375Sgblack@eecs.umich.edu#ifndef __ARCH_ARM_INSTS_VFP_HH__
7375Sgblack@eecs.umich.edu#define __ARCH_ARM_INSTS_VFP_HH__
7375Sgblack@eecs.umich.edu
7375Sgblack@eecs.umich.edu#include "arch/arm/insts/misc.hh"
7378Sgblack@eecs.umich.edu#include "arch/arm/miscregs.hh"
7378Sgblack@eecs.umich.edu#include <fenv.h>
7382Sgblack@eecs.umich.edu#include <cmath>
7375Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edunamespace ArmISA
7384Sgblack@eecs.umich.edu{
7384Sgblack@eecs.umich.edu
7375Sgblack@eecs.umich.eduenum VfpMicroMode {
7375Sgblack@eecs.umich.edu    VfpNotAMicroop,
7375Sgblack@eecs.umich.edu    VfpMicroop,
7375Sgblack@eecs.umich.edu    VfpFirstMicroop,
7375Sgblack@eecs.umich.edu    VfpLastMicroop
7375Sgblack@eecs.umich.edu};
7375Sgblack@eecs.umich.edu
7375Sgblack@eecs.umich.edutemplate<class T>
7375Sgblack@eecs.umich.edustatic inline void
7375Sgblack@eecs.umich.edusetVfpMicroFlags(VfpMicroMode mode, T &flags)
7375Sgblack@eecs.umich.edu{
7375Sgblack@eecs.umich.edu    switch (mode) {
7375Sgblack@eecs.umich.edu      case VfpMicroop:
7375Sgblack@eecs.umich.edu        flags[StaticInst::IsMicroop] = true;
7375Sgblack@eecs.umich.edu        break;
7375Sgblack@eecs.umich.edu      case VfpFirstMicroop:
7375Sgblack@eecs.umich.edu        flags[StaticInst::IsMicroop] =
7375Sgblack@eecs.umich.edu            flags[StaticInst::IsFirstMicroop] = true;
7375Sgblack@eecs.umich.edu        break;
7375Sgblack@eecs.umich.edu      case VfpLastMicroop:
7375Sgblack@eecs.umich.edu        flags[StaticInst::IsMicroop] =
7375Sgblack@eecs.umich.edu            flags[StaticInst::IsLastMicroop] = true;
7375Sgblack@eecs.umich.edu        break;
7375Sgblack@eecs.umich.edu      case VfpNotAMicroop:
7375Sgblack@eecs.umich.edu        break;
7375Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu    if (mode == VfpMicroop || mode == VfpFirstMicroop) {
7376Sgblack@eecs.umich.edu        flags[StaticInst::IsDelayedCommit] = true;
7376Sgblack@eecs.umich.edu    }
7375Sgblack@eecs.umich.edu}
7375Sgblack@eecs.umich.edu
7378Sgblack@eecs.umich.eduenum FeExceptionBit
7378Sgblack@eecs.umich.edu{
7378Sgblack@eecs.umich.edu    FeDivByZero = FE_DIVBYZERO,
7378Sgblack@eecs.umich.edu    FeInexact = FE_INEXACT,
7378Sgblack@eecs.umich.edu    FeInvalid = FE_INVALID,
7378Sgblack@eecs.umich.edu    FeOverflow = FE_OVERFLOW,
7378Sgblack@eecs.umich.edu    FeUnderflow = FE_UNDERFLOW,
7378Sgblack@eecs.umich.edu    FeAllExceptions = FE_ALL_EXCEPT
7378Sgblack@eecs.umich.edu};
7378Sgblack@eecs.umich.edu
7378Sgblack@eecs.umich.eduenum FeRoundingMode
7378Sgblack@eecs.umich.edu{
7378Sgblack@eecs.umich.edu    FeRoundDown = FE_DOWNWARD,
7378Sgblack@eecs.umich.edu    FeRoundNearest = FE_TONEAREST,
7378Sgblack@eecs.umich.edu    FeRoundZero = FE_TOWARDZERO,
7378Sgblack@eecs.umich.edu    FeRoundUpward = FE_UPWARD
7378Sgblack@eecs.umich.edu};
7378Sgblack@eecs.umich.edu
7378Sgblack@eecs.umich.eduenum VfpRoundingMode
7378Sgblack@eecs.umich.edu{
7378Sgblack@eecs.umich.edu    VfpRoundNearest = 0,
7378Sgblack@eecs.umich.edu    VfpRoundUpward = 1,
7378Sgblack@eecs.umich.edu    VfpRoundDown = 2,
7378Sgblack@eecs.umich.edu    VfpRoundZero = 3
7378Sgblack@eecs.umich.edu};
7378Sgblack@eecs.umich.edu
7382Sgblack@eecs.umich.edutemplate <class fpType>
7396Sgblack@eecs.umich.edustatic inline bool
7396Sgblack@eecs.umich.eduflushToZero(fpType &op)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    fpType junk = 0.0;
7396Sgblack@eecs.umich.edu    if (std::fpclassify(op) == FP_SUBNORMAL) {
7396Sgblack@eecs.umich.edu        uint64_t bitMask = ULL(0x1) << (sizeof(fpType) * 8 - 1);
7396Sgblack@eecs.umich.edu        op = bitsToFp(fpToBits(op) & bitMask, junk);
7396Sgblack@eecs.umich.edu        return true;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    return false;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edutemplate <class fpType>
7396Sgblack@eecs.umich.edustatic inline bool
7396Sgblack@eecs.umich.eduflushToZero(fpType &op1, fpType &op2)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    bool flush1 = flushToZero(op1);
7396Sgblack@eecs.umich.edu    bool flush2 = flushToZero(op2);
7396Sgblack@eecs.umich.edu    return flush1 || flush2;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7397Sgblack@eecs.umich.edutemplate <class fpType>
7397Sgblack@eecs.umich.edustatic inline void
7397Sgblack@eecs.umich.eduvfpFlushToZero(FPSCR &fpscr, fpType &op)
7397Sgblack@eecs.umich.edu{
7397Sgblack@eecs.umich.edu    if (fpscr.fz == 1 && flushToZero(op)) {
7397Sgblack@eecs.umich.edu        fpscr.idc = 1;
7397Sgblack@eecs.umich.edu    }
7397Sgblack@eecs.umich.edu}
7397Sgblack@eecs.umich.edu
7397Sgblack@eecs.umich.edutemplate <class fpType>
7397Sgblack@eecs.umich.edustatic inline void
7397Sgblack@eecs.umich.eduvfpFlushToZero(FPSCR &fpscr, fpType &op1, fpType &op2)
7397Sgblack@eecs.umich.edu{
7397Sgblack@eecs.umich.edu    vfpFlushToZero(fpscr, op1);
7397Sgblack@eecs.umich.edu    vfpFlushToZero(fpscr, op2);
7397Sgblack@eecs.umich.edu}
7397Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edustatic inline uint32_t
7384Sgblack@eecs.umich.edufpToBits(float fp)
7384Sgblack@eecs.umich.edu{
7384Sgblack@eecs.umich.edu    union
7384Sgblack@eecs.umich.edu    {
7384Sgblack@eecs.umich.edu        float fp;
7384Sgblack@eecs.umich.edu        uint32_t bits;
7384Sgblack@eecs.umich.edu    } val;
7384Sgblack@eecs.umich.edu    val.fp = fp;
7384Sgblack@eecs.umich.edu    return val.bits;
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edustatic inline uint64_t
7384Sgblack@eecs.umich.edufpToBits(double fp)
7384Sgblack@eecs.umich.edu{
7384Sgblack@eecs.umich.edu    union
7384Sgblack@eecs.umich.edu    {
7384Sgblack@eecs.umich.edu        double fp;
7384Sgblack@eecs.umich.edu        uint64_t bits;
7384Sgblack@eecs.umich.edu    } val;
7384Sgblack@eecs.umich.edu    val.fp = fp;
7384Sgblack@eecs.umich.edu    return val.bits;
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edustatic inline float
7384Sgblack@eecs.umich.edubitsToFp(uint64_t bits, float junk)
7384Sgblack@eecs.umich.edu{
7384Sgblack@eecs.umich.edu    union
7384Sgblack@eecs.umich.edu    {
7384Sgblack@eecs.umich.edu        float fp;
7384Sgblack@eecs.umich.edu        uint32_t bits;
7384Sgblack@eecs.umich.edu    } val;
7384Sgblack@eecs.umich.edu    val.bits = bits;
7384Sgblack@eecs.umich.edu    return val.fp;
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edustatic inline double
7384Sgblack@eecs.umich.edubitsToFp(uint64_t bits, double junk)
7384Sgblack@eecs.umich.edu{
7384Sgblack@eecs.umich.edu    union
7384Sgblack@eecs.umich.edu    {
7384Sgblack@eecs.umich.edu        double fp;
7384Sgblack@eecs.umich.edu        uint64_t bits;
7384Sgblack@eecs.umich.edu    } val;
7384Sgblack@eecs.umich.edu    val.bits = bits;
7384Sgblack@eecs.umich.edu    return val.fp;
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edutypedef int VfpSavedState;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline VfpSavedState
7396Sgblack@eecs.umich.eduprepFpState(uint32_t rMode)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    int roundingMode = fegetround();
7396Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7396Sgblack@eecs.umich.edu    switch (rMode) {
7396Sgblack@eecs.umich.edu      case VfpRoundNearest:
7396Sgblack@eecs.umich.edu        fesetround(FeRoundNearest);
7396Sgblack@eecs.umich.edu        break;
7396Sgblack@eecs.umich.edu      case VfpRoundUpward:
7396Sgblack@eecs.umich.edu        fesetround(FeRoundUpward);
7396Sgblack@eecs.umich.edu        break;
7396Sgblack@eecs.umich.edu      case VfpRoundDown:
7396Sgblack@eecs.umich.edu        fesetround(FeRoundDown);
7396Sgblack@eecs.umich.edu        break;
7396Sgblack@eecs.umich.edu      case VfpRoundZero:
7396Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7396Sgblack@eecs.umich.edu        break;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    return roundingMode;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline void
7396Sgblack@eecs.umich.edufinishVfp(FPSCR &fpscr, VfpSavedState state)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    int exceptions = fetestexcept(FeAllExceptions);
7396Sgblack@eecs.umich.edu    bool underflow = false;
7396Sgblack@eecs.umich.edu    if (exceptions & FeInvalid) {
7396Sgblack@eecs.umich.edu        fpscr.ioc = 1;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    if (exceptions & FeDivByZero) {
7396Sgblack@eecs.umich.edu        fpscr.dzc = 1;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    if (exceptions & FeOverflow) {
7396Sgblack@eecs.umich.edu        fpscr.ofc = 1;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    if (exceptions & FeUnderflow) {
7396Sgblack@eecs.umich.edu        underflow = true;
7396Sgblack@eecs.umich.edu        fpscr.ufc = 1;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    if ((exceptions & FeInexact) && !(underflow && fpscr.fz)) {
7396Sgblack@eecs.umich.edu        fpscr.ixc = 1;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    fesetround(state);
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edutemplate <class fpType>
7384Sgblack@eecs.umich.edustatic inline fpType
7386Sgblack@eecs.umich.edufixDest(FPSCR fpscr, fpType val, fpType op1)
7386Sgblack@eecs.umich.edu{
7386Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(val);
7386Sgblack@eecs.umich.edu    fpType junk = 0.0;
7386Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7386Sgblack@eecs.umich.edu        const bool single = (sizeof(val) == sizeof(float));
7386Sgblack@eecs.umich.edu        const uint64_t qnan = single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7386Sgblack@eecs.umich.edu        const bool nan = std::isnan(op1);
7386Sgblack@eecs.umich.edu        if (!nan || (fpscr.dn == 1)) {
7386Sgblack@eecs.umich.edu            val = bitsToFp(qnan, junk);
7386Sgblack@eecs.umich.edu        } else if (nan) {
7386Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op1) | qnan, junk);
7386Sgblack@eecs.umich.edu        }
7386Sgblack@eecs.umich.edu    } else if (fpClass == FP_SUBNORMAL && fpscr.fz == 1) {
7386Sgblack@eecs.umich.edu        // Turn val into a zero with the correct sign;
7386Sgblack@eecs.umich.edu        uint64_t bitMask = ULL(0x1) << (sizeof(fpType) * 8 - 1);
7386Sgblack@eecs.umich.edu        val = bitsToFp(fpToBits(val) & bitMask, junk);
7396Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7386Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7386Sgblack@eecs.umich.edu    }
7386Sgblack@eecs.umich.edu    return val;
7386Sgblack@eecs.umich.edu}
7386Sgblack@eecs.umich.edu
7386Sgblack@eecs.umich.edutemplate <class fpType>
7386Sgblack@eecs.umich.edustatic inline fpType
7385Sgblack@eecs.umich.edufixDest(FPSCR fpscr, fpType val, fpType op1, fpType op2)
7384Sgblack@eecs.umich.edu{
7385Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(val);
7385Sgblack@eecs.umich.edu    fpType junk = 0.0;
7385Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7384Sgblack@eecs.umich.edu        const bool single = (sizeof(val) == sizeof(float));
7384Sgblack@eecs.umich.edu        const uint64_t qnan = single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7384Sgblack@eecs.umich.edu        const bool nan1 = std::isnan(op1);
7384Sgblack@eecs.umich.edu        const bool nan2 = std::isnan(op2);
7384Sgblack@eecs.umich.edu        const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
7384Sgblack@eecs.umich.edu        const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
7384Sgblack@eecs.umich.edu        if ((!nan1 && !nan2) || (fpscr.dn == 1)) {
7384Sgblack@eecs.umich.edu            val = bitsToFp(qnan, junk);
7384Sgblack@eecs.umich.edu        } else if (signal1) {
7384Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op1) | qnan, junk);
7384Sgblack@eecs.umich.edu        } else if (signal2) {
7384Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op2) | qnan, junk);
7384Sgblack@eecs.umich.edu        } else if (nan1) {
7384Sgblack@eecs.umich.edu            val = op1;
7384Sgblack@eecs.umich.edu        } else if (nan2) {
7384Sgblack@eecs.umich.edu            val = op2;
7384Sgblack@eecs.umich.edu        }
7385Sgblack@eecs.umich.edu    } else if (fpClass == FP_SUBNORMAL && fpscr.fz == 1) {
7385Sgblack@eecs.umich.edu        // Turn val into a zero with the correct sign;
7385Sgblack@eecs.umich.edu        uint64_t bitMask = ULL(0x1) << (sizeof(fpType) * 8 - 1);
7385Sgblack@eecs.umich.edu        val = bitsToFp(fpToBits(val) & bitMask, junk);
7396Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7385Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7384Sgblack@eecs.umich.edu    }
7384Sgblack@eecs.umich.edu    return val;
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7386Sgblack@eecs.umich.edutemplate <class fpType>
7386Sgblack@eecs.umich.edustatic inline fpType
7386Sgblack@eecs.umich.edufixDivDest(FPSCR fpscr, fpType val, fpType op1, fpType op2)
7386Sgblack@eecs.umich.edu{
7386Sgblack@eecs.umich.edu    fpType mid = fixDest(fpscr, val, op1, op2);
7386Sgblack@eecs.umich.edu    const bool single = (sizeof(fpType) == sizeof(float));
7386Sgblack@eecs.umich.edu    const fpType junk = 0.0;
7386Sgblack@eecs.umich.edu    if ((single && (val == bitsToFp(0x00800000, junk) ||
7386Sgblack@eecs.umich.edu                    val == bitsToFp(0x80800000, junk))) ||
7386Sgblack@eecs.umich.edu        (!single && (val == bitsToFp(ULL(0x0010000000000000), junk) ||
7386Sgblack@eecs.umich.edu                     val == bitsToFp(ULL(0x8010000000000000), junk)))
7386Sgblack@eecs.umich.edu        ) {
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (op1) : "m" (op1));
7386Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7386Sgblack@eecs.umich.edu        fpType temp = 0.0;
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7386Sgblack@eecs.umich.edu        temp = op1 / op2;
7396Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7386Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7396Sgblack@eecs.umich.edu            if (fpscr.fz) {
7396Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7396Sgblack@eecs.umich.edu                mid = temp;
7396Sgblack@eecs.umich.edu            }
7386Sgblack@eecs.umich.edu        }
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7386Sgblack@eecs.umich.edu    }
7386Sgblack@eecs.umich.edu    return mid;
7386Sgblack@eecs.umich.edu}
7386Sgblack@eecs.umich.edu
7386Sgblack@eecs.umich.edustatic inline float
7386Sgblack@eecs.umich.edufixFpDFpSDest(FPSCR fpscr, double val)
7386Sgblack@eecs.umich.edu{
7386Sgblack@eecs.umich.edu    const float junk = 0.0;
7386Sgblack@eecs.umich.edu    float op1 = 0.0;
7386Sgblack@eecs.umich.edu    if (std::isnan(val)) {
7386Sgblack@eecs.umich.edu        uint64_t valBits = fpToBits(val);
7386Sgblack@eecs.umich.edu        uint32_t op1Bits = bits(valBits, 50, 29) |
7386Sgblack@eecs.umich.edu                           (mask(9) << 22) |
7386Sgblack@eecs.umich.edu                           (bits(valBits, 63) << 31);
7386Sgblack@eecs.umich.edu        op1 = bitsToFp(op1Bits, junk);
7386Sgblack@eecs.umich.edu    }
7386Sgblack@eecs.umich.edu    float mid = fixDest(fpscr, (float)val, op1);
7396Sgblack@eecs.umich.edu    if (fpscr.fz && fetestexcept(FeUnderflow | FeInexact) ==
7396Sgblack@eecs.umich.edu                    (FeUnderflow | FeInexact)) {
7396Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7396Sgblack@eecs.umich.edu    }
7386Sgblack@eecs.umich.edu    if (mid == bitsToFp(0x00800000, junk) ||
7386Sgblack@eecs.umich.edu        mid == bitsToFp(0x80800000, junk)) {
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (val) : "m" (val));
7386Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7386Sgblack@eecs.umich.edu        float temp = 0.0;
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7386Sgblack@eecs.umich.edu        temp = val;
7396Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7386Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7396Sgblack@eecs.umich.edu            if (fpscr.fz) {
7396Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7396Sgblack@eecs.umich.edu                mid = temp;
7396Sgblack@eecs.umich.edu            }
7386Sgblack@eecs.umich.edu        }
7386Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7386Sgblack@eecs.umich.edu    }
7386Sgblack@eecs.umich.edu    return mid;
7386Sgblack@eecs.umich.edu}
7386Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edufixFpSFpDDest(FPSCR fpscr, float val)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    const double junk = 0.0;
7396Sgblack@eecs.umich.edu    double op1 = 0.0;
7396Sgblack@eecs.umich.edu    if (std::isnan(val)) {
7396Sgblack@eecs.umich.edu        uint32_t valBits = fpToBits(val);
7396Sgblack@eecs.umich.edu        uint64_t op1Bits = ((uint64_t)bits(valBits, 21, 0) << 29) |
7396Sgblack@eecs.umich.edu                           (mask(12) << 51) |
7396Sgblack@eecs.umich.edu                           ((uint64_t)bits(valBits, 31) << 63);
7396Sgblack@eecs.umich.edu        op1 = bitsToFp(op1Bits, junk);
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    double mid = fixDest(fpscr, (double)val, op1);
7396Sgblack@eecs.umich.edu    if (mid == bitsToFp(ULL(0x0010000000000000), junk) ||
7396Sgblack@eecs.umich.edu        mid == bitsToFp(ULL(0x8010000000000000), junk)) {
7396Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (val) : "m" (val));
7396Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7396Sgblack@eecs.umich.edu        double temp = 0.0;
7396Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7396Sgblack@eecs.umich.edu        temp = val;
7396Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7396Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7396Sgblack@eecs.umich.edu            if (fpscr.fz) {
7396Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7396Sgblack@eecs.umich.edu                mid = temp;
7396Sgblack@eecs.umich.edu            }
7396Sgblack@eecs.umich.edu        }
7396Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu    return mid;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edustatic inline float
7398Sgblack@eecs.umich.eduvcvtFpSFpH(FPSCR &fpscr, float op, float dest, bool top)
7398Sgblack@eecs.umich.edu{
7398Sgblack@eecs.umich.edu    float junk = 0.0;
7398Sgblack@eecs.umich.edu    uint32_t destBits = fpToBits(dest);
7398Sgblack@eecs.umich.edu    uint32_t opBits = fpToBits(op);
7398Sgblack@eecs.umich.edu    // Extract the operand.
7398Sgblack@eecs.umich.edu    bool neg = bits(opBits, 31);
7398Sgblack@eecs.umich.edu    uint32_t exponent = bits(opBits, 30, 23);
7398Sgblack@eecs.umich.edu    uint32_t oldMantissa = bits(opBits, 22, 0);
7398Sgblack@eecs.umich.edu    uint32_t mantissa = oldMantissa >> (23 - 10);
7398Sgblack@eecs.umich.edu    // Do the conversion.
7398Sgblack@eecs.umich.edu    uint32_t extra = oldMantissa & mask(23 - 10);
7398Sgblack@eecs.umich.edu    if (exponent == 0xff) {
7398Sgblack@eecs.umich.edu        if (oldMantissa != 0) {
7398Sgblack@eecs.umich.edu            // Nans.
7398Sgblack@eecs.umich.edu            if (bits(mantissa, 9) == 0) {
7398Sgblack@eecs.umich.edu                // Signalling nan.
7398Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu            if (fpscr.ahp) {
7398Sgblack@eecs.umich.edu                mantissa = 0;
7398Sgblack@eecs.umich.edu                exponent = 0;
7398Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7398Sgblack@eecs.umich.edu            } else if (fpscr.dn) {
7398Sgblack@eecs.umich.edu                mantissa = (1 << 9);
7398Sgblack@eecs.umich.edu                exponent = 0x1f;
7398Sgblack@eecs.umich.edu                neg = false;
7398Sgblack@eecs.umich.edu            } else {
7398Sgblack@eecs.umich.edu                exponent = 0x1f;
7398Sgblack@eecs.umich.edu                mantissa |= (1 << 9);
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        } else {
7398Sgblack@eecs.umich.edu            // Infinities.
7398Sgblack@eecs.umich.edu            exponent = 0x1F;
7398Sgblack@eecs.umich.edu            if (fpscr.ahp) {
7398Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7398Sgblack@eecs.umich.edu                mantissa = 0x3ff;
7398Sgblack@eecs.umich.edu            } else {
7398Sgblack@eecs.umich.edu                mantissa = 0;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        }
7398Sgblack@eecs.umich.edu    } else if (exponent == 0 && oldMantissa == 0) {
7398Sgblack@eecs.umich.edu        // Zero, don't need to do anything.
7398Sgblack@eecs.umich.edu    } else {
7398Sgblack@eecs.umich.edu        // Normalized or denormalized numbers.
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu        bool inexact = (extra != 0);
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu        if (exponent == 0) {
7398Sgblack@eecs.umich.edu            // Denormalized.
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // If flush to zero is on, this shouldn't happen.
7398Sgblack@eecs.umich.edu            assert(fpscr.fz == 0);
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // Check for underflow
7398Sgblack@eecs.umich.edu            if (inexact || fpscr.ufe)
7398Sgblack@eecs.umich.edu                fpscr.ufc = 1;
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // Handle rounding.
7398Sgblack@eecs.umich.edu            unsigned mode = fpscr.rMode;
7398Sgblack@eecs.umich.edu            if ((mode == VfpRoundUpward && !neg && extra) ||
7398Sgblack@eecs.umich.edu                (mode == VfpRoundDown && neg && extra) ||
7398Sgblack@eecs.umich.edu                (mode == VfpRoundNearest &&
7398Sgblack@eecs.umich.edu                 (extra > (1 << 9) ||
7398Sgblack@eecs.umich.edu                  (extra == (1 << 9) && bits(mantissa, 0))))) {
7398Sgblack@eecs.umich.edu                mantissa++;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // See if the number became normalized after rounding.
7398Sgblack@eecs.umich.edu            if (mantissa == (1 << 10)) {
7398Sgblack@eecs.umich.edu                mantissa = 0;
7398Sgblack@eecs.umich.edu                exponent = 1;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        } else {
7398Sgblack@eecs.umich.edu            // Normalized.
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // We need to track the dropped bits differently since
7398Sgblack@eecs.umich.edu            // more can be dropped by denormalizing.
7398Sgblack@eecs.umich.edu            bool topOne = bits(extra, 12);
7398Sgblack@eecs.umich.edu            bool restZeros = bits(extra, 11, 0) == 0;
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            if (exponent <= (127 - 15)) {
7398Sgblack@eecs.umich.edu                // The result is too small. Denormalize.
7398Sgblack@eecs.umich.edu                mantissa |= (1 << 10);
7398Sgblack@eecs.umich.edu                while (mantissa && exponent <= (127 - 15)) {
7398Sgblack@eecs.umich.edu                    restZeros = restZeros && !topOne;
7398Sgblack@eecs.umich.edu                    topOne = bits(mantissa, 0);
7398Sgblack@eecs.umich.edu                    mantissa = mantissa >> 1;
7398Sgblack@eecs.umich.edu                    exponent++;
7398Sgblack@eecs.umich.edu                }
7398Sgblack@eecs.umich.edu                if (topOne || !restZeros)
7398Sgblack@eecs.umich.edu                    inexact = true;
7398Sgblack@eecs.umich.edu                exponent = 0;
7398Sgblack@eecs.umich.edu            } else {
7398Sgblack@eecs.umich.edu                // Change bias.
7398Sgblack@eecs.umich.edu                exponent -= (127 - 15);
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            if (exponent == 0 && (inexact || fpscr.ufe)) {
7398Sgblack@eecs.umich.edu                // Underflow
7398Sgblack@eecs.umich.edu                fpscr.ufc = 1;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // Handle rounding.
7398Sgblack@eecs.umich.edu            unsigned mode = fpscr.rMode;
7398Sgblack@eecs.umich.edu            bool nonZero = topOne || !restZeros;
7398Sgblack@eecs.umich.edu            if ((mode == VfpRoundUpward && !neg && nonZero) ||
7398Sgblack@eecs.umich.edu                (mode == VfpRoundDown && neg && nonZero) ||
7398Sgblack@eecs.umich.edu                (mode == VfpRoundNearest && topOne &&
7398Sgblack@eecs.umich.edu                 (!restZeros || bits(mantissa, 0)))) {
7398Sgblack@eecs.umich.edu                mantissa++;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // See if we rounded up and need to bump the exponent.
7398Sgblack@eecs.umich.edu            if (mantissa == (1 << 10)) {
7398Sgblack@eecs.umich.edu                mantissa = 0;
7398Sgblack@eecs.umich.edu                exponent++;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu            // Deal with overflow
7398Sgblack@eecs.umich.edu            if (fpscr.ahp) {
7398Sgblack@eecs.umich.edu                if (exponent >= 0x20) {
7398Sgblack@eecs.umich.edu                    exponent = 0x1f;
7398Sgblack@eecs.umich.edu                    mantissa = 0x3ff;
7398Sgblack@eecs.umich.edu                    fpscr.ioc = 1;
7398Sgblack@eecs.umich.edu                    // Supress inexact exception.
7398Sgblack@eecs.umich.edu                    inexact = false;
7398Sgblack@eecs.umich.edu                }
7398Sgblack@eecs.umich.edu            } else {
7398Sgblack@eecs.umich.edu                if (exponent >= 0x1f) {
7398Sgblack@eecs.umich.edu                    if ((mode == VfpRoundNearest) ||
7398Sgblack@eecs.umich.edu                        (mode == VfpRoundUpward && !neg) ||
7398Sgblack@eecs.umich.edu                        (mode == VfpRoundDown && neg)) {
7398Sgblack@eecs.umich.edu                        // Overflow to infinity.
7398Sgblack@eecs.umich.edu                        exponent = 0x1f;
7398Sgblack@eecs.umich.edu                        mantissa = 0;
7398Sgblack@eecs.umich.edu                    } else {
7398Sgblack@eecs.umich.edu                        // Overflow to max normal.
7398Sgblack@eecs.umich.edu                        exponent = 0x1e;
7398Sgblack@eecs.umich.edu                        mantissa = 0x3ff;
7398Sgblack@eecs.umich.edu                    }
7398Sgblack@eecs.umich.edu                    fpscr.ofc = 1;
7398Sgblack@eecs.umich.edu                    inexact = true;
7398Sgblack@eecs.umich.edu                }
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        }
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edu        if (inexact) {
7398Sgblack@eecs.umich.edu            fpscr.ixc = 1;
7398Sgblack@eecs.umich.edu        }
7398Sgblack@eecs.umich.edu    }
7398Sgblack@eecs.umich.edu    // Reassemble and install the result.
7398Sgblack@eecs.umich.edu    uint32_t result = bits(mantissa, 9, 0);
7398Sgblack@eecs.umich.edu    replaceBits(result, 14, 10, exponent);
7398Sgblack@eecs.umich.edu    if (neg)
7398Sgblack@eecs.umich.edu        result |= (1 << 15);
7398Sgblack@eecs.umich.edu    if (top)
7398Sgblack@eecs.umich.edu        replaceBits(destBits, 31, 16, result);
7398Sgblack@eecs.umich.edu    else
7398Sgblack@eecs.umich.edu        replaceBits(destBits, 15, 0, result);
7398Sgblack@eecs.umich.edu    return bitsToFp(destBits, junk);
7398Sgblack@eecs.umich.edu}
7398Sgblack@eecs.umich.edu
7398Sgblack@eecs.umich.edustatic inline float
7398Sgblack@eecs.umich.eduvcvtFpHFpS(FPSCR &fpscr, float op, bool top)
7398Sgblack@eecs.umich.edu{
7398Sgblack@eecs.umich.edu    float junk = 0.0;
7398Sgblack@eecs.umich.edu    uint32_t opBits = fpToBits(op);
7398Sgblack@eecs.umich.edu    // Extract the operand.
7398Sgblack@eecs.umich.edu    if (top)
7398Sgblack@eecs.umich.edu        opBits = bits(opBits, 31, 16);
7398Sgblack@eecs.umich.edu    else
7398Sgblack@eecs.umich.edu        opBits = bits(opBits, 15, 0);
7398Sgblack@eecs.umich.edu    // Extract the bitfields.
7398Sgblack@eecs.umich.edu    bool neg = bits(opBits, 15);
7398Sgblack@eecs.umich.edu    uint32_t exponent = bits(opBits, 14, 10);
7398Sgblack@eecs.umich.edu    uint32_t mantissa = bits(opBits, 9, 0);
7398Sgblack@eecs.umich.edu    // Do the conversion.
7398Sgblack@eecs.umich.edu    if (exponent == 0) {
7398Sgblack@eecs.umich.edu        if (mantissa != 0) {
7398Sgblack@eecs.umich.edu            // Normalize the value.
7398Sgblack@eecs.umich.edu            exponent = exponent + (127 - 15) + 1;
7398Sgblack@eecs.umich.edu            while (mantissa < (1 << 10)) {
7398Sgblack@eecs.umich.edu                mantissa = mantissa << 1;
7398Sgblack@eecs.umich.edu                exponent--;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        }
7398Sgblack@eecs.umich.edu        mantissa = mantissa << (23 - 10);
7398Sgblack@eecs.umich.edu    } else if (exponent == 0x1f && !fpscr.ahp) {
7398Sgblack@eecs.umich.edu        // Infinities and nans.
7398Sgblack@eecs.umich.edu        exponent = 0xff;
7398Sgblack@eecs.umich.edu        if (mantissa != 0) {
7398Sgblack@eecs.umich.edu            // Nans.
7398Sgblack@eecs.umich.edu            mantissa = mantissa << (23 - 10);
7398Sgblack@eecs.umich.edu            if (bits(mantissa, 22) == 0) {
7398Sgblack@eecs.umich.edu                // Signalling nan.
7398Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7398Sgblack@eecs.umich.edu                mantissa |= (1 << 22);
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu            if (fpscr.dn) {
7398Sgblack@eecs.umich.edu                mantissa &= ~mask(22);
7398Sgblack@eecs.umich.edu                neg = false;
7398Sgblack@eecs.umich.edu            }
7398Sgblack@eecs.umich.edu        }
7398Sgblack@eecs.umich.edu    } else {
7398Sgblack@eecs.umich.edu        exponent = exponent + (127 - 15);
7398Sgblack@eecs.umich.edu        mantissa = mantissa << (23 - 10);
7398Sgblack@eecs.umich.edu    }
7398Sgblack@eecs.umich.edu    // Reassemble the result.
7398Sgblack@eecs.umich.edu    uint32_t result = bits(mantissa, 22, 0);
7398Sgblack@eecs.umich.edu    replaceBits(result, 30, 23, exponent);
7398Sgblack@eecs.umich.edu    if (neg)
7398Sgblack@eecs.umich.edu        result |= (1 << 31);
7398Sgblack@eecs.umich.edu    return bitsToFp(result, junk);
7398Sgblack@eecs.umich.edu}
7398Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edumakeDouble(uint32_t low, uint32_t high)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    double junk = 0.0;
7396Sgblack@eecs.umich.edu    return bitsToFp((uint64_t)low | ((uint64_t)high << 32), junk);
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline uint32_t
7396Sgblack@eecs.umich.edulowFromDouble(double val)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return fpToBits(val);
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline uint32_t
7396Sgblack@eecs.umich.eduhighFromDouble(double val)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return fpToBits(val) >> 32;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline uint64_t
7388Sgblack@eecs.umich.eduvfpFpSToFixed(float val, bool isSigned, bool half,
7388Sgblack@eecs.umich.edu              uint8_t imm, bool rzero = true)
7379Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    int rmode = rzero ? FeRoundZero : fegetround();
7396Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (rmode) : "m" (rmode));
7388Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    val = val * powf(2.0, imm);
7379Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (val) : "m" (val));
7396Sgblack@eecs.umich.edu    fesetround(rmode);
7379Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (val) : "m" (val));
7382Sgblack@eecs.umich.edu    float origVal = val;
7382Sgblack@eecs.umich.edu    val = rintf(val);
7382Sgblack@eecs.umich.edu    int fpType = std::fpclassify(val);
7382Sgblack@eecs.umich.edu    if (fpType == FP_SUBNORMAL || fpType == FP_NAN) {
7382Sgblack@eecs.umich.edu        if (fpType == FP_NAN) {
7382Sgblack@eecs.umich.edu            feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu        }
7382Sgblack@eecs.umich.edu        val = 0.0;
7382Sgblack@eecs.umich.edu    } else if (origVal != val) {
7396Sgblack@eecs.umich.edu        switch (rmode) {
7396Sgblack@eecs.umich.edu          case FeRoundNearest:
7396Sgblack@eecs.umich.edu            if (origVal - val > 0.5)
7396Sgblack@eecs.umich.edu                val += 1.0;
7396Sgblack@eecs.umich.edu            else if (val - origVal > 0.5)
7396Sgblack@eecs.umich.edu                val -= 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu          case FeRoundDown:
7396Sgblack@eecs.umich.edu            if (origVal < val)
7396Sgblack@eecs.umich.edu                val -= 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu          case FeRoundUpward:
7396Sgblack@eecs.umich.edu            if (origVal > val)
7396Sgblack@eecs.umich.edu                val += 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu        }
7382Sgblack@eecs.umich.edu        feraiseexcept(FeInexact);
7382Sgblack@eecs.umich.edu    }
7382Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edu    if (isSigned) {
7379Sgblack@eecs.umich.edu        if (half) {
7381Sgblack@eecs.umich.edu            if ((double)val < (int16_t)(1 << 15)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int16_t)(1 << 15);
7379Sgblack@eecs.umich.edu            }
7381Sgblack@eecs.umich.edu            if ((double)val > (int16_t)mask(15)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int16_t)mask(15);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (int16_t)val;
7379Sgblack@eecs.umich.edu        } else {
7381Sgblack@eecs.umich.edu            if ((double)val < (int32_t)(1 << 31)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int32_t)(1 << 31);
7379Sgblack@eecs.umich.edu            }
7381Sgblack@eecs.umich.edu            if ((double)val > (int32_t)mask(31)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int32_t)mask(31);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (int32_t)val;
7379Sgblack@eecs.umich.edu        }
7379Sgblack@eecs.umich.edu    } else {
7379Sgblack@eecs.umich.edu        if (half) {
7381Sgblack@eecs.umich.edu            if ((double)val < 0) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return 0;
7379Sgblack@eecs.umich.edu            }
7381Sgblack@eecs.umich.edu            if ((double)val > (mask(16))) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return mask(16);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (uint16_t)val;
7379Sgblack@eecs.umich.edu        } else {
7381Sgblack@eecs.umich.edu            if ((double)val < 0) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return 0;
7379Sgblack@eecs.umich.edu            }
7381Sgblack@eecs.umich.edu            if ((double)val > (mask(32))) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return mask(32);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (uint32_t)val;
7379Sgblack@eecs.umich.edu        }
7379Sgblack@eecs.umich.edu    }
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline float
7386Sgblack@eecs.umich.eduvfpUFixedToFpS(FPSCR fpscr, uint32_t val, bool half, uint8_t imm)
7379Sgblack@eecs.umich.edu{
7379Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    if (half)
7379Sgblack@eecs.umich.edu        val = (uint16_t)val;
7382Sgblack@eecs.umich.edu    float scale = powf(2.0, imm);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7382Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7386Sgblack@eecs.umich.edu    return fixDivDest(fpscr, val / scale, (float)val, scale);
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline float
7386Sgblack@eecs.umich.eduvfpSFixedToFpS(FPSCR fpscr, int32_t val, bool half, uint8_t imm)
7379Sgblack@eecs.umich.edu{
7379Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    if (half)
7379Sgblack@eecs.umich.edu        val = sext<16>(val & mask(16));
7382Sgblack@eecs.umich.edu    float scale = powf(2.0, imm);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7382Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7386Sgblack@eecs.umich.edu    return fixDivDest(fpscr, val / scale, (float)val, scale);
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline uint64_t
7388Sgblack@eecs.umich.eduvfpFpDToFixed(double val, bool isSigned, bool half,
7388Sgblack@eecs.umich.edu              uint8_t imm, bool rzero = true)
7379Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    int rmode = rzero ? FeRoundZero : fegetround();
7382Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    val = val * pow(2.0, imm);
7379Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (val) : "m" (val));
7396Sgblack@eecs.umich.edu    fesetround(rmode);
7379Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (val) : "m" (val));
7382Sgblack@eecs.umich.edu    double origVal = val;
7382Sgblack@eecs.umich.edu    val = rint(val);
7382Sgblack@eecs.umich.edu    int fpType = std::fpclassify(val);
7382Sgblack@eecs.umich.edu    if (fpType == FP_SUBNORMAL || fpType == FP_NAN) {
7382Sgblack@eecs.umich.edu        if (fpType == FP_NAN) {
7382Sgblack@eecs.umich.edu            feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu        }
7382Sgblack@eecs.umich.edu        val = 0.0;
7382Sgblack@eecs.umich.edu    } else if (origVal != val) {
7396Sgblack@eecs.umich.edu        switch (rmode) {
7396Sgblack@eecs.umich.edu          case FeRoundNearest:
7396Sgblack@eecs.umich.edu            if (origVal - val > 0.5)
7396Sgblack@eecs.umich.edu                val += 1.0;
7396Sgblack@eecs.umich.edu            else if (val - origVal > 0.5)
7396Sgblack@eecs.umich.edu                val -= 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu          case FeRoundDown:
7396Sgblack@eecs.umich.edu            if (origVal < val)
7396Sgblack@eecs.umich.edu                val -= 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu          case FeRoundUpward:
7396Sgblack@eecs.umich.edu            if (origVal > val)
7396Sgblack@eecs.umich.edu                val += 1.0;
7396Sgblack@eecs.umich.edu            break;
7396Sgblack@eecs.umich.edu        }
7382Sgblack@eecs.umich.edu        feraiseexcept(FeInexact);
7382Sgblack@eecs.umich.edu    }
7379Sgblack@eecs.umich.edu    if (isSigned) {
7379Sgblack@eecs.umich.edu        if (half) {
7379Sgblack@eecs.umich.edu            if (val < (int16_t)(1 << 15)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int16_t)(1 << 15);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            if (val > (int16_t)mask(15)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int16_t)mask(15);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (int16_t)val;
7379Sgblack@eecs.umich.edu        } else {
7379Sgblack@eecs.umich.edu            if (val < (int32_t)(1 << 31)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int32_t)(1 << 31);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            if (val > (int32_t)mask(31)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return (int32_t)mask(31);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (int32_t)val;
7379Sgblack@eecs.umich.edu        }
7379Sgblack@eecs.umich.edu    } else {
7379Sgblack@eecs.umich.edu        if (half) {
7379Sgblack@eecs.umich.edu            if (val < 0) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return 0;
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            if (val > mask(16)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return mask(16);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (uint16_t)val;
7379Sgblack@eecs.umich.edu        } else {
7379Sgblack@eecs.umich.edu            if (val < 0) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return 0;
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            if (val > mask(32)) {
7379Sgblack@eecs.umich.edu                feraiseexcept(FeInvalid);
7382Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7379Sgblack@eecs.umich.edu                return mask(32);
7379Sgblack@eecs.umich.edu            }
7379Sgblack@eecs.umich.edu            return (uint32_t)val;
7379Sgblack@eecs.umich.edu        }
7379Sgblack@eecs.umich.edu    }
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline double
7386Sgblack@eecs.umich.eduvfpUFixedToFpD(FPSCR fpscr, uint32_t val, bool half, uint8_t imm)
7379Sgblack@eecs.umich.edu{
7379Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    if (half)
7379Sgblack@eecs.umich.edu        val = (uint16_t)val;
7382Sgblack@eecs.umich.edu    double scale = pow(2.0, imm);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7382Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7386Sgblack@eecs.umich.edu    return fixDivDest(fpscr, val / scale, (double)val, scale);
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7379Sgblack@eecs.umich.edustatic inline double
7386Sgblack@eecs.umich.eduvfpSFixedToFpD(FPSCR fpscr, int32_t val, bool half, uint8_t imm)
7379Sgblack@eecs.umich.edu{
7379Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
7379Sgblack@eecs.umich.edu    if (half)
7379Sgblack@eecs.umich.edu        val = sext<16>(val & mask(16));
7382Sgblack@eecs.umich.edu    double scale = pow(2.0, imm);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7382Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7382Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7386Sgblack@eecs.umich.edu    return fixDivDest(fpscr, val / scale, (double)val, scale);
7379Sgblack@eecs.umich.edu}
7379Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.educlass VfpMacroOp : public PredMacroOp
7376Sgblack@eecs.umich.edu{
7376Sgblack@eecs.umich.edu  public:
7376Sgblack@eecs.umich.edu    static bool
7376Sgblack@eecs.umich.edu    inScalarBank(IntRegIndex idx)
7376Sgblack@eecs.umich.edu    {
7376Sgblack@eecs.umich.edu        return (idx % 32) < 8;
7376Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu  protected:
7376Sgblack@eecs.umich.edu    bool wide;
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu    VfpMacroOp(const char *mnem, ExtMachInst _machInst,
7376Sgblack@eecs.umich.edu            OpClass __opClass, bool _wide) :
7376Sgblack@eecs.umich.edu        PredMacroOp(mnem, _machInst, __opClass), wide(_wide)
7376Sgblack@eecs.umich.edu    {}
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu    IntRegIndex
7376Sgblack@eecs.umich.edu    addStride(IntRegIndex idx, unsigned stride)
7376Sgblack@eecs.umich.edu    {
7376Sgblack@eecs.umich.edu        if (wide) {
7376Sgblack@eecs.umich.edu            stride *= 2;
7376Sgblack@eecs.umich.edu        }
7376Sgblack@eecs.umich.edu        unsigned offset = idx % 8;
7376Sgblack@eecs.umich.edu        idx = (IntRegIndex)(idx - offset);
7376Sgblack@eecs.umich.edu        offset += stride;
7376Sgblack@eecs.umich.edu        idx = (IntRegIndex)(idx + (offset % 8));
7376Sgblack@eecs.umich.edu        return idx;
7376Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu    void
7376Sgblack@eecs.umich.edu    nextIdxs(IntRegIndex &dest, IntRegIndex &op1, IntRegIndex &op2)
7376Sgblack@eecs.umich.edu    {
7376Sgblack@eecs.umich.edu        unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7376Sgblack@eecs.umich.edu        assert(!inScalarBank(dest));
7376Sgblack@eecs.umich.edu        dest = addStride(dest, stride);
7376Sgblack@eecs.umich.edu        op1 = addStride(op1, stride);
7376Sgblack@eecs.umich.edu        if (!inScalarBank(op2)) {
7376Sgblack@eecs.umich.edu            op2 = addStride(op2, stride);
7376Sgblack@eecs.umich.edu        }
7376Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu    void
7376Sgblack@eecs.umich.edu    nextIdxs(IntRegIndex &dest, IntRegIndex &op1)
7376Sgblack@eecs.umich.edu    {
7376Sgblack@eecs.umich.edu        unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7376Sgblack@eecs.umich.edu        assert(!inScalarBank(dest));
7376Sgblack@eecs.umich.edu        dest = addStride(dest, stride);
7376Sgblack@eecs.umich.edu        if (!inScalarBank(op1)) {
7376Sgblack@eecs.umich.edu            op1 = addStride(op1, stride);
7376Sgblack@eecs.umich.edu        }
7376Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu
7376Sgblack@eecs.umich.edu    void
7376Sgblack@eecs.umich.edu    nextIdxs(IntRegIndex &dest)
7376Sgblack@eecs.umich.edu    {
7376Sgblack@eecs.umich.edu        unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7376Sgblack@eecs.umich.edu        assert(!inScalarBank(dest));
7376Sgblack@eecs.umich.edu        dest = addStride(dest, stride);
7376Sgblack@eecs.umich.edu    }
7376Sgblack@eecs.umich.edu};
7376Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline float
7396Sgblack@eecs.umich.edufpAddS(float a, float b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a + b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edufpAddD(double a, double b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a + b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline float
7396Sgblack@eecs.umich.edufpSubS(float a, float b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a - b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edufpSubD(double a, double b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a - b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline float
7396Sgblack@eecs.umich.edufpDivS(float a, float b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a / b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edufpDivD(double a, double b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a / b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline float
7396Sgblack@eecs.umich.edufpMulS(float a, float b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a * b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustatic inline double
7396Sgblack@eecs.umich.edufpMulD(double a, double b)
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    return a * b;
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.educlass FpOp : public PredOp
7375Sgblack@eecs.umich.edu{
7375Sgblack@eecs.umich.edu  protected:
7396Sgblack@eecs.umich.edu    FpOp(const char *mnem, ExtMachInst _machInst, OpClass __opClass) :
7396Sgblack@eecs.umich.edu        PredOp(mnem, _machInst, __opClass)
7396Sgblack@eecs.umich.edu    {}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    virtual float
7396Sgblack@eecs.umich.edu    doOp(float op1, float op2) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        panic("Unimplemented version of doOp called.\n");
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    virtual float
7396Sgblack@eecs.umich.edu    doOp(float op1) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        panic("Unimplemented version of doOp called.\n");
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    virtual double
7396Sgblack@eecs.umich.edu    doOp(double op1, double op2) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        panic("Unimplemented version of doOp called.\n");
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    virtual double
7396Sgblack@eecs.umich.edu    doOp(double op1) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        panic("Unimplemented version of doOp called.\n");
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    double
7396Sgblack@eecs.umich.edu    dbl(uint32_t low, uint32_t high) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        double junk = 0.0;
7396Sgblack@eecs.umich.edu        return bitsToFp((uint64_t)low | ((uint64_t)high << 32), junk);
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    uint32_t
7396Sgblack@eecs.umich.edu    dblLow(double val) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        return fpToBits(val);
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    uint32_t
7396Sgblack@eecs.umich.edu    dblHi(double val) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        return fpToBits(val) >> 32;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    template <class fpType>
7396Sgblack@eecs.umich.edu    fpType
7396Sgblack@eecs.umich.edu    binaryOp(FPSCR &fpscr, fpType op1, fpType op2,
7396Sgblack@eecs.umich.edu            fpType (*func)(fpType, fpType),
7396Sgblack@eecs.umich.edu            bool flush, uint32_t rMode) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        const bool single = (sizeof(fpType) == sizeof(float));
7396Sgblack@eecs.umich.edu        fpType junk = 0.0;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu        if (flush && flushToZero(op1, op2))
7396Sgblack@eecs.umich.edu            fpscr.idc = 1;
7396Sgblack@eecs.umich.edu        VfpSavedState state = prepFpState(rMode);
7396Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2), "=m" (state)
7396Sgblack@eecs.umich.edu                                 : "m" (op1), "m" (op2), "m" (state));
7396Sgblack@eecs.umich.edu        fpType dest = func(op1, op2);
7396Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (dest) : "m" (dest));
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu        int fpClass = std::fpclassify(dest);
7396Sgblack@eecs.umich.edu        // Get NAN behavior right. This varies between x86 and ARM.
7396Sgblack@eecs.umich.edu        if (fpClass == FP_NAN) {
7396Sgblack@eecs.umich.edu            const bool single = (sizeof(fpType) == sizeof(float));
7396Sgblack@eecs.umich.edu            const uint64_t qnan =
7396Sgblack@eecs.umich.edu                single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7396Sgblack@eecs.umich.edu            const bool nan1 = std::isnan(op1);
7396Sgblack@eecs.umich.edu            const bool nan2 = std::isnan(op2);
7396Sgblack@eecs.umich.edu            const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
7396Sgblack@eecs.umich.edu            const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
7396Sgblack@eecs.umich.edu            if ((!nan1 && !nan2) || (fpscr.dn == 1)) {
7396Sgblack@eecs.umich.edu                dest = bitsToFp(qnan, junk);
7396Sgblack@eecs.umich.edu            } else if (signal1) {
7396Sgblack@eecs.umich.edu                dest = bitsToFp(fpToBits(op1) | qnan, junk);
7396Sgblack@eecs.umich.edu            } else if (signal2) {
7396Sgblack@eecs.umich.edu                dest = bitsToFp(fpToBits(op2) | qnan, junk);
7396Sgblack@eecs.umich.edu            } else if (nan1) {
7396Sgblack@eecs.umich.edu                dest = op1;
7396Sgblack@eecs.umich.edu            } else if (nan2) {
7396Sgblack@eecs.umich.edu                dest = op2;
7396Sgblack@eecs.umich.edu            }
7396Sgblack@eecs.umich.edu        } else if (flush && flushToZero(dest)) {
7396Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7396Sgblack@eecs.umich.edu        } else if ((
7396Sgblack@eecs.umich.edu                    (single && (dest == bitsToFp(0x00800000, junk) ||
7396Sgblack@eecs.umich.edu                         dest == bitsToFp(0x80800000, junk))) ||
7396Sgblack@eecs.umich.edu                    (!single &&
7396Sgblack@eecs.umich.edu                        (dest == bitsToFp(ULL(0x0010000000000000), junk) ||
7396Sgblack@eecs.umich.edu                         dest == bitsToFp(ULL(0x8010000000000000), junk)))
7396Sgblack@eecs.umich.edu                   ) && rMode != VfpRoundZero) {
7396Sgblack@eecs.umich.edu            /*
7396Sgblack@eecs.umich.edu             * Correct for the fact that underflow is detected -before- rounding
7396Sgblack@eecs.umich.edu             * in ARM and -after- rounding in x86.
7396Sgblack@eecs.umich.edu             */
7396Sgblack@eecs.umich.edu            fesetround(FeRoundZero);
7396Sgblack@eecs.umich.edu            __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2)
7396Sgblack@eecs.umich.edu                                     : "m" (op1), "m" (op2));
7396Sgblack@eecs.umich.edu            fpType temp = func(op1, op2);
7396Sgblack@eecs.umich.edu            __asm__ __volatile__ ("" : "=m" (temp) : "m" (temp));
7396Sgblack@eecs.umich.edu            if (flush && flushToZero(temp)) {
7396Sgblack@eecs.umich.edu                dest = temp;
7396Sgblack@eecs.umich.edu            }
7396Sgblack@eecs.umich.edu        }
7396Sgblack@eecs.umich.edu        finishVfp(fpscr, state);
7396Sgblack@eecs.umich.edu        return dest;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    template <class fpType>
7396Sgblack@eecs.umich.edu    fpType
7396Sgblack@eecs.umich.edu    unaryOp(FPSCR &fpscr, fpType op1,
7396Sgblack@eecs.umich.edu            fpType (*func)(fpType),
7396Sgblack@eecs.umich.edu            bool flush, uint32_t rMode) const
7396Sgblack@eecs.umich.edu    {
7396Sgblack@eecs.umich.edu        const bool single = (sizeof(fpType) == sizeof(float));
7396Sgblack@eecs.umich.edu        fpType junk = 0.0;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu        if (flush && flushToZero(op1))
7396Sgblack@eecs.umich.edu            fpscr.idc = 1;
7396Sgblack@eecs.umich.edu        VfpSavedState state = prepFpState(rMode);
7396Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (op1), "=m" (state)
7396Sgblack@eecs.umich.edu                                 : "m" (op1), "m" (state));
7396Sgblack@eecs.umich.edu        fpType dest = func(op1);
7396Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (dest) : "m" (dest));
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu        int fpClass = std::fpclassify(dest);
7396Sgblack@eecs.umich.edu        // Get NAN behavior right. This varies between x86 and ARM.
7396Sgblack@eecs.umich.edu        if (fpClass == FP_NAN) {
7396Sgblack@eecs.umich.edu            const bool single = (sizeof(fpType) == sizeof(float));
7396Sgblack@eecs.umich.edu            const uint64_t qnan =
7396Sgblack@eecs.umich.edu                single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7396Sgblack@eecs.umich.edu            const bool nan = std::isnan(op1);
7396Sgblack@eecs.umich.edu            if (!nan || fpscr.dn == 1) {
7396Sgblack@eecs.umich.edu                dest = bitsToFp(qnan, junk);
7396Sgblack@eecs.umich.edu            } else if (nan) {
7396Sgblack@eecs.umich.edu                dest = bitsToFp(fpToBits(op1) | qnan, junk);
7396Sgblack@eecs.umich.edu            }
7396Sgblack@eecs.umich.edu        } else if (flush && flushToZero(dest)) {
7396Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7396Sgblack@eecs.umich.edu        } else if ((
7396Sgblack@eecs.umich.edu                    (single && (dest == bitsToFp(0x00800000, junk) ||
7396Sgblack@eecs.umich.edu                         dest == bitsToFp(0x80800000, junk))) ||
7396Sgblack@eecs.umich.edu                    (!single &&
7396Sgblack@eecs.umich.edu                        (dest == bitsToFp(ULL(0x0010000000000000), junk) ||
7396Sgblack@eecs.umich.edu                         dest == bitsToFp(ULL(0x8010000000000000), junk)))
7396Sgblack@eecs.umich.edu                   ) && rMode != VfpRoundZero) {
7396Sgblack@eecs.umich.edu            /*
7396Sgblack@eecs.umich.edu             * Correct for the fact that underflow is detected -before- rounding
7396Sgblack@eecs.umich.edu             * in ARM and -after- rounding in x86.
7396Sgblack@eecs.umich.edu             */
7396Sgblack@eecs.umich.edu            fesetround(FeRoundZero);
7396Sgblack@eecs.umich.edu            __asm__ __volatile__ ("" : "=m" (op1) : "m" (op1));
7396Sgblack@eecs.umich.edu            fpType temp = func(op1);
7396Sgblack@eecs.umich.edu            __asm__ __volatile__ ("" : "=m" (temp) : "m" (temp));
7396Sgblack@eecs.umich.edu            if (flush && flushToZero(temp)) {
7396Sgblack@eecs.umich.edu                dest = temp;
7396Sgblack@eecs.umich.edu            }
7396Sgblack@eecs.umich.edu        }
7396Sgblack@eecs.umich.edu        finishVfp(fpscr, state);
7396Sgblack@eecs.umich.edu        return dest;
7396Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu};
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.educlass FpRegRegOp : public FpOp
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu  protected:
7396Sgblack@eecs.umich.edu    IntRegIndex dest;
7396Sgblack@eecs.umich.edu    IntRegIndex op1;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    FpRegRegOp(const char *mnem, ExtMachInst _machInst, OpClass __opClass,
7396Sgblack@eecs.umich.edu               IntRegIndex _dest, IntRegIndex _op1,
7396Sgblack@eecs.umich.edu               VfpMicroMode mode = VfpNotAMicroop) :
7396Sgblack@eecs.umich.edu        FpOp(mnem, _machInst, __opClass), dest(_dest), op1(_op1)
7375Sgblack@eecs.umich.edu    {
7375Sgblack@eecs.umich.edu        setVfpMicroFlags(mode, flags);
7375Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    std::string generateDisassembly(Addr pc, const SymbolTable *symtab) const;
7375Sgblack@eecs.umich.edu};
7375Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.educlass FpRegImmOp : public FpOp
7375Sgblack@eecs.umich.edu{
7375Sgblack@eecs.umich.edu  protected:
7396Sgblack@eecs.umich.edu    IntRegIndex dest;
7396Sgblack@eecs.umich.edu    uint64_t imm;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    FpRegImmOp(const char *mnem, ExtMachInst _machInst, OpClass __opClass,
7396Sgblack@eecs.umich.edu               IntRegIndex _dest, uint64_t _imm,
7396Sgblack@eecs.umich.edu               VfpMicroMode mode = VfpNotAMicroop) :
7396Sgblack@eecs.umich.edu        FpOp(mnem, _machInst, __opClass), dest(_dest), imm(_imm)
7375Sgblack@eecs.umich.edu    {
7375Sgblack@eecs.umich.edu        setVfpMicroFlags(mode, flags);
7375Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    std::string generateDisassembly(Addr pc, const SymbolTable *symtab) const;
7375Sgblack@eecs.umich.edu};
7375Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.educlass FpRegRegImmOp : public FpOp
7375Sgblack@eecs.umich.edu{
7375Sgblack@eecs.umich.edu  protected:
7396Sgblack@eecs.umich.edu    IntRegIndex dest;
7396Sgblack@eecs.umich.edu    IntRegIndex op1;
7396Sgblack@eecs.umich.edu    uint64_t imm;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    FpRegRegImmOp(const char *mnem, ExtMachInst _machInst, OpClass __opClass,
7396Sgblack@eecs.umich.edu                  IntRegIndex _dest, IntRegIndex _op1,
7396Sgblack@eecs.umich.edu                  uint64_t _imm, VfpMicroMode mode = VfpNotAMicroop) :
7396Sgblack@eecs.umich.edu        FpOp(mnem, _machInst, __opClass), dest(_dest), op1(_op1), imm(_imm)
7375Sgblack@eecs.umich.edu    {
7375Sgblack@eecs.umich.edu        setVfpMicroFlags(mode, flags);
7375Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    std::string generateDisassembly(Addr pc, const SymbolTable *symtab) const;
7375Sgblack@eecs.umich.edu};
7375Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.educlass FpRegRegRegOp : public FpOp
7375Sgblack@eecs.umich.edu{
7375Sgblack@eecs.umich.edu  protected:
7396Sgblack@eecs.umich.edu    IntRegIndex dest;
7396Sgblack@eecs.umich.edu    IntRegIndex op1;
7396Sgblack@eecs.umich.edu    IntRegIndex op2;
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    FpRegRegRegOp(const char *mnem, ExtMachInst _machInst, OpClass __opClass,
7396Sgblack@eecs.umich.edu                  IntRegIndex _dest, IntRegIndex _op1, IntRegIndex _op2,
7396Sgblack@eecs.umich.edu                  VfpMicroMode mode = VfpNotAMicroop) :
7396Sgblack@eecs.umich.edu        FpOp(mnem, _machInst, __opClass), dest(_dest), op1(_op1), op2(_op2)
7375Sgblack@eecs.umich.edu    {
7375Sgblack@eecs.umich.edu        setVfpMicroFlags(mode, flags);
7375Sgblack@eecs.umich.edu    }
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu    std::string generateDisassembly(Addr pc, const SymbolTable *symtab) const;
7375Sgblack@eecs.umich.edu};
7375Sgblack@eecs.umich.edu
7384Sgblack@eecs.umich.edu}
7384Sgblack@eecs.umich.edu
7375Sgblack@eecs.umich.edu#endif //__ARCH_ARM_INSTS_VFP_HH__