arm/insts/vfp.cc

7396Sgblack@eecs.umich.edu/*
10037SARM gem5 Developers * Copyright (c) 2010-2013 ARM Limited
7396Sgblack@eecs.umich.edu * All rights reserved
7396Sgblack@eecs.umich.edu *
7396Sgblack@eecs.umich.edu * The license below extends only to copyright in the software and shall
7396Sgblack@eecs.umich.edu * not be construed as granting a license to any other intellectual
7396Sgblack@eecs.umich.edu * property including but not limited to intellectual property relating
7396Sgblack@eecs.umich.edu * to a hardware implementation of the functionality of the software
7396Sgblack@eecs.umich.edu * licensed hereunder.  You may use the software subject to the license
7396Sgblack@eecs.umich.edu * terms below provided that you ensure that this notice is replicated
7396Sgblack@eecs.umich.edu * unmodified and in its entirety in all distributions of the software,
7396Sgblack@eecs.umich.edu * modified or unmodified, in source code or in binary form.
7396Sgblack@eecs.umich.edu *
7396Sgblack@eecs.umich.edu * Redistribution and use in source and binary forms, with or without
7396Sgblack@eecs.umich.edu * modification, are permitted provided that the following conditions are
7396Sgblack@eecs.umich.edu * met: redistributions of source code must retain the above copyright
7396Sgblack@eecs.umich.edu * notice, this list of conditions and the following disclaimer;
7396Sgblack@eecs.umich.edu * redistributions in binary form must reproduce the above copyright
7396Sgblack@eecs.umich.edu * notice, this list of conditions and the following disclaimer in the
7396Sgblack@eecs.umich.edu * documentation and/or other materials provided with the distribution;
7396Sgblack@eecs.umich.edu * neither the name of the copyright holders nor the names of its
7396Sgblack@eecs.umich.edu * contributors may be used to endorse or promote products derived from
7396Sgblack@eecs.umich.edu * this software without specific prior written permission.
7396Sgblack@eecs.umich.edu *
7396Sgblack@eecs.umich.edu * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
7396Sgblack@eecs.umich.edu * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
7396Sgblack@eecs.umich.edu * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
7396Sgblack@eecs.umich.edu * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
7396Sgblack@eecs.umich.edu * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
7396Sgblack@eecs.umich.edu * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
7396Sgblack@eecs.umich.edu * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
7396Sgblack@eecs.umich.edu * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
7396Sgblack@eecs.umich.edu * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
7396Sgblack@eecs.umich.edu * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
7396Sgblack@eecs.umich.edu * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
7396Sgblack@eecs.umich.edu *
7396Sgblack@eecs.umich.edu * Authors: Gabe Black
7396Sgblack@eecs.umich.edu */
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edu#include "arch/arm/insts/vfp.hh"
7396Sgblack@eecs.umich.edu
7434Sgblack@eecs.umich.edu/*
7434Sgblack@eecs.umich.edu * The asm statements below are to keep gcc from reordering code. Otherwise
7434Sgblack@eecs.umich.edu * the rounding mode might be set after the operation it was intended for, the
7434Sgblack@eecs.umich.edu * exception bits read before it, etc.
7434Sgblack@eecs.umich.edu */
7434Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustd::string
10037SARM gem5 DevelopersFpCondCompRegOp::generateDisassembly(
10037SARM gem5 Developers        Addr pc, const SymbolTable *symtab) const
10037SARM gem5 Developers{
10037SARM gem5 Developers    std::stringstream ss;
10037SARM gem5 Developers    printMnemonic(ss, "", false);
10037SARM gem5 Developers    printReg(ss, op1);
10037SARM gem5 Developers    ccprintf(ss, ", ");
10037SARM gem5 Developers    printReg(ss, op2);
10037SARM gem5 Developers    ccprintf(ss, ", #%d", defCc);
10037SARM gem5 Developers    ccprintf(ss, ", ");
10037SARM gem5 Developers    printCondition(ss, condCode, true);
10037SARM gem5 Developers    return ss.str();
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstd::string
10037SARM gem5 DevelopersFpCondSelOp::generateDisassembly(
10037SARM gem5 Developers        Addr pc, const SymbolTable *symtab) const
10037SARM gem5 Developers{
10037SARM gem5 Developers    std::stringstream ss;
10037SARM gem5 Developers    printMnemonic(ss, "", false);
10037SARM gem5 Developers    printReg(ss, dest);
10037SARM gem5 Developers    ccprintf(ss, ", ");
10037SARM gem5 Developers    printReg(ss, op1);
10037SARM gem5 Developers    ccprintf(ss, ", ");
10037SARM gem5 Developers    printReg(ss, op2);
10037SARM gem5 Developers    ccprintf(ss, ", ");
10037SARM gem5 Developers    printCondition(ss, condCode, true);
10037SARM gem5 Developers    return ss.str();
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstd::string
7396Sgblack@eecs.umich.eduFpRegRegOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    std::stringstream ss;
7396Sgblack@eecs.umich.edu    printMnemonic(ss);
9918Ssteve.reinhardt@amd.com    printReg(ss, dest + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op1 + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    return ss.str();
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustd::string
7396Sgblack@eecs.umich.eduFpRegImmOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    std::stringstream ss;
7396Sgblack@eecs.umich.edu    printMnemonic(ss);
9918Ssteve.reinhardt@amd.com    printReg(ss, dest + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ccprintf(ss, ", #%d", imm);
7396Sgblack@eecs.umich.edu    return ss.str();
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustd::string
7396Sgblack@eecs.umich.eduFpRegRegImmOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    std::stringstream ss;
7396Sgblack@eecs.umich.edu    printMnemonic(ss);
9918Ssteve.reinhardt@amd.com    printReg(ss, dest + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op1 + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ccprintf(ss, ", #%d", imm);
7396Sgblack@eecs.umich.edu    return ss.str();
7396Sgblack@eecs.umich.edu}
7396Sgblack@eecs.umich.edu
7396Sgblack@eecs.umich.edustd::string
7396Sgblack@eecs.umich.eduFpRegRegRegOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
7396Sgblack@eecs.umich.edu{
7396Sgblack@eecs.umich.edu    std::stringstream ss;
7396Sgblack@eecs.umich.edu    printMnemonic(ss);
9918Ssteve.reinhardt@amd.com    printReg(ss, dest + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op1 + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op2 + FP_Reg_Base);
7396Sgblack@eecs.umich.edu    return ss.str();
7396Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edustd::string
11671Smitch.hayenga@arm.comFpRegRegRegCondOp::generateDisassembly(Addr pc, const SymbolTable *symtab)
11671Smitch.hayenga@arm.com    const
11671Smitch.hayenga@arm.com{
11671Smitch.hayenga@arm.com    std::stringstream ss;
11671Smitch.hayenga@arm.com    printMnemonic(ss);
11671Smitch.hayenga@arm.com    printCondition(ss, cond);
11671Smitch.hayenga@arm.com    printReg(ss, dest + FP_Reg_Base);
11671Smitch.hayenga@arm.com    ss << ", ";
11671Smitch.hayenga@arm.com    printReg(ss, op1 + FP_Reg_Base);
11671Smitch.hayenga@arm.com    ss << ", ";
11671Smitch.hayenga@arm.com    printReg(ss, op2 + FP_Reg_Base);
11671Smitch.hayenga@arm.com    return ss.str();
11671Smitch.hayenga@arm.com}
11671Smitch.hayenga@arm.com
11671Smitch.hayenga@arm.comstd::string
10037SARM gem5 DevelopersFpRegRegRegRegOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
10037SARM gem5 Developers{
10037SARM gem5 Developers    std::stringstream ss;
10037SARM gem5 Developers    printMnemonic(ss);
10037SARM gem5 Developers    printReg(ss, dest + FP_Reg_Base);
10037SARM gem5 Developers    ss << ", ";
10037SARM gem5 Developers    printReg(ss, op1 + FP_Reg_Base);
10037SARM gem5 Developers    ss << ", ";
10037SARM gem5 Developers    printReg(ss, op2 + FP_Reg_Base);
10037SARM gem5 Developers    ss << ", ";
10037SARM gem5 Developers    printReg(ss, op3 + FP_Reg_Base);
10037SARM gem5 Developers    return ss.str();
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstd::string
7639Sgblack@eecs.umich.eduFpRegRegRegImmOp::generateDisassembly(Addr pc, const SymbolTable *symtab) const
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    std::stringstream ss;
7639Sgblack@eecs.umich.edu    printMnemonic(ss);
9918Ssteve.reinhardt@amd.com    printReg(ss, dest + FP_Reg_Base);
7639Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op1 + FP_Reg_Base);
7639Sgblack@eecs.umich.edu    ss << ", ";
9918Ssteve.reinhardt@amd.com    printReg(ss, op2 + FP_Reg_Base);
7639Sgblack@eecs.umich.edu    ccprintf(ss, ", #%d", imm);
7639Sgblack@eecs.umich.edu    return ss.str();
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edunamespace ArmISA
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduVfpSavedState
7430Sgblack@eecs.umich.eduprepFpState(uint32_t rMode)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    int roundingMode = fegetround();
7430Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    switch (rMode) {
7430Sgblack@eecs.umich.edu      case VfpRoundNearest:
7430Sgblack@eecs.umich.edu        fesetround(FeRoundNearest);
7430Sgblack@eecs.umich.edu        break;
7430Sgblack@eecs.umich.edu      case VfpRoundUpward:
7430Sgblack@eecs.umich.edu        fesetround(FeRoundUpward);
7430Sgblack@eecs.umich.edu        break;
7430Sgblack@eecs.umich.edu      case VfpRoundDown:
7430Sgblack@eecs.umich.edu        fesetround(FeRoundDown);
7430Sgblack@eecs.umich.edu        break;
7430Sgblack@eecs.umich.edu      case VfpRoundZero:
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        break;
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return roundingMode;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduvoid
10037SARM gem5 DevelopersfinishVfp(FPSCR &fpscr, VfpSavedState state, bool flush, FPSCR mask)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    int exceptions = fetestexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    bool underflow = false;
10037SARM gem5 Developers    if ((exceptions & FeInvalid) && mask.ioc) {
7430Sgblack@eecs.umich.edu        fpscr.ioc = 1;
7430Sgblack@eecs.umich.edu    }
10037SARM gem5 Developers    if ((exceptions & FeDivByZero) && mask.dzc) {
7430Sgblack@eecs.umich.edu        fpscr.dzc = 1;
7430Sgblack@eecs.umich.edu    }
10037SARM gem5 Developers    if ((exceptions & FeOverflow) && mask.ofc) {
7430Sgblack@eecs.umich.edu        fpscr.ofc = 1;
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    if (exceptions & FeUnderflow) {
7430Sgblack@eecs.umich.edu        underflow = true;
10037SARM gem5 Developers        if (mask.ufc)
10037SARM gem5 Developers            fpscr.ufc = 1;
7430Sgblack@eecs.umich.edu    }
10037SARM gem5 Developers    if ((exceptions & FeInexact) && !(underflow && flush) && mask.ixc) {
7430Sgblack@eecs.umich.edu        fpscr.ixc = 1;
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    fesetround(state);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate <class fpType>
7430Sgblack@eecs.umich.edufpType
7639Sgblack@eecs.umich.edufixDest(bool flush, bool defaultNan, fpType val, fpType op1)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(val);
7430Sgblack@eecs.umich.edu    fpType junk = 0.0;
7430Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7430Sgblack@eecs.umich.edu        const bool single = (sizeof(val) == sizeof(float));
7430Sgblack@eecs.umich.edu        const uint64_t qnan = single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7430Sgblack@eecs.umich.edu        const bool nan = std::isnan(op1);
7639Sgblack@eecs.umich.edu        if (!nan || defaultNan) {
7430Sgblack@eecs.umich.edu            val = bitsToFp(qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (nan) {
7430Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op1) | qnan, junk);
7430Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_SUBNORMAL && flush == 1) {
7430Sgblack@eecs.umich.edu        // Turn val into a zero with the correct sign;
7430Sgblack@eecs.umich.edu        uint64_t bitMask = ULL(0x1) << (sizeof(fpType) * 8 - 1);
7430Sgblack@eecs.umich.edu        val = bitsToFp(fpToBits(val) & bitMask, junk);
7430Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return val;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edufloat fixDest<float>(bool flush, bool defaultNan, float val, float op1);
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edudouble fixDest<double>(bool flush, bool defaultNan, double val, double op1);
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate <class fpType>
7430Sgblack@eecs.umich.edufpType
7639Sgblack@eecs.umich.edufixDest(bool flush, bool defaultNan, fpType val, fpType op1, fpType op2)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(val);
7430Sgblack@eecs.umich.edu    fpType junk = 0.0;
7430Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7430Sgblack@eecs.umich.edu        const bool single = (sizeof(val) == sizeof(float));
7430Sgblack@eecs.umich.edu        const uint64_t qnan = single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7430Sgblack@eecs.umich.edu        const bool nan1 = std::isnan(op1);
7430Sgblack@eecs.umich.edu        const bool nan2 = std::isnan(op2);
7430Sgblack@eecs.umich.edu        const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
7430Sgblack@eecs.umich.edu        const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
7639Sgblack@eecs.umich.edu        if ((!nan1 && !nan2) || defaultNan) {
7430Sgblack@eecs.umich.edu            val = bitsToFp(qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (signal1) {
7430Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op1) | qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (signal2) {
7430Sgblack@eecs.umich.edu            val = bitsToFp(fpToBits(op2) | qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (nan1) {
7430Sgblack@eecs.umich.edu            val = op1;
7430Sgblack@eecs.umich.edu        } else if (nan2) {
7430Sgblack@eecs.umich.edu            val = op2;
7430Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_SUBNORMAL && flush) {
7430Sgblack@eecs.umich.edu        // Turn val into a zero with the correct sign;
7430Sgblack@eecs.umich.edu        uint64_t bitMask = ULL(0x1) << (sizeof(fpType) * 8 - 1);
7430Sgblack@eecs.umich.edu        val = bitsToFp(fpToBits(val) & bitMask, junk);
7430Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return val;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edufloat fixDest<float>(bool flush, bool defaultNan,
7639Sgblack@eecs.umich.edu                     float val, float op1, float op2);
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edudouble fixDest<double>(bool flush, bool defaultNan,
7639Sgblack@eecs.umich.edu                       double val, double op1, double op2);
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate <class fpType>
7430Sgblack@eecs.umich.edufpType
7639Sgblack@eecs.umich.edufixDivDest(bool flush, bool defaultNan, fpType val, fpType op1, fpType op2)
7430Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    fpType mid = fixDest(flush, defaultNan, val, op1, op2);
7430Sgblack@eecs.umich.edu    const bool single = (sizeof(fpType) == sizeof(float));
7430Sgblack@eecs.umich.edu    const fpType junk = 0.0;
7430Sgblack@eecs.umich.edu    if ((single && (val == bitsToFp(0x00800000, junk) ||
7430Sgblack@eecs.umich.edu                    val == bitsToFp(0x80800000, junk))) ||
7430Sgblack@eecs.umich.edu        (!single && (val == bitsToFp(ULL(0x0010000000000000), junk) ||
7430Sgblack@eecs.umich.edu                     val == bitsToFp(ULL(0x8010000000000000), junk)))
7430Sgblack@eecs.umich.edu        ) {
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (op1) : "m" (op1));
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        fpType temp = 0.0;
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7430Sgblack@eecs.umich.edu        temp = op1 / op2;
7430Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7430Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7639Sgblack@eecs.umich.edu            if (flush) {
7430Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu                mid = temp;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return mid;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edufloat fixDivDest<float>(bool flush, bool defaultNan,
7639Sgblack@eecs.umich.edu                        float val, float op1, float op2);
7430Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edudouble fixDivDest<double>(bool flush, bool defaultNan,
7639Sgblack@eecs.umich.edu                          double val, double op1, double op2);
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edufloat
7430Sgblack@eecs.umich.edufixFpDFpSDest(FPSCR fpscr, double val)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    const float junk = 0.0;
7430Sgblack@eecs.umich.edu    float op1 = 0.0;
7430Sgblack@eecs.umich.edu    if (std::isnan(val)) {
7430Sgblack@eecs.umich.edu        uint64_t valBits = fpToBits(val);
7430Sgblack@eecs.umich.edu        uint32_t op1Bits = bits(valBits, 50, 29) |
7430Sgblack@eecs.umich.edu                           (mask(9) << 22) |
7430Sgblack@eecs.umich.edu                           (bits(valBits, 63) << 31);
7430Sgblack@eecs.umich.edu        op1 = bitsToFp(op1Bits, junk);
7430Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    float mid = fixDest(fpscr.fz, fpscr.dn, (float)val, op1);
7430Sgblack@eecs.umich.edu    if (fpscr.fz && fetestexcept(FeUnderflow | FeInexact) ==
7430Sgblack@eecs.umich.edu                    (FeUnderflow | FeInexact)) {
7430Sgblack@eecs.umich.edu        feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    if (mid == bitsToFp(0x00800000, junk) ||
7430Sgblack@eecs.umich.edu        mid == bitsToFp(0x80800000, junk)) {
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (val) : "m" (val));
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        float temp = 0.0;
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7430Sgblack@eecs.umich.edu        temp = val;
7430Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7430Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu            if (fpscr.fz) {
7430Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu                mid = temp;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return mid;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edudouble
7430Sgblack@eecs.umich.edufixFpSFpDDest(FPSCR fpscr, float val)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    const double junk = 0.0;
7430Sgblack@eecs.umich.edu    double op1 = 0.0;
7430Sgblack@eecs.umich.edu    if (std::isnan(val)) {
7430Sgblack@eecs.umich.edu        uint32_t valBits = fpToBits(val);
7430Sgblack@eecs.umich.edu        uint64_t op1Bits = ((uint64_t)bits(valBits, 21, 0) << 29) |
7430Sgblack@eecs.umich.edu                           (mask(12) << 51) |
7430Sgblack@eecs.umich.edu                           ((uint64_t)bits(valBits, 31) << 63);
7430Sgblack@eecs.umich.edu        op1 = bitsToFp(op1Bits, junk);
7430Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    double mid = fixDest(fpscr.fz, fpscr.dn, (double)val, op1);
7430Sgblack@eecs.umich.edu    if (mid == bitsToFp(ULL(0x0010000000000000), junk) ||
7430Sgblack@eecs.umich.edu        mid == bitsToFp(ULL(0x8010000000000000), junk)) {
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (val) : "m" (val));
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        double temp = 0.0;
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" : "=m" (temp) : "m" (temp));
7430Sgblack@eecs.umich.edu        temp = val;
7430Sgblack@eecs.umich.edu        if (flushToZero(temp)) {
7430Sgblack@eecs.umich.edu            feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu            if (fpscr.fz) {
7430Sgblack@eecs.umich.edu                feclearexcept(FeInexact);
7430Sgblack@eecs.umich.edu                mid = temp;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu        __asm__ __volatile__("" :: "m" (temp));
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    return mid;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 DevelopersvcvtFpFpH(FPSCR &fpscr, bool flush, bool defaultNan,
10037SARM gem5 Developers          uint32_t rMode, bool ahp, uint64_t opBits, bool isDouble)
7430Sgblack@eecs.umich.edu{
10037SARM gem5 Developers    uint32_t mWidth;
10037SARM gem5 Developers    uint32_t eWidth;
10037SARM gem5 Developers    uint32_t eHalfRange;
10037SARM gem5 Developers    uint32_t sBitPos;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (isDouble) {
10037SARM gem5 Developers        mWidth = 52;
10037SARM gem5 Developers        eWidth = 11;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        mWidth = 23;
10037SARM gem5 Developers        eWidth = 8;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    sBitPos    = eWidth + mWidth;
10037SARM gem5 Developers    eHalfRange = (1 << (eWidth-1)) - 1;
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edu    // Extract the operand.
10037SARM gem5 Developers    bool neg = bits(opBits, sBitPos);
10037SARM gem5 Developers    uint32_t exponent = bits(opBits, sBitPos-1, mWidth);
10037SARM gem5 Developers    uint64_t oldMantissa = bits(opBits, mWidth-1, 0);
10037SARM gem5 Developers    uint32_t mantissa = oldMantissa >> (mWidth - 10);
7430Sgblack@eecs.umich.edu    // Do the conversion.
10037SARM gem5 Developers    uint64_t extra = oldMantissa & mask(mWidth - 10);
10037SARM gem5 Developers    if (exponent == mask(eWidth)) {
7430Sgblack@eecs.umich.edu        if (oldMantissa != 0) {
7430Sgblack@eecs.umich.edu            // Nans.
7430Sgblack@eecs.umich.edu            if (bits(mantissa, 9) == 0) {
7430Sgblack@eecs.umich.edu                // Signalling nan.
7430Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7430Sgblack@eecs.umich.edu            }
7639Sgblack@eecs.umich.edu            if (ahp) {
7430Sgblack@eecs.umich.edu                mantissa = 0;
7430Sgblack@eecs.umich.edu                exponent = 0;
7430Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7639Sgblack@eecs.umich.edu            } else if (defaultNan) {
7430Sgblack@eecs.umich.edu                mantissa = (1 << 9);
7430Sgblack@eecs.umich.edu                exponent = 0x1f;
7430Sgblack@eecs.umich.edu                neg = false;
7430Sgblack@eecs.umich.edu            } else {
7430Sgblack@eecs.umich.edu                exponent = 0x1f;
7430Sgblack@eecs.umich.edu                mantissa |= (1 << 9);
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        } else {
7430Sgblack@eecs.umich.edu            // Infinities.
7430Sgblack@eecs.umich.edu            exponent = 0x1F;
7639Sgblack@eecs.umich.edu            if (ahp) {
7430Sgblack@eecs.umich.edu                fpscr.ioc = 1;
7430Sgblack@eecs.umich.edu                mantissa = 0x3ff;
7430Sgblack@eecs.umich.edu            } else {
7430Sgblack@eecs.umich.edu                mantissa = 0;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    } else if (exponent == 0 && oldMantissa == 0) {
7430Sgblack@eecs.umich.edu        // Zero, don't need to do anything.
7430Sgblack@eecs.umich.edu    } else {
7430Sgblack@eecs.umich.edu        // Normalized or denormalized numbers.
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu        bool inexact = (extra != 0);
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu        if (exponent == 0) {
7430Sgblack@eecs.umich.edu            // Denormalized.
7430Sgblack@eecs.umich.edu            // If flush to zero is on, this shouldn't happen.
7639Sgblack@eecs.umich.edu            assert(!flush);
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // Check for underflow
7430Sgblack@eecs.umich.edu            if (inexact || fpscr.ufe)
7430Sgblack@eecs.umich.edu                fpscr.ufc = 1;
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // Handle rounding.
7639Sgblack@eecs.umich.edu            unsigned mode = rMode;
7430Sgblack@eecs.umich.edu            if ((mode == VfpRoundUpward && !neg && extra) ||
7430Sgblack@eecs.umich.edu                (mode == VfpRoundDown && neg && extra) ||
7430Sgblack@eecs.umich.edu                (mode == VfpRoundNearest &&
7430Sgblack@eecs.umich.edu                 (extra > (1 << 9) ||
7430Sgblack@eecs.umich.edu                  (extra == (1 << 9) && bits(mantissa, 0))))) {
7430Sgblack@eecs.umich.edu                mantissa++;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // See if the number became normalized after rounding.
7430Sgblack@eecs.umich.edu            if (mantissa == (1 << 10)) {
7430Sgblack@eecs.umich.edu                mantissa = 0;
7430Sgblack@eecs.umich.edu                exponent = 1;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        } else {
7430Sgblack@eecs.umich.edu            // Normalized.
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // We need to track the dropped bits differently since
7430Sgblack@eecs.umich.edu            // more can be dropped by denormalizing.
10037SARM gem5 Developers            bool topOne = bits(extra, mWidth - 10 - 1);
10037SARM gem5 Developers            bool restZeros = bits(extra, mWidth - 10 - 2, 0) == 0;
7430Sgblack@eecs.umich.edu
10037SARM gem5 Developers            if (exponent <= (eHalfRange - 15)) {
7430Sgblack@eecs.umich.edu                // The result is too small. Denormalize.
7430Sgblack@eecs.umich.edu                mantissa |= (1 << 10);
10037SARM gem5 Developers                while (mantissa && exponent <= (eHalfRange - 15)) {
7430Sgblack@eecs.umich.edu                    restZeros = restZeros && !topOne;
7430Sgblack@eecs.umich.edu                    topOne = bits(mantissa, 0);
7430Sgblack@eecs.umich.edu                    mantissa = mantissa >> 1;
7430Sgblack@eecs.umich.edu                    exponent++;
7430Sgblack@eecs.umich.edu                }
7430Sgblack@eecs.umich.edu                if (topOne || !restZeros)
7430Sgblack@eecs.umich.edu                    inexact = true;
7430Sgblack@eecs.umich.edu                exponent = 0;
7430Sgblack@eecs.umich.edu            } else {
7430Sgblack@eecs.umich.edu                // Change bias.
10037SARM gem5 Developers                exponent -= (eHalfRange - 15);
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            if (exponent == 0 && (inexact || fpscr.ufe)) {
7430Sgblack@eecs.umich.edu                // Underflow
7430Sgblack@eecs.umich.edu                fpscr.ufc = 1;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // Handle rounding.
7639Sgblack@eecs.umich.edu            unsigned mode = rMode;
7430Sgblack@eecs.umich.edu            bool nonZero = topOne || !restZeros;
7430Sgblack@eecs.umich.edu            if ((mode == VfpRoundUpward && !neg && nonZero) ||
7430Sgblack@eecs.umich.edu                (mode == VfpRoundDown && neg && nonZero) ||
7430Sgblack@eecs.umich.edu                (mode == VfpRoundNearest && topOne &&
7430Sgblack@eecs.umich.edu                 (!restZeros || bits(mantissa, 0)))) {
7430Sgblack@eecs.umich.edu                mantissa++;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // See if we rounded up and need to bump the exponent.
7430Sgblack@eecs.umich.edu            if (mantissa == (1 << 10)) {
7430Sgblack@eecs.umich.edu                mantissa = 0;
7430Sgblack@eecs.umich.edu                exponent++;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu            // Deal with overflow
7639Sgblack@eecs.umich.edu            if (ahp) {
7430Sgblack@eecs.umich.edu                if (exponent >= 0x20) {
7430Sgblack@eecs.umich.edu                    exponent = 0x1f;
7430Sgblack@eecs.umich.edu                    mantissa = 0x3ff;
7430Sgblack@eecs.umich.edu                    fpscr.ioc = 1;
7430Sgblack@eecs.umich.edu                    // Supress inexact exception.
7430Sgblack@eecs.umich.edu                    inexact = false;
7430Sgblack@eecs.umich.edu                }
7430Sgblack@eecs.umich.edu            } else {
7430Sgblack@eecs.umich.edu                if (exponent >= 0x1f) {
7430Sgblack@eecs.umich.edu                    if ((mode == VfpRoundNearest) ||
7430Sgblack@eecs.umich.edu                        (mode == VfpRoundUpward && !neg) ||
7430Sgblack@eecs.umich.edu                        (mode == VfpRoundDown && neg)) {
7430Sgblack@eecs.umich.edu                        // Overflow to infinity.
7430Sgblack@eecs.umich.edu                        exponent = 0x1f;
7430Sgblack@eecs.umich.edu                        mantissa = 0;
7430Sgblack@eecs.umich.edu                    } else {
7430Sgblack@eecs.umich.edu                        // Overflow to max normal.
7430Sgblack@eecs.umich.edu                        exponent = 0x1e;
7430Sgblack@eecs.umich.edu                        mantissa = 0x3ff;
7430Sgblack@eecs.umich.edu                    }
7430Sgblack@eecs.umich.edu                    fpscr.ofc = 1;
7430Sgblack@eecs.umich.edu                    inexact = true;
7430Sgblack@eecs.umich.edu                }
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu        if (inexact) {
7430Sgblack@eecs.umich.edu            fpscr.ixc = 1;
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    // Reassemble and install the result.
7430Sgblack@eecs.umich.edu    uint32_t result = bits(mantissa, 9, 0);
7430Sgblack@eecs.umich.edu    replaceBits(result, 14, 10, exponent);
7430Sgblack@eecs.umich.edu    if (neg)
7430Sgblack@eecs.umich.edu        result |= (1 << 15);
7639Sgblack@eecs.umich.edu    return result;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
10037SARM gem5 Developersuint16_t
10037SARM gem5 DevelopersvcvtFpSFpH(FPSCR &fpscr, bool flush, bool defaultNan,
10037SARM gem5 Developers           uint32_t rMode, bool ahp, float op)
7430Sgblack@eecs.umich.edu{
10037SARM gem5 Developers    uint64_t opBits = fpToBits(op);
10037SARM gem5 Developers    return vcvtFpFpH(fpscr, flush, defaultNan, rMode, ahp, opBits, false);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersuint16_t
10037SARM gem5 DevelopersvcvtFpDFpH(FPSCR &fpscr, bool flush, bool defaultNan,
10037SARM gem5 Developers           uint32_t rMode, bool ahp, double op)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint64_t opBits = fpToBits(op);
10037SARM gem5 Developers    return vcvtFpFpH(fpscr, flush, defaultNan, rMode, ahp, opBits, true);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 DevelopersvcvtFpHFp(FPSCR &fpscr, bool defaultNan, bool ahp, uint16_t op, bool isDouble)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint32_t mWidth;
10037SARM gem5 Developers    uint32_t eWidth;
10037SARM gem5 Developers    uint32_t eHalfRange;
10037SARM gem5 Developers    uint32_t sBitPos;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (isDouble) {
10037SARM gem5 Developers        mWidth = 52;
10037SARM gem5 Developers        eWidth = 11;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        mWidth = 23;
10037SARM gem5 Developers        eWidth = 8;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    sBitPos    = eWidth + mWidth;
10037SARM gem5 Developers    eHalfRange = (1 << (eWidth-1)) - 1;
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edu    // Extract the bitfields.
7639Sgblack@eecs.umich.edu    bool neg = bits(op, 15);
7639Sgblack@eecs.umich.edu    uint32_t exponent = bits(op, 14, 10);
10037SARM gem5 Developers    uint64_t mantissa = bits(op, 9, 0);
7430Sgblack@eecs.umich.edu    // Do the conversion.
7430Sgblack@eecs.umich.edu    if (exponent == 0) {
7430Sgblack@eecs.umich.edu        if (mantissa != 0) {
7430Sgblack@eecs.umich.edu            // Normalize the value.
10037SARM gem5 Developers            exponent = exponent + (eHalfRange - 15) + 1;
7430Sgblack@eecs.umich.edu            while (mantissa < (1 << 10)) {
7430Sgblack@eecs.umich.edu                mantissa = mantissa << 1;
7430Sgblack@eecs.umich.edu                exponent--;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
10037SARM gem5 Developers        mantissa = mantissa << (mWidth - 10);
7639Sgblack@eecs.umich.edu    } else if (exponent == 0x1f && !ahp) {
7430Sgblack@eecs.umich.edu        // Infinities and nans.
10037SARM gem5 Developers        exponent = mask(eWidth);
7430Sgblack@eecs.umich.edu        if (mantissa != 0) {
7430Sgblack@eecs.umich.edu            // Nans.
10037SARM gem5 Developers            mantissa = mantissa << (mWidth - 10);
10037SARM gem5 Developers            if (bits(mantissa, mWidth-1) == 0) {
7430Sgblack@eecs.umich.edu                // Signalling nan.
7430Sgblack@eecs.umich.edu                fpscr.ioc = 1;
10037SARM gem5 Developers                mantissa |= (((uint64_t) 1) << (mWidth-1));
7430Sgblack@eecs.umich.edu            }
7639Sgblack@eecs.umich.edu            if (defaultNan) {
10037SARM gem5 Developers                mantissa &= ~mask(mWidth-1);
7430Sgblack@eecs.umich.edu                neg = false;
7430Sgblack@eecs.umich.edu            }
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    } else {
10037SARM gem5 Developers        exponent = exponent + (eHalfRange - 15);
10037SARM gem5 Developers        mantissa = mantissa << (mWidth - 10);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    // Reassemble the result.
10037SARM gem5 Developers    uint64_t result = bits(mantissa, mWidth-1, 0);
10037SARM gem5 Developers    replaceBits(result, sBitPos-1, mWidth, exponent);
10037SARM gem5 Developers    if (neg) {
10037SARM gem5 Developers        result |= (((uint64_t) 1) << sBitPos);
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersdouble
10037SARM gem5 DevelopersvcvtFpHFpD(FPSCR &fpscr, bool defaultNan, bool ahp, uint16_t op)
10037SARM gem5 Developers{
10037SARM gem5 Developers    double junk = 0.0;
10037SARM gem5 Developers    uint64_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    result = vcvtFpHFp(fpscr, defaultNan, ahp, op, true);
7430Sgblack@eecs.umich.edu    return bitsToFp(result, junk);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
10037SARM gem5 Developersfloat
10037SARM gem5 DevelopersvcvtFpHFpS(FPSCR &fpscr, bool defaultNan, bool ahp, uint16_t op)
7430Sgblack@eecs.umich.edu{
10037SARM gem5 Developers    float junk = 0.0;
10037SARM gem5 Developers    uint64_t result;
7430Sgblack@eecs.umich.edu
10037SARM gem5 Developers    result = vcvtFpHFp(fpscr, defaultNan, ahp, op, false);
10037SARM gem5 Developers    return bitsToFp(result, junk);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edufloat
7639Sgblack@eecs.umich.eduvfpUFixedToFpS(bool flush, bool defaultNan,
10037SARM gem5 Developers        uint64_t val, uint8_t width, uint8_t imm)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
10037SARM gem5 Developers    if (width == 16)
7430Sgblack@eecs.umich.edu        val = (uint16_t)val;
10037SARM gem5 Developers    else if (width == 32)
10037SARM gem5 Developers        val = (uint32_t)val;
10037SARM gem5 Developers    else if (width != 64)
10037SARM gem5 Developers        panic("Unsupported width %d", width);
7430Sgblack@eecs.umich.edu    float scale = powf(2.0, imm);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7430Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7639Sgblack@eecs.umich.edu    return fixDivDest(flush, defaultNan, val / scale, (float)val, scale);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edufloat
7639Sgblack@eecs.umich.eduvfpSFixedToFpS(bool flush, bool defaultNan,
10037SARM gem5 Developers        int64_t val, uint8_t width, uint8_t imm)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
10037SARM gem5 Developers    if (width == 16)
7430Sgblack@eecs.umich.edu        val = sext<16>(val & mask(16));
10037SARM gem5 Developers    else if (width == 32)
10037SARM gem5 Developers        val = sext<32>(val & mask(32));
10037SARM gem5 Developers    else if (width != 64)
10037SARM gem5 Developers        panic("Unsupported width %d", width);
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edu    float scale = powf(2.0, imm);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7430Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7639Sgblack@eecs.umich.edu    return fixDivDest(flush, defaultNan, val / scale, (float)val, scale);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edudouble
7639Sgblack@eecs.umich.eduvfpUFixedToFpD(bool flush, bool defaultNan,
10037SARM gem5 Developers        uint64_t val, uint8_t width, uint8_t imm)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
10037SARM gem5 Developers    if (width == 16)
7430Sgblack@eecs.umich.edu        val = (uint16_t)val;
10037SARM gem5 Developers    else if (width == 32)
10037SARM gem5 Developers        val = (uint32_t)val;
10037SARM gem5 Developers    else if (width != 64)
10037SARM gem5 Developers        panic("Unsupported width %d", width);
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edu    double scale = pow(2.0, imm);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7430Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7639Sgblack@eecs.umich.edu    return fixDivDest(flush, defaultNan, val / scale, (double)val, scale);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edudouble
7639Sgblack@eecs.umich.eduvfpSFixedToFpD(bool flush, bool defaultNan,
10037SARM gem5 Developers        int64_t val, uint8_t width, uint8_t imm)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    fesetround(FeRoundNearest);
10037SARM gem5 Developers    if (width == 16)
7430Sgblack@eecs.umich.edu        val = sext<16>(val & mask(16));
10037SARM gem5 Developers    else if (width == 32)
10037SARM gem5 Developers        val = sext<32>(val & mask(32));
10037SARM gem5 Developers    else if (width != 64)
10037SARM gem5 Developers        panic("Unsupported width %d", width);
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edu    double scale = pow(2.0, imm);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7430Sgblack@eecs.umich.edu    feclearexcept(FeAllExceptions);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__("" : "=m" (scale) : "m" (scale));
7639Sgblack@eecs.umich.edu    return fixDivDest(flush, defaultNan, val / scale, (double)val, scale);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu// This function implements a magic formula taken from the architecture
7639Sgblack@eecs.umich.edu// reference manual. It was originally called recip_sqrt_estimate.
7639Sgblack@eecs.umich.edustatic double
7639Sgblack@eecs.umich.edurecipSqrtEstimate(double a)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    int64_t q0, q1, s;
7639Sgblack@eecs.umich.edu    double r;
7639Sgblack@eecs.umich.edu    if (a < 0.5) {
7639Sgblack@eecs.umich.edu        q0 = (int64_t)(a * 512.0);
7639Sgblack@eecs.umich.edu        r = 1.0 / sqrt(((double)q0 + 0.5) / 512.0);
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        q1 = (int64_t)(a * 256.0);
7639Sgblack@eecs.umich.edu        r = 1.0 / sqrt(((double)q1 + 0.5) / 256.0);
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    s = (int64_t)(256.0 * r + 0.5);
7639Sgblack@eecs.umich.edu    return (double)s / 256.0;
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu// This function is only intended for use in Neon instructions because
7639Sgblack@eecs.umich.edu// it ignores certain bits in the FPSCR.
7639Sgblack@eecs.umich.edufloat
7639Sgblack@eecs.umich.edufprSqrtEstimate(FPSCR &fpscr, float op)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    const uint32_t qnan = 0x7fc00000;
7639Sgblack@eecs.umich.edu    float junk = 0.0;
7639Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(op);
7639Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7639Sgblack@eecs.umich.edu        if ((fpToBits(op) & qnan) != qnan)
7639Sgblack@eecs.umich.edu            fpscr.ioc = 1;
7639Sgblack@eecs.umich.edu        return bitsToFp(qnan, junk);
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_ZERO) {
7639Sgblack@eecs.umich.edu        fpscr.dzc = 1;
7639Sgblack@eecs.umich.edu        // Return infinity with the same sign as the operand.
7639Sgblack@eecs.umich.edu        return bitsToFp((std::signbit(op) << 31) |
7639Sgblack@eecs.umich.edu                       (0xFF << 23) | (0 << 0), junk);
7639Sgblack@eecs.umich.edu    } else if (std::signbit(op)) {
7639Sgblack@eecs.umich.edu        // Set invalid op bit.
7639Sgblack@eecs.umich.edu        fpscr.ioc = 1;
7639Sgblack@eecs.umich.edu        return bitsToFp(qnan, junk);
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_INFINITE) {
7639Sgblack@eecs.umich.edu        return 0.0;
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        uint64_t opBits = fpToBits(op);
7639Sgblack@eecs.umich.edu        double scaled;
7639Sgblack@eecs.umich.edu        if (bits(opBits, 23)) {
7639Sgblack@eecs.umich.edu            scaled = bitsToFp((0 << 0) | (bits(opBits, 22, 0) << 29) |
7639Sgblack@eecs.umich.edu                              (ULL(0x3fd) << 52) | (bits(opBits, 31) << 63),
7639Sgblack@eecs.umich.edu                              (double)0.0);
7639Sgblack@eecs.umich.edu        } else {
7639Sgblack@eecs.umich.edu            scaled = bitsToFp((0 << 0) | (bits(opBits, 22, 0) << 29) |
7639Sgblack@eecs.umich.edu                              (ULL(0x3fe) << 52) | (bits(opBits, 31) << 63),
7639Sgblack@eecs.umich.edu                              (double)0.0);
7639Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu        uint64_t resultExp = (380 - bits(opBits, 30, 23)) / 2;
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu        uint64_t estimate = fpToBits(recipSqrtEstimate(scaled));
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu        return bitsToFp((bits(estimate, 63) << 31) |
7639Sgblack@eecs.umich.edu                        (bits(resultExp, 7, 0) << 23) |
7639Sgblack@eecs.umich.edu                        (bits(estimate, 51, 29) << 0), junk);
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.eduuint32_t
7639Sgblack@eecs.umich.eduunsignedRSqrtEstimate(uint32_t op)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    if (bits(op, 31, 30) == 0) {
7639Sgblack@eecs.umich.edu        return -1;
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        double dpOp;
7639Sgblack@eecs.umich.edu        if (bits(op, 31)) {
7639Sgblack@eecs.umich.edu            dpOp = bitsToFp((ULL(0) << 63) |
7639Sgblack@eecs.umich.edu                            (ULL(0x3fe) << 52) |
7639Sgblack@eecs.umich.edu                            (bits((uint64_t)op, 30, 0) << 21) |
7639Sgblack@eecs.umich.edu                            (0 << 0), (double)0.0);
7639Sgblack@eecs.umich.edu        } else {
7639Sgblack@eecs.umich.edu            dpOp = bitsToFp((ULL(0) << 63) |
7639Sgblack@eecs.umich.edu                            (ULL(0x3fd) << 52) |
7639Sgblack@eecs.umich.edu                            (bits((uint64_t)op, 29, 0) << 22) |
7639Sgblack@eecs.umich.edu                            (0 << 0), (double)0.0);
7639Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu        uint64_t estimate = fpToBits(recipSqrtEstimate(dpOp));
7639Sgblack@eecs.umich.edu        return (1 << 31) | bits(estimate, 51, 21);
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu// This function implements a magic formula taken from the architecture
7639Sgblack@eecs.umich.edu// reference manual. It was originally called recip_estimate.
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edustatic double
7639Sgblack@eecs.umich.edurecipEstimate(double a)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    int64_t q, s;
7639Sgblack@eecs.umich.edu    double r;
7639Sgblack@eecs.umich.edu    q = (int64_t)(a * 512.0);
7639Sgblack@eecs.umich.edu    r = 1.0 / (((double)q + 0.5) / 512.0);
7639Sgblack@eecs.umich.edu    s = (int64_t)(256.0 * r + 0.5);
7639Sgblack@eecs.umich.edu    return (double)s / 256.0;
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu// This function is only intended for use in Neon instructions because
7639Sgblack@eecs.umich.edu// it ignores certain bits in the FPSCR.
7639Sgblack@eecs.umich.edufloat
7639Sgblack@eecs.umich.edufpRecipEstimate(FPSCR &fpscr, float op)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    const uint32_t qnan = 0x7fc00000;
7639Sgblack@eecs.umich.edu    float junk = 0.0;
7639Sgblack@eecs.umich.edu    int fpClass = std::fpclassify(op);
7639Sgblack@eecs.umich.edu    if (fpClass == FP_NAN) {
7639Sgblack@eecs.umich.edu        if ((fpToBits(op) & qnan) != qnan)
7639Sgblack@eecs.umich.edu            fpscr.ioc = 1;
7639Sgblack@eecs.umich.edu        return bitsToFp(qnan, junk);
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_INFINITE) {
7639Sgblack@eecs.umich.edu        return bitsToFp(std::signbit(op) << 31, junk);
7639Sgblack@eecs.umich.edu    } else if (fpClass == FP_ZERO) {
7639Sgblack@eecs.umich.edu        fpscr.dzc = 1;
7639Sgblack@eecs.umich.edu        // Return infinity with the same sign as the operand.
7639Sgblack@eecs.umich.edu        return bitsToFp((std::signbit(op) << 31) |
7639Sgblack@eecs.umich.edu                       (0xFF << 23) | (0 << 0), junk);
7639Sgblack@eecs.umich.edu    } else if (fabs(op) >= pow(2.0, 126)) {
7639Sgblack@eecs.umich.edu        fpscr.ufc = 1;
7639Sgblack@eecs.umich.edu        return bitsToFp(std::signbit(op) << 31, junk);
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        uint64_t opBits = fpToBits(op);
7639Sgblack@eecs.umich.edu        double scaled;
7639Sgblack@eecs.umich.edu        scaled = bitsToFp((0 << 0) | (bits(opBits, 22, 0) << 29) |
7639Sgblack@eecs.umich.edu                          (ULL(0x3fe) << 52) | (ULL(0) << 63),
7639Sgblack@eecs.umich.edu                          (double)0.0);
7639Sgblack@eecs.umich.edu        uint64_t resultExp = 253 - bits(opBits, 30, 23);
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu        uint64_t estimate = fpToBits(recipEstimate(scaled));
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edu        return bitsToFp((bits(opBits, 31) << 31) |
7639Sgblack@eecs.umich.edu                        (bits(resultExp, 7, 0) << 23) |
7639Sgblack@eecs.umich.edu                        (bits(estimate, 51, 29) << 0), junk);
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.eduuint32_t
7639Sgblack@eecs.umich.eduunsignedRecipEstimate(uint32_t op)
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    if (bits(op, 31) == 0) {
7639Sgblack@eecs.umich.edu        return -1;
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        double dpOp;
7639Sgblack@eecs.umich.edu        dpOp = bitsToFp((ULL(0) << 63) |
7639Sgblack@eecs.umich.edu                        (ULL(0x3fe) << 52) |
7639Sgblack@eecs.umich.edu                        (bits((uint64_t)op, 30, 0) << 21) |
7639Sgblack@eecs.umich.edu                        (0 << 0), (double)0.0);
7639Sgblack@eecs.umich.edu        uint64_t estimate = fpToBits(recipEstimate(dpOp));
7639Sgblack@eecs.umich.edu        return (1 << 31) | bits(estimate, 51, 21);
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edutemplate <class fpType>
7639Sgblack@eecs.umich.edufpType
7639Sgblack@eecs.umich.eduFpOp::processNans(FPSCR &fpscr, bool &done, bool defaultNan,
7639Sgblack@eecs.umich.edu                  fpType op1, fpType op2) const
7639Sgblack@eecs.umich.edu{
7639Sgblack@eecs.umich.edu    done = true;
7639Sgblack@eecs.umich.edu    fpType junk = 0.0;
7639Sgblack@eecs.umich.edu    fpType dest = 0.0;
7639Sgblack@eecs.umich.edu    const bool single = (sizeof(fpType) == sizeof(float));
7639Sgblack@eecs.umich.edu    const uint64_t qnan =
7639Sgblack@eecs.umich.edu        single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7639Sgblack@eecs.umich.edu    const bool nan1 = std::isnan(op1);
7639Sgblack@eecs.umich.edu    const bool nan2 = std::isnan(op2);
7639Sgblack@eecs.umich.edu    const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
7639Sgblack@eecs.umich.edu    const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
7639Sgblack@eecs.umich.edu    if (nan1 || nan2) {
7639Sgblack@eecs.umich.edu        if (defaultNan) {
7639Sgblack@eecs.umich.edu            dest = bitsToFp(qnan, junk);
7639Sgblack@eecs.umich.edu        }  else if (signal1) {
7639Sgblack@eecs.umich.edu            dest = bitsToFp(fpToBits(op1) | qnan, junk);
7639Sgblack@eecs.umich.edu        } else if (signal2) {
7639Sgblack@eecs.umich.edu            dest = bitsToFp(fpToBits(op2) | qnan, junk);
7639Sgblack@eecs.umich.edu        } else if (nan1) {
7639Sgblack@eecs.umich.edu            dest = op1;
7639Sgblack@eecs.umich.edu        } else if (nan2) {
7639Sgblack@eecs.umich.edu            dest = op2;
7639Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu        if (signal1 || signal2) {
7639Sgblack@eecs.umich.edu            fpscr.ioc = 1;
7639Sgblack@eecs.umich.edu        }
7639Sgblack@eecs.umich.edu    } else {
7639Sgblack@eecs.umich.edu        done = false;
7639Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    return dest;
7639Sgblack@eecs.umich.edu}
7639Sgblack@eecs.umich.edu
7639Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edufloat FpOp::processNans(FPSCR &fpscr, bool &done, bool defaultNan,
7639Sgblack@eecs.umich.edu                        float op1, float op2) const;
7639Sgblack@eecs.umich.edutemplate
7639Sgblack@eecs.umich.edudouble FpOp::processNans(FPSCR &fpscr, bool &done, bool defaultNan,
7639Sgblack@eecs.umich.edu                         double op1, double op2) const;
7639Sgblack@eecs.umich.edu
10037SARM gem5 Developers// @TODO remove this function when we've finished switching all FMA code to use the new FPLIB
10037SARM gem5 Developerstemplate <class fpType>
10037SARM gem5 DevelopersfpType
10037SARM gem5 DevelopersFpOp::ternaryOp(FPSCR &fpscr, fpType op1, fpType op2, fpType op3,
10037SARM gem5 Developers                fpType (*func)(fpType, fpType, fpType),
10037SARM gem5 Developers                bool flush, bool defaultNan, uint32_t rMode) const
10037SARM gem5 Developers{
10037SARM gem5 Developers    const bool single = (sizeof(fpType) == sizeof(float));
10037SARM gem5 Developers    fpType junk = 0.0;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (flush && (flushToZero(op1, op2) || flushToZero(op3)))
10037SARM gem5 Developers        fpscr.idc = 1;
10037SARM gem5 Developers    VfpSavedState state = prepFpState(rMode);
10037SARM gem5 Developers    __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2), "=m" (op3), "=m" (state)
10037SARM gem5 Developers                             :  "m" (op1),  "m" (op2),  "m" (op3),  "m" (state));
10037SARM gem5 Developers    fpType dest = func(op1, op2, op3);
10037SARM gem5 Developers    __asm__ __volatile__ ("" : "=m" (dest) : "m" (dest));
10037SARM gem5 Developers
10037SARM gem5 Developers    int fpClass = std::fpclassify(dest);
10037SARM gem5 Developers    // Get NAN behavior right. This varies between x86 and ARM.
10037SARM gem5 Developers    if (fpClass == FP_NAN) {
10037SARM gem5 Developers        const uint64_t qnan =
10037SARM gem5 Developers            single ? 0x7fc00000 : ULL(0x7ff8000000000000);
10037SARM gem5 Developers        const bool nan1 = std::isnan(op1);
10037SARM gem5 Developers        const bool nan2 = std::isnan(op2);
10037SARM gem5 Developers        const bool nan3 = std::isnan(op3);
10037SARM gem5 Developers        const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
10037SARM gem5 Developers        const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
10037SARM gem5 Developers        const bool signal3 = nan3 && ((fpToBits(op3) & qnan) != qnan);
10037SARM gem5 Developers        if ((!nan1 && !nan2 && !nan3) || (defaultNan == 1)) {
10037SARM gem5 Developers            dest = bitsToFp(qnan, junk);
10037SARM gem5 Developers        } else if (signal1) {
10037SARM gem5 Developers            dest = bitsToFp(fpToBits(op1) | qnan, junk);
10037SARM gem5 Developers        } else if (signal2) {
10037SARM gem5 Developers            dest = bitsToFp(fpToBits(op2) | qnan, junk);
10037SARM gem5 Developers        } else if (signal3) {
10037SARM gem5 Developers            dest = bitsToFp(fpToBits(op3) | qnan, junk);
10037SARM gem5 Developers        } else if (nan1) {
10037SARM gem5 Developers            dest = op1;
10037SARM gem5 Developers        } else if (nan2) {
10037SARM gem5 Developers            dest = op2;
10037SARM gem5 Developers        } else if (nan3) {
10037SARM gem5 Developers            dest = op3;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    } else if (flush && flushToZero(dest)) {
10037SARM gem5 Developers        feraiseexcept(FeUnderflow);
10037SARM gem5 Developers    } else if ((
10037SARM gem5 Developers                (single && (dest == bitsToFp(0x00800000, junk) ||
10037SARM gem5 Developers                     dest == bitsToFp(0x80800000, junk))) ||
10037SARM gem5 Developers                (!single &&
10037SARM gem5 Developers                    (dest == bitsToFp(ULL(0x0010000000000000), junk) ||
10037SARM gem5 Developers                     dest == bitsToFp(ULL(0x8010000000000000), junk)))
10037SARM gem5 Developers               ) && rMode != VfpRoundZero) {
10037SARM gem5 Developers        /*
10037SARM gem5 Developers         * Correct for the fact that underflow is detected -before- rounding
10037SARM gem5 Developers         * in ARM and -after- rounding in x86.
10037SARM gem5 Developers         */
10037SARM gem5 Developers        fesetround(FeRoundZero);
10037SARM gem5 Developers        __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2), "=m" (op3)
10037SARM gem5 Developers                                 :  "m" (op1),  "m" (op2),  "m" (op3));
10037SARM gem5 Developers        fpType temp = func(op1, op2, op2);
10037SARM gem5 Developers        __asm__ __volatile__ ("" : "=m" (temp) : "m" (temp));
10037SARM gem5 Developers        if (flush && flushToZero(temp)) {
10037SARM gem5 Developers            dest = temp;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers    finishVfp(fpscr, state, flush);
10037SARM gem5 Developers    return dest;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate
10037SARM gem5 Developersfloat FpOp::ternaryOp(FPSCR &fpscr, float op1, float op2, float op3,
10037SARM gem5 Developers                      float (*func)(float, float, float),
10037SARM gem5 Developers                      bool flush, bool defaultNan, uint32_t rMode) const;
10037SARM gem5 Developerstemplate
10037SARM gem5 Developersdouble FpOp::ternaryOp(FPSCR &fpscr, double op1, double op2, double op3,
10037SARM gem5 Developers                       double (*func)(double, double, double),
10037SARM gem5 Developers                       bool flush, bool defaultNan, uint32_t rMode) const;
10037SARM gem5 Developers
7430Sgblack@eecs.umich.edutemplate <class fpType>
7430Sgblack@eecs.umich.edufpType
7430Sgblack@eecs.umich.eduFpOp::binaryOp(FPSCR &fpscr, fpType op1, fpType op2,
7430Sgblack@eecs.umich.edu               fpType (*func)(fpType, fpType),
7639Sgblack@eecs.umich.edu               bool flush, bool defaultNan, uint32_t rMode) const
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    const bool single = (sizeof(fpType) == sizeof(float));
7430Sgblack@eecs.umich.edu    fpType junk = 0.0;
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu    if (flush && flushToZero(op1, op2))
7430Sgblack@eecs.umich.edu        fpscr.idc = 1;
7430Sgblack@eecs.umich.edu    VfpSavedState state = prepFpState(rMode);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2), "=m" (state)
7430Sgblack@eecs.umich.edu                             : "m" (op1), "m" (op2), "m" (state));
7430Sgblack@eecs.umich.edu    fpType dest = func(op1, op2);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__ ("" : "=m" (dest) : "m" (dest));
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu    // Get NAN behavior right. This varies between x86 and ARM.
9515SAli.Saidi@ARM.com    if (std::isnan(dest)) {
7430Sgblack@eecs.umich.edu        const uint64_t qnan =
7430Sgblack@eecs.umich.edu            single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7430Sgblack@eecs.umich.edu        const bool nan1 = std::isnan(op1);
7430Sgblack@eecs.umich.edu        const bool nan2 = std::isnan(op2);
7430Sgblack@eecs.umich.edu        const bool signal1 = nan1 && ((fpToBits(op1) & qnan) != qnan);
7430Sgblack@eecs.umich.edu        const bool signal2 = nan2 && ((fpToBits(op2) & qnan) != qnan);
7639Sgblack@eecs.umich.edu        if ((!nan1 && !nan2) || (defaultNan == 1)) {
7430Sgblack@eecs.umich.edu            dest = bitsToFp(qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (signal1) {
7430Sgblack@eecs.umich.edu            dest = bitsToFp(fpToBits(op1) | qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (signal2) {
7430Sgblack@eecs.umich.edu            dest = bitsToFp(fpToBits(op2) | qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (nan1) {
7430Sgblack@eecs.umich.edu            dest = op1;
7430Sgblack@eecs.umich.edu        } else if (nan2) {
7430Sgblack@eecs.umich.edu            dest = op2;
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    } else if (flush && flushToZero(dest)) {
7430Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu    } else if ((
7430Sgblack@eecs.umich.edu                (single && (dest == bitsToFp(0x00800000, junk) ||
7430Sgblack@eecs.umich.edu                     dest == bitsToFp(0x80800000, junk))) ||
7430Sgblack@eecs.umich.edu                (!single &&
7430Sgblack@eecs.umich.edu                    (dest == bitsToFp(ULL(0x0010000000000000), junk) ||
7430Sgblack@eecs.umich.edu                     dest == bitsToFp(ULL(0x8010000000000000), junk)))
7430Sgblack@eecs.umich.edu               ) && rMode != VfpRoundZero) {
7430Sgblack@eecs.umich.edu        /*
7430Sgblack@eecs.umich.edu         * Correct for the fact that underflow is detected -before- rounding
7430Sgblack@eecs.umich.edu         * in ARM and -after- rounding in x86.
7430Sgblack@eecs.umich.edu         */
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (op1), "=m" (op2)
7430Sgblack@eecs.umich.edu                                 : "m" (op1), "m" (op2));
7430Sgblack@eecs.umich.edu        fpType temp = func(op1, op2);
7430Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (temp) : "m" (temp));
7430Sgblack@eecs.umich.edu        if (flush && flushToZero(temp)) {
7430Sgblack@eecs.umich.edu            dest = temp;
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    finishVfp(fpscr, state, flush);
7430Sgblack@eecs.umich.edu    return dest;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate
7430Sgblack@eecs.umich.edufloat FpOp::binaryOp(FPSCR &fpscr, float op1, float op2,
7430Sgblack@eecs.umich.edu                     float (*func)(float, float),
7639Sgblack@eecs.umich.edu                     bool flush, bool defaultNan, uint32_t rMode) const;
7430Sgblack@eecs.umich.edutemplate
7430Sgblack@eecs.umich.edudouble FpOp::binaryOp(FPSCR &fpscr, double op1, double op2,
7430Sgblack@eecs.umich.edu                      double (*func)(double, double),
7639Sgblack@eecs.umich.edu                      bool flush, bool defaultNan, uint32_t rMode) const;
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate <class fpType>
7430Sgblack@eecs.umich.edufpType
7430Sgblack@eecs.umich.eduFpOp::unaryOp(FPSCR &fpscr, fpType op1, fpType (*func)(fpType),
7430Sgblack@eecs.umich.edu              bool flush, uint32_t rMode) const
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    const bool single = (sizeof(fpType) == sizeof(float));
7430Sgblack@eecs.umich.edu    fpType junk = 0.0;
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu    if (flush && flushToZero(op1))
7430Sgblack@eecs.umich.edu        fpscr.idc = 1;
7430Sgblack@eecs.umich.edu    VfpSavedState state = prepFpState(rMode);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__ ("" : "=m" (op1), "=m" (state)
7430Sgblack@eecs.umich.edu                             : "m" (op1), "m" (state));
7430Sgblack@eecs.umich.edu    fpType dest = func(op1);
7430Sgblack@eecs.umich.edu    __asm__ __volatile__ ("" : "=m" (dest) : "m" (dest));
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu    // Get NAN behavior right. This varies between x86 and ARM.
9515SAli.Saidi@ARM.com    if (std::isnan(dest)) {
7430Sgblack@eecs.umich.edu        const uint64_t qnan =
7430Sgblack@eecs.umich.edu            single ? 0x7fc00000 : ULL(0x7ff8000000000000);
7430Sgblack@eecs.umich.edu        const bool nan = std::isnan(op1);
7430Sgblack@eecs.umich.edu        if (!nan || fpscr.dn == 1) {
7430Sgblack@eecs.umich.edu            dest = bitsToFp(qnan, junk);
7430Sgblack@eecs.umich.edu        } else if (nan) {
7430Sgblack@eecs.umich.edu            dest = bitsToFp(fpToBits(op1) | qnan, junk);
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    } else if (flush && flushToZero(dest)) {
7430Sgblack@eecs.umich.edu        feraiseexcept(FeUnderflow);
7430Sgblack@eecs.umich.edu    } else if ((
7430Sgblack@eecs.umich.edu                (single && (dest == bitsToFp(0x00800000, junk) ||
7430Sgblack@eecs.umich.edu                     dest == bitsToFp(0x80800000, junk))) ||
7430Sgblack@eecs.umich.edu                (!single &&
7430Sgblack@eecs.umich.edu                    (dest == bitsToFp(ULL(0x0010000000000000), junk) ||
7430Sgblack@eecs.umich.edu                     dest == bitsToFp(ULL(0x8010000000000000), junk)))
7430Sgblack@eecs.umich.edu               ) && rMode != VfpRoundZero) {
7430Sgblack@eecs.umich.edu        /*
7430Sgblack@eecs.umich.edu         * Correct for the fact that underflow is detected -before- rounding
7430Sgblack@eecs.umich.edu         * in ARM and -after- rounding in x86.
7430Sgblack@eecs.umich.edu         */
7430Sgblack@eecs.umich.edu        fesetround(FeRoundZero);
7430Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (op1) : "m" (op1));
7430Sgblack@eecs.umich.edu        fpType temp = func(op1);
7430Sgblack@eecs.umich.edu        __asm__ __volatile__ ("" : "=m" (temp) : "m" (temp));
7430Sgblack@eecs.umich.edu        if (flush && flushToZero(temp)) {
7430Sgblack@eecs.umich.edu            dest = temp;
7430Sgblack@eecs.umich.edu        }
7430Sgblack@eecs.umich.edu    }
7639Sgblack@eecs.umich.edu    finishVfp(fpscr, state, flush);
7430Sgblack@eecs.umich.edu    return dest;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edutemplate
7430Sgblack@eecs.umich.edufloat FpOp::unaryOp(FPSCR &fpscr, float op1, float (*func)(float),
7430Sgblack@eecs.umich.edu                    bool flush, uint32_t rMode) const;
7430Sgblack@eecs.umich.edutemplate
7430Sgblack@eecs.umich.edudouble FpOp::unaryOp(FPSCR &fpscr, double op1, double (*func)(double),
7430Sgblack@eecs.umich.edu                     bool flush, uint32_t rMode) const;
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduIntRegIndex
7430Sgblack@eecs.umich.eduVfpMacroOp::addStride(IntRegIndex idx, unsigned stride)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    if (wide) {
7430Sgblack@eecs.umich.edu        stride *= 2;
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu    unsigned offset = idx % 8;
7430Sgblack@eecs.umich.edu    idx = (IntRegIndex)(idx - offset);
7430Sgblack@eecs.umich.edu    offset += stride;
7430Sgblack@eecs.umich.edu    idx = (IntRegIndex)(idx + (offset % 8));
7430Sgblack@eecs.umich.edu    return idx;
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduvoid
7430Sgblack@eecs.umich.eduVfpMacroOp::nextIdxs(IntRegIndex &dest, IntRegIndex &op1, IntRegIndex &op2)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7430Sgblack@eecs.umich.edu    assert(!inScalarBank(dest));
7430Sgblack@eecs.umich.edu    dest = addStride(dest, stride);
7430Sgblack@eecs.umich.edu    op1 = addStride(op1, stride);
7430Sgblack@eecs.umich.edu    if (!inScalarBank(op2)) {
7430Sgblack@eecs.umich.edu        op2 = addStride(op2, stride);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduvoid
7430Sgblack@eecs.umich.eduVfpMacroOp::nextIdxs(IntRegIndex &dest, IntRegIndex &op1)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7430Sgblack@eecs.umich.edu    assert(!inScalarBank(dest));
7430Sgblack@eecs.umich.edu    dest = addStride(dest, stride);
7430Sgblack@eecs.umich.edu    if (!inScalarBank(op1)) {
7430Sgblack@eecs.umich.edu        op1 = addStride(op1, stride);
7430Sgblack@eecs.umich.edu    }
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.eduvoid
7430Sgblack@eecs.umich.eduVfpMacroOp::nextIdxs(IntRegIndex &dest)
7430Sgblack@eecs.umich.edu{
7430Sgblack@eecs.umich.edu    unsigned stride = (machInst.fpscrStride == 0) ? 1 : 2;
7430Sgblack@eecs.umich.edu    assert(!inScalarBank(dest));
7430Sgblack@eecs.umich.edu    dest = addStride(dest, stride);
7430Sgblack@eecs.umich.edu}
7430Sgblack@eecs.umich.edu
7430Sgblack@eecs.umich.edu}