arm/insts/fplib.cc

10037SARM gem5 Developers/*
13118SEdmund.Grimley-Evans@arm.com* Copyright (c) 2012-2013, 2017-2018 ARM Limited
10037SARM gem5 Developers* All rights reserved
10037SARM gem5 Developers*
10037SARM gem5 Developers* The license below extends only to copyright in the software and shall
10037SARM gem5 Developers* not be construed as granting a license to any other intellectual
10037SARM gem5 Developers* property including but not limited to intellectual property relating
10037SARM gem5 Developers* to a hardware implementation of the functionality of the software
10037SARM gem5 Developers* licensed hereunder.  You may use the software subject to the license
10037SARM gem5 Developers* terms below provided that you ensure that this notice is replicated
10037SARM gem5 Developers* unmodified and in its entirety in all distributions of the software,
10037SARM gem5 Developers* modified or unmodified, in source code or in binary form.
10037SARM gem5 Developers*
10037SARM gem5 Developers* Redistribution and use in source and binary forms, with or without
10037SARM gem5 Developers* modification, are permitted provided that the following conditions are
10037SARM gem5 Developers* met: redistributions of source code must retain the above copyright
10037SARM gem5 Developers* notice, this list of conditions and the following disclaimer;
10037SARM gem5 Developers* redistributions in binary form must reproduce the above copyright
10037SARM gem5 Developers* notice, this list of conditions and the following disclaimer in the
10037SARM gem5 Developers* documentation and/or other materials provided with the distribution;
10037SARM gem5 Developers* neither the name of the copyright holders nor the names of its
10037SARM gem5 Developers* contributors may be used to endorse or promote products derived from
10037SARM gem5 Developers* this software without specific prior written permission.
10037SARM gem5 Developers*
10037SARM gem5 Developers* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
10037SARM gem5 Developers* "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
10037SARM gem5 Developers* LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
10037SARM gem5 Developers* A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
10037SARM gem5 Developers* OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
10037SARM gem5 Developers* SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
10037SARM gem5 Developers* LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
10037SARM gem5 Developers* DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
10037SARM gem5 Developers* THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
10037SARM gem5 Developers* (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
10037SARM gem5 Developers* OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
10037SARM gem5 Developers*
10037SARM gem5 Developers* Authors: Edmund Grimley Evans
10037SARM gem5 Developers*          Thomas Grocutt
10037SARM gem5 Developers*/
10037SARM gem5 Developers
10037SARM gem5 Developers#include <stdint.h>
10037SARM gem5 Developers
10037SARM gem5 Developers#include <cassert>
10037SARM gem5 Developers
13449Sgabeblack@google.com#include "base/logging.hh"
10037SARM gem5 Developers#include "fplib.hh"
10037SARM gem5 Developers
10037SARM gem5 Developersnamespace ArmISA
10037SARM gem5 Developers{
10037SARM gem5 Developers
10037SARM gem5 Developers#define FPLIB_RN 0
10037SARM gem5 Developers#define FPLIB_RP 1
10037SARM gem5 Developers#define FPLIB_RM 2
10037SARM gem5 Developers#define FPLIB_RZ 3
10037SARM gem5 Developers#define FPLIB_FZ 4
10037SARM gem5 Developers#define FPLIB_DN 8
10037SARM gem5 Developers#define FPLIB_AHP 16
13118SEdmund.Grimley-Evans@arm.com#define FPLIB_FZ16 32
10037SARM gem5 Developers
10037SARM gem5 Developers#define FPLIB_IDC 128 // Input Denormal
10037SARM gem5 Developers#define FPLIB_IXC 16  // Inexact
10037SARM gem5 Developers#define FPLIB_UFC 8   // Underflow
10037SARM gem5 Developers#define FPLIB_OFC 4   // Overflow
10037SARM gem5 Developers#define FPLIB_DZC 2   // Division by Zero
10037SARM gem5 Developers#define FPLIB_IOC 1   // Invalid Operation
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com#define FP16_BITS 16
13118SEdmund.Grimley-Evans@arm.com#define FP32_BITS 32
13118SEdmund.Grimley-Evans@arm.com#define FP64_BITS 64
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_EXP_BITS 5
13118SEdmund.Grimley-Evans@arm.com#define FP32_EXP_BITS 8
13118SEdmund.Grimley-Evans@arm.com#define FP64_EXP_BITS 11
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_EXP_BIAS 15
13118SEdmund.Grimley-Evans@arm.com#define FP32_EXP_BIAS 127
13118SEdmund.Grimley-Evans@arm.com#define FP64_EXP_BIAS 1023
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_EXP_INF ((1ULL << FP16_EXP_BITS) - 1)
13118SEdmund.Grimley-Evans@arm.com#define FP32_EXP_INF ((1ULL << FP32_EXP_BITS) - 1)
13118SEdmund.Grimley-Evans@arm.com#define FP64_EXP_INF ((1ULL << FP64_EXP_BITS) - 1)
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_MANT_BITS (FP16_BITS - FP16_EXP_BITS - 1)
13118SEdmund.Grimley-Evans@arm.com#define FP32_MANT_BITS (FP32_BITS - FP32_EXP_BITS - 1)
13118SEdmund.Grimley-Evans@arm.com#define FP64_MANT_BITS (FP64_BITS - FP64_EXP_BITS - 1)
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_EXP(x) ((x) >> FP16_MANT_BITS & ((1ULL << FP16_EXP_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com#define FP32_EXP(x) ((x) >> FP32_MANT_BITS & ((1ULL << FP32_EXP_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com#define FP64_EXP(x) ((x) >> FP64_MANT_BITS & ((1ULL << FP64_EXP_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com#define FP16_MANT(x) ((x) & ((1ULL << FP16_MANT_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com#define FP32_MANT(x) ((x) & ((1ULL << FP32_MANT_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com#define FP64_MANT(x) ((x) & ((1ULL << FP64_MANT_BITS) - 1))
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developerslsl16(uint16_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 16 ? x << shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developerslsr16(uint16_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 16 ? x >> shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developerslsl32(uint32_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 32 ? x << shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developerslsr32(uint32_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 32 ? x >> shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developerslsl64(uint64_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 64 ? x << shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developerslsr64(uint64_t x, uint32_t shift)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return shift < 64 ? x >> shift : 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developerslsl128(uint64_t *r0, uint64_t *r1, uint64_t x0, uint64_t x1, uint32_t shift)
10037SARM gem5 Developers{
11224Snathananel.premillieu@arm.com    if (shift == 0) {
11224Snathananel.premillieu@arm.com        *r1 = x1;
11224Snathananel.premillieu@arm.com        *r0 = x0;
11224Snathananel.premillieu@arm.com    } else if (shift < 64) {
10037SARM gem5 Developers        *r1 = x1 << shift | x0 >> (64 - shift);
10037SARM gem5 Developers        *r0 = x0 << shift;
10037SARM gem5 Developers    } else if (shift < 128) {
10037SARM gem5 Developers        *r1 = x0 << (shift - 64);
10037SARM gem5 Developers        *r0 = 0;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        *r1 = 0;
10037SARM gem5 Developers        *r0 = 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developerslsr128(uint64_t *r0, uint64_t *r1, uint64_t x0, uint64_t x1, uint32_t shift)
10037SARM gem5 Developers{
11224Snathananel.premillieu@arm.com    if (shift == 0) {
11224Snathananel.premillieu@arm.com        *r1 = x1;
11224Snathananel.premillieu@arm.com        *r0 = x0;
11224Snathananel.premillieu@arm.com    } else if (shift < 64) {
10037SARM gem5 Developers        *r0 = x0 >> shift | x1 << (64 - shift);
10037SARM gem5 Developers        *r1 = x1 >> shift;
10037SARM gem5 Developers    } else if (shift < 128) {
10037SARM gem5 Developers        *r0 = x1 >> (shift - 64);
10037SARM gem5 Developers        *r1 = 0;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        *r0 = 0;
10037SARM gem5 Developers        *r1 = 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersmul62x62(uint64_t *x0, uint64_t *x1, uint64_t a, uint64_t b)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint32_t mask = ((uint32_t)1 << 31) - 1;
10037SARM gem5 Developers    uint64_t a0 = a & mask;
10037SARM gem5 Developers    uint64_t a1 = a >> 31 & mask;
10037SARM gem5 Developers    uint64_t b0 = b & mask;
10037SARM gem5 Developers    uint64_t b1 = b >> 31 & mask;
10037SARM gem5 Developers    uint64_t p0 = a0 * b0;
10037SARM gem5 Developers    uint64_t p2 = a1 * b1;
10037SARM gem5 Developers    uint64_t p1 = (a0 + a1) * (b0 + b1) - p0 - p2;
10037SARM gem5 Developers    uint64_t s0 = p0;
10037SARM gem5 Developers    uint64_t s1 = (s0 >> 31) + p1;
10037SARM gem5 Developers    uint64_t s2 = (s1 >> 31) + p2;
10037SARM gem5 Developers    *x0 = (s0 & mask) | (s1 & mask) << 31 | s2 << 62;
10037SARM gem5 Developers    *x1 = s2 >> 2;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline
10037SARM gem5 Developersvoid mul64x32(uint64_t *x0, uint64_t *x1, uint64_t a, uint32_t b)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint64_t t0 = (uint64_t)(uint32_t)a * b;
10037SARM gem5 Developers    uint64_t t1 = (t0 >> 32) + (a >> 32) * b;
10037SARM gem5 Developers    *x0 = t1 << 32 | (uint32_t)t0;
10037SARM gem5 Developers    *x1 = t1 >> 32;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersadd128(uint64_t *x0, uint64_t *x1, uint64_t a0, uint64_t a1, uint64_t b0,
10037SARM gem5 Developers       uint64_t b1)
10037SARM gem5 Developers{
10037SARM gem5 Developers    *x0 = a0 + b0;
10037SARM gem5 Developers    *x1 = a1 + b1 + (*x0 < a0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developerssub128(uint64_t *x0, uint64_t *x1, uint64_t a0, uint64_t a1, uint64_t b0,
10037SARM gem5 Developers       uint64_t b1)
10037SARM gem5 Developers{
10037SARM gem5 Developers    *x0 = a0 - b0;
10037SARM gem5 Developers    *x1 = a1 - b1 - (*x0 > a0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline int
10037SARM gem5 Developerscmp128(uint64_t a0, uint64_t a1, uint64_t b0, uint64_t b1)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return (a1 < b1 ? -1 : a1 > b1 ? 1 : a0 < b0 ? -1 : a0 > b0 ? 1 : 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_normalise(uint16_t mnt, int *exp)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int shift;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!mnt) {
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    for (shift = 8; shift; shift >>= 1) {
10037SARM gem5 Developers        if (!(mnt >> (16 - shift))) {
10037SARM gem5 Developers            mnt <<= shift;
10037SARM gem5 Developers            *exp -= shift;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return mnt;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_normalise(uint32_t mnt, int *exp)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int shift;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!mnt) {
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    for (shift = 16; shift; shift >>= 1) {
10037SARM gem5 Developers        if (!(mnt >> (32 - shift))) {
10037SARM gem5 Developers            mnt <<= shift;
10037SARM gem5 Developers            *exp -= shift;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return mnt;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_normalise(uint64_t mnt, int *exp)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int shift;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!mnt) {
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    for (shift = 32; shift; shift >>= 1) {
10037SARM gem5 Developers        if (!(mnt >> (64 - shift))) {
10037SARM gem5 Developers            mnt <<= shift;
10037SARM gem5 Developers            *exp -= shift;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return mnt;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersfp128_normalise(uint64_t *mnt0, uint64_t *mnt1, int *exp)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint64_t x0 = *mnt0;
10037SARM gem5 Developers    uint64_t x1 = *mnt1;
10037SARM gem5 Developers    int shift;
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x0 && !x1) {
10037SARM gem5 Developers        return;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x1) {
10037SARM gem5 Developers        x1 = x0;
10037SARM gem5 Developers        x0 = 0;
10037SARM gem5 Developers        *exp -= 64;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    for (shift = 32; shift; shift >>= 1) {
10037SARM gem5 Developers        if (!(x1 >> (64 - shift))) {
10037SARM gem5 Developers            x1 = x1 << shift | x0 >> (64 - shift);
10037SARM gem5 Developers            x0 <<= shift;
10037SARM gem5 Developers            *exp -= shift;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    *mnt0 = x0;
10037SARM gem5 Developers    *mnt1 = x1;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_pack(uint16_t sgn, uint16_t exp, uint16_t mnt)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return sgn << (FP16_BITS - 1) | exp << FP16_MANT_BITS | FP16_MANT(mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_pack(uint32_t sgn, uint32_t exp, uint32_t mnt)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return sgn << (FP32_BITS - 1) | exp << FP32_MANT_BITS | FP32_MANT(mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_pack(uint64_t sgn, uint64_t exp, uint64_t mnt)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return sgn << (FP64_BITS - 1) | exp << FP64_MANT_BITS | FP64_MANT(mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_zero(int sgn)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return fp16_pack(sgn, 0, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_zero(int sgn)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return fp32_pack(sgn, 0, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_zero(int sgn)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return fp64_pack(sgn, 0, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_max_normal(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, FP16_EXP_INF - 1, -1);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_max_normal(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, FP32_EXP_INF - 1, -1);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_max_normal(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, FP64_EXP_INF - 1, -1);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_infinity(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, FP16_EXP_INF, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_infinity(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, FP32_EXP_INF, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_infinity(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, FP64_EXP_INF, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint16_t
10037SARM gem5 Developersfp16_defaultNaN()
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(0, FP16_EXP_INF, 1ULL << (FP16_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_defaultNaN()
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(0, FP32_EXP_INF, 1ULL << (FP32_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_defaultNaN()
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(0, FP64_EXP_INF, 1ULL << (FP64_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersfp16_unpack(int *sgn, int *exp, uint16_t *mnt, uint16_t x, int mode,
10037SARM gem5 Developers            int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    *sgn = x >> (FP16_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    *exp = FP16_EXP(x);
13118SEdmund.Grimley-Evans@arm.com    *mnt = FP16_MANT(x);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle subnormals:
10037SARM gem5 Developers    if (*exp) {
13118SEdmund.Grimley-Evans@arm.com        *mnt |= 1ULL << FP16_MANT_BITS;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        ++*exp;
13118SEdmund.Grimley-Evans@arm.com        // IDC (Input Denormal) is not set in this case.
13118SEdmund.Grimley-Evans@arm.com        if (mode & FPLIB_FZ16)
13118SEdmund.Grimley-Evans@arm.com            *mnt = 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersfp32_unpack(int *sgn, int *exp, uint32_t *mnt, uint32_t x, int mode,
10037SARM gem5 Developers            int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    *sgn = x >> (FP32_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    *exp = FP32_EXP(x);
13118SEdmund.Grimley-Evans@arm.com    *mnt = FP32_MANT(x);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle subnormals:
10037SARM gem5 Developers    if (*exp) {
13118SEdmund.Grimley-Evans@arm.com        *mnt |= 1ULL << FP32_MANT_BITS;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        ++*exp;
10037SARM gem5 Developers        if ((mode & FPLIB_FZ) && *mnt) {
10037SARM gem5 Developers            *flags |= FPLIB_IDC;
10037SARM gem5 Developers            *mnt = 0;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline void
10037SARM gem5 Developersfp64_unpack(int *sgn, int *exp, uint64_t *mnt, uint64_t x, int mode,
10037SARM gem5 Developers            int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    *sgn = x >> (FP64_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    *exp = FP64_EXP(x);
13118SEdmund.Grimley-Evans@arm.com    *mnt = FP64_MANT(x);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle subnormals:
10037SARM gem5 Developers    if (*exp) {
13118SEdmund.Grimley-Evans@arm.com        *mnt |= 1ULL << FP64_MANT_BITS;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        ++*exp;
10037SARM gem5 Developers        if ((mode & FPLIB_FZ) && *mnt) {
10037SARM gem5 Developers            *flags |= FPLIB_IDC;
10037SARM gem5 Developers            *mnt = 0;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp16_is_NaN(int exp, uint16_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP16_EXP_INF && FP16_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp32_is_NaN(int exp, uint32_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP32_EXP_INF && FP32_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp64_is_NaN(int exp, uint64_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP64_EXP_INF && FP64_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp16_is_signalling_NaN(int exp, uint16_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_is_NaN(exp, mnt) && !(mnt >> (FP16_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp32_is_signalling_NaN(int exp, uint32_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp32_is_NaN(exp, mnt) && !(mnt >> (FP32_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp64_is_signalling_NaN(int exp, uint64_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp64_is_NaN(exp, mnt) && !(mnt >> (FP64_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp16_is_quiet_NaN(int exp, uint16_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP16_EXP_INF && (mnt >> (FP16_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp32_is_quiet_NaN(int exp, uint32_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP32_EXP_INF && (mnt >> (FP32_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp64_is_quiet_NaN(int exp, uint64_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP64_EXP_INF && (mnt >> (FP64_MANT_BITS - 1) & 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp16_is_infinity(int exp, uint16_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP16_EXP_INF && !FP16_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp32_is_infinity(int exp, uint32_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP32_EXP_INF && !FP32_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline int
13118SEdmund.Grimley-Evans@arm.comfp64_is_infinity(int exp, uint64_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return exp == FP64_EXP_INF && !FP64_MANT(mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic inline uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_process_NaN(uint16_t a, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    if (!(a >> (FP16_MANT_BITS - 1) & 1)) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        a |= 1ULL << (FP16_MANT_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return mode & FPLIB_DN ? fp16_defaultNaN() : a;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic inline uint32_t
10037SARM gem5 Developersfp32_process_NaN(uint32_t a, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    if (!(a >> (FP32_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        a |= 1ULL << (FP32_MANT_BITS - 1);
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return mode & FPLIB_DN ? fp32_defaultNaN() : a;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic inline uint64_t
10037SARM gem5 Developersfp64_process_NaN(uint64_t a, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    if (!(a >> (FP64_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        a |= 1ULL << (FP64_MANT_BITS - 1);
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return mode & FPLIB_DN ? fp64_defaultNaN() : a;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_process_NaNs(uint16_t a, uint16_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP16_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt = FP16_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP16_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint16_t b_mnt = FP16_MANT(b);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_signalling_NaN(a_exp, a_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_process_NaNs(uint32_t a, uint32_t b, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP32_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt = FP32_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP32_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint32_t b_mnt = FP32_MANT(b);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_signalling_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_process_NaNs(uint64_t a, uint64_t b, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP64_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt = FP64_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP64_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint64_t b_mnt = FP64_MANT(b);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_signalling_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_process_NaNs3(uint16_t a, uint16_t b, uint16_t c, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP16_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt = FP16_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP16_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint16_t b_mnt = FP16_MANT(b);
13118SEdmund.Grimley-Evans@arm.com    int c_exp = FP16_EXP(c);
13118SEdmund.Grimley-Evans@arm.com    uint16_t c_mnt = FP16_MANT(c);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_signalling_NaN(a_exp, a_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_signalling_NaN(c_exp, c_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(c, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(c_exp, c_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(c, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_process_NaNs3(uint32_t a, uint32_t b, uint32_t c, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP32_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt = FP32_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP32_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint32_t b_mnt = FP32_MANT(b);
13118SEdmund.Grimley-Evans@arm.com    int c_exp = FP32_EXP(c);
13118SEdmund.Grimley-Evans@arm.com    uint32_t c_mnt = FP32_MANT(c);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_signalling_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_signalling_NaN(c_exp, c_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(c_exp, c_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_process_NaNs3(uint64_t a, uint64_t b, uint64_t c, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int a_exp = FP64_EXP(a);
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt = FP64_MANT(a);
13118SEdmund.Grimley-Evans@arm.com    int b_exp = FP64_EXP(b);
13118SEdmund.Grimley-Evans@arm.com    uint64_t b_mnt = FP64_MANT(b);
13118SEdmund.Grimley-Evans@arm.com    int c_exp = FP64_EXP(c);
13118SEdmund.Grimley-Evans@arm.com    uint64_t c_mnt = FP64_MANT(c);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle signalling NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_signalling_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_signalling_NaN(c_exp, c_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle quiet NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(b_exp, b_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(c_exp, c_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint16_t
10037SARM gem5 Developersfp16_round_(int sgn, int exp, uint16_t mnt, int rm, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int biased_exp; // non-negative exponent value for result
13118SEdmund.Grimley-Evans@arm.com    uint16_t int_mant; // mantissa for result, less than (2 << FP16_MANT_BITS)
10037SARM gem5 Developers    int error; // 0, 1, 2 or 3, where 2 means int_mant is wrong by exactly 0.5
10037SARM gem5 Developers
10037SARM gem5 Developers    assert(rm != FPRounding_TIEAWAY);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Flush to zero:
13118SEdmund.Grimley-Evans@arm.com    if ((mode & FPLIB_FZ16) && exp < 1) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_UFC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // The bottom FP16_EXP_BITS bits of mnt are orred together:
13118SEdmund.Grimley-Evans@arm.com    mnt = (4ULL << FP16_MANT_BITS | mnt >> (FP16_EXP_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com           ((mnt & ((1ULL << FP16_EXP_BITS) - 1)) != 0));
10037SARM gem5 Developers
10037SARM gem5 Developers    if (exp > 0) {
10037SARM gem5 Developers        biased_exp = exp;
10037SARM gem5 Developers        int_mant = mnt >> 2;
10037SARM gem5 Developers        error = mnt & 3;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        biased_exp = 0;
10037SARM gem5 Developers        int_mant = lsr16(mnt, 3 - exp);
10037SARM gem5 Developers        error = (lsr16(mnt, 1 - exp) & 3) | !!(mnt & (lsl16(1, 1 - exp) - 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!biased_exp && error) { // xx should also check fpscr_val<11>
10037SARM gem5 Developers        *flags |= FPLIB_UFC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Round up:
10037SARM gem5 Developers    if ((rm == FPLIB_RN && (error == 3 ||
10037SARM gem5 Developers                            (error == 2 && (int_mant & 1)))) ||
10037SARM gem5 Developers        (((rm == FPLIB_RP && !sgn) || (rm == FPLIB_RM && sgn)) && error)) {
10037SARM gem5 Developers        ++int_mant;
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 1ULL << FP16_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up from denormalized to normalized
10037SARM gem5 Developers            biased_exp = 1;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 2ULL << FP16_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up to next exponent
10037SARM gem5 Developers            ++biased_exp;
10037SARM gem5 Developers            int_mant >>= 1;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle rounding to odd aka Von Neumann rounding:
10037SARM gem5 Developers    if (error && rm == FPRounding_ODD)
10037SARM gem5 Developers        int_mant |= 1;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle overflow:
10037SARM gem5 Developers    if (!(mode & FPLIB_AHP)) {
13118SEdmund.Grimley-Evans@arm.com        if (biased_exp >= (int)FP16_EXP_INF) {
10037SARM gem5 Developers            *flags |= FPLIB_OFC | FPLIB_IXC;
10037SARM gem5 Developers            if (rm == FPLIB_RN || (rm == FPLIB_RP && !sgn) ||
10037SARM gem5 Developers                (rm == FPLIB_RM && sgn)) {
10037SARM gem5 Developers                return fp16_infinity(sgn);
10037SARM gem5 Developers            } else {
10037SARM gem5 Developers                return fp16_max_normal(sgn);
10037SARM gem5 Developers            }
10037SARM gem5 Developers        }
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        if (biased_exp >= (int)FP16_EXP_INF + 1) {
10037SARM gem5 Developers            *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com            return fp16_pack(sgn, FP16_EXP_INF, -1);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (error) {
10037SARM gem5 Developers        *flags |= FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp16_pack(sgn, biased_exp, int_mant);
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_round(int sgn, int exp, uint16_t mnt, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_round_(sgn, exp, mnt, mode & 3, mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_round_(int sgn, int exp, uint32_t mnt, int rm, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int biased_exp; // non-negative exponent value for result
13118SEdmund.Grimley-Evans@arm.com    uint32_t int_mant; // mantissa for result, less than (2 << FP32_MANT_BITS)
10037SARM gem5 Developers    int error; // 0, 1, 2 or 3, where 2 means int_mant is wrong by exactly 0.5
10037SARM gem5 Developers
10037SARM gem5 Developers    assert(rm != FPRounding_TIEAWAY);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Flush to zero:
10037SARM gem5 Developers    if ((mode & FPLIB_FZ) && exp < 1) {
10037SARM gem5 Developers        *flags |= FPLIB_UFC;
10037SARM gem5 Developers        return fp32_zero(sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // The bottom FP32_EXP_BITS bits of mnt are orred together:
13118SEdmund.Grimley-Evans@arm.com    mnt = (4ULL << FP32_MANT_BITS | mnt >> (FP32_EXP_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com           ((mnt & ((1ULL << FP32_EXP_BITS) - 1)) != 0));
10037SARM gem5 Developers
10037SARM gem5 Developers    if (exp > 0) {
10037SARM gem5 Developers        biased_exp = exp;
10037SARM gem5 Developers        int_mant = mnt >> 2;
10037SARM gem5 Developers        error = mnt & 3;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        biased_exp = 0;
10037SARM gem5 Developers        int_mant = lsr32(mnt, 3 - exp);
10037SARM gem5 Developers        error = (lsr32(mnt, 1 - exp) & 3) | !!(mnt & (lsl32(1, 1 - exp) - 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!biased_exp && error) { // xx should also check fpscr_val<11>
10037SARM gem5 Developers        *flags |= FPLIB_UFC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Round up:
10037SARM gem5 Developers    if ((rm == FPLIB_RN && (error == 3 ||
10037SARM gem5 Developers                            (error == 2 && (int_mant & 1)))) ||
10037SARM gem5 Developers        (((rm == FPLIB_RP && !sgn) || (rm == FPLIB_RM && sgn)) && error)) {
10037SARM gem5 Developers        ++int_mant;
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 1ULL << FP32_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up from denormalized to normalized
10037SARM gem5 Developers            biased_exp = 1;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 2ULL << FP32_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up to next exponent
10037SARM gem5 Developers            ++biased_exp;
10037SARM gem5 Developers            int_mant >>= 1;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle rounding to odd aka Von Neumann rounding:
10037SARM gem5 Developers    if (error && rm == FPRounding_ODD)
10037SARM gem5 Developers        int_mant |= 1;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle overflow:
13118SEdmund.Grimley-Evans@arm.com    if (biased_exp >= (int)FP32_EXP_INF) {
10037SARM gem5 Developers        *flags |= FPLIB_OFC | FPLIB_IXC;
10037SARM gem5 Developers        if (rm == FPLIB_RN || (rm == FPLIB_RP && !sgn) ||
10037SARM gem5 Developers            (rm == FPLIB_RM && sgn)) {
10037SARM gem5 Developers            return fp32_infinity(sgn);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            return fp32_max_normal(sgn);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (error) {
10037SARM gem5 Developers        *flags |= FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_pack(sgn, biased_exp, int_mant);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_round(int sgn, int exp, uint32_t mnt, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return fp32_round_(sgn, exp, mnt, mode & 3, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_round_(int sgn, int exp, uint64_t mnt, int rm, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int biased_exp; // non-negative exponent value for result
13118SEdmund.Grimley-Evans@arm.com    uint64_t int_mant; // mantissa for result, less than (2 << FP64_MANT_BITS)
10037SARM gem5 Developers    int error; // 0, 1, 2 or 3, where 2 means int_mant is wrong by exactly 0.5
10037SARM gem5 Developers
10037SARM gem5 Developers    assert(rm != FPRounding_TIEAWAY);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Flush to zero:
10037SARM gem5 Developers    if ((mode & FPLIB_FZ) && exp < 1) {
10037SARM gem5 Developers        *flags |= FPLIB_UFC;
10037SARM gem5 Developers        return fp64_zero(sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // The bottom FP64_EXP_BITS bits of mnt are orred together:
13118SEdmund.Grimley-Evans@arm.com    mnt = (4ULL << FP64_MANT_BITS | mnt >> (FP64_EXP_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com           ((mnt & ((1ULL << FP64_EXP_BITS) - 1)) != 0));
10037SARM gem5 Developers
10037SARM gem5 Developers    if (exp > 0) {
10037SARM gem5 Developers        biased_exp = exp;
10037SARM gem5 Developers        int_mant = mnt >> 2;
10037SARM gem5 Developers        error = mnt & 3;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        biased_exp = 0;
10037SARM gem5 Developers        int_mant = lsr64(mnt, 3 - exp);
10037SARM gem5 Developers        error = (lsr64(mnt, 1 - exp) & 3) | !!(mnt & (lsl64(1, 1 - exp) - 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!biased_exp && error) { // xx should also check fpscr_val<11>
10037SARM gem5 Developers        *flags |= FPLIB_UFC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Round up:
10037SARM gem5 Developers    if ((rm == FPLIB_RN && (error == 3 ||
10037SARM gem5 Developers                            (error == 2 && (int_mant & 1)))) ||
10037SARM gem5 Developers        (((rm == FPLIB_RP && !sgn) || (rm == FPLIB_RM && sgn)) && error)) {
10037SARM gem5 Developers        ++int_mant;
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 1ULL << FP64_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up from denormalized to normalized
10037SARM gem5 Developers            biased_exp = 1;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (int_mant == 2ULL << FP64_MANT_BITS) {
10037SARM gem5 Developers            // Rounded up to next exponent
10037SARM gem5 Developers            ++biased_exp;
10037SARM gem5 Developers            int_mant >>= 1;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle rounding to odd aka Von Neumann rounding:
10037SARM gem5 Developers    if (error && rm == FPRounding_ODD)
10037SARM gem5 Developers        int_mant |= 1;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle overflow:
13118SEdmund.Grimley-Evans@arm.com    if (biased_exp >= (int)FP64_EXP_INF) {
10037SARM gem5 Developers        *flags |= FPLIB_OFC | FPLIB_IXC;
10037SARM gem5 Developers        if (rm == FPLIB_RN || (rm == FPLIB_RP && !sgn) ||
10037SARM gem5 Developers            (rm == FPLIB_RM && sgn)) {
10037SARM gem5 Developers            return fp64_infinity(sgn);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            return fp64_max_normal(sgn);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (error) {
10037SARM gem5 Developers        *flags |= FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_pack(sgn, biased_exp, int_mant);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_round(int sgn, int exp, uint64_t mnt, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    return fp64_round_(sgn, exp, mnt, mode & 3, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp16_compare_eq(uint16_t a, uint16_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp16_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp16_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp16_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers            *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return a == b || (!a_mnt && !b_mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp16_compare_ge(uint16_t a, uint16_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp16_is_NaN(b_exp, b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (!a_mnt && !b_mnt)
10037SARM gem5 Developers        return 1;
10037SARM gem5 Developers    if (a_sgn != b_sgn)
10037SARM gem5 Developers        return b_sgn;
10037SARM gem5 Developers    if (a_exp != b_exp)
10037SARM gem5 Developers        return a_sgn ^ (a_exp > b_exp);
10037SARM gem5 Developers    if (a_mnt != b_mnt)
10037SARM gem5 Developers        return a_sgn ^ (a_mnt > b_mnt);
10037SARM gem5 Developers    return 1;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp16_compare_gt(uint16_t a, uint16_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp16_is_NaN(b_exp, b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (!a_mnt && !b_mnt)
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    if (a_sgn != b_sgn)
10037SARM gem5 Developers        return b_sgn;
10037SARM gem5 Developers    if (a_exp != b_exp)
10037SARM gem5 Developers        return a_sgn ^ (a_exp > b_exp);
10037SARM gem5 Developers    if (a_mnt != b_mnt)
10037SARM gem5 Developers        return a_sgn ^ (a_mnt > b_mnt);
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp16_compare_un(uint16_t a, uint16_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp16_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp16_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp16_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com            *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 1;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp32_compare_eq(uint32_t a, uint32_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp32_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp32_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp32_is_signalling_NaN(b_exp, b_mnt))
10037SARM gem5 Developers            *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return a == b || (!a_mnt && !b_mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp32_compare_ge(uint32_t a, uint32_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp32_is_NaN(b_exp, b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (!a_mnt && !b_mnt)
10037SARM gem5 Developers        return 1;
10037SARM gem5 Developers    if (a_sgn != b_sgn)
10037SARM gem5 Developers        return b_sgn;
10037SARM gem5 Developers    if (a_exp != b_exp)
10037SARM gem5 Developers        return a_sgn ^ (a_exp > b_exp);
10037SARM gem5 Developers    if (a_mnt != b_mnt)
10037SARM gem5 Developers        return a_sgn ^ (a_mnt > b_mnt);
10037SARM gem5 Developers    return 1;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
13118SEdmund.Grimley-Evans@arm.comfp32_compare_gt(uint32_t a, uint32_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp32_is_NaN(b_exp, b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (!a_mnt && !b_mnt)
10037SARM gem5 Developers        return 0;
10037SARM gem5 Developers    if (a_sgn != b_sgn)
10037SARM gem5 Developers        return b_sgn;
10037SARM gem5 Developers    if (a_exp != b_exp)
10037SARM gem5 Developers        return a_sgn ^ (a_exp > b_exp);
10037SARM gem5 Developers    if (a_mnt != b_mnt)
10037SARM gem5 Developers        return a_sgn ^ (a_mnt > b_mnt);
10037SARM gem5 Developers    return 0;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp32_compare_un(uint32_t a, uint32_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp32_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp32_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp32_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com            *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 1;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp64_compare_eq(uint64_t a, uint64_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp64_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp64_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp64_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com            *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 0;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return a == b || (!a_mnt && !b_mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp64_compare_ge(uint64_t a, uint64_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp64_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 0;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt && !b_mnt)
13118SEdmund.Grimley-Evans@arm.com        return 1;
13118SEdmund.Grimley-Evans@arm.com    if (a_sgn != b_sgn)
13118SEdmund.Grimley-Evans@arm.com        return b_sgn;
13118SEdmund.Grimley-Evans@arm.com    if (a_exp != b_exp)
13118SEdmund.Grimley-Evans@arm.com        return a_sgn ^ (a_exp > b_exp);
13118SEdmund.Grimley-Evans@arm.com    if (a_mnt != b_mnt)
13118SEdmund.Grimley-Evans@arm.com        return a_sgn ^ (a_mnt > b_mnt);
13118SEdmund.Grimley-Evans@arm.com    return 1;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp64_compare_gt(uint64_t a, uint64_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp64_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 0;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt && !b_mnt)
13118SEdmund.Grimley-Evans@arm.com        return 0;
13118SEdmund.Grimley-Evans@arm.com    if (a_sgn != b_sgn)
13118SEdmund.Grimley-Evans@arm.com        return b_sgn;
13118SEdmund.Grimley-Evans@arm.com    if (a_exp != b_exp)
13118SEdmund.Grimley-Evans@arm.com        return a_sgn ^ (a_exp > b_exp);
13118SEdmund.Grimley-Evans@arm.com    if (a_mnt != b_mnt)
13118SEdmund.Grimley-Evans@arm.com        return a_sgn ^ (a_mnt > b_mnt);
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic int
13118SEdmund.Grimley-Evans@arm.comfp64_compare_un(uint64_t a, uint64_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt, b_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        fp64_is_NaN(b_exp, b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        if (fp64_is_signalling_NaN(a_exp, a_mnt) ||
13118SEdmund.Grimley-Evans@arm.com            fp64_is_signalling_NaN(b_exp, b_mnt))
13118SEdmund.Grimley-Evans@arm.com            *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return 1;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return 0;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_add(uint16_t a, uint16_t b, int neg, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt, x, x_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if ((x = fp16_process_NaNs(a, b, mode, flags))) {
13118SEdmund.Grimley-Evans@arm.com        return x;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    b_sgn ^= neg;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP16_EXP_INF && b_exp == FP16_EXP_INF && a_sgn != b_sgn) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (b_exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(b_sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (!a_mnt && !b_mnt && a_sgn == b_sgn) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    a_mnt <<= 3;
13118SEdmund.Grimley-Evans@arm.com    b_mnt <<= 3;
13118SEdmund.Grimley-Evans@arm.com    if (a_exp >= b_exp) {
13118SEdmund.Grimley-Evans@arm.com        b_mnt = (lsr16(b_mnt, a_exp - b_exp) |
13118SEdmund.Grimley-Evans@arm.com                 !!(b_mnt & (lsl16(1, a_exp - b_exp) - 1)));
13118SEdmund.Grimley-Evans@arm.com        b_exp = a_exp;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        a_mnt = (lsr16(a_mnt, b_exp - a_exp) |
13118SEdmund.Grimley-Evans@arm.com                 !!(a_mnt & (lsl16(1, b_exp - a_exp) - 1)));
13118SEdmund.Grimley-Evans@arm.com        a_exp = b_exp;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    x_sgn = a_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp;
13118SEdmund.Grimley-Evans@arm.com    if (a_sgn == b_sgn) {
13118SEdmund.Grimley-Evans@arm.com        x_mnt = a_mnt + b_mnt;
13118SEdmund.Grimley-Evans@arm.com    } else if (a_mnt >= b_mnt) {
13118SEdmund.Grimley-Evans@arm.com        x_mnt = a_mnt - b_mnt;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        x_sgn ^= 1;
13118SEdmund.Grimley-Evans@arm.com        x_mnt = b_mnt - a_mnt;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (!x_mnt) {
13118SEdmund.Grimley-Evans@arm.com        // Sign of exact zero result depends on rounding mode
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero((mode & 3) == 2);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp16_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp + FP16_EXP_BITS - 3, x_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_add(uint32_t a, uint32_t b, int neg, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint32_t a_mnt, b_mnt, x, x_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp32_process_NaNs(a, b, mode, flags))) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    b_sgn ^= neg;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP32_EXP_INF && b_exp == FP32_EXP_INF && a_sgn != b_sgn) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp32_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP32_EXP_INF) {
10037SARM gem5 Developers        return fp32_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (b_exp == FP32_EXP_INF) {
10037SARM gem5 Developers        return fp32_infinity(b_sgn);
10037SARM gem5 Developers    } else if (!a_mnt && !b_mnt && a_sgn == b_sgn) {
10037SARM gem5 Developers        return fp32_zero(a_sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    a_mnt <<= 3;
10037SARM gem5 Developers    b_mnt <<= 3;
10037SARM gem5 Developers    if (a_exp >= b_exp) {
10037SARM gem5 Developers        b_mnt = (lsr32(b_mnt, a_exp - b_exp) |
10037SARM gem5 Developers                 !!(b_mnt & (lsl32(1, a_exp - b_exp) - 1)));
10037SARM gem5 Developers        b_exp = a_exp;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        a_mnt = (lsr32(a_mnt, b_exp - a_exp) |
10037SARM gem5 Developers                 !!(a_mnt & (lsl32(1, b_exp - a_exp) - 1)));
10037SARM gem5 Developers        a_exp = b_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    x_sgn = a_sgn;
10037SARM gem5 Developers    x_exp = a_exp;
10037SARM gem5 Developers    if (a_sgn == b_sgn) {
10037SARM gem5 Developers        x_mnt = a_mnt + b_mnt;
10037SARM gem5 Developers    } else if (a_mnt >= b_mnt) {
10037SARM gem5 Developers        x_mnt = a_mnt - b_mnt;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        x_sgn ^= 1;
10037SARM gem5 Developers        x_mnt = b_mnt - a_mnt;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x_mnt) {
10037SARM gem5 Developers        // Sign of exact zero result depends on rounding mode
10037SARM gem5 Developers        return fp32_zero((mode & 3) == 2);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp32_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    return fp32_round(x_sgn, x_exp + FP32_EXP_BITS - 3, x_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_add(uint64_t a, uint64_t b, int neg, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint64_t a_mnt, b_mnt, x, x_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp64_process_NaNs(a, b, mode, flags))) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    b_sgn ^= neg;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP64_EXP_INF && b_exp == FP64_EXP_INF && a_sgn != b_sgn) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp64_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP64_EXP_INF) {
10037SARM gem5 Developers        return fp64_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (b_exp == FP64_EXP_INF) {
10037SARM gem5 Developers        return fp64_infinity(b_sgn);
10037SARM gem5 Developers    } else if (!a_mnt && !b_mnt && a_sgn == b_sgn) {
10037SARM gem5 Developers        return fp64_zero(a_sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    a_mnt <<= 3;
10037SARM gem5 Developers    b_mnt <<= 3;
10037SARM gem5 Developers    if (a_exp >= b_exp) {
10037SARM gem5 Developers        b_mnt = (lsr64(b_mnt, a_exp - b_exp) |
10037SARM gem5 Developers                 !!(b_mnt & (lsl64(1, a_exp - b_exp) - 1)));
10037SARM gem5 Developers        b_exp = a_exp;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        a_mnt = (lsr64(a_mnt, b_exp - a_exp) |
10037SARM gem5 Developers                 !!(a_mnt & (lsl64(1, b_exp - a_exp) - 1)));
10037SARM gem5 Developers        a_exp = b_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    x_sgn = a_sgn;
10037SARM gem5 Developers    x_exp = a_exp;
10037SARM gem5 Developers    if (a_sgn == b_sgn) {
10037SARM gem5 Developers        x_mnt = a_mnt + b_mnt;
10037SARM gem5 Developers    } else if (a_mnt >= b_mnt) {
10037SARM gem5 Developers        x_mnt = a_mnt - b_mnt;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        x_sgn ^= 1;
10037SARM gem5 Developers        x_mnt = b_mnt - a_mnt;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x_mnt) {
10037SARM gem5 Developers        // Sign of exact zero result depends on rounding mode
10037SARM gem5 Developers        return fp64_zero((mode & 3) == 2);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    return fp64_round(x_sgn, x_exp + FP64_EXP_BITS - 3, x_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_mul(uint16_t a, uint16_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt, x;
13118SEdmund.Grimley-Evans@arm.com    uint32_t x_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if ((x = fp16_process_NaNs(a, b, mode, flags))) {
13118SEdmund.Grimley-Evans@arm.com        return x;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP16_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (b_exp == FP16_EXP_INF && !a_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP16_EXP_INF || b_exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn ^ b_sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (!a_mnt || !b_mnt) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn ^ b_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Multiply and normalise:
13118SEdmund.Grimley-Evans@arm.com    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + b_exp - FP16_EXP_BIAS + 2 * FP16_EXP_BITS + 1;
13118SEdmund.Grimley-Evans@arm.com    x_mnt = (uint32_t)a_mnt * b_mnt;
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp32_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Convert to FP16_BITS bits, collapsing error into bottom bit:
13118SEdmund.Grimley-Evans@arm.com    x_mnt = lsr32(x_mnt, FP16_BITS - 1) | !!lsl32(x_mnt, FP16_BITS + 1);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp, x_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_mul(uint32_t a, uint32_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint32_t a_mnt, b_mnt, x;
10037SARM gem5 Developers    uint64_t x_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp32_process_NaNs(a, b, mode, flags))) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP32_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (b_exp == FP32_EXP_INF && !a_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp32_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP32_EXP_INF || b_exp == FP32_EXP_INF) {
10037SARM gem5 Developers        return fp32_infinity(a_sgn ^ b_sgn);
10037SARM gem5 Developers    } else if (!a_mnt || !b_mnt) {
10037SARM gem5 Developers        return fp32_zero(a_sgn ^ b_sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Multiply and normalise:
10037SARM gem5 Developers    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + b_exp - FP32_EXP_BIAS + 2 * FP32_EXP_BITS + 1;
10037SARM gem5 Developers    x_mnt = (uint64_t)a_mnt * b_mnt;
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Convert to FP32_BITS bits, collapsing error into bottom bit:
13118SEdmund.Grimley-Evans@arm.com    x_mnt = lsr64(x_mnt, FP32_BITS - 1) | !!lsl64(x_mnt, FP32_BITS + 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_round(x_sgn, x_exp, x_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_mul(uint64_t a, uint64_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint64_t a_mnt, b_mnt, x;
10037SARM gem5 Developers    uint64_t x0_mnt, x1_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp64_process_NaNs(a, b, mode, flags))) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP64_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (b_exp == FP64_EXP_INF && !a_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp64_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    } else if (a_exp == FP64_EXP_INF || b_exp == FP64_EXP_INF) {
10037SARM gem5 Developers        return fp64_infinity(a_sgn ^ b_sgn);
10037SARM gem5 Developers    } else if (!a_mnt || !b_mnt) {
10037SARM gem5 Developers        return fp64_zero(a_sgn ^ b_sgn);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Multiply and normalise:
10037SARM gem5 Developers    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + b_exp - FP64_EXP_BIAS + 2 * FP64_EXP_BITS + 1;
10037SARM gem5 Developers    mul62x62(&x0_mnt, &x1_mnt, a_mnt, b_mnt);
10037SARM gem5 Developers    fp128_normalise(&x0_mnt, &x1_mnt, &x_exp);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Convert to FP64_BITS bits, collapsing error into bottom bit:
10037SARM gem5 Developers    x0_mnt = x1_mnt << 1 | !!x0_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_round(x_sgn, x_exp, x0_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_muladd(uint16_t a, uint16_t b, uint16_t c, int scale,
13118SEdmund.Grimley-Evans@arm.com            int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp, c_sgn, c_exp, x_sgn, x_exp, y_sgn, y_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt, c_mnt, x;
13118SEdmund.Grimley-Evans@arm.com    uint32_t x_mnt, y_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&c_sgn, &c_exp, &c_mnt, c, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    x = fp16_process_NaNs3(a, b, c, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Quiet NaN added to product of zero and infinity:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_quiet_NaN(a_exp, a_mnt) &&
13118SEdmund.Grimley-Evans@arm.com        ((!b_mnt && fp16_is_infinity(c_exp, c_mnt)) ||
13118SEdmund.Grimley-Evans@arm.com         (!c_mnt && fp16_is_infinity(b_exp, b_mnt)))) {
13118SEdmund.Grimley-Evans@arm.com        x = fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (x) {
13118SEdmund.Grimley-Evans@arm.com        return x;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((b_exp == FP16_EXP_INF && !c_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (c_exp == FP16_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (a_exp == FP16_EXP_INF &&
13118SEdmund.Grimley-Evans@arm.com         (b_exp == FP16_EXP_INF || c_exp == FP16_EXP_INF) &&
13118SEdmund.Grimley-Evans@arm.com         (a_sgn != (b_sgn ^ c_sgn)))) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (b_exp == FP16_EXP_INF || c_exp == FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(b_sgn ^ c_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt && (!b_mnt || !c_mnt) && a_sgn == (b_sgn ^ c_sgn))
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    x_sgn = a_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + 2 * FP16_EXP_BITS - 3;
13118SEdmund.Grimley-Evans@arm.com    x_mnt = (uint32_t)a_mnt << (FP16_MANT_BITS + 4);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Multiply:
13118SEdmund.Grimley-Evans@arm.com    y_sgn = b_sgn ^ c_sgn;
13118SEdmund.Grimley-Evans@arm.com    y_exp = b_exp + c_exp - FP16_EXP_BIAS + 2 * FP16_EXP_BITS + 1 - 3;
13118SEdmund.Grimley-Evans@arm.com    y_mnt = (uint32_t)b_mnt * c_mnt << 3;
13118SEdmund.Grimley-Evans@arm.com    if (!y_mnt) {
13118SEdmund.Grimley-Evans@arm.com        y_exp = x_exp;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Add:
13118SEdmund.Grimley-Evans@arm.com    if (x_exp >= y_exp) {
13118SEdmund.Grimley-Evans@arm.com        y_mnt = (lsr32(y_mnt, x_exp - y_exp) |
13118SEdmund.Grimley-Evans@arm.com                 !!(y_mnt & (lsl32(1, x_exp - y_exp) - 1)));
13118SEdmund.Grimley-Evans@arm.com        y_exp = x_exp;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        x_mnt = (lsr32(x_mnt, y_exp - x_exp) |
13118SEdmund.Grimley-Evans@arm.com                 !!(x_mnt & (lsl32(1, y_exp - x_exp) - 1)));
13118SEdmund.Grimley-Evans@arm.com        x_exp = y_exp;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (x_sgn == y_sgn) {
13118SEdmund.Grimley-Evans@arm.com        x_mnt = x_mnt + y_mnt;
13118SEdmund.Grimley-Evans@arm.com    } else if (x_mnt >= y_mnt) {
13118SEdmund.Grimley-Evans@arm.com        x_mnt = x_mnt - y_mnt;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        x_sgn ^= 1;
13118SEdmund.Grimley-Evans@arm.com        x_mnt = y_mnt - x_mnt;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (!x_mnt) {
13118SEdmund.Grimley-Evans@arm.com        // Sign of exact zero result depends on rounding mode
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero((mode & 3) == 2);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP16_BITS bits, collapsing error into bottom bit:
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp32_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = x_mnt >> (FP16_BITS - 1) | !!(uint16_t)(x_mnt << 1);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp + scale, x_mnt, mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_muladd(uint32_t a, uint32_t b, uint32_t c, int scale,
10037SARM gem5 Developers            int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, c_sgn, c_exp, x_sgn, x_exp, y_sgn, y_exp;
10037SARM gem5 Developers    uint32_t a_mnt, b_mnt, c_mnt, x;
10037SARM gem5 Developers    uint64_t x_mnt, y_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers    fp32_unpack(&c_sgn, &c_exp, &c_mnt, c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    x = fp32_process_NaNs3(a, b, c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Quiet NaN added to product of zero and infinity:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_quiet_NaN(a_exp, a_mnt) &&
13118SEdmund.Grimley-Evans@arm.com        ((!b_mnt && fp32_is_infinity(c_exp, c_mnt)) ||
13118SEdmund.Grimley-Evans@arm.com         (!c_mnt && fp32_is_infinity(b_exp, b_mnt)))) {
10037SARM gem5 Developers        x = fp32_defaultNaN();
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (x) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((b_exp == FP32_EXP_INF && !c_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (c_exp == FP32_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (a_exp == FP32_EXP_INF &&
13118SEdmund.Grimley-Evans@arm.com         (b_exp == FP32_EXP_INF || c_exp == FP32_EXP_INF) &&
10037SARM gem5 Developers         (a_sgn != (b_sgn ^ c_sgn)))) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp32_defaultNaN();
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP32_EXP_INF)
10037SARM gem5 Developers        return fp32_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (b_exp == FP32_EXP_INF || c_exp == FP32_EXP_INF)
10037SARM gem5 Developers        return fp32_infinity(b_sgn ^ c_sgn);
10037SARM gem5 Developers    if (!a_mnt && (!b_mnt || !c_mnt) && a_sgn == (b_sgn ^ c_sgn))
10037SARM gem5 Developers        return fp32_zero(a_sgn);
10037SARM gem5 Developers
10037SARM gem5 Developers    x_sgn = a_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + 2 * FP32_EXP_BITS - 3;
13118SEdmund.Grimley-Evans@arm.com    x_mnt = (uint64_t)a_mnt << (FP32_MANT_BITS + 4);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Multiply:
10037SARM gem5 Developers    y_sgn = b_sgn ^ c_sgn;
13118SEdmund.Grimley-Evans@arm.com    y_exp = b_exp + c_exp - FP32_EXP_BIAS + 2 * FP32_EXP_BITS + 1 - 3;
10037SARM gem5 Developers    y_mnt = (uint64_t)b_mnt * c_mnt << 3;
10037SARM gem5 Developers    if (!y_mnt) {
10037SARM gem5 Developers        y_exp = x_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Add:
10037SARM gem5 Developers    if (x_exp >= y_exp) {
10037SARM gem5 Developers        y_mnt = (lsr64(y_mnt, x_exp - y_exp) |
10037SARM gem5 Developers                 !!(y_mnt & (lsl64(1, x_exp - y_exp) - 1)));
10037SARM gem5 Developers        y_exp = x_exp;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        x_mnt = (lsr64(x_mnt, y_exp - x_exp) |
10037SARM gem5 Developers                 !!(x_mnt & (lsl64(1, y_exp - x_exp) - 1)));
10037SARM gem5 Developers        x_exp = y_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (x_sgn == y_sgn) {
10037SARM gem5 Developers        x_mnt = x_mnt + y_mnt;
10037SARM gem5 Developers    } else if (x_mnt >= y_mnt) {
10037SARM gem5 Developers        x_mnt = x_mnt - y_mnt;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        x_sgn ^= 1;
10037SARM gem5 Developers        x_mnt = y_mnt - x_mnt;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x_mnt) {
10037SARM gem5 Developers        // Sign of exact zero result depends on rounding mode
10037SARM gem5 Developers        return fp32_zero((mode & 3) == 2);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP32_BITS bits, collapsing error into bottom bit:
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = x_mnt >> (FP32_BITS - 1) | !!(uint32_t)(x_mnt << 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_round(x_sgn, x_exp + scale, x_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_muladd(uint64_t a, uint64_t b, uint64_t c, int scale,
10037SARM gem5 Developers            int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, c_sgn, c_exp, x_sgn, x_exp, y_sgn, y_exp;
10037SARM gem5 Developers    uint64_t a_mnt, b_mnt, c_mnt, x;
10037SARM gem5 Developers    uint64_t x0_mnt, x1_mnt, y0_mnt, y1_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers    fp64_unpack(&c_sgn, &c_exp, &c_mnt, c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    x = fp64_process_NaNs3(a, b, c, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Quiet NaN added to product of zero and infinity:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_quiet_NaN(a_exp, a_mnt) &&
13118SEdmund.Grimley-Evans@arm.com        ((!b_mnt && fp64_is_infinity(c_exp, c_mnt)) ||
13118SEdmund.Grimley-Evans@arm.com         (!c_mnt && fp64_is_infinity(b_exp, b_mnt)))) {
10037SARM gem5 Developers        x = fp64_defaultNaN();
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (x) {
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((b_exp == FP64_EXP_INF && !c_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (c_exp == FP64_EXP_INF && !b_mnt) ||
13118SEdmund.Grimley-Evans@arm.com        (a_exp == FP64_EXP_INF &&
13118SEdmund.Grimley-Evans@arm.com         (b_exp == FP64_EXP_INF || c_exp == FP64_EXP_INF) &&
10037SARM gem5 Developers         (a_sgn != (b_sgn ^ c_sgn)))) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp64_defaultNaN();
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP64_EXP_INF)
10037SARM gem5 Developers        return fp64_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (b_exp == FP64_EXP_INF || c_exp == FP64_EXP_INF)
10037SARM gem5 Developers        return fp64_infinity(b_sgn ^ c_sgn);
10037SARM gem5 Developers    if (!a_mnt && (!b_mnt || !c_mnt) && a_sgn == (b_sgn ^ c_sgn))
10037SARM gem5 Developers        return fp64_zero(a_sgn);
10037SARM gem5 Developers
10037SARM gem5 Developers    x_sgn = a_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp + FP64_EXP_BITS;
10037SARM gem5 Developers    x0_mnt = 0;
10037SARM gem5 Developers    x1_mnt = a_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Multiply:
10037SARM gem5 Developers    y_sgn = b_sgn ^ c_sgn;
13118SEdmund.Grimley-Evans@arm.com    y_exp = b_exp + c_exp - FP64_EXP_BIAS + 2 * FP64_EXP_BITS + 1 - 3;
10037SARM gem5 Developers    mul62x62(&y0_mnt, &y1_mnt, b_mnt, c_mnt << 3);
10037SARM gem5 Developers    if (!y0_mnt && !y1_mnt) {
10037SARM gem5 Developers        y_exp = x_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // Add:
10037SARM gem5 Developers    if (x_exp >= y_exp) {
10037SARM gem5 Developers        uint64_t t0, t1;
10037SARM gem5 Developers        lsl128(&t0, &t1, y0_mnt, y1_mnt,
10037SARM gem5 Developers               x_exp - y_exp < 128 ? 128 - (x_exp - y_exp) : 0);
10037SARM gem5 Developers        lsr128(&y0_mnt, &y1_mnt, y0_mnt, y1_mnt, x_exp - y_exp);
10037SARM gem5 Developers        y0_mnt |= !!(t0 | t1);
10037SARM gem5 Developers        y_exp = x_exp;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        uint64_t t0, t1;
10037SARM gem5 Developers        lsl128(&t0, &t1, x0_mnt, x1_mnt,
10037SARM gem5 Developers               y_exp - x_exp < 128 ? 128 - (y_exp - x_exp) : 0);
10037SARM gem5 Developers        lsr128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, y_exp - x_exp);
10037SARM gem5 Developers        x0_mnt |= !!(t0 | t1);
10037SARM gem5 Developers        x_exp = y_exp;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (x_sgn == y_sgn) {
10037SARM gem5 Developers        add128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, y0_mnt, y1_mnt);
10037SARM gem5 Developers    } else if (cmp128(x0_mnt, x1_mnt, y0_mnt, y1_mnt) >= 0) {
10037SARM gem5 Developers        sub128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, y0_mnt, y1_mnt);
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        x_sgn ^= 1;
10037SARM gem5 Developers        sub128(&x0_mnt, &x1_mnt, y0_mnt, y1_mnt, x0_mnt, x1_mnt);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (!x0_mnt && !x1_mnt) {
10037SARM gem5 Developers        // Sign of exact zero result depends on rounding mode
10037SARM gem5 Developers        return fp64_zero((mode & 3) == 2);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP64_BITS bits, collapsing error into bottom bit:
10037SARM gem5 Developers    fp128_normalise(&x0_mnt, &x1_mnt, &x_exp);
10037SARM gem5 Developers    x0_mnt = x1_mnt << 1 | !!x0_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_round(x_sgn, x_exp + scale, x0_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_div(uint16_t a, uint16_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, b_mnt, x;
13118SEdmund.Grimley-Evans@arm.com    uint32_t x_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if ((x = fp16_process_NaNs(a, b, mode, flags)))
13118SEdmund.Grimley-Evans@arm.com        return x;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP16_EXP_INF && b_exp == FP16_EXP_INF) ||
13118SEdmund.Grimley-Evans@arm.com        (!a_mnt && !b_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP16_EXP_INF || !b_mnt) {
13118SEdmund.Grimley-Evans@arm.com        if (a_exp != FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com            *flags |= FPLIB_DZC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn ^ b_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt || b_exp == FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn ^ b_sgn);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Divide, setting bottom bit if inexact:
13118SEdmund.Grimley-Evans@arm.com    a_mnt = fp16_normalise(a_mnt, &a_exp);
13118SEdmund.Grimley-Evans@arm.com    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp - b_exp + (FP16_EXP_BIAS + FP16_BITS + 2 * FP16_EXP_BITS - 3);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = ((uint32_t)a_mnt << (FP16_MANT_BITS - FP16_EXP_BITS + 3)) / b_mnt;
13118SEdmund.Grimley-Evans@arm.com    x_mnt |= (x_mnt * b_mnt !=
13118SEdmund.Grimley-Evans@arm.com              (uint32_t)a_mnt << (FP16_MANT_BITS - FP16_EXP_BITS + 3));
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP16_BITS bits, collapsing error into bottom bit:
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp32_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = x_mnt >> (FP16_BITS - 1) | !!(uint16_t)(x_mnt << 1);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp, x_mnt, mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_div(uint32_t a, uint32_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint32_t a_mnt, b_mnt, x;
10037SARM gem5 Developers    uint64_t x_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp32_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp32_process_NaNs(a, b, mode, flags)))
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP32_EXP_INF && b_exp == FP32_EXP_INF) ||
13118SEdmund.Grimley-Evans@arm.com        (!a_mnt && !b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp32_defaultNaN();
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP32_EXP_INF || !b_mnt) {
13118SEdmund.Grimley-Evans@arm.com        if (a_exp != FP32_EXP_INF)
10037SARM gem5 Developers            *flags |= FPLIB_DZC;
10037SARM gem5 Developers        return fp32_infinity(a_sgn ^ b_sgn);
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt || b_exp == FP32_EXP_INF)
10037SARM gem5 Developers        return fp32_zero(a_sgn ^ b_sgn);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Divide, setting bottom bit if inexact:
10037SARM gem5 Developers    a_mnt = fp32_normalise(a_mnt, &a_exp);
10037SARM gem5 Developers    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp - b_exp + (FP32_EXP_BIAS + FP32_BITS + 2 * FP32_EXP_BITS - 3);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = ((uint64_t)a_mnt << (FP32_MANT_BITS - FP32_EXP_BITS + 3)) / b_mnt;
13118SEdmund.Grimley-Evans@arm.com    x_mnt |= (x_mnt * b_mnt !=
13118SEdmund.Grimley-Evans@arm.com              (uint64_t)a_mnt << (FP32_MANT_BITS - FP32_EXP_BITS + 3));
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP32_BITS bits, collapsing error into bottom bit:
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = x_mnt >> (FP32_BITS - 1) | !!(uint32_t)(x_mnt << 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_round(x_sgn, x_exp, x_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_div(uint64_t a, uint64_t b, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, b_sgn, b_exp, x_sgn, x_exp, c;
10037SARM gem5 Developers    uint64_t a_mnt, b_mnt, x, x_mnt, x0_mnt, x1_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers    fp64_unpack(&b_sgn, &b_exp, &b_mnt, b, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp64_process_NaNs(a, b, mode, flags)))
10037SARM gem5 Developers        return x;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if ((a_exp == FP64_EXP_INF && b_exp == FP64_EXP_INF) ||
13118SEdmund.Grimley-Evans@arm.com        (!a_mnt && !b_mnt)) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp64_defaultNaN();
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP64_EXP_INF || !b_mnt) {
13118SEdmund.Grimley-Evans@arm.com        if (a_exp != FP64_EXP_INF)
10037SARM gem5 Developers            *flags |= FPLIB_DZC;
10037SARM gem5 Developers        return fp64_infinity(a_sgn ^ b_sgn);
10037SARM gem5 Developers    }
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt || b_exp == FP64_EXP_INF)
10037SARM gem5 Developers        return fp64_zero(a_sgn ^ b_sgn);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Find reciprocal of divisor with Newton-Raphson:
10037SARM gem5 Developers    a_mnt = fp64_normalise(a_mnt, &a_exp);
10037SARM gem5 Developers    b_mnt = fp64_normalise(b_mnt, &b_exp);
10037SARM gem5 Developers    x_mnt = ~(uint64_t)0 / (b_mnt >> 31);
10037SARM gem5 Developers    mul64x32(&x0_mnt, &x1_mnt, b_mnt, x_mnt);
10037SARM gem5 Developers    sub128(&x0_mnt, &x1_mnt, 0, (uint64_t)1 << 32, x0_mnt, x1_mnt);
10037SARM gem5 Developers    lsr128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, 32);
10037SARM gem5 Developers    mul64x32(&x0_mnt, &x1_mnt, x0_mnt, x_mnt);
10037SARM gem5 Developers    lsr128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, 33);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Multiply by dividend:
10037SARM gem5 Developers    x_sgn = a_sgn ^ b_sgn;
13118SEdmund.Grimley-Evans@arm.com    x_exp = a_exp - b_exp + FP64_EXP_BIAS + 8;
13118SEdmund.Grimley-Evans@arm.com    mul62x62(&x0_mnt, &x1_mnt, x0_mnt, a_mnt >> 2);
10037SARM gem5 Developers    lsr128(&x0_mnt, &x1_mnt, x0_mnt, x1_mnt, 4);
10037SARM gem5 Developers    x_mnt = x1_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    // This is an underestimate, so try adding one:
13118SEdmund.Grimley-Evans@arm.com    mul62x62(&x0_mnt, &x1_mnt, b_mnt >> 2, x_mnt + 1);
10037SARM gem5 Developers    c = cmp128(x0_mnt, x1_mnt, 0, a_mnt >> 11);
10037SARM gem5 Developers    if (c <= 0) {
10037SARM gem5 Developers        ++x_mnt;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_round(x_sgn, x_exp, x_mnt << 1 | !!c, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic void
10037SARM gem5 Developersset_fpscr0(FPSCR &fpscr, int flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    if (flags & FPLIB_IDC) {
10037SARM gem5 Developers        fpscr.idc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_IOC) {
10037SARM gem5 Developers        fpscr.ioc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_DZC) {
10037SARM gem5 Developers        fpscr.dzc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_OFC) {
10037SARM gem5 Developers        fpscr.ofc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_UFC) {
10037SARM gem5 Developers        fpscr.ufc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_IXC) {
10037SARM gem5 Developers        fpscr.ixc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_scale(uint16_t a, int16_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    b = b < -300 ? -300 : b;
13118SEdmund.Grimley-Evans@arm.com    b = b >  300 ?  300 : b;
13118SEdmund.Grimley-Evans@arm.com    a_exp += b;
13118SEdmund.Grimley-Evans@arm.com    a_mnt <<= 3;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    a_mnt = fp16_normalise(a_mnt, &a_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(a_sgn, a_exp + FP16_EXP_BITS - 3, a_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint32_t
13118SEdmund.Grimley-Evans@arm.comfp32_scale(uint32_t a, int32_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t a_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        return fp32_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt) {
13118SEdmund.Grimley-Evans@arm.com        return fp32_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP32_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp32_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    b = b < -300 ? -300 : b;
13118SEdmund.Grimley-Evans@arm.com    b = b >  300 ?  300 : b;
13118SEdmund.Grimley-Evans@arm.com    a_exp += b;
13118SEdmund.Grimley-Evans@arm.com    a_mnt <<= 3;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    a_mnt = fp32_normalise(a_mnt, &a_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp32_round(a_sgn, a_exp + FP32_EXP_BITS - 3, a_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint64_t
13118SEdmund.Grimley-Evans@arm.comfp64_scale(uint64_t a, int64_t b, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t a_mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt)) {
13118SEdmund.Grimley-Evans@arm.com        return fp64_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt) {
13118SEdmund.Grimley-Evans@arm.com        return fp64_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities:
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP64_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        return fp64_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    b = b < -3000 ? -3000 : b;
13118SEdmund.Grimley-Evans@arm.com    b = b >  3000 ?  3000 : b;
13118SEdmund.Grimley-Evans@arm.com    a_exp += b;
13118SEdmund.Grimley-Evans@arm.com    a_mnt <<= 3;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    a_mnt = fp64_normalise(a_mnt, &a_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp64_round(a_sgn, a_exp + FP64_EXP_BITS - 3, a_mnt << 1,
13118SEdmund.Grimley-Evans@arm.com                      mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_sqrt(uint16_t a, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int a_sgn, a_exp, x_sgn, x_exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t a_mnt, x_mnt;
13118SEdmund.Grimley-Evans@arm.com    uint32_t x, t0, t1;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(a_exp, a_mnt))
13118SEdmund.Grimley-Evans@arm.com        return fp16_process_NaN(a, mode, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt)
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP16_EXP_INF && !a_sgn)
13118SEdmund.Grimley-Evans@arm.com        return fp16_infinity(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (a_sgn) {
13118SEdmund.Grimley-Evans@arm.com        *flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    a_mnt = fp16_normalise(a_mnt, &a_exp);
13118SEdmund.Grimley-Evans@arm.com    if (a_exp & 1) {
13118SEdmund.Grimley-Evans@arm.com        ++a_exp;
13118SEdmund.Grimley-Evans@arm.com        a_mnt >>= 1;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // x = (a * 3 + 5) / 8
13118SEdmund.Grimley-Evans@arm.com    x = ((uint32_t)a_mnt << 14) + ((uint32_t)a_mnt << 13) + ((uint32_t)5 << 28);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // x = (a / x + x) / 2; // 8-bit accuracy
13118SEdmund.Grimley-Evans@arm.com    x = (((uint32_t)a_mnt << 16) / (x >> 15) + (x >> 16)) << 15;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // x = (a / x + x) / 2; // 16-bit accuracy
13118SEdmund.Grimley-Evans@arm.com    x = (((uint32_t)a_mnt << 16) / (x >> 15) + (x >> 16)) << 15;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    x_sgn = 0;
13118SEdmund.Grimley-Evans@arm.com    x_exp = (a_exp + 27) >> 1;
13118SEdmund.Grimley-Evans@arm.com    x_mnt = ((x - (1 << 18)) >> 19) + 1;
13118SEdmund.Grimley-Evans@arm.com    t1 = (uint32_t)x_mnt * x_mnt;
13118SEdmund.Grimley-Evans@arm.com    t0 = (uint32_t)a_mnt << 9;
13118SEdmund.Grimley-Evans@arm.com    if (t1 > t0) {
13118SEdmund.Grimley-Evans@arm.com        --x_mnt;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp16_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp, x_mnt << 1 | (t1 != t0), mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_sqrt(uint32_t a, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, x_sgn, x_exp;
10037SARM gem5 Developers    uint32_t a_mnt, x, x_mnt;
10037SARM gem5 Developers    uint64_t t0, t1;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp32_process_NaN(a, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (!a_mnt)
10037SARM gem5 Developers        return fp32_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP32_EXP_INF && !a_sgn)
10037SARM gem5 Developers        return fp32_infinity(a_sgn);
10037SARM gem5 Developers    if (a_sgn) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp32_defaultNaN();
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    a_mnt = fp32_normalise(a_mnt, &a_exp);
10037SARM gem5 Developers    if (!(a_exp & 1)) {
10037SARM gem5 Developers        ++a_exp;
10037SARM gem5 Developers        a_mnt >>= 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a * 3 + 5) / 8
13118SEdmund.Grimley-Evans@arm.com    x = (a_mnt >> 2) + (a_mnt >> 3) + ((uint32_t)5 << 28);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // x = (a / x + x) / 2; // 8-bit accuracy
10037SARM gem5 Developers    x = (a_mnt / (x >> 15) + (x >> 16)) << 15;
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a / x + x) / 2; // 16-bit accuracy
10037SARM gem5 Developers    x = (a_mnt / (x >> 15) + (x >> 16)) << 15;
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a / x + x) / 2; // 32-bit accuracy
10037SARM gem5 Developers    x = ((((uint64_t)a_mnt << 32) / x) >> 2) + (x >> 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    x_sgn = 0;
10037SARM gem5 Developers    x_exp = (a_exp + 147) >> 1;
10037SARM gem5 Developers    x_mnt = ((x - (1 << 5)) >> 6) + 1;
10037SARM gem5 Developers    t1 = (uint64_t)x_mnt * x_mnt;
10037SARM gem5 Developers    t0 = (uint64_t)a_mnt << 19;
10037SARM gem5 Developers    if (t1 > t0) {
10037SARM gem5 Developers        --x_mnt;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp32_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_round(x_sgn, x_exp, x_mnt << 1 | (t1 != t0), mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_sqrt(uint64_t a, int mode, int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int a_sgn, a_exp, x_sgn, x_exp, c;
10037SARM gem5 Developers    uint64_t a_mnt, x_mnt, r, x0, x1;
10037SARM gem5 Developers    uint32_t x;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&a_sgn, &a_exp, &a_mnt, a, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle NaNs:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(a_exp, a_mnt))
10037SARM gem5 Developers        return fp64_process_NaN(a, mode, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle infinities and zeroes:
10037SARM gem5 Developers    if (!a_mnt)
10037SARM gem5 Developers        return fp64_zero(a_sgn);
13118SEdmund.Grimley-Evans@arm.com    if (a_exp == FP64_EXP_INF && !a_sgn)
10037SARM gem5 Developers        return fp64_infinity(a_sgn);
10037SARM gem5 Developers    if (a_sgn) {
10037SARM gem5 Developers        *flags |= FPLIB_IOC;
10037SARM gem5 Developers        return fp64_defaultNaN();
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    a_mnt = fp64_normalise(a_mnt, &a_exp);
10037SARM gem5 Developers    if (a_exp & 1) {
10037SARM gem5 Developers        ++a_exp;
10037SARM gem5 Developers        a_mnt >>= 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a * 3 + 5) / 8
13118SEdmund.Grimley-Evans@arm.com    x = (a_mnt >> 34) + (a_mnt >> 35) + ((uint32_t)5 << 28);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // x = (a / x + x) / 2; // 8-bit accuracy
10037SARM gem5 Developers    x = ((a_mnt >> 32) / (x >> 15) + (x >> 16)) << 15;
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a / x + x) / 2; // 16-bit accuracy
10037SARM gem5 Developers    x = ((a_mnt >> 32) / (x >> 15) + (x >> 16)) << 15;
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (a / x + x) / 2; // 32-bit accuracy
10037SARM gem5 Developers    x = ((a_mnt / x) >> 2) + (x >> 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    // r = 1 / x; // 32-bit accuracy
10037SARM gem5 Developers    r = ((uint64_t)1 << 62) / x;
10037SARM gem5 Developers
10037SARM gem5 Developers    // r = r * (2 - x * r); // 64-bit accuracy
10037SARM gem5 Developers    mul64x32(&x0, &x1, -(uint64_t)x * r << 1, r);
10037SARM gem5 Developers    lsr128(&x0, &x1, x0, x1, 31);
10037SARM gem5 Developers
10037SARM gem5 Developers    // x = (x + a * r) / 2; // 64-bit accuracy
10037SARM gem5 Developers    mul62x62(&x0, &x1, a_mnt >> 10, x0 >> 2);
10037SARM gem5 Developers    lsl128(&x0, &x1, x0, x1, 5);
10037SARM gem5 Developers    lsr128(&x0, &x1, x0, x1, 56);
10037SARM gem5 Developers
10037SARM gem5 Developers    x0 = ((uint64_t)x << 31) + (x0 >> 1);
10037SARM gem5 Developers
10037SARM gem5 Developers    x_sgn = 0;
10037SARM gem5 Developers    x_exp = (a_exp + 1053) >> 1;
10037SARM gem5 Developers    x_mnt = x0;
10037SARM gem5 Developers    x_mnt = ((x_mnt - (1 << 8)) >> 9) + 1;
10037SARM gem5 Developers    mul62x62(&x0, &x1, x_mnt, x_mnt);
10037SARM gem5 Developers    lsl128(&x0, &x1, x0, x1, 19);
10037SARM gem5 Developers    c = cmp128(x0, x1, 0, a_mnt);
10037SARM gem5 Developers    if (c > 0)
10037SARM gem5 Developers        --x_mnt;
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_round(x_sgn, x_exp, x_mnt << 1 | !!c, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic int
10037SARM gem5 DevelopersmodeConv(FPSCR fpscr)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    uint32_t x = (uint32_t)fpscr;
13118SEdmund.Grimley-Evans@arm.com    return (x >> 22 & 0xf) | (x >> 19 & 1 ? FPLIB_FZ16 : 0);
13118SEdmund.Grimley-Evans@arm.com    // AHP bit is ignored. Only fplibConvert uses AHP.
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic void
10037SARM gem5 Developersset_fpscr(FPSCR &fpscr, int flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    // translate back to FPSCR
10037SARM gem5 Developers    bool underflow = false;
10037SARM gem5 Developers    if (flags & FPLIB_IDC) {
10037SARM gem5 Developers        fpscr.idc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_IOC) {
10037SARM gem5 Developers        fpscr.ioc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_DZC) {
10037SARM gem5 Developers        fpscr.dzc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_OFC) {
10037SARM gem5 Developers        fpscr.ofc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if (flags & FPLIB_UFC) {
10037SARM gem5 Developers        underflow = true; //xx Why is this required?
10037SARM gem5 Developers        fpscr.ufc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    if ((flags & FPLIB_IXC) && !(underflow && fpscr.fz)) {
10037SARM gem5 Developers        fpscr.ixc = 1;
10037SARM gem5 Developers    }
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
13118SEdmund.Grimley-Evans@arm.comfplibCompareEQ(uint16_t a, uint16_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp16_compare_eq(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.combool
13118SEdmund.Grimley-Evans@arm.comfplibCompareGE(uint16_t a, uint16_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp16_compare_ge(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.combool
13118SEdmund.Grimley-Evans@arm.comfplibCompareGT(uint16_t a, uint16_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp16_compare_gt(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.combool
13118SEdmund.Grimley-Evans@arm.comfplibCompareUN(uint16_t a, uint16_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp16_compare_un(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.combool
10037SARM gem5 DevelopersfplibCompareEQ(uint32_t a, uint32_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp32_compare_eq(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
10037SARM gem5 DevelopersfplibCompareGE(uint32_t a, uint32_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp32_compare_ge(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
10037SARM gem5 DevelopersfplibCompareGT(uint32_t a, uint32_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp32_compare_gt(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
13118SEdmund.Grimley-Evans@arm.comfplibCompareUN(uint32_t a, uint32_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp32_compare_un(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.combool
10037SARM gem5 DevelopersfplibCompareEQ(uint64_t a, uint64_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp64_compare_eq(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
10037SARM gem5 DevelopersfplibCompareGE(uint64_t a, uint64_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp64_compare_ge(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersbool
10037SARM gem5 DevelopersfplibCompareGT(uint64_t a, uint64_t b, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int x = fp64_compare_gt(a, b, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr(fpscr, flags);
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.combool
13118SEdmund.Grimley-Evans@arm.comfplibCompareUN(uint64_t a, uint64_t b, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int x = fp64_compare_un(a, b, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibAbs(uint16_t op)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return op & ~(1ULL << (FP16_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibAbs(uint32_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return op & ~(1ULL << (FP32_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibAbs(uint64_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return op & ~(1ULL << (FP64_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibAdd(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_add(op1, op2, 0, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibAdd(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_add(op1, op2, 0, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibAdd(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_add(op1, op2, 0, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersint
13118SEdmund.Grimley-Evans@arm.comfplibCompare(uint16_t op1, uint16_t op2, bool signal_nans, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2, result;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp1, mnt1) || fp16_is_NaN(exp2, mnt2)) {
10037SARM gem5 Developers        result = 3;
13118SEdmund.Grimley-Evans@arm.com        if (fp16_is_signalling_NaN(exp1, mnt1) ||
13118SEdmund.Grimley-Evans@arm.com            fp16_is_signalling_NaN(exp2, mnt2) || signal_nans)
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        if (op1 == op2 || (!mnt1 && !mnt2)) {
10037SARM gem5 Developers            result = 6;
10037SARM gem5 Developers        } else if (sgn1 != sgn2) {
10037SARM gem5 Developers            result = sgn1 ? 8 : 2;
10037SARM gem5 Developers        } else if (exp1 != exp2) {
10037SARM gem5 Developers            result = sgn1 ^ (exp1 < exp2) ? 8 : 2;
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = sgn1 ^ (mnt1 < mnt2) ? 8 : 2;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersint
13118SEdmund.Grimley-Evans@arm.comfplibCompare(uint32_t op1, uint32_t op2, bool signal_nans, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2, result;
13118SEdmund.Grimley-Evans@arm.com    uint32_t mnt1, mnt2;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp1, mnt1) || fp32_is_NaN(exp2, mnt2)) {
10037SARM gem5 Developers        result = 3;
13118SEdmund.Grimley-Evans@arm.com        if (fp32_is_signalling_NaN(exp1, mnt1) ||
13118SEdmund.Grimley-Evans@arm.com            fp32_is_signalling_NaN(exp2, mnt2) || signal_nans)
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        if (op1 == op2 || (!mnt1 && !mnt2)) {
10037SARM gem5 Developers            result = 6;
10037SARM gem5 Developers        } else if (sgn1 != sgn2) {
10037SARM gem5 Developers            result = sgn1 ? 8 : 2;
10037SARM gem5 Developers        } else if (exp1 != exp2) {
10037SARM gem5 Developers            result = sgn1 ^ (exp1 < exp2) ? 8 : 2;
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = sgn1 ^ (mnt1 < mnt2) ? 8 : 2;
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comint
13118SEdmund.Grimley-Evans@arm.comfplibCompare(uint64_t op1, uint64_t op2, bool signal_nans, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2, result;
13118SEdmund.Grimley-Evans@arm.com    uint64_t mnt1, mnt2;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp1, mnt1) || fp64_is_NaN(exp2, mnt2)) {
13118SEdmund.Grimley-Evans@arm.com        result = 3;
13118SEdmund.Grimley-Evans@arm.com        if (fp64_is_signalling_NaN(exp1, mnt1) ||
13118SEdmund.Grimley-Evans@arm.com            fp64_is_signalling_NaN(exp2, mnt2) || signal_nans)
13118SEdmund.Grimley-Evans@arm.com            flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        if (op1 == op2 || (!mnt1 && !mnt2)) {
13118SEdmund.Grimley-Evans@arm.com            result = 6;
13118SEdmund.Grimley-Evans@arm.com        } else if (sgn1 != sgn2) {
13118SEdmund.Grimley-Evans@arm.com            result = sgn1 ? 8 : 2;
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 != exp2) {
13118SEdmund.Grimley-Evans@arm.com            result = sgn1 ^ (exp1 < exp2) ? 8 : 2;
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            result = sgn1 ^ (mnt1 < mnt2) ? 8 : 2;
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint16_t
10037SARM gem5 Developersfp16_FPConvertNaN_32(uint32_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(op >> (FP32_BITS - 1), FP16_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP16_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     op >> (FP32_MANT_BITS - FP16_MANT_BITS));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint16_t
10037SARM gem5 Developersfp16_FPConvertNaN_64(uint64_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(op >> (FP64_BITS - 1), FP16_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP16_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     op >> (FP64_MANT_BITS - FP16_MANT_BITS));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_FPConvertNaN_16(uint16_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(op >> (FP16_BITS - 1), FP32_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP32_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     (uint32_t)op << (FP32_MANT_BITS - FP16_MANT_BITS));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_FPConvertNaN_64(uint64_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(op >> (FP64_BITS - 1), FP32_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP32_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     op >> (FP64_MANT_BITS - FP32_MANT_BITS));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_FPConvertNaN_16(uint16_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(op >> (FP16_BITS - 1), FP64_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP64_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     (uint64_t)op << (FP64_MANT_BITS - FP16_MANT_BITS));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_FPConvertNaN_32(uint32_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(op >> (FP32_BITS - 1), FP64_EXP_INF,
13118SEdmund.Grimley-Evans@arm.com                     1ULL << (FP64_MANT_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                     (uint64_t)op << (FP64_MANT_BITS - FP32_MANT_BITS));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_FPOnePointFive(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, FP16_EXP_BIAS, 1ULL << (FP16_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_FPOnePointFive(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, FP32_EXP_BIAS, 1ULL << (FP32_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_FPOnePointFive(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, FP64_EXP_BIAS, 1ULL << (FP64_MANT_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_FPThree(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, FP16_EXP_BIAS + 1, 1ULL << (FP16_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_FPThree(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, FP32_EXP_BIAS + 1, 1ULL << (FP32_MANT_BITS - 1));
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_FPThree(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, FP64_EXP_BIAS + 1, 1ULL << (FP64_MANT_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_FPTwo(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, FP16_EXP_BIAS + 1, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_FPTwo(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, FP32_EXP_BIAS + 1, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_FPTwo(int sgn)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, FP64_EXP_BIAS + 1, 0);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint16_t
10037SARM gem5 DevelopersfplibConvert(uint32_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt;
10037SARM gem5 Developers    uint16_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    bool alt_hp = fpscr.ahp;
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        if (alt_hp) {
10037SARM gem5 Developers            result = fp16_zero(sgn);
10037SARM gem5 Developers        } else if (fpscr.dn) {
10037SARM gem5 Developers            result = fp16_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp16_FPConvertNaN_32(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP32_MANT_BITS - 1) & 1) || alt_hp) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP32_EXP_INF) {
10037SARM gem5 Developers        if (alt_hp) {
13118SEdmund.Grimley-Evans@arm.com            result = ((uint16_t)sgn << (FP16_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                      ((1ULL << (FP16_BITS - 1)) - 1));
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp16_infinity(sgn);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp16_zero(sgn);
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            fp16_round_(sgn, exp - FP32_EXP_BIAS + FP16_EXP_BIAS,
13118SEdmund.Grimley-Evans@arm.com                        mnt >> (FP32_MANT_BITS - FP16_BITS) |
13118SEdmund.Grimley-Evans@arm.com                        !!(mnt & ((1ULL << (FP32_MANT_BITS - FP16_BITS)) - 1)),
13118SEdmund.Grimley-Evans@arm.com                        rounding, (mode & 0xf) | alt_hp << 4, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint16_t
10037SARM gem5 DevelopersfplibConvert(uint64_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt;
10037SARM gem5 Developers    uint16_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    bool alt_hp = fpscr.ahp;
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        if (alt_hp) {
10037SARM gem5 Developers            result = fp16_zero(sgn);
10037SARM gem5 Developers        } else if (fpscr.dn) {
10037SARM gem5 Developers            result = fp16_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp16_FPConvertNaN_64(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP64_MANT_BITS - 1) & 1) || alt_hp) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP64_EXP_INF) {
10037SARM gem5 Developers        if (alt_hp) {
13118SEdmund.Grimley-Evans@arm.com            result = ((uint16_t)sgn << (FP16_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com                      ((1ULL << (FP16_BITS - 1)) - 1));
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp16_infinity(sgn);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp16_zero(sgn);
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            fp16_round_(sgn, exp - FP64_EXP_BIAS + FP16_EXP_BIAS,
13118SEdmund.Grimley-Evans@arm.com                        mnt >> (FP64_MANT_BITS - FP16_BITS) |
13118SEdmund.Grimley-Evans@arm.com                        !!(mnt & ((1ULL << (FP64_MANT_BITS - FP16_BITS)) - 1)),
13118SEdmund.Grimley-Evans@arm.com                        rounding, (mode & 0xf) | alt_hp << 4, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibConvert(uint16_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint16_t mnt;
10037SARM gem5 Developers    uint32_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode & 0xf, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt) && !fpscr.ahp) {
10037SARM gem5 Developers        if (fpscr.dn) {
10037SARM gem5 Developers            result = fp32_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp32_FPConvertNaN_16(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP16_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP16_EXP_INF && !fpscr.ahp) {
10037SARM gem5 Developers        result = fp32_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp32_zero(sgn);
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        mnt = fp16_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        result = fp32_pack(sgn, (exp - FP16_EXP_BIAS +
13118SEdmund.Grimley-Evans@arm.com                                 FP32_EXP_BIAS + FP16_EXP_BITS),
13118SEdmund.Grimley-Evans@arm.com                           (uint32_t)mnt << (FP32_MANT_BITS - FP16_BITS + 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibConvert(uint64_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt;
10037SARM gem5 Developers    uint32_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        if (fpscr.dn) {
10037SARM gem5 Developers            result = fp32_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp32_FPConvertNaN_64(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP64_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP64_EXP_INF) {
10037SARM gem5 Developers        result = fp32_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp32_zero(sgn);
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            fp32_round_(sgn, exp - FP64_EXP_BIAS + FP32_EXP_BIAS,
13118SEdmund.Grimley-Evans@arm.com                        mnt >> (FP64_MANT_BITS - FP32_BITS) |
13118SEdmund.Grimley-Evans@arm.com                        !!(mnt & ((1ULL << (FP64_MANT_BITS - FP32_BITS)) - 1)),
13118SEdmund.Grimley-Evans@arm.com                        rounding, mode, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibConvert(uint16_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint16_t mnt;
10037SARM gem5 Developers    uint64_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode & 0xf, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt) && !fpscr.ahp) {
10037SARM gem5 Developers        if (fpscr.dn) {
10037SARM gem5 Developers            result = fp64_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp64_FPConvertNaN_16(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP16_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP16_EXP_INF && !fpscr.ahp) {
10037SARM gem5 Developers        result = fp64_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp64_zero(sgn);
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        mnt = fp16_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        result = fp64_pack(sgn, (exp - FP16_EXP_BIAS +
13118SEdmund.Grimley-Evans@arm.com                                 FP64_EXP_BIAS + FP16_EXP_BITS),
13118SEdmund.Grimley-Evans@arm.com                           (uint64_t)mnt << (FP64_MANT_BITS - FP16_BITS + 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibConvert(uint32_t op, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt;
10037SARM gem5 Developers    uint64_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack floating-point operand optionally with flush-to-zero:
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        if (fpscr.dn) {
10037SARM gem5 Developers            result = fp64_defaultNaN();
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp64_FPConvertNaN_32(op);
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        if (!(mnt >> (FP32_MANT_BITS - 1) & 1)) {
10037SARM gem5 Developers            flags |= FPLIB_IOC;
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP32_EXP_INF) {
10037SARM gem5 Developers        result = fp64_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp64_zero(sgn);
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        mnt = fp32_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        result = fp64_pack(sgn, (exp - FP32_EXP_BIAS +
13118SEdmund.Grimley-Evans@arm.com                                 FP64_EXP_BIAS + FP32_EXP_BITS),
13118SEdmund.Grimley-Evans@arm.com                           (uint64_t)mnt << (FP64_MANT_BITS - FP32_BITS + 1));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMulAdd(uint16_t addend, uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_muladd(addend, op1, op2, 0, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMulAdd(uint32_t addend, uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_muladd(addend, op1, op2, 0, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMulAdd(uint64_t addend, uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_muladd(addend, op1, op2, 0, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibDiv(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_div(op1, op2, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibDiv(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_div(op1, op2, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibDiv(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_div(op1, op2, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibExpA(uint16_t op)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint16_t coeff[32] = {
13118SEdmund.Grimley-Evans@arm.com        0x0000,
13118SEdmund.Grimley-Evans@arm.com        0x0016,
13118SEdmund.Grimley-Evans@arm.com        0x002d,
13118SEdmund.Grimley-Evans@arm.com        0x0045,
13118SEdmund.Grimley-Evans@arm.com        0x005d,
13118SEdmund.Grimley-Evans@arm.com        0x0075,
13118SEdmund.Grimley-Evans@arm.com        0x008e,
13118SEdmund.Grimley-Evans@arm.com        0x00a8,
13118SEdmund.Grimley-Evans@arm.com        0x00c2,
13118SEdmund.Grimley-Evans@arm.com        0x00dc,
13118SEdmund.Grimley-Evans@arm.com        0x00f8,
13118SEdmund.Grimley-Evans@arm.com        0x0114,
13118SEdmund.Grimley-Evans@arm.com        0x0130,
13118SEdmund.Grimley-Evans@arm.com        0x014d,
13118SEdmund.Grimley-Evans@arm.com        0x016b,
13118SEdmund.Grimley-Evans@arm.com        0x0189,
13118SEdmund.Grimley-Evans@arm.com        0x01a8,
13118SEdmund.Grimley-Evans@arm.com        0x01c8,
13118SEdmund.Grimley-Evans@arm.com        0x01e8,
13118SEdmund.Grimley-Evans@arm.com        0x0209,
13118SEdmund.Grimley-Evans@arm.com        0x022b,
13118SEdmund.Grimley-Evans@arm.com        0x024e,
13118SEdmund.Grimley-Evans@arm.com        0x0271,
13118SEdmund.Grimley-Evans@arm.com        0x0295,
13118SEdmund.Grimley-Evans@arm.com        0x02ba,
13118SEdmund.Grimley-Evans@arm.com        0x02e0,
13118SEdmund.Grimley-Evans@arm.com        0x0306,
13118SEdmund.Grimley-Evans@arm.com        0x032e,
13118SEdmund.Grimley-Evans@arm.com        0x0356,
13118SEdmund.Grimley-Evans@arm.com        0x037f,
13118SEdmund.Grimley-Evans@arm.com        0x03a9,
13118SEdmund.Grimley-Evans@arm.com        0x03d4
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    return ((((op >> 5) & ((1 << FP16_EXP_BITS) - 1)) << FP16_MANT_BITS) |
13118SEdmund.Grimley-Evans@arm.com            coeff[op & ((1 << 5) - 1)]);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibExpA(uint32_t op)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint32_t coeff[64] = {
13118SEdmund.Grimley-Evans@arm.com        0x000000,
13118SEdmund.Grimley-Evans@arm.com        0x0164d2,
13118SEdmund.Grimley-Evans@arm.com        0x02cd87,
13118SEdmund.Grimley-Evans@arm.com        0x043a29,
13118SEdmund.Grimley-Evans@arm.com        0x05aac3,
13118SEdmund.Grimley-Evans@arm.com        0x071f62,
13118SEdmund.Grimley-Evans@arm.com        0x08980f,
13118SEdmund.Grimley-Evans@arm.com        0x0a14d5,
13118SEdmund.Grimley-Evans@arm.com        0x0b95c2,
13118SEdmund.Grimley-Evans@arm.com        0x0d1adf,
13118SEdmund.Grimley-Evans@arm.com        0x0ea43a,
13118SEdmund.Grimley-Evans@arm.com        0x1031dc,
13118SEdmund.Grimley-Evans@arm.com        0x11c3d3,
13118SEdmund.Grimley-Evans@arm.com        0x135a2b,
13118SEdmund.Grimley-Evans@arm.com        0x14f4f0,
13118SEdmund.Grimley-Evans@arm.com        0x16942d,
13118SEdmund.Grimley-Evans@arm.com        0x1837f0,
13118SEdmund.Grimley-Evans@arm.com        0x19e046,
13118SEdmund.Grimley-Evans@arm.com        0x1b8d3a,
13118SEdmund.Grimley-Evans@arm.com        0x1d3eda,
13118SEdmund.Grimley-Evans@arm.com        0x1ef532,
13118SEdmund.Grimley-Evans@arm.com        0x20b051,
13118SEdmund.Grimley-Evans@arm.com        0x227043,
13118SEdmund.Grimley-Evans@arm.com        0x243516,
13118SEdmund.Grimley-Evans@arm.com        0x25fed7,
13118SEdmund.Grimley-Evans@arm.com        0x27cd94,
13118SEdmund.Grimley-Evans@arm.com        0x29a15b,
13118SEdmund.Grimley-Evans@arm.com        0x2b7a3a,
13118SEdmund.Grimley-Evans@arm.com        0x2d583f,
13118SEdmund.Grimley-Evans@arm.com        0x2f3b79,
13118SEdmund.Grimley-Evans@arm.com        0x3123f6,
13118SEdmund.Grimley-Evans@arm.com        0x3311c4,
13118SEdmund.Grimley-Evans@arm.com        0x3504f3,
13118SEdmund.Grimley-Evans@arm.com        0x36fd92,
13118SEdmund.Grimley-Evans@arm.com        0x38fbaf,
13118SEdmund.Grimley-Evans@arm.com        0x3aff5b,
13118SEdmund.Grimley-Evans@arm.com        0x3d08a4,
13118SEdmund.Grimley-Evans@arm.com        0x3f179a,
13118SEdmund.Grimley-Evans@arm.com        0x412c4d,
13118SEdmund.Grimley-Evans@arm.com        0x4346cd,
13118SEdmund.Grimley-Evans@arm.com        0x45672a,
13118SEdmund.Grimley-Evans@arm.com        0x478d75,
13118SEdmund.Grimley-Evans@arm.com        0x49b9be,
13118SEdmund.Grimley-Evans@arm.com        0x4bec15,
13118SEdmund.Grimley-Evans@arm.com        0x4e248c,
13118SEdmund.Grimley-Evans@arm.com        0x506334,
13118SEdmund.Grimley-Evans@arm.com        0x52a81e,
13118SEdmund.Grimley-Evans@arm.com        0x54f35b,
13118SEdmund.Grimley-Evans@arm.com        0x5744fd,
13118SEdmund.Grimley-Evans@arm.com        0x599d16,
13118SEdmund.Grimley-Evans@arm.com        0x5bfbb8,
13118SEdmund.Grimley-Evans@arm.com        0x5e60f5,
13118SEdmund.Grimley-Evans@arm.com        0x60ccdf,
13118SEdmund.Grimley-Evans@arm.com        0x633f89,
13118SEdmund.Grimley-Evans@arm.com        0x65b907,
13118SEdmund.Grimley-Evans@arm.com        0x68396a,
13118SEdmund.Grimley-Evans@arm.com        0x6ac0c7,
13118SEdmund.Grimley-Evans@arm.com        0x6d4f30,
13118SEdmund.Grimley-Evans@arm.com        0x6fe4ba,
13118SEdmund.Grimley-Evans@arm.com        0x728177,
13118SEdmund.Grimley-Evans@arm.com        0x75257d,
13118SEdmund.Grimley-Evans@arm.com        0x77d0df,
13118SEdmund.Grimley-Evans@arm.com        0x7a83b3,
13118SEdmund.Grimley-Evans@arm.com        0x7d3e0c
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    return ((((op >> 6) & ((1 << FP32_EXP_BITS) - 1)) << FP32_MANT_BITS) |
13118SEdmund.Grimley-Evans@arm.com            coeff[op & ((1 << 6) - 1)]);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibExpA(uint64_t op)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint64_t coeff[64] = {
13118SEdmund.Grimley-Evans@arm.com        0x0000000000000ULL,
13118SEdmund.Grimley-Evans@arm.com        0x02c9a3e778061ULL,
13118SEdmund.Grimley-Evans@arm.com        0x059b0d3158574ULL,
13118SEdmund.Grimley-Evans@arm.com        0x0874518759bc8ULL,
13118SEdmund.Grimley-Evans@arm.com        0x0b5586cf9890fULL,
13118SEdmund.Grimley-Evans@arm.com        0x0e3ec32d3d1a2ULL,
13118SEdmund.Grimley-Evans@arm.com        0x11301d0125b51ULL,
13118SEdmund.Grimley-Evans@arm.com        0x1429aaea92de0ULL,
13118SEdmund.Grimley-Evans@arm.com        0x172b83c7d517bULL,
13118SEdmund.Grimley-Evans@arm.com        0x1a35beb6fcb75ULL,
13118SEdmund.Grimley-Evans@arm.com        0x1d4873168b9aaULL,
13118SEdmund.Grimley-Evans@arm.com        0x2063b88628cd6ULL,
13118SEdmund.Grimley-Evans@arm.com        0x2387a6e756238ULL,
13118SEdmund.Grimley-Evans@arm.com        0x26b4565e27cddULL,
13118SEdmund.Grimley-Evans@arm.com        0x29e9df51fdee1ULL,
13118SEdmund.Grimley-Evans@arm.com        0x2d285a6e4030bULL,
13118SEdmund.Grimley-Evans@arm.com        0x306fe0a31b715ULL,
13118SEdmund.Grimley-Evans@arm.com        0x33c08b26416ffULL,
13118SEdmund.Grimley-Evans@arm.com        0x371a7373aa9cbULL,
13118SEdmund.Grimley-Evans@arm.com        0x3a7db34e59ff7ULL,
13118SEdmund.Grimley-Evans@arm.com        0x3dea64c123422ULL,
13118SEdmund.Grimley-Evans@arm.com        0x4160a21f72e2aULL,
13118SEdmund.Grimley-Evans@arm.com        0x44e086061892dULL,
13118SEdmund.Grimley-Evans@arm.com        0x486a2b5c13cd0ULL,
13118SEdmund.Grimley-Evans@arm.com        0x4bfdad5362a27ULL,
13118SEdmund.Grimley-Evans@arm.com        0x4f9b2769d2ca7ULL,
13118SEdmund.Grimley-Evans@arm.com        0x5342b569d4f82ULL,
13118SEdmund.Grimley-Evans@arm.com        0x56f4736b527daULL,
13118SEdmund.Grimley-Evans@arm.com        0x5ab07dd485429ULL,
13118SEdmund.Grimley-Evans@arm.com        0x5e76f15ad2148ULL,
13118SEdmund.Grimley-Evans@arm.com        0x6247eb03a5585ULL,
13118SEdmund.Grimley-Evans@arm.com        0x6623882552225ULL,
13118SEdmund.Grimley-Evans@arm.com        0x6a09e667f3bcdULL,
13118SEdmund.Grimley-Evans@arm.com        0x6dfb23c651a2fULL,
13118SEdmund.Grimley-Evans@arm.com        0x71f75e8ec5f74ULL,
13118SEdmund.Grimley-Evans@arm.com        0x75feb564267c9ULL,
13118SEdmund.Grimley-Evans@arm.com        0x7a11473eb0187ULL,
13118SEdmund.Grimley-Evans@arm.com        0x7e2f336cf4e62ULL,
13118SEdmund.Grimley-Evans@arm.com        0x82589994cce13ULL,
13118SEdmund.Grimley-Evans@arm.com        0x868d99b4492edULL,
13118SEdmund.Grimley-Evans@arm.com        0x8ace5422aa0dbULL,
13118SEdmund.Grimley-Evans@arm.com        0x8f1ae99157736ULL,
13118SEdmund.Grimley-Evans@arm.com        0x93737b0cdc5e5ULL,
13118SEdmund.Grimley-Evans@arm.com        0x97d829fde4e50ULL,
13118SEdmund.Grimley-Evans@arm.com        0x9c49182a3f090ULL,
13118SEdmund.Grimley-Evans@arm.com        0xa0c667b5de565ULL,
13118SEdmund.Grimley-Evans@arm.com        0xa5503b23e255dULL,
13118SEdmund.Grimley-Evans@arm.com        0xa9e6b5579fdbfULL,
13118SEdmund.Grimley-Evans@arm.com        0xae89f995ad3adULL,
13118SEdmund.Grimley-Evans@arm.com        0xb33a2b84f15fbULL,
13118SEdmund.Grimley-Evans@arm.com        0xb7f76f2fb5e47ULL,
13118SEdmund.Grimley-Evans@arm.com        0xbcc1e904bc1d2ULL,
13118SEdmund.Grimley-Evans@arm.com        0xc199bdd85529cULL,
13118SEdmund.Grimley-Evans@arm.com        0xc67f12e57d14bULL,
13118SEdmund.Grimley-Evans@arm.com        0xcb720dcef9069ULL,
13118SEdmund.Grimley-Evans@arm.com        0xd072d4a07897cULL,
13118SEdmund.Grimley-Evans@arm.com        0xd5818dcfba487ULL,
13118SEdmund.Grimley-Evans@arm.com        0xda9e603db3285ULL,
13118SEdmund.Grimley-Evans@arm.com        0xdfc97337b9b5fULL,
13118SEdmund.Grimley-Evans@arm.com        0xe502ee78b3ff6ULL,
13118SEdmund.Grimley-Evans@arm.com        0xea4afa2a490daULL,
13118SEdmund.Grimley-Evans@arm.com        0xefa1bee615a27ULL,
13118SEdmund.Grimley-Evans@arm.com        0xf50765b6e4540ULL,
13118SEdmund.Grimley-Evans@arm.com        0xfa7c1819e90d8ULL
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    return ((((op >> 6) & ((1 << FP64_EXP_BITS) - 1)) << FP64_MANT_BITS) |
13118SEdmund.Grimley-Evans@arm.com            coeff[op & ((1 << 6) - 1)]);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_repack(int sgn, int exp, uint16_t mnt)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_pack(sgn, mnt >> FP16_MANT_BITS ? exp : 0, mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_repack(int sgn, int exp, uint32_t mnt)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp32_pack(sgn, mnt >> FP32_MANT_BITS ? exp : 0, mnt);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_repack(int sgn, int exp, uint64_t mnt)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return fp64_pack(sgn, mnt >> FP64_MANT_BITS ? exp : 0, mnt);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comstatic void
13118SEdmund.Grimley-Evans@arm.comfp16_minmaxnum(uint16_t *op1, uint16_t *op2, int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    // Treat a single quiet-NaN as +Infinity/-Infinity
13118SEdmund.Grimley-Evans@arm.com    if (!((uint16_t)~(*op1 << 1) >> FP16_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint16_t)~(*op2 << 1) >> FP16_MANT_BITS)
13118SEdmund.Grimley-Evans@arm.com        *op1 = fp16_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com    if (!((uint16_t)~(*op2 << 1) >> FP16_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint16_t)~(*op1 << 1) >> FP16_MANT_BITS)
13118SEdmund.Grimley-Evans@arm.com        *op2 = fp16_infinity(sgn);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic void
10037SARM gem5 Developersfp32_minmaxnum(uint32_t *op1, uint32_t *op2, int sgn)
10037SARM gem5 Developers{
10037SARM gem5 Developers    // Treat a single quiet-NaN as +Infinity/-Infinity
13118SEdmund.Grimley-Evans@arm.com    if (!((uint32_t)~(*op1 << 1) >> FP32_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint32_t)~(*op2 << 1) >> FP32_MANT_BITS)
10037SARM gem5 Developers        *op1 = fp32_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com    if (!((uint32_t)~(*op2 << 1) >> FP32_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint32_t)~(*op1 << 1) >> FP32_MANT_BITS)
10037SARM gem5 Developers        *op2 = fp32_infinity(sgn);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic void
10037SARM gem5 Developersfp64_minmaxnum(uint64_t *op1, uint64_t *op2, int sgn)
10037SARM gem5 Developers{
10037SARM gem5 Developers    // Treat a single quiet-NaN as +Infinity/-Infinity
13118SEdmund.Grimley-Evans@arm.com    if (!((uint64_t)~(*op1 << 1) >> FP64_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint64_t)~(*op2 << 1) >> FP64_MANT_BITS)
10037SARM gem5 Developers        *op1 = fp64_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com    if (!((uint64_t)~(*op2 << 1) >> FP64_MANT_BITS) &&
13118SEdmund.Grimley-Evans@arm.com        (uint64_t)~(*op1 << 1) >> FP64_MANT_BITS)
10037SARM gem5 Developers        *op2 = fp64_infinity(sgn);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMax(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2, x, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if ((x = fp16_process_NaNs(op1, op2, mode, &flags))) {
13118SEdmund.Grimley-Evans@arm.com        result = x;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        result = ((sgn1 != sgn2 ? sgn2 : sgn1 ^ (op1 > op2)) ?
13118SEdmund.Grimley-Evans@arm.com                  fp16_repack(sgn1, exp1, mnt1) :
13118SEdmund.Grimley-Evans@arm.com                  fp16_repack(sgn2, exp2, mnt2));
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMax(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint32_t mnt1, mnt2, x, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp32_process_NaNs(op1, op2, mode, &flags))) {
10037SARM gem5 Developers        result = x;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        result = ((sgn1 != sgn2 ? sgn2 : sgn1 ^ (op1 > op2)) ?
10037SARM gem5 Developers                  fp32_repack(sgn1, exp1, mnt1) :
10037SARM gem5 Developers                  fp32_repack(sgn2, exp2, mnt2));
10037SARM gem5 Developers    }
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMax(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint64_t mnt1, mnt2, x, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp64_process_NaNs(op1, op2, mode, &flags))) {
10037SARM gem5 Developers        result = x;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        result = ((sgn1 != sgn2 ? sgn2 : sgn1 ^ (op1 > op2)) ?
10037SARM gem5 Developers                  fp64_repack(sgn1, exp1, mnt1) :
10037SARM gem5 Developers                  fp64_repack(sgn2, exp2, mnt2));
10037SARM gem5 Developers    }
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMaxNum(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    fp16_minmaxnum(&op1, &op2, 1);
13118SEdmund.Grimley-Evans@arm.com    return fplibMax<uint16_t>(op1, op2, fpscr);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMaxNum(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    fp32_minmaxnum(&op1, &op2, 1);
10037SARM gem5 Developers    return fplibMax<uint32_t>(op1, op2, fpscr);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMaxNum(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    fp64_minmaxnum(&op1, &op2, 1);
10037SARM gem5 Developers    return fplibMax<uint64_t>(op1, op2, fpscr);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMin(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2, x, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if ((x = fp16_process_NaNs(op1, op2, mode, &flags))) {
13118SEdmund.Grimley-Evans@arm.com        result = x;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        result = ((sgn1 != sgn2 ? sgn1 : sgn1 ^ (op1 < op2)) ?
13118SEdmund.Grimley-Evans@arm.com                  fp16_repack(sgn1, exp1, mnt1) :
13118SEdmund.Grimley-Evans@arm.com                  fp16_repack(sgn2, exp2, mnt2));
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMin(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint32_t mnt1, mnt2, x, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp32_process_NaNs(op1, op2, mode, &flags))) {
10037SARM gem5 Developers        result = x;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        result = ((sgn1 != sgn2 ? sgn1 : sgn1 ^ (op1 < op2)) ?
10037SARM gem5 Developers                  fp32_repack(sgn1, exp1, mnt1) :
10037SARM gem5 Developers                  fp32_repack(sgn2, exp2, mnt2));
10037SARM gem5 Developers    }
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMin(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint64_t mnt1, mnt2, x, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    if ((x = fp64_process_NaNs(op1, op2, mode, &flags))) {
10037SARM gem5 Developers        result = x;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        result = ((sgn1 != sgn2 ? sgn1 : sgn1 ^ (op1 < op2)) ?
10037SARM gem5 Developers                  fp64_repack(sgn1, exp1, mnt1) :
10037SARM gem5 Developers                  fp64_repack(sgn2, exp2, mnt2));
10037SARM gem5 Developers    }
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMinNum(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    fp16_minmaxnum(&op1, &op2, 0);
13118SEdmund.Grimley-Evans@arm.com    return fplibMin<uint16_t>(op1, op2, fpscr);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMinNum(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    fp32_minmaxnum(&op1, &op2, 0);
10037SARM gem5 Developers    return fplibMin<uint32_t>(op1, op2, fpscr);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMinNum(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    fp64_minmaxnum(&op1, &op2, 0);
10037SARM gem5 Developers    return fplibMin<uint64_t>(op1, op2, fpscr);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMul(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_mul(op1, op2, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMul(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_mul(op1, op2, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMul(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_mul(op1, op2, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibMulX(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    result = fp16_process_NaNs(op1, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP16_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP16_EXP_INF && !mnt1)) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_FPTwo(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP16_EXP_INF || exp2 == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_infinity(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else if (!mnt1 || !mnt2) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_zero(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_mul(op1, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibMulX(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint32_t mnt1, mnt2, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    result = fp32_process_NaNs(op1, op2, mode, &flags);
10037SARM gem5 Developers    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP32_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP32_EXP_INF && !mnt1)) {
10037SARM gem5 Developers            result = fp32_FPTwo(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP32_EXP_INF || exp2 == FP32_EXP_INF) {
10037SARM gem5 Developers            result = fp32_infinity(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else if (!mnt1 || !mnt2) {
10037SARM gem5 Developers            result = fp32_zero(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp32_mul(op1, op2, mode, &flags);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibMulX(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint64_t mnt1, mnt2, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    result = fp64_process_NaNs(op1, op2, mode, &flags);
10037SARM gem5 Developers    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP64_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP64_EXP_INF && !mnt1)) {
10037SARM gem5 Developers            result = fp64_FPTwo(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP64_EXP_INF || exp2 == FP64_EXP_INF) {
10037SARM gem5 Developers            result = fp64_infinity(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else if (!mnt1 || !mnt2) {
10037SARM gem5 Developers            result = fp64_zero(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp64_mul(op1, op2, mode, &flags);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibNeg(uint16_t op)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return op ^ 1ULL << (FP16_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibNeg(uint32_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return op ^ 1ULL << (FP32_BITS - 1);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibNeg(uint64_t op)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    return op ^ 1ULL << (FP64_BITS - 1);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic const uint8_t recip_sqrt_estimate[256] = {
10037SARM gem5 Developers    255, 253, 251, 249, 247, 245, 243, 242, 240, 238, 236, 234, 233, 231, 229, 228,
10037SARM gem5 Developers    226, 224, 223, 221, 219, 218, 216, 215, 213, 212, 210, 209, 207, 206, 204, 203,
10037SARM gem5 Developers    201, 200, 198, 197, 196, 194, 193, 192, 190, 189, 188, 186, 185, 184, 183, 181,
10037SARM gem5 Developers    180, 179, 178, 176, 175, 174, 173, 172, 170, 169, 168, 167, 166, 165, 164, 163,
10037SARM gem5 Developers    162, 160, 159, 158, 157, 156, 155, 154, 153, 152, 151, 150, 149, 148, 147, 146,
10037SARM gem5 Developers    145, 144, 143, 142, 141, 140, 140, 139, 138, 137, 136, 135, 134, 133, 132, 131,
10037SARM gem5 Developers    131, 130, 129, 128, 127, 126, 126, 125, 124, 123, 122, 121, 121, 120, 119, 118,
10037SARM gem5 Developers    118, 117, 116, 115, 114, 114, 113, 112, 111, 111, 110, 109, 109, 108, 107, 106,
10037SARM gem5 Developers    105, 104, 103, 101, 100,  99,  97,  96,  95,  93,  92,  91,  90,  88,  87,  86,
10037SARM gem5 Developers    85,  84,  82,  81,  80,  79,  78,  77,  76,  75,  74,  72,  71,  70,  69,  68,
10037SARM gem5 Developers    67,  66,  65,  64,  63,  62,  61,  60,  60,  59,  58,  57,  56,  55,  54,  53,
10037SARM gem5 Developers    52,  51,  51,  50,  49,  48,  47,  46,  46,  45,  44,  43,  42,  42,  41,  40,
10037SARM gem5 Developers    39,  38,  38,  37,  36,  35,  35,  34,  33,  33,  32,  31,  30,  30,  29,  28,
10037SARM gem5 Developers    28,  27,  26,  26,  25,  24,  24,  23,  22,  22,  21,  20,  20,  19,  19,  18,
10037SARM gem5 Developers    17,  17,  16,  16,  15,  14,  14,  13,  13,  12,  11,  11,  10,  10,   9,   9,
10037SARM gem5 Developers    8,   8,   7,   6,   6,   5,   5,   4,   4,   3,   3,   2,   2,   1,   1,   0
10037SARM gem5 Developers};
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRSqrtEstimate(uint16_t op, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (!mnt) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com        flags |= FPLIB_DZC;
13118SEdmund.Grimley-Evans@arm.com    } else if (sgn) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com        flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_zero(0);
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP16_EXP_BITS;
13118SEdmund.Grimley-Evans@arm.com        mnt = fp16_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        mnt = recip_sqrt_estimate[(~exp & 1) << 7 |
13118SEdmund.Grimley-Evans@arm.com                                  (mnt >> (FP16_BITS - 8) & 127)];
13118SEdmund.Grimley-Evans@arm.com        result = fp16_pack(0, (3 * FP16_EXP_BIAS - exp - 1) >> 1,
13118SEdmund.Grimley-Evans@arm.com                           mnt << (FP16_MANT_BITS - 8));
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibRSqrtEstimate(uint32_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp32_process_NaN(op, mode, &flags);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp32_infinity(sgn);
10037SARM gem5 Developers        flags |= FPLIB_DZC;
10037SARM gem5 Developers    } else if (sgn) {
10037SARM gem5 Developers        result = fp32_defaultNaN();
10037SARM gem5 Developers        flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP32_EXP_INF) {
10037SARM gem5 Developers        result = fp32_zero(0);
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP32_EXP_BITS;
10037SARM gem5 Developers        mnt = fp32_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        mnt = recip_sqrt_estimate[(~exp & 1) << 7 |
13118SEdmund.Grimley-Evans@arm.com                                  (mnt >> (FP32_BITS - 8) & 127)];
13118SEdmund.Grimley-Evans@arm.com        result = fp32_pack(0, (3 * FP32_EXP_BIAS - exp - 1) >> 1,
13118SEdmund.Grimley-Evans@arm.com                           mnt << (FP32_MANT_BITS - 8));
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibRSqrtEstimate(uint64_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp64_process_NaN(op, mode, &flags);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp64_infinity(sgn);
10037SARM gem5 Developers        flags |= FPLIB_DZC;
10037SARM gem5 Developers    } else if (sgn) {
10037SARM gem5 Developers        result = fp64_defaultNaN();
10037SARM gem5 Developers        flags |= FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP64_EXP_INF) {
10037SARM gem5 Developers        result = fp32_zero(0);
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP64_EXP_BITS;
10037SARM gem5 Developers        mnt = fp64_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        mnt = recip_sqrt_estimate[(~exp & 1) << 7 |
13118SEdmund.Grimley-Evans@arm.com                                  (mnt >> (FP64_BITS - 8) & 127)];
13118SEdmund.Grimley-Evans@arm.com        result = fp64_pack(0, (3 * FP64_EXP_BIAS - exp - 1) >> 1,
13118SEdmund.Grimley-Evans@arm.com                           mnt << (FP64_MANT_BITS - 8));
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRSqrtStepFused(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    op1 = fplibNeg<uint16_t>(op1);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    result = fp16_process_NaNs(op1, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP16_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP16_EXP_INF && !mnt1)) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_FPOnePointFive(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP16_EXP_INF || exp2 == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_infinity(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_muladd(fp16_FPThree(0), op1, op2, -1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibRSqrtStepFused(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint32_t mnt1, mnt2, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    op1 = fplibNeg<uint32_t>(op1);
10037SARM gem5 Developers    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    result = fp32_process_NaNs(op1, op2, mode, &flags);
10037SARM gem5 Developers    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP32_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP32_EXP_INF && !mnt1)) {
10037SARM gem5 Developers            result = fp32_FPOnePointFive(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP32_EXP_INF || exp2 == FP32_EXP_INF) {
10037SARM gem5 Developers            result = fp32_infinity(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp32_muladd(fp32_FPThree(0), op1, op2, -1, mode, &flags);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibRSqrtStepFused(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint64_t mnt1, mnt2, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    op1 = fplibNeg<uint64_t>(op1);
10037SARM gem5 Developers    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    result = fp64_process_NaNs(op1, op2, mode, &flags);
10037SARM gem5 Developers    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP64_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP64_EXP_INF && !mnt1)) {
10037SARM gem5 Developers            result = fp64_FPOnePointFive(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP64_EXP_INF || exp2 == FP64_EXP_INF) {
10037SARM gem5 Developers            result = fp64_infinity(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp64_muladd(fp64_FPThree(0), op1, op2, -1, mode, &flags);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRecipEstimate(uint16_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (!mnt) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com        flags |= FPLIB_DZC;
13118SEdmund.Grimley-Evans@arm.com    } else if (!((uint16_t)(op << 1) >> (FP16_MANT_BITS - 1))) {
13118SEdmund.Grimley-Evans@arm.com        bool overflow_to_inf = false;
13118SEdmund.Grimley-Evans@arm.com        switch (FPCRRounding(fpscr)) {
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_TIEEVEN:
13118SEdmund.Grimley-Evans@arm.com            overflow_to_inf = true;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_POSINF:
13118SEdmund.Grimley-Evans@arm.com            overflow_to_inf = !sgn;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_NEGINF:
13118SEdmund.Grimley-Evans@arm.com            overflow_to_inf = sgn;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_ZERO:
13118SEdmund.Grimley-Evans@arm.com            overflow_to_inf = false;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers        }
13118SEdmund.Grimley-Evans@arm.com        result = overflow_to_inf ? fp16_infinity(sgn) : fp16_max_normal(sgn);
13118SEdmund.Grimley-Evans@arm.com        flags |= FPLIB_OFC | FPLIB_IXC;
13118SEdmund.Grimley-Evans@arm.com    } else if (fpscr.fz16 && exp >= 2 * FP16_EXP_BIAS - 1) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com        flags |= FPLIB_UFC;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP16_EXP_BITS;
13118SEdmund.Grimley-Evans@arm.com        mnt = fp16_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        int result_exp = 2 * FP16_EXP_BIAS - 1 - exp;
13118SEdmund.Grimley-Evans@arm.com        uint16_t fraction = (((uint32_t)1 << 19) /
13118SEdmund.Grimley-Evans@arm.com                             (mnt >> (FP16_BITS - 10) | 1) + 1) >> 1;
13118SEdmund.Grimley-Evans@arm.com        fraction <<= FP16_MANT_BITS - 8;
13118SEdmund.Grimley-Evans@arm.com        if (result_exp == 0) {
13118SEdmund.Grimley-Evans@arm.com            fraction >>= 1;
13118SEdmund.Grimley-Evans@arm.com        } else if (result_exp == -1) {
13118SEdmund.Grimley-Evans@arm.com            fraction >>= 2;
13118SEdmund.Grimley-Evans@arm.com            result_exp = 0;
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com        result = fp16_pack(sgn, result_exp, fraction);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibRecipEstimate(uint32_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp32_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP32_EXP_INF) {
10037SARM gem5 Developers        result = fp32_zero(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp32_infinity(sgn);
10037SARM gem5 Developers        flags |= FPLIB_DZC;
13118SEdmund.Grimley-Evans@arm.com    } else if (!((uint32_t)(op << 1) >> (FP32_MANT_BITS - 1))) {
10104Smitch.hayenga@arm.com        bool overflow_to_inf = false;
10037SARM gem5 Developers        switch (FPCRRounding(fpscr)) {
10037SARM gem5 Developers          case FPRounding_TIEEVEN:
10037SARM gem5 Developers            overflow_to_inf = true;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_POSINF:
10037SARM gem5 Developers            overflow_to_inf = !sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_NEGINF:
10037SARM gem5 Developers            overflow_to_inf = sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_ZERO:
10037SARM gem5 Developers            overflow_to_inf = false;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers        }
10037SARM gem5 Developers        result = overflow_to_inf ? fp32_infinity(sgn) : fp32_max_normal(sgn);
10037SARM gem5 Developers        flags |= FPLIB_OFC | FPLIB_IXC;
13118SEdmund.Grimley-Evans@arm.com    } else if (fpscr.fz && exp >= 2 * FP32_EXP_BIAS - 1) {
10037SARM gem5 Developers        result = fp32_zero(sgn);
10037SARM gem5 Developers        flags |= FPLIB_UFC;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP32_EXP_BITS;
10037SARM gem5 Developers        mnt = fp32_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        int result_exp = 2 * FP32_EXP_BIAS - 1 - exp;
13118SEdmund.Grimley-Evans@arm.com        uint32_t fraction = (((uint32_t)1 << 19) /
13118SEdmund.Grimley-Evans@arm.com                             (mnt >> (FP32_BITS - 10) | 1) + 1) >> 1;
13118SEdmund.Grimley-Evans@arm.com        fraction <<= FP32_MANT_BITS - 8;
10037SARM gem5 Developers        if (result_exp == 0) {
10037SARM gem5 Developers            fraction >>= 1;
10037SARM gem5 Developers        } else if (result_exp == -1) {
10037SARM gem5 Developers            fraction >>= 2;
10037SARM gem5 Developers            result_exp = 0;
10037SARM gem5 Developers        }
10037SARM gem5 Developers        result = fp32_pack(sgn, result_exp, fraction);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibRecipEstimate(uint64_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp64_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP64_EXP_INF) {
10037SARM gem5 Developers        result = fp64_zero(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
10037SARM gem5 Developers        result = fp64_infinity(sgn);
10037SARM gem5 Developers        flags |= FPLIB_DZC;
13118SEdmund.Grimley-Evans@arm.com    } else if (!((uint64_t)(op << 1) >> (FP64_MANT_BITS - 1))) {
10104Smitch.hayenga@arm.com        bool overflow_to_inf = false;
10037SARM gem5 Developers        switch (FPCRRounding(fpscr)) {
10037SARM gem5 Developers          case FPRounding_TIEEVEN:
10037SARM gem5 Developers            overflow_to_inf = true;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_POSINF:
10037SARM gem5 Developers            overflow_to_inf = !sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_NEGINF:
10037SARM gem5 Developers            overflow_to_inf = sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_ZERO:
10037SARM gem5 Developers            overflow_to_inf = false;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers        }
10037SARM gem5 Developers        result = overflow_to_inf ? fp64_infinity(sgn) : fp64_max_normal(sgn);
10037SARM gem5 Developers        flags |= FPLIB_OFC | FPLIB_IXC;
13118SEdmund.Grimley-Evans@arm.com    } else if (fpscr.fz && exp >= 2 * FP64_EXP_BIAS - 1) {
10037SARM gem5 Developers        result = fp64_zero(sgn);
10037SARM gem5 Developers        flags |= FPLIB_UFC;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        exp += FP64_EXP_BITS;
10037SARM gem5 Developers        mnt = fp64_normalise(mnt, &exp);
13118SEdmund.Grimley-Evans@arm.com        int result_exp = 2 * FP64_EXP_BIAS - 1 - exp;
13118SEdmund.Grimley-Evans@arm.com        uint64_t fraction = (((uint32_t)1 << 19) /
13118SEdmund.Grimley-Evans@arm.com                             (mnt >> (FP64_BITS - 10) | 1) + 1) >> 1;
13118SEdmund.Grimley-Evans@arm.com        fraction <<= FP64_MANT_BITS - 8;
10037SARM gem5 Developers        if (result_exp == 0) {
10037SARM gem5 Developers            fraction >>= 1;
10037SARM gem5 Developers        } else if (result_exp == -1) {
10037SARM gem5 Developers            fraction >>= 2;
10037SARM gem5 Developers            result_exp = 0;
10037SARM gem5 Developers        }
10037SARM gem5 Developers        result = fp64_pack(sgn, result_exp, fraction);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRecipStepFused(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt1, mnt2, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    op1 = fplibNeg<uint16_t>(op1);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    result = fp16_process_NaNs(op1, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP16_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP16_EXP_INF && !mnt1)) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_FPTwo(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP16_EXP_INF || exp2 == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_infinity(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_muladd(fp16_FPTwo(0), op1, op2, 0, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibRecipStepFused(uint32_t op1, uint32_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn1, exp1, sgn2, exp2;
13118SEdmund.Grimley-Evans@arm.com    uint32_t mnt1, mnt2, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    op1 = fplibNeg<uint32_t>(op1);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    result = fp32_process_NaNs(op1, op2, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP32_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP32_EXP_INF && !mnt1)) {
13118SEdmund.Grimley-Evans@arm.com            result = fp32_FPTwo(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP32_EXP_INF || exp2 == FP32_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com            result = fp32_infinity(sgn1 ^ sgn2);
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            result = fp32_muladd(fp32_FPTwo(0), op1, op2, 0, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibRecipStepFused(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn1, exp1, sgn2, exp2;
10037SARM gem5 Developers    uint64_t mnt1, mnt2, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    op1 = fplibNeg<uint64_t>(op1);
10037SARM gem5 Developers    fp64_unpack(&sgn1, &exp1, &mnt1, op1, mode, &flags);
10037SARM gem5 Developers    fp64_unpack(&sgn2, &exp2, &mnt2, op2, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    result = fp64_process_NaNs(op1, op2, mode, &flags);
10037SARM gem5 Developers    if (!result) {
13118SEdmund.Grimley-Evans@arm.com        if ((exp1 == FP64_EXP_INF && !mnt2) ||
13118SEdmund.Grimley-Evans@arm.com            (exp2 == FP64_EXP_INF && !mnt1)) {
10037SARM gem5 Developers            result = fp64_FPTwo(0);
13118SEdmund.Grimley-Evans@arm.com        } else if (exp1 == FP64_EXP_INF || exp2 == FP64_EXP_INF) {
10037SARM gem5 Developers            result = fp64_infinity(sgn1 ^ sgn2);
10037SARM gem5 Developers        } else {
10037SARM gem5 Developers            result = fp64_muladd(fp64_FPTwo(0), op1, op2, 0, mode, &flags);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRecpX(uint16_t op, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    else {
13118SEdmund.Grimley-Evans@arm.com        if (!mnt) { // Zero and denormals
13118SEdmund.Grimley-Evans@arm.com            result = fp16_pack(sgn, FP16_EXP_INF - 1, 0);
13118SEdmund.Grimley-Evans@arm.com        } else { // Infinities and normals
13118SEdmund.Grimley-Evans@arm.com            result = fp16_pack(sgn, exp ^ FP16_EXP_INF, 0);
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibRecpX(uint32_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp32_process_NaN(op, mode, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers    else {
10037SARM gem5 Developers        if (!mnt) { // Zero and denormals
13118SEdmund.Grimley-Evans@arm.com            result = fp32_pack(sgn, FP32_EXP_INF - 1, 0);
10037SARM gem5 Developers        } else { // Infinities and normals
13118SEdmund.Grimley-Evans@arm.com            result = fp32_pack(sgn, exp ^ FP32_EXP_INF, 0);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibRecpX(uint64_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        result = fp64_process_NaN(op, mode, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers    else {
10037SARM gem5 Developers        if (!mnt) { // Zero and denormals
13118SEdmund.Grimley-Evans@arm.com            result = fp64_pack(sgn, FP64_EXP_INF - 1, 0);
10037SARM gem5 Developers        } else { // Infinities and normals
13118SEdmund.Grimley-Evans@arm.com            result = fp64_pack(sgn, exp ^ FP64_EXP_INF, 0);
10037SARM gem5 Developers        }
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibRoundInt(uint16_t op, FPRounding rounding, bool exact, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int expint = FP16_EXP_BIAS + FP16_MANT_BITS;
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle NaNs, infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP16_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
13118SEdmund.Grimley-Evans@arm.com        result = fp16_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp >= expint) {
10037SARM gem5 Developers        // There are no fractional bits
10037SARM gem5 Developers        result = op;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        // Truncate towards zero:
13118SEdmund.Grimley-Evans@arm.com        uint16_t x = expint - exp >= FP16_BITS ? 0 : mnt >> (expint - exp);
13118SEdmund.Grimley-Evans@arm.com        int err = exp < expint - FP16_BITS ? 1 :
13118SEdmund.Grimley-Evans@arm.com            ((mnt << 1 >> (expint - exp - 1) & 3) |
13118SEdmund.Grimley-Evans@arm.com             ((uint16_t)(mnt << 2 << (FP16_BITS + exp - expint)) != 0));
10037SARM gem5 Developers        switch (rounding) {
10037SARM gem5 Developers          case FPRounding_TIEEVEN:
10037SARM gem5 Developers            x += (err == 3 || (err == 2 && (x & 1)));
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_POSINF:
10037SARM gem5 Developers            x += err && !sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_NEGINF:
10037SARM gem5 Developers            x += err && sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_ZERO:
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_TIEAWAY:
10037SARM gem5 Developers            x += err >> 1;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers        }
10037SARM gem5 Developers
10037SARM gem5 Developers        if (x == 0) {
13118SEdmund.Grimley-Evans@arm.com            result = fp16_zero(sgn);
10037SARM gem5 Developers        } else {
13118SEdmund.Grimley-Evans@arm.com            exp = expint;
13118SEdmund.Grimley-Evans@arm.com            mnt = fp16_normalise(x, &exp);
13118SEdmund.Grimley-Evans@arm.com            result = fp16_pack(sgn, exp + FP16_EXP_BITS, mnt >> FP16_EXP_BITS);
10037SARM gem5 Developers        }
10037SARM gem5 Developers
10037SARM gem5 Developers        if (err && exact)
10037SARM gem5 Developers            flags |= FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibRoundInt(uint32_t op, FPRounding rounding, bool exact, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int expint = FP32_EXP_BIAS + FP32_MANT_BITS;
10037SARM gem5 Developers    int mode = modeConv(fpscr);
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn, &exp, &mnt, op, mode, &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle NaNs, infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp32_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP32_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        result = fp32_infinity(sgn);
10037SARM gem5 Developers    } else if (!mnt) {
13118SEdmund.Grimley-Evans@arm.com        result = fp32_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp >= expint) {
10037SARM gem5 Developers        // There are no fractional bits
10037SARM gem5 Developers        result = op;
10037SARM gem5 Developers    } else {
10037SARM gem5 Developers        // Truncate towards zero:
13118SEdmund.Grimley-Evans@arm.com        uint32_t x = expint - exp >= FP32_BITS ? 0 : mnt >> (expint - exp);
13118SEdmund.Grimley-Evans@arm.com        int err = exp < expint - FP32_BITS ? 1 :
13118SEdmund.Grimley-Evans@arm.com            ((mnt << 1 >> (expint - exp - 1) & 3) |
13118SEdmund.Grimley-Evans@arm.com             ((uint32_t)(mnt << 2 << (FP32_BITS + exp - expint)) != 0));
10037SARM gem5 Developers        switch (rounding) {
10037SARM gem5 Developers          case FPRounding_TIEEVEN:
10037SARM gem5 Developers            x += (err == 3 || (err == 2 && (x & 1)));
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_POSINF:
10037SARM gem5 Developers            x += err && !sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_NEGINF:
10037SARM gem5 Developers            x += err && sgn;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_ZERO:
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          case FPRounding_TIEAWAY:
10037SARM gem5 Developers            x += err >> 1;
10037SARM gem5 Developers            break;
10037SARM gem5 Developers          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers        }
10037SARM gem5 Developers
10037SARM gem5 Developers        if (x == 0) {
13118SEdmund.Grimley-Evans@arm.com            result = fp32_zero(sgn);
10037SARM gem5 Developers        } else {
13118SEdmund.Grimley-Evans@arm.com            exp = expint;
13118SEdmund.Grimley-Evans@arm.com            mnt = fp32_normalise(x, &exp);
13118SEdmund.Grimley-Evans@arm.com            result = fp32_pack(sgn, exp + FP32_EXP_BITS, mnt >> FP32_EXP_BITS);
10037SARM gem5 Developers        }
10037SARM gem5 Developers
10037SARM gem5 Developers        if (err && exact)
10037SARM gem5 Developers            flags |= FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibRoundInt(uint64_t op, FPRounding rounding, bool exact, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int expint = FP64_EXP_BIAS + FP64_MANT_BITS;
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t mnt, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&sgn, &exp, &mnt, op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle NaNs, infinities and zeroes:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = fp64_process_NaN(op, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp == FP64_EXP_INF) {
13118SEdmund.Grimley-Evans@arm.com        result = fp64_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (!mnt) {
13118SEdmund.Grimley-Evans@arm.com        result = fp64_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com    } else if (exp >= expint) {
13118SEdmund.Grimley-Evans@arm.com        // There are no fractional bits
13118SEdmund.Grimley-Evans@arm.com        result = op;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        // Truncate towards zero:
13118SEdmund.Grimley-Evans@arm.com        uint64_t x = expint - exp >= FP64_BITS ? 0 : mnt >> (expint - exp);
13118SEdmund.Grimley-Evans@arm.com        int err = exp < expint - FP64_BITS ? 1 :
13118SEdmund.Grimley-Evans@arm.com            ((mnt << 1 >> (expint - exp - 1) & 3) |
13118SEdmund.Grimley-Evans@arm.com             ((uint64_t)(mnt << 2 << (FP64_BITS + exp - expint)) != 0));
13118SEdmund.Grimley-Evans@arm.com        switch (rounding) {
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_TIEEVEN:
13118SEdmund.Grimley-Evans@arm.com            x += (err == 3 || (err == 2 && (x & 1)));
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_POSINF:
13118SEdmund.Grimley-Evans@arm.com            x += err && !sgn;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_NEGINF:
13118SEdmund.Grimley-Evans@arm.com            x += err && sgn;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_ZERO:
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          case FPRounding_TIEAWAY:
13118SEdmund.Grimley-Evans@arm.com            x += err >> 1;
13118SEdmund.Grimley-Evans@arm.com            break;
13118SEdmund.Grimley-Evans@arm.com          default:
13449Sgabeblack@google.com            panic("Unrecognized FP rounding mode");
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com        if (x == 0) {
13118SEdmund.Grimley-Evans@arm.com            result = fp64_zero(sgn);
13118SEdmund.Grimley-Evans@arm.com        } else {
13118SEdmund.Grimley-Evans@arm.com            exp = expint;
13118SEdmund.Grimley-Evans@arm.com            mnt = fp64_normalise(x, &exp);
13118SEdmund.Grimley-Evans@arm.com            result = fp64_pack(sgn, exp + FP64_EXP_BITS, mnt >> FP64_EXP_BITS);
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com        if (err && exact)
13118SEdmund.Grimley-Evans@arm.com            flags |= FPLIB_IXC;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibScale(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_scale(op1, (int16_t)op2, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibScale(uint32_t op1, uint32_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint32_t result = fp32_scale(op1, (int32_t)op2, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibScale(uint64_t op1, uint64_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint64_t result = fp64_scale(op1, (int64_t)op2, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibSqrt(uint16_t op, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_sqrt(op, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibSqrt(uint32_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_sqrt(op, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibSqrt(uint64_t op, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_sqrt(op, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibSub(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_add(op1, op2, 1, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibSub(uint32_t op1, uint32_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t result = fp32_add(op1, op2, 1, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibSub(uint64_t op1, uint64_t op2, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t result = fp64_add(op1, op2, 1, modeConv(fpscr), &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigMulAdd(uint8_t coeff_index, uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint16_t coeff[2][8] = {
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3c00,
13118SEdmund.Grimley-Evans@arm.com            0xb155,
13118SEdmund.Grimley-Evans@arm.com            0x2030,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com        },
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3c00,
13118SEdmund.Grimley-Evans@arm.com            0xb800,
13118SEdmund.Grimley-Evans@arm.com            0x293a,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000,
13118SEdmund.Grimley-Evans@arm.com            0x0000
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t result =
13118SEdmund.Grimley-Evans@arm.com        fp16_muladd(coeff[op2 >> (FP16_BITS - 1)][coeff_index], op1,
13118SEdmund.Grimley-Evans@arm.com                    fplibAbs(op2), 0, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigMulAdd(uint8_t coeff_index, uint32_t op1, uint32_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint32_t coeff[2][8] = {
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3f800000,
13118SEdmund.Grimley-Evans@arm.com            0xbe2aaaab,
13118SEdmund.Grimley-Evans@arm.com            0x3c088886,
13118SEdmund.Grimley-Evans@arm.com            0xb95008b9,
13118SEdmund.Grimley-Evans@arm.com            0x36369d6d,
13118SEdmund.Grimley-Evans@arm.com            0x00000000,
13118SEdmund.Grimley-Evans@arm.com            0x00000000,
13118SEdmund.Grimley-Evans@arm.com            0x00000000
13118SEdmund.Grimley-Evans@arm.com        },
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3f800000,
13118SEdmund.Grimley-Evans@arm.com            0xbf000000,
13118SEdmund.Grimley-Evans@arm.com            0x3d2aaaa6,
13118SEdmund.Grimley-Evans@arm.com            0xbab60705,
13118SEdmund.Grimley-Evans@arm.com            0x37cd37cc,
13118SEdmund.Grimley-Evans@arm.com            0x00000000,
13118SEdmund.Grimley-Evans@arm.com            0x00000000,
13118SEdmund.Grimley-Evans@arm.com            0x00000000
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint32_t result =
13118SEdmund.Grimley-Evans@arm.com        fp32_muladd(coeff[op2 >> (FP32_BITS - 1)][coeff_index], op1,
13118SEdmund.Grimley-Evans@arm.com                    fplibAbs(op2), 0, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigMulAdd(uint8_t coeff_index, uint64_t op1, uint64_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static uint64_t coeff[2][8] = {
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3ff0000000000000ULL,
13118SEdmund.Grimley-Evans@arm.com            0xbfc5555555555543ULL,
13118SEdmund.Grimley-Evans@arm.com            0x3f8111111110f30cULL,
13118SEdmund.Grimley-Evans@arm.com            0xbf2a01a019b92fc6ULL,
13118SEdmund.Grimley-Evans@arm.com            0x3ec71de351f3d22bULL,
13118SEdmund.Grimley-Evans@arm.com            0xbe5ae5e2b60f7b91ULL,
13118SEdmund.Grimley-Evans@arm.com            0x3de5d8408868552fULL,
13118SEdmund.Grimley-Evans@arm.com            0x0000000000000000ULL
13118SEdmund.Grimley-Evans@arm.com        },
13118SEdmund.Grimley-Evans@arm.com        {
13118SEdmund.Grimley-Evans@arm.com            0x3ff0000000000000ULL,
13118SEdmund.Grimley-Evans@arm.com            0xbfe0000000000000ULL,
13118SEdmund.Grimley-Evans@arm.com            0x3fa5555555555536ULL,
13118SEdmund.Grimley-Evans@arm.com            0xbf56c16c16c13a0bULL,
13118SEdmund.Grimley-Evans@arm.com            0x3efa01a019b1e8d8ULL,
13118SEdmund.Grimley-Evans@arm.com            0xbe927e4f7282f468ULL,
13118SEdmund.Grimley-Evans@arm.com            0x3e21ee96d2641b13ULL,
13118SEdmund.Grimley-Evans@arm.com            0xbda8f76380fbb401ULL
13118SEdmund.Grimley-Evans@arm.com        }
13118SEdmund.Grimley-Evans@arm.com    };
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint64_t result =
13118SEdmund.Grimley-Evans@arm.com        fp64_muladd(coeff[op2 >> (FP64_BITS - 1)][coeff_index], op1,
13118SEdmund.Grimley-Evans@arm.com                    fplibAbs(op2), 0, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSMul(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    uint16_t result = fp16_mul(op1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, result, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = (result & ~(1ULL << (FP16_BITS - 1))) |
13118SEdmund.Grimley-Evans@arm.com            op2 << (FP16_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSMul(uint32_t op1, uint32_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint32_t mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    uint32_t result = fp32_mul(op1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp32_unpack(&sgn, &exp, &mnt, result, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!fp32_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = (result & ~(1ULL << (FP32_BITS - 1))) | op2 << (FP32_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSMul(uint64_t op1, uint64_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint64_t mnt;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    int mode = modeConv(fpscr);
13118SEdmund.Grimley-Evans@arm.com    uint64_t result = fp64_mul(op1, op1, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    fp64_unpack(&sgn, &exp, &mnt, result, mode, &flags);
13118SEdmund.Grimley-Evans@arm.com    if (!fp64_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        result = (result & ~(1ULL << (FP64_BITS - 1))) | op2 << (FP64_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSSel(uint16_t op1, uint16_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static constexpr uint16_t fpOne =
13118SEdmund.Grimley-Evans@arm.com        (uint16_t)FP16_EXP_BIAS << FP16_MANT_BITS; // 1.0
13118SEdmund.Grimley-Evans@arm.com    if (op2 & 1)
13118SEdmund.Grimley-Evans@arm.com        op1 = fpOne;
13118SEdmund.Grimley-Evans@arm.com    return op1 ^ ((op2 >> 1) << (FP16_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSSel(uint32_t op1, uint32_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static constexpr uint32_t fpOne =
13118SEdmund.Grimley-Evans@arm.com        (uint32_t)FP32_EXP_BIAS << FP32_MANT_BITS; // 1.0
13118SEdmund.Grimley-Evans@arm.com    if (op2 & 1)
13118SEdmund.Grimley-Evans@arm.com        op1 = fpOne;
13118SEdmund.Grimley-Evans@arm.com    return op1 ^ ((op2 >> 1) << (FP32_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibTrigSSel(uint64_t op1, uint64_t op2, FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    static constexpr uint64_t fpOne =
13118SEdmund.Grimley-Evans@arm.com        (uint64_t)FP64_EXP_BIAS << FP64_MANT_BITS; // 1.0
13118SEdmund.Grimley-Evans@arm.com    if (op2 & 1)
13118SEdmund.Grimley-Evans@arm.com        op1 = fpOne;
13118SEdmund.Grimley-Evans@arm.com    return op1 ^ ((op2 >> 1) << (FP64_BITS - 1));
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 DevelopersFPToFixed_64(int sgn, int exp, uint64_t mnt, bool u, FPRounding rounding,
10037SARM gem5 Developers             int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int expmax = FP64_EXP_BIAS + FP64_BITS - 1;
10037SARM gem5 Developers    uint64_t x;
10037SARM gem5 Developers    int err;
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (exp > expmax) {
10037SARM gem5 Developers        *flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return ((uint64_t)!u << (FP64_BITS - 1)) - !sgn;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    x = lsr64(mnt << FP64_EXP_BITS, expmax - exp);
13118SEdmund.Grimley-Evans@arm.com    err = (exp > expmax - 2 ? 0 :
13118SEdmund.Grimley-Evans@arm.com           (lsr64(mnt << FP64_EXP_BITS, expmax - 2 - exp) & 3) |
13118SEdmund.Grimley-Evans@arm.com           !!(mnt << FP64_EXP_BITS & (lsl64(1, expmax - 2 - exp) - 1)));
10037SARM gem5 Developers
10037SARM gem5 Developers    switch (rounding) {
10037SARM gem5 Developers      case FPRounding_TIEEVEN:
10037SARM gem5 Developers        x += (err == 3 || (err == 2 && (x & 1)));
10037SARM gem5 Developers        break;
10037SARM gem5 Developers      case FPRounding_POSINF:
10037SARM gem5 Developers        x += err && !sgn;
10037SARM gem5 Developers        break;
10037SARM gem5 Developers      case FPRounding_NEGINF:
10037SARM gem5 Developers        x += err && sgn;
10037SARM gem5 Developers        break;
10037SARM gem5 Developers      case FPRounding_ZERO:
10037SARM gem5 Developers        break;
10037SARM gem5 Developers      case FPRounding_TIEAWAY:
10037SARM gem5 Developers        x += err >> 1;
10037SARM gem5 Developers        break;
10037SARM gem5 Developers      default:
13449Sgabeblack@google.com        panic("Unrecognized FP rounding mode");
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    if (u ? sgn && x : x > (1ULL << (FP64_BITS - 1)) - !sgn) {
10037SARM gem5 Developers        *flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        return ((uint64_t)!u << (FP64_BITS - 1)) - !sgn;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    if (err) {
10037SARM gem5 Developers        *flags = FPLIB_IXC;
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    return sgn ? -x : x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 DevelopersFPToFixed_32(int sgn, int exp, uint64_t mnt, bool u, FPRounding rounding,
10037SARM gem5 Developers             int *flags)
10037SARM gem5 Developers{
10037SARM gem5 Developers    uint64_t x = FPToFixed_64(sgn, exp, mnt, u, rounding, flags);
13118SEdmund.Grimley-Evans@arm.com    if (u ? x >= 1ULL << FP32_BITS :
13118SEdmund.Grimley-Evans@arm.com        !(x < 1ULL << (FP32_BITS - 1) ||
13118SEdmund.Grimley-Evans@arm.com          (uint64_t)-x <= (uint64_t)1 << (FP32_BITS - 1))) {
10037SARM gem5 Developers        *flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        x = ((uint32_t)!u << (FP32_BITS - 1)) - !sgn;
10037SARM gem5 Developers    }
10037SARM gem5 Developers    return x;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comFPToFixed_16(int sgn, int exp, uint64_t mnt, bool u, FPRounding rounding,
13118SEdmund.Grimley-Evans@arm.com             int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    uint64_t x = FPToFixed_64(sgn, exp, mnt, u, rounding, flags);
13118SEdmund.Grimley-Evans@arm.com    if (u ? x >= 1ULL << FP16_BITS :
13118SEdmund.Grimley-Evans@arm.com        !(x < 1ULL << (FP16_BITS - 1) ||
13118SEdmund.Grimley-Evans@arm.com          (uint64_t)-x <= (uint64_t)1 << (FP16_BITS - 1))) {
13118SEdmund.Grimley-Evans@arm.com        *flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        x = ((uint16_t)!u << (FP16_BITS - 1)) - !sgn;
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com    return x;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibFPToFixed(uint16_t op, int fbits, bool u, FPRounding rounding,
13118SEdmund.Grimley-Evans@arm.com               FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt, result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        result = 0;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        // Infinity is treated as an ordinary normalised number that saturates.
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            FPToFixed_16(sgn, exp + FP64_EXP_BIAS - FP16_EXP_BIAS + fbits,
13118SEdmund.Grimley-Evans@arm.com                         (uint64_t)mnt << (FP64_MANT_BITS - FP16_MANT_BITS),
13118SEdmund.Grimley-Evans@arm.com                         u, rounding, &flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibFPToFixed(uint16_t op, int fbits, bool u, FPRounding rounding,
13118SEdmund.Grimley-Evans@arm.com               FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt;
13118SEdmund.Grimley-Evans@arm.com    uint32_t result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        result = 0;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        if (exp == FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com            exp = 255; // infinity: make it big enough to saturate
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            FPToFixed_32(sgn, exp + FP64_EXP_BIAS - FP16_EXP_BIAS + fbits,
13118SEdmund.Grimley-Evans@arm.com                         (uint64_t)mnt << (FP64_MANT_BITS - FP16_MANT_BITS),
13118SEdmund.Grimley-Evans@arm.com                         u, rounding, &flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibFPToFixed(uint32_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        flags = FPLIB_IOC;
10037SARM gem5 Developers        result = 0;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        // Infinity is treated as an ordinary normalised number that saturates.
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            FPToFixed_32(sgn, exp + FP64_EXP_BIAS - FP32_EXP_BIAS + fbits,
13118SEdmund.Grimley-Evans@arm.com                         (uint64_t)mnt << (FP64_MANT_BITS - FP32_MANT_BITS),
13118SEdmund.Grimley-Evans@arm.com                         u, rounding, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibFPToFixed(uint64_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt;
10037SARM gem5 Developers    uint32_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        flags = FPLIB_IOC;
10037SARM gem5 Developers        result = 0;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        // Infinity is treated as an ordinary normalised number that saturates.
10037SARM gem5 Developers        result = FPToFixed_32(sgn, exp + fbits, mnt, u, rounding, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibFPToFixed(uint16_t op, int fbits, bool u, FPRounding rounding,
13118SEdmund.Grimley-Evans@arm.com               FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    int sgn, exp;
13118SEdmund.Grimley-Evans@arm.com    uint16_t mnt;
13118SEdmund.Grimley-Evans@arm.com    uint64_t result;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
13118SEdmund.Grimley-Evans@arm.com    fp16_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp16_is_NaN(exp, mnt)) {
13118SEdmund.Grimley-Evans@arm.com        flags = FPLIB_IOC;
13118SEdmund.Grimley-Evans@arm.com        result = 0;
13118SEdmund.Grimley-Evans@arm.com    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        if (exp == FP16_EXP_INF)
13118SEdmund.Grimley-Evans@arm.com            exp = 255; // infinity: make it big enough to saturate
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            FPToFixed_64(sgn, exp + FP64_EXP_BIAS - FP16_EXP_BIAS + fbits,
13118SEdmund.Grimley-Evans@arm.com                         (uint64_t)mnt << (FP64_MANT_BITS - FP16_MANT_BITS),
13118SEdmund.Grimley-Evans@arm.com                         u, rounding, &flags);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return result;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
10037SARM gem5 DevelopersfplibFPToFixed(uint32_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint32_t mnt;
10037SARM gem5 Developers    uint64_t result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
10037SARM gem5 Developers    fp32_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp32_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        flags = FPLIB_IOC;
10037SARM gem5 Developers        result = 0;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        // Infinity is treated as an ordinary normalised number that saturates.
13118SEdmund.Grimley-Evans@arm.com        result =
13118SEdmund.Grimley-Evans@arm.com            FPToFixed_64(sgn, exp + FP64_EXP_BIAS - FP32_EXP_BIAS + fbits,
13118SEdmund.Grimley-Evans@arm.com                         (uint64_t)mnt << (FP64_MANT_BITS - FP32_MANT_BITS),
13118SEdmund.Grimley-Evans@arm.com                         u, rounding, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibFPToFixed(uint64_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    int sgn, exp;
10037SARM gem5 Developers    uint64_t mnt, result;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Unpack using FPCR to determine if subnormals are flushed-to-zero:
10037SARM gem5 Developers    fp64_unpack(&sgn, &exp, &mnt, op, modeConv(fpscr), &flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    // If NaN, set cumulative flag or take exception:
13118SEdmund.Grimley-Evans@arm.com    if (fp64_is_NaN(exp, mnt)) {
10037SARM gem5 Developers        flags = FPLIB_IOC;
10037SARM gem5 Developers        result = 0;
10037SARM gem5 Developers    } else {
13118SEdmund.Grimley-Evans@arm.com        assert(fbits >= 0);
13118SEdmund.Grimley-Evans@arm.com        // Infinity is treated as an ordinary normalised number that saturates.
10037SARM gem5 Developers        result = FPToFixed_64(sgn, exp + fbits, mnt, u, rounding, &flags);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers
10037SARM gem5 Developers    return result;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comstatic uint16_t
13118SEdmund.Grimley-Evans@arm.comfp16_cvtf(uint64_t a, int fbits, int u, int mode, int *flags)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int x_sgn = !u && a >> (FP64_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    int x_exp = FP16_EXP_BIAS + FP64_BITS - 1 - fbits;
13118SEdmund.Grimley-Evans@arm.com    uint64_t x_mnt = x_sgn ? -a : a;
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Handle zero:
13118SEdmund.Grimley-Evans@arm.com    if (!x_mnt) {
13118SEdmund.Grimley-Evans@arm.com        return fp16_zero(0);
13118SEdmund.Grimley-Evans@arm.com    }
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP16_BITS bits, collapsing error into bottom bit:
13118SEdmund.Grimley-Evans@arm.com    x_mnt = fp64_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = (x_mnt >> (FP64_BITS - FP16_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com             !!(x_mnt & ((1ULL << (FP64_BITS - FP16_BITS - 1)) - 1)));
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com    return fp16_round(x_sgn, x_exp, x_mnt, mode, flags);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
10037SARM gem5 Developersstatic uint32_t
10037SARM gem5 Developersfp32_cvtf(uint64_t a, int fbits, int u, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int x_sgn = !u && a >> (FP64_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    int x_exp = FP32_EXP_BIAS + FP64_BITS - 1 - fbits;
10037SARM gem5 Developers    uint64_t x_mnt = x_sgn ? -a : a;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle zero:
10037SARM gem5 Developers    if (!x_mnt) {
10037SARM gem5 Developers        return fp32_zero(0);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.com    // Normalise into FP32_BITS bits, collapsing error into bottom bit:
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
13118SEdmund.Grimley-Evans@arm.com    x_mnt = (x_mnt >> (FP64_BITS - FP32_BITS - 1) |
13118SEdmund.Grimley-Evans@arm.com             !!(x_mnt & ((1ULL << (FP64_BITS - FP32_BITS - 1)) - 1)));
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp32_round(x_sgn, x_exp, x_mnt, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developersstatic uint64_t
10037SARM gem5 Developersfp64_cvtf(uint64_t a, int fbits, int u, int mode, int *flags)
10037SARM gem5 Developers{
13118SEdmund.Grimley-Evans@arm.com    int x_sgn = !u && a >> (FP64_BITS - 1);
13118SEdmund.Grimley-Evans@arm.com    int x_exp = FP64_EXP_BIAS + FP64_BITS - 1 - fbits;
10037SARM gem5 Developers    uint64_t x_mnt = x_sgn ? -a : a;
10037SARM gem5 Developers
10037SARM gem5 Developers    // Handle zero:
10037SARM gem5 Developers    if (!x_mnt) {
10037SARM gem5 Developers        return fp64_zero(0);
10037SARM gem5 Developers    }
10037SARM gem5 Developers
10037SARM gem5 Developers    x_mnt = fp64_normalise(x_mnt, &x_exp);
10037SARM gem5 Developers
10037SARM gem5 Developers    return fp64_round(x_sgn, x_exp, x_mnt << 1, mode, flags);
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibFixedToFP(uint64_t op, int fbits, bool u, FPRounding rounding,
13118SEdmund.Grimley-Evans@arm.com               FPSCR &fpscr)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    int flags = 0;
13118SEdmund.Grimley-Evans@arm.com    uint16_t res = fp16_cvtf(op, fbits, u,
13118SEdmund.Grimley-Evans@arm.com                             (int)rounding | ((uint32_t)fpscr >> 22 & 12),
13118SEdmund.Grimley-Evans@arm.com                             &flags);
13118SEdmund.Grimley-Evans@arm.com    set_fpscr0(fpscr, flags);
13118SEdmund.Grimley-Evans@arm.com    return res;
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
10037SARM gem5 Developersuint32_t
10037SARM gem5 DevelopersfplibFixedToFP(uint64_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint32_t res = fp32_cvtf(op, fbits, u,
10037SARM gem5 Developers                             (int)rounding | ((uint32_t)fpscr >> 22 & 12),
10037SARM gem5 Developers                             &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return res;
10037SARM gem5 Developers}
10037SARM gem5 Developers
10037SARM gem5 Developerstemplate <>
10037SARM gem5 Developersuint64_t
10037SARM gem5 DevelopersfplibFixedToFP(uint64_t op, int fbits, bool u, FPRounding rounding, FPSCR &fpscr)
10037SARM gem5 Developers{
10037SARM gem5 Developers    int flags = 0;
10037SARM gem5 Developers    uint64_t res = fp64_cvtf(op, fbits, u,
10037SARM gem5 Developers                             (int)rounding | ((uint32_t)fpscr >> 22 & 12),
10037SARM gem5 Developers                             &flags);
10037SARM gem5 Developers    set_fpscr0(fpscr, flags);
10037SARM gem5 Developers    return res;
10037SARM gem5 Developers}
10037SARM gem5 Developers
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibInfinity(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibInfinity(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp32_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibInfinity(int sgn)
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp64_infinity(sgn);
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint16_t
13118SEdmund.Grimley-Evans@arm.comfplibDefaultNaN()
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp16_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint32_t
13118SEdmund.Grimley-Evans@arm.comfplibDefaultNaN()
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp32_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.comtemplate <>
13118SEdmund.Grimley-Evans@arm.comuint64_t
13118SEdmund.Grimley-Evans@arm.comfplibDefaultNaN()
13118SEdmund.Grimley-Evans@arm.com{
13118SEdmund.Grimley-Evans@arm.com    return fp64_defaultNaN();
13118SEdmund.Grimley-Evans@arm.com}
13118SEdmund.Grimley-Evans@arm.com
13118SEdmund.Grimley-Evans@arm.com}