src/gpu-compute/gpu_tlb.cc

11308Santhony.gutierrez@amd.com/*
11308Santhony.gutierrez@amd.com * Copyright (c) 2011-2015 Advanced Micro Devices, Inc.
11308Santhony.gutierrez@amd.com * All rights reserved.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * For use for simulation and test purposes only
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Redistribution and use in source and binary forms, with or without
11308Santhony.gutierrez@amd.com * modification, are permitted provided that the following conditions are met:
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 1. Redistributions of source code must retain the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 2. Redistributions in binary form must reproduce the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer in the documentation
11308Santhony.gutierrez@amd.com * and/or other materials provided with the distribution.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 3. Neither the name of the copyright holder nor the names of its contributors
11308Santhony.gutierrez@amd.com * may be used to endorse or promote products derived from this software
11308Santhony.gutierrez@amd.com * without specific prior written permission.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
11308Santhony.gutierrez@amd.com * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
11308Santhony.gutierrez@amd.com * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
11308Santhony.gutierrez@amd.com * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
11308Santhony.gutierrez@amd.com * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
11308Santhony.gutierrez@amd.com * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
11308Santhony.gutierrez@amd.com * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
11308Santhony.gutierrez@amd.com * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
11308Santhony.gutierrez@amd.com * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
11308Santhony.gutierrez@amd.com * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
11308Santhony.gutierrez@amd.com * POSSIBILITY OF SUCH DAMAGE.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Author: Lisa Hsu
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "gpu-compute/gpu_tlb.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include <cmath>
11308Santhony.gutierrez@amd.com#include <cstring>
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "arch/x86/faults.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/insts/microldstop.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/pagetable.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/pagetable_walker.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/regs/misc.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/x86_traits.hh"
11308Santhony.gutierrez@amd.com#include "base/bitfield.hh"
11308Santhony.gutierrez@amd.com#include "base/output.hh"
11308Santhony.gutierrez@amd.com#include "base/trace.hh"
11308Santhony.gutierrez@amd.com#include "cpu/base.hh"
11308Santhony.gutierrez@amd.com#include "cpu/thread_context.hh"
11308Santhony.gutierrez@amd.com#include "debug/GPUPrefetch.hh"
11308Santhony.gutierrez@amd.com#include "debug/GPUTLB.hh"
11308Santhony.gutierrez@amd.com#include "mem/packet_access.hh"
11308Santhony.gutierrez@amd.com#include "mem/page_table.hh"
11308Santhony.gutierrez@amd.com#include "mem/request.hh"
11308Santhony.gutierrez@amd.com#include "sim/process.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comnamespace X86ISA
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GpuTLB::GpuTLB(const Params *p)
11308Santhony.gutierrez@amd.com        : MemObject(p), configAddress(0), size(p->size),
12085Sspwilson2@wisc.edu          cleanupEvent([this]{ cleanup(); }, name(), false,
12085Sspwilson2@wisc.edu                       Event::Maximum_Pri),
12085Sspwilson2@wisc.edu          exitEvent([this]{ exitCallback(); }, name())
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        assoc = p->assoc;
11308Santhony.gutierrez@amd.com        assert(assoc <= size);
11308Santhony.gutierrez@amd.com        numSets = size/assoc;
11308Santhony.gutierrez@amd.com        allocationPolicy = p->allocationPolicy;
11308Santhony.gutierrez@amd.com        hasMemSidePort = false;
11308Santhony.gutierrez@amd.com        accessDistance = p->accessDistance;
11308Santhony.gutierrez@amd.com        clock = p->clk_domain->clockPeriod();
11308Santhony.gutierrez@amd.com
11704Santhony.gutierrez@amd.com        tlb.assign(size, GpuTlbEntry());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        freeList.resize(numSets);
11308Santhony.gutierrez@amd.com        entryList.resize(numSets);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        for (int set = 0; set < numSets; ++set) {
11308Santhony.gutierrez@amd.com            for (int way = 0; way < assoc; ++way) {
11704Santhony.gutierrez@amd.com                int x = set * assoc + way;
11704Santhony.gutierrez@amd.com                freeList[set].push_back(&tlb.at(x));
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        FA = (size == assoc);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * @warning: the set-associative version assumes you have a
11308Santhony.gutierrez@amd.com         * fixed page size of 4KB.
11308Santhony.gutierrez@amd.com         * If the page size is greather than 4KB (as defined in the
11308Santhony.gutierrez@amd.com         * TheISA::PageBytes), then there are various issues w/ the current
11308Santhony.gutierrez@amd.com         * implementation (you'd have the same 8KB page being replicated in
11308Santhony.gutierrez@amd.com         * different sets etc)
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        setMask = numSets - 1;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    #if 0
11308Santhony.gutierrez@amd.com        // GpuTLB doesn't yet support full system
11308Santhony.gutierrez@amd.com        walker = p->walker;
11308Santhony.gutierrez@amd.com        walker->setTLB(this);
11308Santhony.gutierrez@amd.com    #endif
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        maxCoalescedReqs = p->maxOutstandingReqs;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Do not allow maxCoalescedReqs to be more than the TLB associativity
11308Santhony.gutierrez@amd.com        if (maxCoalescedReqs > assoc) {
11308Santhony.gutierrez@amd.com            maxCoalescedReqs = assoc;
11308Santhony.gutierrez@amd.com            cprintf("Forcing maxCoalescedReqs to %d (TLB assoc.) \n", assoc);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        outstandingReqs = 0;
11308Santhony.gutierrez@amd.com        hitLatency = p->hitLatency;
11308Santhony.gutierrez@amd.com        missLatency1 = p->missLatency1;
11308Santhony.gutierrez@amd.com        missLatency2 = p->missLatency2;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // create the slave ports based on the number of connected ports
11308Santhony.gutierrez@amd.com        for (size_t i = 0; i < p->port_slave_connection_count; ++i) {
11308Santhony.gutierrez@amd.com            cpuSidePort.push_back(new CpuSidePort(csprintf("%s-port%d",
11308Santhony.gutierrez@amd.com                                  name(), i), this, i));
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // create the master ports based on the number of connected ports
11308Santhony.gutierrez@amd.com        for (size_t i = 0; i < p->port_master_connection_count; ++i) {
11308Santhony.gutierrez@amd.com            memSidePort.push_back(new MemSidePort(csprintf("%s-port%d",
11308Santhony.gutierrez@amd.com                                  name(), i), this, i));
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // fixme: this is never called?
11308Santhony.gutierrez@amd.com    GpuTLB::~GpuTLB()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        // make sure all the hash-maps are empty
11308Santhony.gutierrez@amd.com        assert(translationReturnEvent.empty());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    BaseSlavePort&
11308Santhony.gutierrez@amd.com    GpuTLB::getSlavePort(const std::string &if_name, PortID idx)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        if (if_name == "slave") {
11308Santhony.gutierrez@amd.com            if (idx >= static_cast<PortID>(cpuSidePort.size())) {
11308Santhony.gutierrez@amd.com                panic("TLBCoalescer::getSlavePort: unknown index %d\n", idx);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            return *cpuSidePort[idx];
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            panic("TLBCoalescer::getSlavePort: unknown port %s\n", if_name);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    BaseMasterPort&
11308Santhony.gutierrez@amd.com    GpuTLB::getMasterPort(const std::string &if_name, PortID idx)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        if (if_name == "master") {
11308Santhony.gutierrez@amd.com            if (idx >= static_cast<PortID>(memSidePort.size())) {
11308Santhony.gutierrez@amd.com                panic("TLBCoalescer::getMasterPort: unknown index %d\n", idx);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            hasMemSidePort = true;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            return *memSidePort[idx];
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            panic("TLBCoalescer::getMasterPort: unknown port %s\n", if_name);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GpuTlbEntry*
11308Santhony.gutierrez@amd.com    GpuTLB::insert(Addr vpn, GpuTlbEntry &entry)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        GpuTlbEntry *newEntry = nullptr;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * vpn holds the virtual page address
11308Santhony.gutierrez@amd.com         * The least significant bits are simply masked
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        int set = (vpn >> TheISA::PageShift) & setMask;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (!freeList[set].empty()) {
11308Santhony.gutierrez@amd.com            newEntry = freeList[set].front();
11308Santhony.gutierrez@amd.com            freeList[set].pop_front();
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            newEntry = entryList[set].back();
11308Santhony.gutierrez@amd.com            entryList[set].pop_back();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        *newEntry = entry;
11308Santhony.gutierrez@amd.com        newEntry->vaddr = vpn;
11308Santhony.gutierrez@amd.com        entryList[set].push_front(newEntry);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return newEntry;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GpuTLB::EntryList::iterator
11308Santhony.gutierrez@amd.com    GpuTLB::lookupIt(Addr va, bool update_lru)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        int set = (va >> TheISA::PageShift) & setMask;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (FA) {
11308Santhony.gutierrez@amd.com            assert(!set);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        auto entry = entryList[set].begin();
11308Santhony.gutierrez@amd.com        for (; entry != entryList[set].end(); ++entry) {
11308Santhony.gutierrez@amd.com            int page_size = (*entry)->size();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if ((*entry)->vaddr <= va && (*entry)->vaddr + page_size > va) {
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Matched vaddr %#x to entry starting at %#x "
11308Santhony.gutierrez@amd.com                        "with size %#x.\n", va, (*entry)->vaddr, page_size);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (update_lru) {
11308Santhony.gutierrez@amd.com                    entryList[set].push_front(*entry);
11308Santhony.gutierrez@amd.com                    entryList[set].erase(entry);
11308Santhony.gutierrez@amd.com                    entry = entryList[set].begin();
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return entry;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GpuTlbEntry*
11308Santhony.gutierrez@amd.com    GpuTLB::lookup(Addr va, bool update_lru)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        int set = (va >> TheISA::PageShift) & setMask;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        auto entry = lookupIt(va, update_lru);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (entry == entryList[set].end())
11308Santhony.gutierrez@amd.com            return nullptr;
11308Santhony.gutierrez@amd.com        else
11308Santhony.gutierrez@amd.com            return *entry;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::invalidateAll()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Invalidating all entries.\n");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        for (int i = 0; i < numSets; ++i) {
11308Santhony.gutierrez@amd.com            while (!entryList[i].empty()) {
11308Santhony.gutierrez@amd.com                GpuTlbEntry *entry = entryList[i].front();
11308Santhony.gutierrez@amd.com                entryList[i].pop_front();
11308Santhony.gutierrez@amd.com                freeList[i].push_back(entry);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::setConfigAddress(uint32_t addr)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        configAddress = addr;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::invalidateNonGlobal()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Invalidating all non global entries.\n");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        for (int i = 0; i < numSets; ++i) {
11308Santhony.gutierrez@amd.com            for (auto entryIt = entryList[i].begin();
11308Santhony.gutierrez@amd.com                 entryIt != entryList[i].end();) {
11308Santhony.gutierrez@amd.com                if (!(*entryIt)->global) {
11308Santhony.gutierrez@amd.com                    freeList[i].push_back(*entryIt);
11308Santhony.gutierrez@amd.com                    entryList[i].erase(entryIt++);
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    ++entryIt;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::demapPage(Addr va, uint64_t asn)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        int set = (va >> TheISA::PageShift) & setMask;
11308Santhony.gutierrez@amd.com        auto entry = lookupIt(va, false);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (entry != entryList[set].end()) {
11308Santhony.gutierrez@amd.com            freeList[set].push_back(*entry);
11308Santhony.gutierrez@amd.com            entryList[set].erase(entry);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Fault
11308Santhony.gutierrez@amd.com    GpuTLB::translateInt(RequestPtr req, ThreadContext *tc)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Addresses references internal memory.\n");
11308Santhony.gutierrez@amd.com        Addr vaddr = req->getVaddr();
11308Santhony.gutierrez@amd.com        Addr prefix = (vaddr >> 3) & IntAddrPrefixMask;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (prefix == IntAddrPrefixCPUID) {
11308Santhony.gutierrez@amd.com            panic("CPUID memory space not yet implemented!\n");
11308Santhony.gutierrez@amd.com        } else if (prefix == IntAddrPrefixMSR) {
11308Santhony.gutierrez@amd.com            vaddr = vaddr >> 3;
11308Santhony.gutierrez@amd.com            req->setFlags(Request::MMAPPED_IPR);
11308Santhony.gutierrez@amd.com            Addr regNum = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            switch (vaddr & ~IntAddrPrefixMask) {
11308Santhony.gutierrez@amd.com              case 0x10:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_TSC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_APIC_BASE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xFE:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRRCAP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x174:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SYSENTER_CS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x175:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SYSENTER_ESP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x176:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SYSENTER_EIP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x179:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MCG_CAP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x17A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MCG_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x17B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MCG_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1D9:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_DEBUG_CTL_MSR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1DB:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_LAST_BRANCH_FROM_IP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1DC:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_LAST_BRANCH_TO_IP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1DD:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_LAST_EXCEPTION_FROM_IP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x1DE:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_LAST_EXCEPTION_TO_IP;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x200:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x201:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x202:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x203:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x204:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_2;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x205:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_2;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x206:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_3;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x207:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_3;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x208:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_4;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x209:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_4;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_5;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_5;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20C:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_6;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20D:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_6;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20E:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_BASE_7;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x20F:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_PHYS_MASK_7;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x250:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_64K_00000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x258:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_16K_80000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x259:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_16K_A0000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x268:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_C0000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x269:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_C8000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_D0000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_D8000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26C:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_E0000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26D:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_E8000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26E:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_F0000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x26F:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MTRR_FIX_4K_F8000;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x277:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PAT;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x2FF:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_DEF_TYPE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x400:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC0_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x404:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC1_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x408:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC2_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40C:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC3_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x410:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC4_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x414:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC5_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x418:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC6_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41C:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC7_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x401:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC0_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x405:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC1_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x409:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC2_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40D:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC3_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x411:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC4_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x415:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC5_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x419:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC6_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41D:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC7_STATUS;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x402:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC0_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x406:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC1_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC2_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40E:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC3_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x412:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC4_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x416:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC5_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC6_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41E:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC7_ADDR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x403:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC0_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x407:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC1_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC2_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x40F:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC3_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x413:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC4_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x417:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC5_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41B:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC6_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0x41F:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_MC7_MISC;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000080:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_EFER;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000081:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_STAR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000082:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_LSTAR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000083:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_CSTAR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000084:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SF_MASK;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000100:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_FS_BASE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000101:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_GS_BASE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000102:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_KERNEL_GS_BASE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0000103:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_TSC_AUX;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010000:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_SEL0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010001:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_SEL1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010002:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_SEL2;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010003:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_SEL3;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010004:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_CTR0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010005:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_CTR1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010006:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_CTR2;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010007:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_PERF_EVT_CTR3;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010010:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SYSCFG;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010016:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_IORR_BASE0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010017:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_IORR_BASE1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010018:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_IORR_MASK0;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010019:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_IORR_MASK1;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC001001A:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_TOP_MEM;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC001001D:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_TOP_MEM2;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010114:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_VM_CR;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010115:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_IGNNE;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010116:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_SMM_CTL;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              case 0xC0010117:
11308Santhony.gutierrez@amd.com                regNum = MISCREG_VM_HSAVE_PA;
11308Santhony.gutierrez@amd.com                break;
11308Santhony.gutierrez@amd.com              default:
11308Santhony.gutierrez@amd.com                return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com            //The index is multiplied by the size of a MiscReg so that
11308Santhony.gutierrez@amd.com            //any memory dependence calculations will not see these as
11308Santhony.gutierrez@amd.com            //overlapping.
11308Santhony.gutierrez@amd.com            req->setPaddr(regNum * sizeof(MiscReg));
11308Santhony.gutierrez@amd.com            return NoFault;
11308Santhony.gutierrez@amd.com        } else if (prefix == IntAddrPrefixIO) {
11308Santhony.gutierrez@amd.com            // TODO If CPL > IOPL or in virtual mode, check the I/O permission
11308Santhony.gutierrez@amd.com            // bitmap in the TSS.
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            Addr IOPort = vaddr & ~IntAddrPrefixMask;
11308Santhony.gutierrez@amd.com            // Make sure the address fits in the expected 16 bit IO address
11308Santhony.gutierrez@amd.com            // space.
11308Santhony.gutierrez@amd.com            assert(!(IOPort & ~0xFFFF));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (IOPort == 0xCF8 && req->getSize() == 4) {
11308Santhony.gutierrez@amd.com                req->setFlags(Request::MMAPPED_IPR);
11308Santhony.gutierrez@amd.com                req->setPaddr(MISCREG_PCI_CONFIG_ADDRESS * sizeof(MiscReg));
11308Santhony.gutierrez@amd.com            } else if ((IOPort & ~mask(2)) == 0xCFC) {
11308Santhony.gutierrez@amd.com                req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                Addr configAddress =
11308Santhony.gutierrez@amd.com                    tc->readMiscRegNoEffect(MISCREG_PCI_CONFIG_ADDRESS);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (bits(configAddress, 31, 31)) {
11308Santhony.gutierrez@amd.com                    req->setPaddr(PhysAddrPrefixPciConfig |
11308Santhony.gutierrez@amd.com                                  mbits(configAddress, 30, 2) |
11308Santhony.gutierrez@amd.com                                  (IOPort & mask(2)));
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    req->setPaddr(PhysAddrPrefixIO | IOPort);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com                req->setPaddr(PhysAddrPrefixIO | IOPort);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com            return NoFault;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            panic("Access to unrecognized internal address space %#x.\n",
11308Santhony.gutierrez@amd.com                  prefix);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * TLB_lookup will only perform a TLB lookup returning true on a TLB hit
11308Santhony.gutierrez@amd.com     * and false on a TLB miss.
11308Santhony.gutierrez@amd.com     * Many of the checks about different modes have been converted to
11308Santhony.gutierrez@amd.com     * assertions, since these parts of the code are not really used.
11308Santhony.gutierrez@amd.com     * On a hit it will update the LRU stack.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    bool
11308Santhony.gutierrez@amd.com    GpuTLB::tlbLookup(RequestPtr req, ThreadContext *tc, bool update_stats)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        bool tlb_hit = false;
11308Santhony.gutierrez@amd.com    #ifndef NDEBUG
11308Santhony.gutierrez@amd.com        uint32_t flags = req->getFlags();
11308Santhony.gutierrez@amd.com        int seg = flags & SegmentFlagMask;
11308Santhony.gutierrez@amd.com    #endif
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        assert(seg != SEGMENT_REG_MS);
11308Santhony.gutierrez@amd.com        Addr vaddr = req->getVaddr();
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "TLB Lookup for vaddr %#x.\n", vaddr);
11308Santhony.gutierrez@amd.com        HandyM5Reg m5Reg = tc->readMiscRegNoEffect(MISCREG_M5_REG);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (m5Reg.prot) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "In protected mode.\n");
11308Santhony.gutierrez@amd.com            // make sure we are in 64-bit mode
11308Santhony.gutierrez@amd.com            assert(m5Reg.mode == LongMode);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // If paging is enabled, do the translation.
11308Santhony.gutierrez@amd.com            if (m5Reg.paging) {
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Paging enabled.\n");
11308Santhony.gutierrez@amd.com                //update LRU stack on a hit
11308Santhony.gutierrez@amd.com                GpuTlbEntry *entry = lookup(vaddr, true);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (entry)
11308Santhony.gutierrez@amd.com                    tlb_hit = true;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (!update_stats) {
11308Santhony.gutierrez@amd.com                    // functional tlb access for memory initialization
11308Santhony.gutierrez@amd.com                    // i.e., memory seeding or instr. seeding -> don't update
11308Santhony.gutierrez@amd.com                    // TLB and stats
11308Santhony.gutierrez@amd.com                    return tlb_hit;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                localNumTLBAccesses++;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (!entry) {
11308Santhony.gutierrez@amd.com                    localNumTLBMisses++;
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    localNumTLBHits++;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return tlb_hit;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Fault
11308Santhony.gutierrez@amd.com    GpuTLB::translate(RequestPtr req, ThreadContext *tc,
11308Santhony.gutierrez@amd.com                      Translation *translation, Mode mode,
11308Santhony.gutierrez@amd.com                      bool &delayedResponse, bool timing, int &latency)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        uint32_t flags = req->getFlags();
11308Santhony.gutierrez@amd.com        int seg = flags & SegmentFlagMask;
11308Santhony.gutierrez@amd.com        bool storeCheck = flags & (StoreCheck << FlagShift);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // If this is true, we're dealing with a request
11308Santhony.gutierrez@amd.com        // to a non-memory address space.
11308Santhony.gutierrez@amd.com        if (seg == SEGMENT_REG_MS) {
11308Santhony.gutierrez@amd.com            return translateInt(req, tc);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        delayedResponse = false;
11308Santhony.gutierrez@amd.com        Addr vaddr = req->getVaddr();
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Translating vaddr %#x.\n", vaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        HandyM5Reg m5Reg = tc->readMiscRegNoEffect(MISCREG_M5_REG);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // If protected mode has been enabled...
11308Santhony.gutierrez@amd.com        if (m5Reg.prot) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "In protected mode.\n");
11308Santhony.gutierrez@amd.com            // If we're not in 64-bit mode, do protection/limit checks
11308Santhony.gutierrez@amd.com            if (m5Reg.mode != LongMode) {
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Not in long mode. Checking segment "
11308Santhony.gutierrez@amd.com                        "protection.\n");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                // Check for a null segment selector.
11308Santhony.gutierrez@amd.com                if (!(seg == SEGMENT_REG_TSG || seg == SYS_SEGMENT_REG_IDTR ||
11308Santhony.gutierrez@amd.com                    seg == SEGMENT_REG_HS || seg == SEGMENT_REG_LS)
11308Santhony.gutierrez@amd.com                    && !tc->readMiscRegNoEffect(MISCREG_SEG_SEL(seg))) {
11308Santhony.gutierrez@amd.com                    return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                bool expandDown = false;
11308Santhony.gutierrez@amd.com                SegAttr attr = tc->readMiscRegNoEffect(MISCREG_SEG_ATTR(seg));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (seg >= SEGMENT_REG_ES && seg <= SEGMENT_REG_HS) {
11308Santhony.gutierrez@amd.com                    if (!attr.writable && (mode == BaseTLB::Write ||
11308Santhony.gutierrez@amd.com                        storeCheck))
11308Santhony.gutierrez@amd.com                        return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    if (!attr.readable && mode == BaseTLB::Read)
11308Santhony.gutierrez@amd.com                        return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    expandDown = attr.expandDown;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                Addr base = tc->readMiscRegNoEffect(MISCREG_SEG_BASE(seg));
11308Santhony.gutierrez@amd.com                Addr limit = tc->readMiscRegNoEffect(MISCREG_SEG_LIMIT(seg));
11308Santhony.gutierrez@amd.com                // This assumes we're not in 64 bit mode. If we were, the
11308Santhony.gutierrez@amd.com                // default address size is 64 bits, overridable to 32.
11308Santhony.gutierrez@amd.com                int size = 32;
11308Santhony.gutierrez@amd.com                bool sizeOverride = (flags & (AddrSizeFlagBit << FlagShift));
11308Santhony.gutierrez@amd.com                SegAttr csAttr = tc->readMiscRegNoEffect(MISCREG_CS_ATTR);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if ((csAttr.defaultSize && sizeOverride) ||
11308Santhony.gutierrez@amd.com                    (!csAttr.defaultSize && !sizeOverride)) {
11308Santhony.gutierrez@amd.com                    size = 16;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                Addr offset = bits(vaddr - base, size - 1, 0);
11308Santhony.gutierrez@amd.com                Addr endOffset = offset + req->getSize() - 1;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (expandDown) {
11308Santhony.gutierrez@amd.com                    DPRINTF(GPUTLB, "Checking an expand down segment.\n");
11308Santhony.gutierrez@amd.com                    warn_once("Expand down segments are untested.\n");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    if (offset <= limit || endOffset <= limit)
11308Santhony.gutierrez@amd.com                        return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    if (offset > limit || endOffset > limit)
11308Santhony.gutierrez@amd.com                        return std::make_shared<GeneralProtection>(0);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // If paging is enabled, do the translation.
11308Santhony.gutierrez@amd.com            if (m5Reg.paging) {
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Paging enabled.\n");
11308Santhony.gutierrez@amd.com                // The vaddr already has the segment base applied.
11308Santhony.gutierrez@amd.com                GpuTlbEntry *entry = lookup(vaddr);
11308Santhony.gutierrez@amd.com                localNumTLBAccesses++;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (!entry) {
11308Santhony.gutierrez@amd.com                    localNumTLBMisses++;
11308Santhony.gutierrez@amd.com                    if (timing) {
11308Santhony.gutierrez@amd.com                        latency = missLatency1;
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    if (FullSystem) {
11308Santhony.gutierrez@amd.com                        fatal("GpuTLB doesn't support full-system mode\n");
11308Santhony.gutierrez@amd.com                    } else {
11308Santhony.gutierrez@amd.com                        DPRINTF(GPUTLB, "Handling a TLB miss for address %#x "
11308Santhony.gutierrez@amd.com                                "at pc %#x.\n", vaddr, tc->instAddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        Process *p = tc->getProcessPtr();
11308Santhony.gutierrez@amd.com                        GpuTlbEntry newEntry;
11308Santhony.gutierrez@amd.com                        bool success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        if (!success && mode != BaseTLB::Execute) {
11308Santhony.gutierrez@amd.com                            // penalize a "page fault" more
11308Santhony.gutierrez@amd.com                            if (timing) {
11308Santhony.gutierrez@amd.com                                latency += missLatency2;
11308Santhony.gutierrez@amd.com                            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                            if (p->fixupStackFault(vaddr))
11308Santhony.gutierrez@amd.com                                success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com                        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        if (!success) {
11308Santhony.gutierrez@amd.com                            return std::make_shared<PageFault>(vaddr, true,
11308Santhony.gutierrez@amd.com                                                               mode, true,
11308Santhony.gutierrez@amd.com                                                               false);
11308Santhony.gutierrez@amd.com                        } else {
11308Santhony.gutierrez@amd.com                            newEntry.valid = success;
11308Santhony.gutierrez@amd.com                            Addr alignedVaddr = p->pTable->pageAlign(vaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                            DPRINTF(GPUTLB, "Mapping %#x to %#x\n",
11308Santhony.gutierrez@amd.com                                    alignedVaddr, newEntry.pageStart());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                            entry = insert(alignedVaddr, newEntry);
11308Santhony.gutierrez@amd.com                        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        DPRINTF(GPUTLB, "Miss was serviced.\n");
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    localNumTLBHits++;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    if (timing) {
11308Santhony.gutierrez@amd.com                        latency = hitLatency;
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                // Do paging protection checks.
11308Santhony.gutierrez@amd.com                bool inUser = (m5Reg.cpl == 3 &&
11308Santhony.gutierrez@amd.com                               !(flags & (CPL0FlagBit << FlagShift)));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                CR0 cr0 = tc->readMiscRegNoEffect(MISCREG_CR0);
11308Santhony.gutierrez@amd.com                bool badWrite = (!entry->writable && (inUser || cr0.wp));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if ((inUser && !entry->user) || (mode == BaseTLB::Write &&
11308Santhony.gutierrez@amd.com                     badWrite)) {
11308Santhony.gutierrez@amd.com                    // The page must have been present to get into the TLB in
11308Santhony.gutierrez@amd.com                    // the first place. We'll assume the reserved bits are
11308Santhony.gutierrez@amd.com                    // fine even though we're not checking them.
11308Santhony.gutierrez@amd.com                    return std::make_shared<PageFault>(vaddr, true, mode,
11308Santhony.gutierrez@amd.com                                                       inUser, false);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (storeCheck && badWrite) {
11308Santhony.gutierrez@amd.com                    // This would fault if this were a write, so return a page
11308Santhony.gutierrez@amd.com                    // fault that reflects that happening.
11308Santhony.gutierrez@amd.com                    return std::make_shared<PageFault>(vaddr, true,
11308Santhony.gutierrez@amd.com                                                       BaseTLB::Write,
11308Santhony.gutierrez@amd.com                                                       inUser, false);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Entry found with paddr %#x, doing protection "
11308Santhony.gutierrez@amd.com                        "checks.\n", entry->paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                int page_size = entry->size();
11308Santhony.gutierrez@amd.com                Addr paddr = entry->paddr | (vaddr & (page_size - 1));
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Translated %#x -> %#x.\n", vaddr, paddr);
11308Santhony.gutierrez@amd.com                req->setPaddr(paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (entry->uncacheable)
11308Santhony.gutierrez@amd.com                    req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                //Use the address which already has segmentation applied.
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Paging disabled.\n");
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Translated %#x -> %#x.\n", vaddr, vaddr);
11308Santhony.gutierrez@amd.com                req->setPaddr(vaddr);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            // Real mode
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "In real mode.\n");
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Translated %#x -> %#x.\n", vaddr, vaddr);
11308Santhony.gutierrez@amd.com            req->setPaddr(vaddr);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Check for an access to the local APIC
11308Santhony.gutierrez@amd.com        if (FullSystem) {
11308Santhony.gutierrez@amd.com            LocalApicBase localApicBase =
11308Santhony.gutierrez@amd.com                tc->readMiscRegNoEffect(MISCREG_APIC_BASE);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            Addr baseAddr = localApicBase.base * PageBytes;
11308Santhony.gutierrez@amd.com            Addr paddr = req->getPaddr();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (baseAddr <= paddr && baseAddr + PageBytes > paddr) {
11308Santhony.gutierrez@amd.com                // Force the access to be uncacheable.
11308Santhony.gutierrez@amd.com                req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com                req->setPaddr(x86LocalAPICAddress(tc->contextId(),
11308Santhony.gutierrez@amd.com                                                  paddr - baseAddr));
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return NoFault;
11308Santhony.gutierrez@amd.com    };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Fault
11308Santhony.gutierrez@amd.com    GpuTLB::translateAtomic(RequestPtr req, ThreadContext *tc, Mode mode,
11308Santhony.gutierrez@amd.com                            int &latency)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        bool delayedResponse;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return GpuTLB::translate(req, tc, nullptr, mode, delayedResponse, false,
11308Santhony.gutierrez@amd.com                                 latency);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::translateTiming(RequestPtr req, ThreadContext *tc,
11308Santhony.gutierrez@amd.com            Translation *translation, Mode mode, int &latency)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        bool delayedResponse;
11308Santhony.gutierrez@amd.com        assert(translation);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Fault fault = GpuTLB::translate(req, tc, translation, mode,
11308Santhony.gutierrez@amd.com                                        delayedResponse, true, latency);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (!delayedResponse)
11308Santhony.gutierrez@amd.com            translation->finish(fault, req, tc, mode);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Walker*
11308Santhony.gutierrez@amd.com    GpuTLB::getWalker()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        return walker;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::serialize(CheckpointOut &cp) const
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::unserialize(CheckpointIn &cp)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::regStats()
11308Santhony.gutierrez@amd.com    {
11523Sdavid.guillen@arm.com        MemObject::regStats();
11523Sdavid.guillen@arm.com
11308Santhony.gutierrez@amd.com        localNumTLBAccesses
11308Santhony.gutierrez@amd.com            .name(name() + ".local_TLB_accesses")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB accesses")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localNumTLBHits
11308Santhony.gutierrez@amd.com            .name(name() + ".local_TLB_hits")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB hits")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localNumTLBMisses
11308Santhony.gutierrez@amd.com            .name(name() + ".local_TLB_misses")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB misses")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localTLBMissRate
11308Santhony.gutierrez@amd.com            .name(name() + ".local_TLB_miss_rate")
11308Santhony.gutierrez@amd.com            .desc("TLB miss rate")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        accessCycles
11308Santhony.gutierrez@amd.com            .name(name() + ".access_cycles")
11308Santhony.gutierrez@amd.com            .desc("Cycles spent accessing this TLB level")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        pageTableCycles
11308Santhony.gutierrez@amd.com            .name(name() + ".page_table_cycles")
11308Santhony.gutierrez@amd.com            .desc("Cycles spent accessing the page table")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localTLBMissRate = 100 * localNumTLBMisses / localNumTLBAccesses;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        numUniquePages
11308Santhony.gutierrez@amd.com            .name(name() + ".unique_pages")
11308Santhony.gutierrez@amd.com            .desc("Number of unique pages touched")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localCycles
11308Santhony.gutierrez@amd.com            .name(name() + ".local_cycles")
11308Santhony.gutierrez@amd.com            .desc("Number of cycles spent in queue for all incoming reqs")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localLatency
11308Santhony.gutierrez@amd.com            .name(name() + ".local_latency")
11308Santhony.gutierrez@amd.com            .desc("Avg. latency over incoming coalesced reqs")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        localLatency = localCycles / localNumTLBAccesses;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        globalNumTLBAccesses
11308Santhony.gutierrez@amd.com            .name(name() + ".global_TLB_accesses")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB accesses")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        globalNumTLBHits
11308Santhony.gutierrez@amd.com            .name(name() + ".global_TLB_hits")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB hits")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        globalNumTLBMisses
11308Santhony.gutierrez@amd.com            .name(name() + ".global_TLB_misses")
11308Santhony.gutierrez@amd.com            .desc("Number of TLB misses")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        globalTLBMissRate
11308Santhony.gutierrez@amd.com            .name(name() + ".global_TLB_miss_rate")
11308Santhony.gutierrez@amd.com            .desc("TLB miss rate")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        globalTLBMissRate = 100 * globalNumTLBMisses / globalNumTLBAccesses;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        avgReuseDistance
11308Santhony.gutierrez@amd.com            .name(name() + ".avg_reuse_distance")
11308Santhony.gutierrez@amd.com            .desc("avg. reuse distance over all pages (in ticks)")
11308Santhony.gutierrez@amd.com            ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * Do the TLB lookup for this coalesced request and schedule
11308Santhony.gutierrez@amd.com     * another event <TLB access latency> cycles later.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::issueTLBLookup(PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        assert(pkt);
11308Santhony.gutierrez@amd.com        assert(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Addr virt_page_addr = roundDown(pkt->req->getVaddr(),
11308Santhony.gutierrez@amd.com                                        TheISA::PageBytes);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        TranslationState *sender_state =
11308Santhony.gutierrez@amd.com                safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        bool update_stats = !sender_state->prefetch;
11308Santhony.gutierrez@amd.com        ThreadContext * tmp_tc = sender_state->tc;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Translation req. for virt. page addr %#x\n",
11308Santhony.gutierrez@amd.com                virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        int req_cnt = sender_state->reqCnt.back();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (update_stats) {
11308Santhony.gutierrez@amd.com            accessCycles -= (curTick() * req_cnt);
11308Santhony.gutierrez@amd.com            localCycles -= curTick();
11308Santhony.gutierrez@amd.com            updatePageFootprint(virt_page_addr);
11308Santhony.gutierrez@amd.com            globalNumTLBAccesses += req_cnt;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        tlbOutcome lookup_outcome = TLB_MISS;
11308Santhony.gutierrez@amd.com        RequestPtr tmp_req = pkt->req;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Access the TLB and figure out if it's a hit or a miss.
11308Santhony.gutierrez@amd.com        bool success = tlbLookup(tmp_req, tmp_tc, update_stats);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (success) {
11308Santhony.gutierrez@amd.com            lookup_outcome = TLB_HIT;
11308Santhony.gutierrez@amd.com            // Put the entry in SenderState
11308Santhony.gutierrez@amd.com            GpuTlbEntry *entry = lookup(tmp_req->getVaddr(), false);
11308Santhony.gutierrez@amd.com            assert(entry);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            sender_state->tlbEntry =
11308Santhony.gutierrez@amd.com                new GpuTlbEntry(0, entry->vaddr, entry->paddr, entry->valid);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (update_stats) {
11308Santhony.gutierrez@amd.com                // the reqCnt has an entry per level, so its size tells us
11308Santhony.gutierrez@amd.com                // which level we are in
11308Santhony.gutierrez@amd.com                sender_state->hitLevel = sender_state->reqCnt.size();
11308Santhony.gutierrez@amd.com                globalNumTLBHits += req_cnt;
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            if (update_stats)
11308Santhony.gutierrez@amd.com                globalNumTLBMisses += req_cnt;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /*
11308Santhony.gutierrez@amd.com         * We now know the TLB lookup outcome (if it's a hit or a miss), as well
11308Santhony.gutierrez@amd.com         * as the TLB access latency.
11308Santhony.gutierrez@amd.com         *
11308Santhony.gutierrez@amd.com         * We create and schedule a new TLBEvent which will help us take the
11308Santhony.gutierrez@amd.com         * appropriate actions (e.g., update TLB on a hit, send request to lower
11308Santhony.gutierrez@amd.com         * level TLB on a miss, or start a page walk if this was the last-level
11308Santhony.gutierrez@amd.com         * TLB)
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        TLBEvent *tlb_event =
11308Santhony.gutierrez@amd.com            new TLBEvent(this, virt_page_addr, lookup_outcome, pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (translationReturnEvent.count(virt_page_addr)) {
11308Santhony.gutierrez@amd.com            panic("Virtual Page Address %#x already has a return event\n",
11308Santhony.gutierrez@amd.com                  virt_page_addr);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        translationReturnEvent[virt_page_addr] = tlb_event;
11308Santhony.gutierrez@amd.com        assert(tlb_event);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "schedule translationReturnEvent @ curTick %d\n",
11308Santhony.gutierrez@amd.com                curTick() + this->ticks(hitLatency));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        schedule(tlb_event, curTick() + this->ticks(hitLatency));
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GpuTLB::TLBEvent::TLBEvent(GpuTLB* _tlb, Addr _addr, tlbOutcome tlb_outcome,
11308Santhony.gutierrez@amd.com                               PacketPtr _pkt)
11308Santhony.gutierrez@amd.com        : Event(CPU_Tick_Pri), tlb(_tlb), virtPageAddr(_addr),
11308Santhony.gutierrez@amd.com        outcome(tlb_outcome), pkt(_pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * Do Paging protection checks. If we encounter a page fault, then
11308Santhony.gutierrez@amd.com     * an assertion is fired.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::pagingProtectionChecks(ThreadContext *tc, PacketPtr pkt,
11308Santhony.gutierrez@amd.com            GpuTlbEntry * tlb_entry, Mode mode)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        HandyM5Reg m5Reg = tc->readMiscRegNoEffect(MISCREG_M5_REG);
11308Santhony.gutierrez@amd.com        uint32_t flags = pkt->req->getFlags();
11308Santhony.gutierrez@amd.com        bool storeCheck = flags & (StoreCheck << FlagShift);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Do paging protection checks.
11308Santhony.gutierrez@amd.com        bool inUser = (m5Reg.cpl == 3 && !(flags & (CPL0FlagBit << FlagShift)));
11308Santhony.gutierrez@amd.com        CR0 cr0 = tc->readMiscRegNoEffect(MISCREG_CR0);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        bool badWrite = (!tlb_entry->writable && (inUser || cr0.wp));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if ((inUser && !tlb_entry->user) ||
11308Santhony.gutierrez@amd.com            (mode == BaseTLB::Write && badWrite)) {
11308Santhony.gutierrez@amd.com           // The page must have been present to get into the TLB in
11308Santhony.gutierrez@amd.com           // the first place. We'll assume the reserved bits are
11308Santhony.gutierrez@amd.com           // fine even though we're not checking them.
11308Santhony.gutierrez@amd.com           assert(false);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (storeCheck && badWrite) {
11308Santhony.gutierrez@amd.com           // This would fault if this were a write, so return a page
11308Santhony.gutierrez@amd.com           // fault that reflects that happening.
11308Santhony.gutierrez@amd.com           assert(false);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * handleTranslationReturn is called on a TLB hit,
11308Santhony.gutierrez@amd.com     * when a TLB miss returns or when a page fault returns.
11308Santhony.gutierrez@amd.com     * The latter calls handelHit with TLB miss as tlbOutcome.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::handleTranslationReturn(Addr virt_page_addr, tlbOutcome tlb_outcome,
11308Santhony.gutierrez@amd.com            PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        assert(pkt);
11308Santhony.gutierrez@amd.com        Addr vaddr = pkt->req->getVaddr();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        TranslationState *sender_state =
11308Santhony.gutierrez@amd.com            safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ThreadContext *tc = sender_state->tc;
11308Santhony.gutierrez@amd.com        Mode mode = sender_state->tlbMode;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        GpuTlbEntry *local_entry, *new_entry;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (tlb_outcome == TLB_HIT) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Translation Done - TLB Hit for addr %#x\n", vaddr);
11308Santhony.gutierrez@amd.com            local_entry = sender_state->tlbEntry;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Translation Done - TLB Miss for addr %#x\n",
11308Santhony.gutierrez@amd.com                    vaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // We are returning either from a page walk or from a hit at a lower
11308Santhony.gutierrez@amd.com            // TLB level. The senderState should be "carrying" a pointer to the
11308Santhony.gutierrez@amd.com            // correct TLBEntry.
11308Santhony.gutierrez@amd.com            new_entry = sender_state->tlbEntry;
11308Santhony.gutierrez@amd.com            assert(new_entry);
11308Santhony.gutierrez@amd.com            local_entry = new_entry;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (allocationPolicy) {
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "allocating entry w/ addr %#x\n",
11308Santhony.gutierrez@amd.com                        virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                local_entry = insert(virt_page_addr, *new_entry);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            assert(local_entry);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * At this point the packet carries an up-to-date tlbEntry pointer
11308Santhony.gutierrez@amd.com         * in its senderState.
11308Santhony.gutierrez@amd.com         * Next step is to do the paging protection checks.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Entry found with vaddr %#x,  doing protection checks "
11308Santhony.gutierrez@amd.com                "while paddr was %#x.\n", local_entry->vaddr,
11308Santhony.gutierrez@amd.com                local_entry->paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        pagingProtectionChecks(tc, pkt, local_entry, mode);
11308Santhony.gutierrez@amd.com        int page_size = local_entry->size();
11308Santhony.gutierrez@amd.com        Addr paddr = local_entry->paddr | (vaddr & (page_size - 1));
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Translated %#x -> %#x.\n", vaddr, paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Since this packet will be sent through the cpu side slave port,
11308Santhony.gutierrez@amd.com        // it must be converted to a response pkt if it is not one already
11308Santhony.gutierrez@amd.com        if (pkt->isRequest()) {
11308Santhony.gutierrez@amd.com            pkt->makeTimingResponse();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        pkt->req->setPaddr(paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (local_entry->uncacheable) {
11308Santhony.gutierrez@amd.com             pkt->req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        //send packet back to coalescer
11308Santhony.gutierrez@amd.com        cpuSidePort[0]->sendTimingResp(pkt);
11308Santhony.gutierrez@amd.com        //schedule cleanup event
11308Santhony.gutierrez@amd.com        cleanupQueue.push(virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // schedule this only once per cycle.
11308Santhony.gutierrez@amd.com        // The check is required because we might have multiple translations
11308Santhony.gutierrez@amd.com        // returning the same cycle
11308Santhony.gutierrez@amd.com        // this is a maximum priority event and must be on the same cycle
11308Santhony.gutierrez@amd.com        // as the cleanup event in TLBCoalescer to avoid a race with
11308Santhony.gutierrez@amd.com        // IssueProbeEvent caused by TLBCoalescer::MemSidePort::recvReqRetry
11308Santhony.gutierrez@amd.com        if (!cleanupEvent.scheduled())
11308Santhony.gutierrez@amd.com            schedule(cleanupEvent, curTick());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * Here we take the appropriate actions based on the result of the
11308Santhony.gutierrez@amd.com     * TLB lookup.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::translationReturn(Addr virtPageAddr, tlbOutcome outcome,
11308Santhony.gutierrez@amd.com                              PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Triggered TLBEvent for addr %#x\n", virtPageAddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        assert(translationReturnEvent[virtPageAddr]);
11308Santhony.gutierrez@amd.com        assert(pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        TranslationState *tmp_sender_state =
11308Santhony.gutierrez@amd.com            safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        int req_cnt = tmp_sender_state->reqCnt.back();
11308Santhony.gutierrez@amd.com        bool update_stats = !tmp_sender_state->prefetch;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (outcome == TLB_HIT) {
11308Santhony.gutierrez@amd.com            handleTranslationReturn(virtPageAddr, TLB_HIT, pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (update_stats) {
11308Santhony.gutierrez@amd.com                accessCycles += (req_cnt * curTick());
11308Santhony.gutierrez@amd.com                localCycles += curTick();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        } else if (outcome == TLB_MISS) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "This is a TLB miss\n");
11308Santhony.gutierrez@amd.com            if (update_stats) {
11308Santhony.gutierrez@amd.com                accessCycles += (req_cnt*curTick());
11308Santhony.gutierrez@amd.com                localCycles += curTick();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (hasMemSidePort) {
11308Santhony.gutierrez@amd.com                // the one cyle added here represent the delay from when we get
11308Santhony.gutierrez@amd.com                // the reply back till when we propagate it to the coalescer
11308Santhony.gutierrez@amd.com                // above.
11308Santhony.gutierrez@amd.com                if (update_stats) {
11308Santhony.gutierrez@amd.com                    accessCycles += (req_cnt * 1);
11308Santhony.gutierrez@amd.com                    localCycles += 1;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                /**
11308Santhony.gutierrez@amd.com                 * There is a TLB below. Send the coalesced request.
11308Santhony.gutierrez@amd.com                 * We actually send the very first packet of all the
11308Santhony.gutierrez@amd.com                 * pending packets for this virtual page address.
11308Santhony.gutierrez@amd.com                 */
11308Santhony.gutierrez@amd.com                if (!memSidePort[0]->sendTimingReq(pkt)) {
11308Santhony.gutierrez@amd.com                    DPRINTF(GPUTLB, "Failed sending translation request to "
11308Santhony.gutierrez@amd.com                            "lower level TLB for addr %#x\n", virtPageAddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    memSidePort[0]->retries.push_back(pkt);
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    DPRINTF(GPUTLB, "Sent translation request to lower level "
11308Santhony.gutierrez@amd.com                            "TLB for addr %#x\n", virtPageAddr);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                //this is the last level TLB. Start a page walk
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Last level TLB - start a page walk for "
11308Santhony.gutierrez@amd.com                        "addr %#x\n", virtPageAddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (update_stats)
11308Santhony.gutierrez@amd.com                    pageTableCycles -= (req_cnt*curTick());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                TLBEvent *tlb_event = translationReturnEvent[virtPageAddr];
11308Santhony.gutierrez@amd.com                assert(tlb_event);
11308Santhony.gutierrez@amd.com                tlb_event->updateOutcome(PAGE_WALK);
11308Santhony.gutierrez@amd.com                schedule(tlb_event, curTick() + ticks(missLatency2));
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else if (outcome == PAGE_WALK) {
11308Santhony.gutierrez@amd.com            if (update_stats)
11308Santhony.gutierrez@amd.com                pageTableCycles += (req_cnt*curTick());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // Need to access the page table and update the TLB
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Doing a page walk for address %#x\n",
11308Santhony.gutierrez@amd.com                    virtPageAddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            TranslationState *sender_state =
11308Santhony.gutierrez@amd.com                safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            Process *p = sender_state->tc->getProcessPtr();
11308Santhony.gutierrez@amd.com            TlbEntry newEntry;
11308Santhony.gutierrez@amd.com            Addr vaddr = pkt->req->getVaddr();
11308Santhony.gutierrez@amd.com    #ifndef NDEBUG
11308Santhony.gutierrez@amd.com            Addr alignedVaddr = p->pTable->pageAlign(vaddr);
11308Santhony.gutierrez@amd.com            assert(alignedVaddr == virtPageAddr);
11308Santhony.gutierrez@amd.com    #endif
11308Santhony.gutierrez@amd.com            bool success;
11308Santhony.gutierrez@amd.com            success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com            if (!success && sender_state->tlbMode != BaseTLB::Execute) {
11308Santhony.gutierrez@amd.com                if (p->fixupStackFault(vaddr)) {
11308Santhony.gutierrez@amd.com                    success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Mapping %#x to %#x\n", alignedVaddr,
11308Santhony.gutierrez@amd.com                    newEntry.pageStart());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            sender_state->tlbEntry =
11308Santhony.gutierrez@amd.com                new GpuTlbEntry(0, newEntry.vaddr, newEntry.paddr, success);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            handleTranslationReturn(virtPageAddr, TLB_MISS, pkt);
11308Santhony.gutierrez@amd.com        } else if (outcome == MISS_RETURN) {
11308Santhony.gutierrez@amd.com            /** we add an extra cycle in the return path of the translation
11308Santhony.gutierrez@amd.com             * requests in between the various TLB levels.
11308Santhony.gutierrez@amd.com             */
11308Santhony.gutierrez@amd.com            handleTranslationReturn(virtPageAddr, TLB_MISS, pkt);
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            assert(false);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::TLBEvent::process()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        tlb->translationReturn(virtPageAddr, outcome, pkt);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    const char*
11308Santhony.gutierrez@amd.com    GpuTLB::TLBEvent::description() const
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        return "trigger translationDoneEvent";
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::TLBEvent::updateOutcome(tlbOutcome _outcome)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        outcome = _outcome;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Addr
11308Santhony.gutierrez@amd.com    GpuTLB::TLBEvent::getTLBEventVaddr()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        return virtPageAddr;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /*
11308Santhony.gutierrez@amd.com     * recvTiming receives a coalesced timing request from a TLBCoalescer
11308Santhony.gutierrez@amd.com     * and it calls issueTLBLookup()
11308Santhony.gutierrez@amd.com     * It only rejects the packet if we have exceeded the max
11308Santhony.gutierrez@amd.com     * outstanding number of requests for the TLB
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    bool
11308Santhony.gutierrez@amd.com    GpuTLB::CpuSidePort::recvTimingReq(PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        if (tlb->outstandingReqs < tlb->maxCoalescedReqs) {
11308Santhony.gutierrez@amd.com            tlb->issueTLBLookup(pkt);
11308Santhony.gutierrez@amd.com            // update number of outstanding translation requests
11308Santhony.gutierrez@amd.com            tlb->outstandingReqs++;
11308Santhony.gutierrez@amd.com            return true;
11308Santhony.gutierrez@amd.com         } else {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Reached maxCoalescedReqs number %d\n",
11308Santhony.gutierrez@amd.com                    tlb->outstandingReqs);
11308Santhony.gutierrez@amd.com            return false;
11308Santhony.gutierrez@amd.com         }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * handleFuncTranslationReturn is called on a TLB hit,
11308Santhony.gutierrez@amd.com     * when a TLB miss returns or when a page fault returns.
11308Santhony.gutierrez@amd.com     * It updates LRU, inserts the TLB entry on a miss
11308Santhony.gutierrez@amd.com     * depending on the allocation policy and does the required
11308Santhony.gutierrez@amd.com     * protection checks. It does NOT create a new packet to
11308Santhony.gutierrez@amd.com     * update the packet's addr; this is done in hsail-gpu code.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::handleFuncTranslationReturn(PacketPtr pkt, tlbOutcome tlb_outcome)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        TranslationState *sender_state =
11308Santhony.gutierrez@amd.com            safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ThreadContext *tc = sender_state->tc;
11308Santhony.gutierrez@amd.com        Mode mode = sender_state->tlbMode;
11308Santhony.gutierrez@amd.com        Addr vaddr = pkt->req->getVaddr();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        GpuTlbEntry *local_entry, *new_entry;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (tlb_outcome == TLB_HIT) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Functional Translation Done - TLB hit for addr "
11308Santhony.gutierrez@amd.com                    "%#x\n", vaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            local_entry = sender_state->tlbEntry;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUTLB, "Functional Translation Done - TLB miss for addr "
11308Santhony.gutierrez@amd.com                    "%#x\n", vaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // We are returning either from a page walk or from a hit at a lower
11308Santhony.gutierrez@amd.com            // TLB level. The senderState should be "carrying" a pointer to the
11308Santhony.gutierrez@amd.com            // correct TLBEntry.
11308Santhony.gutierrez@amd.com            new_entry = sender_state->tlbEntry;
11308Santhony.gutierrez@amd.com            assert(new_entry);
11308Santhony.gutierrez@amd.com            local_entry = new_entry;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (allocationPolicy) {
11308Santhony.gutierrez@amd.com                Addr virt_page_addr = roundDown(vaddr, TheISA::PageBytes);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "allocating entry w/ addr %#x\n",
11308Santhony.gutierrez@amd.com                        virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                local_entry = insert(virt_page_addr, *new_entry);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            assert(local_entry);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Entry found with vaddr %#x, doing protection checks "
11308Santhony.gutierrez@amd.com                "while paddr was %#x.\n", local_entry->vaddr,
11308Santhony.gutierrez@amd.com                local_entry->paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Do paging checks if it's a normal functional access.  If it's for a
11308Santhony.gutierrez@amd.com        // prefetch, then sometimes you can try to prefetch something that won't
11308Santhony.gutierrez@amd.com        // pass protection. We don't actually want to fault becuase there is no
11308Santhony.gutierrez@amd.com        // demand access to deem this a violation.  Just put it in the TLB and
11308Santhony.gutierrez@amd.com        // it will fault if indeed a future demand access touches it in
11308Santhony.gutierrez@amd.com        // violation.
11308Santhony.gutierrez@amd.com        if (!sender_state->prefetch && sender_state->tlbEntry->valid)
11308Santhony.gutierrez@amd.com            pagingProtectionChecks(tc, pkt, local_entry, mode);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        int page_size = local_entry->size();
11308Santhony.gutierrez@amd.com        Addr paddr = local_entry->paddr | (vaddr & (page_size - 1));
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "Translated %#x -> %#x.\n", vaddr, paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        pkt->req->setPaddr(paddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (local_entry->uncacheable)
11308Santhony.gutierrez@amd.com             pkt->req->setFlags(Request::UNCACHEABLE);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // This is used for atomic translations. Need to
11308Santhony.gutierrez@amd.com    // make it all happen during the same cycle.
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::CpuSidePort::recvFunctional(PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        TranslationState *sender_state =
11308Santhony.gutierrez@amd.com            safe_cast<TranslationState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ThreadContext *tc = sender_state->tc;
11308Santhony.gutierrez@amd.com        bool update_stats = !sender_state->prefetch;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Addr virt_page_addr = roundDown(pkt->req->getVaddr(),
11308Santhony.gutierrez@amd.com                                        TheISA::PageBytes);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (update_stats)
11308Santhony.gutierrez@amd.com            tlb->updatePageFootprint(virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // do the TLB lookup without updating the stats
11308Santhony.gutierrez@amd.com        bool success = tlb->tlbLookup(pkt->req, tc, update_stats);
11308Santhony.gutierrez@amd.com        tlbOutcome tlb_outcome = success ? TLB_HIT : TLB_MISS;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // functional mode means no coalescing
11308Santhony.gutierrez@amd.com        // global metrics are the same as the local metrics
11308Santhony.gutierrez@amd.com        if (update_stats) {
11308Santhony.gutierrez@amd.com            tlb->globalNumTLBAccesses++;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (success) {
11308Santhony.gutierrez@amd.com                sender_state->hitLevel = sender_state->reqCnt.size();
11308Santhony.gutierrez@amd.com                tlb->globalNumTLBHits++;
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (!success) {
11308Santhony.gutierrez@amd.com            if (update_stats)
11308Santhony.gutierrez@amd.com                tlb->globalNumTLBMisses++;
11308Santhony.gutierrez@amd.com            if (tlb->hasMemSidePort) {
11308Santhony.gutierrez@amd.com                // there is a TLB below -> propagate down the TLB hierarchy
11308Santhony.gutierrez@amd.com                tlb->memSidePort[0]->sendFunctional(pkt);
11308Santhony.gutierrez@amd.com                // If no valid translation from a prefetch, then just return
11308Santhony.gutierrez@amd.com                if (sender_state->prefetch && !pkt->req->hasPaddr())
11308Santhony.gutierrez@amd.com                    return;
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                // Need to access the page table and update the TLB
11308Santhony.gutierrez@amd.com                DPRINTF(GPUTLB, "Doing a page walk for address %#x\n",
11308Santhony.gutierrez@amd.com                        virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                Process *p = tc->getProcessPtr();
11308Santhony.gutierrez@amd.com                TlbEntry newEntry;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                Addr vaddr = pkt->req->getVaddr();
11308Santhony.gutierrez@amd.com    #ifndef NDEBUG
11308Santhony.gutierrez@amd.com                Addr alignedVaddr = p->pTable->pageAlign(vaddr);
11308Santhony.gutierrez@amd.com                assert(alignedVaddr == virt_page_addr);
11308Santhony.gutierrez@amd.com    #endif
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                bool success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com                if (!success && sender_state->tlbMode != BaseTLB::Execute) {
11308Santhony.gutierrez@amd.com                    if (p->fixupStackFault(vaddr))
11308Santhony.gutierrez@amd.com                        success = p->pTable->lookup(vaddr, newEntry);
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (!sender_state->prefetch) {
11308Santhony.gutierrez@amd.com                    // no PageFaults are permitted after
11308Santhony.gutierrez@amd.com                    // the second page table lookup
11308Santhony.gutierrez@amd.com                    assert(success);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    DPRINTF(GPUTLB, "Mapping %#x to %#x\n", alignedVaddr,
11308Santhony.gutierrez@amd.com                           newEntry.pageStart());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    sender_state->tlbEntry = new GpuTlbEntry(0, newEntry.vaddr,
11308Santhony.gutierrez@amd.com                                                             newEntry.paddr,
11308Santhony.gutierrez@amd.com                                                             success);
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    // If this was a prefetch, then do the normal thing if it
11308Santhony.gutierrez@amd.com                    // was a successful translation.  Otherwise, send an empty
11308Santhony.gutierrez@amd.com                    // TLB entry back so that it can be figured out as empty and
11308Santhony.gutierrez@amd.com                    // handled accordingly.
11308Santhony.gutierrez@amd.com                    if (success) {
11308Santhony.gutierrez@amd.com                        DPRINTF(GPUTLB, "Mapping %#x to %#x\n", alignedVaddr,
11308Santhony.gutierrez@amd.com                               newEntry.pageStart());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        sender_state->tlbEntry = new GpuTlbEntry(0,
11308Santhony.gutierrez@amd.com                                                                 newEntry.vaddr,
11308Santhony.gutierrez@amd.com                                                                 newEntry.paddr,
11308Santhony.gutierrez@amd.com                                                                 success);
11308Santhony.gutierrez@amd.com                    } else {
11308Santhony.gutierrez@amd.com                        DPRINTF(GPUPrefetch, "Prefetch failed %#x\n",
11308Santhony.gutierrez@amd.com                                alignedVaddr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        sender_state->tlbEntry = new GpuTlbEntry();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                        return;
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUPrefetch, "Functional Hit for vaddr %#x\n",
11308Santhony.gutierrez@amd.com                    tlb->lookup(pkt->req->getVaddr()));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            GpuTlbEntry *entry = tlb->lookup(pkt->req->getVaddr(),
11308Santhony.gutierrez@amd.com                                             update_stats);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            assert(entry);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            sender_state->tlbEntry =
11308Santhony.gutierrez@amd.com                new GpuTlbEntry(0, entry->vaddr, entry->paddr, entry->valid);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        // This is the function that would populate pkt->req with the paddr of
11308Santhony.gutierrez@amd.com        // the translation. But if no translation happens (i.e Prefetch fails)
11308Santhony.gutierrez@amd.com        // then the early returns in the above code wiill keep this function
11308Santhony.gutierrez@amd.com        // from executing.
11308Santhony.gutierrez@amd.com        tlb->handleFuncTranslationReturn(pkt, tlb_outcome);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::CpuSidePort::recvReqRetry()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        // The CPUSidePort never sends anything but replies. No retries
11308Santhony.gutierrez@amd.com        // expected.
11308Santhony.gutierrez@amd.com        assert(false);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    AddrRangeList
11308Santhony.gutierrez@amd.com    GpuTLB::CpuSidePort::getAddrRanges() const
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        // currently not checked by the master
11308Santhony.gutierrez@amd.com        AddrRangeList ranges;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return ranges;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    /**
11308Santhony.gutierrez@amd.com     * MemSidePort receives the packet back.
11308Santhony.gutierrez@amd.com     * We need to call the handleTranslationReturn
11308Santhony.gutierrez@amd.com     * and propagate up the hierarchy.
11308Santhony.gutierrez@amd.com     */
11308Santhony.gutierrez@amd.com    bool
11308Santhony.gutierrez@amd.com    GpuTLB::MemSidePort::recvTimingResp(PacketPtr pkt)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        Addr virt_page_addr = roundDown(pkt->req->getVaddr(),
11308Santhony.gutierrez@amd.com                                        TheISA::PageBytes);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        DPRINTF(GPUTLB, "MemSidePort recvTiming for virt_page_addr %#x\n",
11308Santhony.gutierrez@amd.com                virt_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        TLBEvent *tlb_event = tlb->translationReturnEvent[virt_page_addr];
11308Santhony.gutierrez@amd.com        assert(tlb_event);
11308Santhony.gutierrez@amd.com        assert(virt_page_addr == tlb_event->getTLBEventVaddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        tlb_event->updateOutcome(MISS_RETURN);
11308Santhony.gutierrez@amd.com        tlb->schedule(tlb_event, curTick()+tlb->ticks(1));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        return true;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::MemSidePort::recvReqRetry()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        // No retries should reach the TLB. The retries
11308Santhony.gutierrez@amd.com        // should only reach the TLBCoalescer.
11308Santhony.gutierrez@amd.com        assert(false);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::cleanup()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        while (!cleanupQueue.empty()) {
11308Santhony.gutierrez@amd.com            Addr cleanup_addr = cleanupQueue.front();
11308Santhony.gutierrez@amd.com            cleanupQueue.pop();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // delete TLBEvent
11308Santhony.gutierrez@amd.com            TLBEvent * old_tlb_event = translationReturnEvent[cleanup_addr];
11308Santhony.gutierrez@amd.com            delete old_tlb_event;
11308Santhony.gutierrez@amd.com            translationReturnEvent.erase(cleanup_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // update number of outstanding requests
11308Santhony.gutierrez@amd.com            outstandingReqs--;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /** the higher level coalescer should retry if it has
11308Santhony.gutierrez@amd.com         * any pending requests.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        for (int i = 0; i < cpuSidePort.size(); ++i) {
11308Santhony.gutierrez@amd.com            cpuSidePort[i]->sendRetryReq();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::updatePageFootprint(Addr virt_page_addr)
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        std::pair<AccessPatternTable::iterator, bool> ret;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        AccessInfo tmp_access_info;
11308Santhony.gutierrez@amd.com        tmp_access_info.lastTimeAccessed = 0;
11308Santhony.gutierrez@amd.com        tmp_access_info.accessesPerPage = 0;
11308Santhony.gutierrez@amd.com        tmp_access_info.totalReuseDistance = 0;
11308Santhony.gutierrez@amd.com        tmp_access_info.sumDistance = 0;
11308Santhony.gutierrez@amd.com        tmp_access_info.meanDistance = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ret = TLBFootprint.insert(AccessPatternTable::value_type(virt_page_addr,
11308Santhony.gutierrez@amd.com                                  tmp_access_info));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        bool first_page_access = ret.second;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (first_page_access) {
11308Santhony.gutierrez@amd.com            numUniquePages++;
11308Santhony.gutierrez@amd.com        } else  {
11308Santhony.gutierrez@amd.com            int accessed_before;
11308Santhony.gutierrez@amd.com            accessed_before  = curTick() - ret.first->second.lastTimeAccessed;
11308Santhony.gutierrez@amd.com            ret.first->second.totalReuseDistance += accessed_before;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ret.first->second.accessesPerPage++;
11308Santhony.gutierrez@amd.com        ret.first->second.lastTimeAccessed = curTick();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (accessDistance) {
11308Santhony.gutierrez@amd.com            ret.first->second.localTLBAccesses
11308Santhony.gutierrez@amd.com                .push_back(localNumTLBAccesses.value());
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    void
11308Santhony.gutierrez@amd.com    GpuTLB::exitCallback()
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com        std::ostream *page_stat_file = nullptr;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (accessDistance) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // print per page statistics to a separate file (.csv format)
11308Santhony.gutierrez@amd.com            // simout is the gem5 output directory (default is m5out or the one
11308Santhony.gutierrez@amd.com            // specified with -d
11364Sandreas.hansson@arm.com            page_stat_file = simout.create(name().c_str())->stream();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // print header
11308Santhony.gutierrez@amd.com            *page_stat_file << "page,max_access_distance,mean_access_distance, "
11308Santhony.gutierrez@amd.com                            << "stddev_distance" << std::endl;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // update avg. reuse distance footprint
11308Santhony.gutierrez@amd.com        AccessPatternTable::iterator iter, iter_begin, iter_end;
11308Santhony.gutierrez@amd.com        unsigned int sum_avg_reuse_distance_per_page = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // iterate through all pages seen by this TLB
11308Santhony.gutierrez@amd.com        for (iter = TLBFootprint.begin(); iter != TLBFootprint.end(); iter++) {
11308Santhony.gutierrez@amd.com            sum_avg_reuse_distance_per_page += iter->second.totalReuseDistance /
11308Santhony.gutierrez@amd.com                                               iter->second.accessesPerPage;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (accessDistance) {
11308Santhony.gutierrez@amd.com                unsigned int tmp = iter->second.localTLBAccesses[0];
11308Santhony.gutierrez@amd.com                unsigned int prev = tmp;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                for (int i = 0; i < iter->second.localTLBAccesses.size(); ++i) {
11308Santhony.gutierrez@amd.com                    if (i) {
11308Santhony.gutierrez@amd.com                        tmp = prev + 1;
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    prev = iter->second.localTLBAccesses[i];
11308Santhony.gutierrez@amd.com                    // update the localTLBAccesses value
11308Santhony.gutierrez@amd.com                    // with the actual differece
11308Santhony.gutierrez@amd.com                    iter->second.localTLBAccesses[i] -= tmp;
11308Santhony.gutierrez@amd.com                    // compute the sum of AccessDistance per page
11308Santhony.gutierrez@amd.com                    // used later for mean
11308Santhony.gutierrez@amd.com                    iter->second.sumDistance +=
11308Santhony.gutierrez@amd.com                        iter->second.localTLBAccesses[i];
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                iter->second.meanDistance =
11308Santhony.gutierrez@amd.com                    iter->second.sumDistance / iter->second.accessesPerPage;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                // compute std_dev and max  (we need a second round because we
11308Santhony.gutierrez@amd.com                // need to know the mean value
11308Santhony.gutierrez@amd.com                unsigned int max_distance = 0;
11308Santhony.gutierrez@amd.com                unsigned int stddev_distance = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                for (int i = 0; i < iter->second.localTLBAccesses.size(); ++i) {
11308Santhony.gutierrez@amd.com                    unsigned int tmp_access_distance =
11308Santhony.gutierrez@amd.com                        iter->second.localTLBAccesses[i];
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    if (tmp_access_distance > max_distance) {
11308Santhony.gutierrez@amd.com                        max_distance = tmp_access_distance;
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                    unsigned int diff =
11308Santhony.gutierrez@amd.com                        tmp_access_distance - iter->second.meanDistance;
11308Santhony.gutierrez@amd.com                    stddev_distance += pow(diff, 2);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                stddev_distance =
11308Santhony.gutierrez@amd.com                    sqrt(stddev_distance/iter->second.accessesPerPage);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                if (page_stat_file) {
11308Santhony.gutierrez@amd.com                    *page_stat_file << std::hex << iter->first << ",";
11308Santhony.gutierrez@amd.com                    *page_stat_file << std::dec << max_distance << ",";
11308Santhony.gutierrez@amd.com                    *page_stat_file << std::dec << iter->second.meanDistance
11308Santhony.gutierrez@amd.com                                    << ",";
11308Santhony.gutierrez@amd.com                    *page_stat_file << std::dec << stddev_distance;
11308Santhony.gutierrez@amd.com                    *page_stat_file << std::endl;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                // erase the localTLBAccesses array
11308Santhony.gutierrez@amd.com                iter->second.localTLBAccesses.clear();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (!TLBFootprint.empty()) {
11308Santhony.gutierrez@amd.com            avgReuseDistance =
11308Santhony.gutierrez@amd.com                sum_avg_reuse_distance_per_page / TLBFootprint.size();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        //clear the TLBFootprint map
11308Santhony.gutierrez@amd.com        TLBFootprint.clear();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com} // namespace X86ISA
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comX86ISA::GpuTLB*
11308Santhony.gutierrez@amd.comX86GPUTLBParams::create()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return new X86ISA::GpuTLB(this);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com