src/gpu-compute/gpu_tlb.hh

11308Santhony.gutierrez@amd.com/*
11308Santhony.gutierrez@amd.com * Copyright (c) 2011-2015 Advanced Micro Devices, Inc.
11308Santhony.gutierrez@amd.com * All rights reserved.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * For use for simulation and test purposes only
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Redistribution and use in source and binary forms, with or without
11308Santhony.gutierrez@amd.com * modification, are permitted provided that the following conditions are met:
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 1. Redistributions of source code must retain the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 2. Redistributions in binary form must reproduce the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer in the documentation
11308Santhony.gutierrez@amd.com * and/or other materials provided with the distribution.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 3. Neither the name of the copyright holder nor the names of its contributors
11308Santhony.gutierrez@amd.com * may be used to endorse or promote products derived from this software
11308Santhony.gutierrez@amd.com * without specific prior written permission.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
11308Santhony.gutierrez@amd.com * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
11308Santhony.gutierrez@amd.com * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
11308Santhony.gutierrez@amd.com * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
11308Santhony.gutierrez@amd.com * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
11308Santhony.gutierrez@amd.com * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
11308Santhony.gutierrez@amd.com * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
11308Santhony.gutierrez@amd.com * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
11308Santhony.gutierrez@amd.com * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
11308Santhony.gutierrez@amd.com * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
11308Santhony.gutierrez@amd.com * POSSIBILITY OF SUCH DAMAGE.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Author: Lisa Hsu
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#ifndef __GPU_TLB_HH__
11308Santhony.gutierrez@amd.com#define __GPU_TLB_HH__
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include <fstream>
11308Santhony.gutierrez@amd.com#include <list>
11308Santhony.gutierrez@amd.com#include <queue>
11308Santhony.gutierrez@amd.com#include <string>
11308Santhony.gutierrez@amd.com#include <vector>
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "arch/generic/tlb.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/pagetable.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/pagetable_walker.hh"
11308Santhony.gutierrez@amd.com#include "arch/x86/regs/segment.hh"
11308Santhony.gutierrez@amd.com#include "base/callback.hh"
11308Santhony.gutierrez@amd.com#include "base/misc.hh"
11308Santhony.gutierrez@amd.com#include "base/statistics.hh"
11308Santhony.gutierrez@amd.com#include "gpu-compute/compute_unit.hh"
11308Santhony.gutierrez@amd.com#include "mem/mem_object.hh"
11308Santhony.gutierrez@amd.com#include "mem/port.hh"
11308Santhony.gutierrez@amd.com#include "mem/request.hh"
11308Santhony.gutierrez@amd.com#include "params/X86GPUTLB.hh"
11308Santhony.gutierrez@amd.com#include "sim/sim_object.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comclass BaseTLB;
11308Santhony.gutierrez@amd.comclass Packet;
11308Santhony.gutierrez@amd.comclass ThreadContext;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comnamespace X86ISA
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    class GpuTlbEntry : public TlbEntry
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com      public:
11308Santhony.gutierrez@amd.com        GpuTlbEntry(Addr asn, Addr _vaddr, Addr _paddr, bool _valid)
11308Santhony.gutierrez@amd.com          : TlbEntry(asn, _vaddr, _paddr, false, false), valid(_valid) { }
11308Santhony.gutierrez@amd.com
11713Santhony.gutierrez@amd.com        GpuTlbEntry() : TlbEntry(), valid(false) { }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        bool valid;
11308Santhony.gutierrez@amd.com    };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    class GpuTLB : public MemObject
11308Santhony.gutierrez@amd.com    {
11308Santhony.gutierrez@amd.com      protected:
11308Santhony.gutierrez@amd.com        friend class Walker;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        typedef std::list<GpuTlbEntry*> EntryList;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        uint32_t configAddress;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // TLB clock: will inherit clock from shader's clock period in terms
11308Santhony.gutierrez@amd.com        // of nuber of ticks of curTime (aka global simulation clock)
11308Santhony.gutierrez@amd.com        // The assignment of TLB clock from shader clock is done in the python
11308Santhony.gutierrez@amd.com        // config files.
11308Santhony.gutierrez@amd.com        int clock;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com      public:
11308Santhony.gutierrez@amd.com        // clock related functions ; maps to-and-from Simulation ticks and
11308Santhony.gutierrez@amd.com        // object clocks.
11308Santhony.gutierrez@amd.com        Tick frequency() const { return SimClock::Frequency / clock; }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Tick
11308Santhony.gutierrez@amd.com        ticks(int numCycles) const
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com            return (Tick)clock * numCycles;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Tick curCycle() const { return curTick() / clock; }
11308Santhony.gutierrez@amd.com        Tick tickToCycles(Tick val) const { return val / clock;}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        typedef X86GPUTLBParams Params;
11308Santhony.gutierrez@amd.com        GpuTLB(const Params *p);
11308Santhony.gutierrez@amd.com        ~GpuTLB();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        typedef enum BaseTLB::Mode Mode;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        class Translation
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com          public:
11308Santhony.gutierrez@amd.com            virtual ~Translation() { }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            /**
11308Santhony.gutierrez@amd.com             * Signal that the translation has been delayed due to a hw page
11308Santhony.gutierrez@amd.com             * table walk.
11308Santhony.gutierrez@amd.com             */
11308Santhony.gutierrez@amd.com            virtual void markDelayed() = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            /**
11308Santhony.gutierrez@amd.com             * The memory for this object may be dynamically allocated, and it
11308Santhony.gutierrez@amd.com             * may be responsible for cleaning itslef up which will happen in
11308Santhony.gutierrez@amd.com             * this function. Once it's called the object is no longer valid.
11308Santhony.gutierrez@amd.com             */
11308Santhony.gutierrez@amd.com            virtual void finish(Fault fault, RequestPtr req, ThreadContext *tc,
11308Santhony.gutierrez@amd.com                    Mode mode) = 0;
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void dumpAll();
11308Santhony.gutierrez@amd.com        GpuTlbEntry *lookup(Addr va, bool update_lru=true);
11308Santhony.gutierrez@amd.com        void setConfigAddress(uint32_t addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com      protected:
11308Santhony.gutierrez@amd.com        EntryList::iterator lookupIt(Addr va, bool update_lru=true);
11308Santhony.gutierrez@amd.com        Walker *walker;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com      public:
11308Santhony.gutierrez@amd.com        Walker *getWalker();
11308Santhony.gutierrez@amd.com        void invalidateAll();
11308Santhony.gutierrez@amd.com        void invalidateNonGlobal();
11308Santhony.gutierrez@amd.com        void demapPage(Addr va, uint64_t asn);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com      protected:
11308Santhony.gutierrez@amd.com        int size;
11308Santhony.gutierrez@amd.com        int assoc;
11308Santhony.gutierrez@amd.com        int numSets;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         *  true if this is a fully-associative TLB
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        bool FA;
11308Santhony.gutierrez@amd.com        Addr setMask;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * Allocation Policy: true if we always allocate on a hit, false
11308Santhony.gutierrez@amd.com         * otherwise. Default is true.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        bool allocationPolicy;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * if true, then this is not the last level TLB
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        bool hasMemSidePort;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * Print out accessDistance stats. One stat file
11308Santhony.gutierrez@amd.com         * per TLB.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        bool accessDistance;
11308Santhony.gutierrez@amd.com
11704Santhony.gutierrez@amd.com        std::vector<GpuTlbEntry> tlb;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /*
11308Santhony.gutierrez@amd.com         * It's a per-set list. As long as we have not reached
11308Santhony.gutierrez@amd.com         * the full capacity of the given set, grab an entry from
11308Santhony.gutierrez@amd.com         * the freeList.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        std::vector<EntryList> freeList;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * An entryList per set is the equivalent of an LRU stack;
11308Santhony.gutierrez@amd.com         * it's used to guide replacement decisions. The head of the list
11308Santhony.gutierrez@amd.com         * contains the MRU TLB entry of the given set. If the freeList
11308Santhony.gutierrez@amd.com         * for this set is empty, the last element of the list
11308Santhony.gutierrez@amd.com         * is evicted (i.e., dropped on the floor).
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        std::vector<EntryList> entryList;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Fault translateInt(RequestPtr req, ThreadContext *tc);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Fault translate(RequestPtr req, ThreadContext *tc,
11308Santhony.gutierrez@amd.com                Translation *translation, Mode mode, bool &delayedResponse,
11308Santhony.gutierrez@amd.com                bool timing, int &latency);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com      public:
11308Santhony.gutierrez@amd.com        // latencies for a TLB hit, miss and page fault
11308Santhony.gutierrez@amd.com        int hitLatency;
11308Santhony.gutierrez@amd.com        int missLatency1;
11308Santhony.gutierrez@amd.com        int missLatency2;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // local_stats are as seen from the TLB
11308Santhony.gutierrez@amd.com        // without taking into account coalescing
11308Santhony.gutierrez@amd.com        Stats::Scalar localNumTLBAccesses;
11308Santhony.gutierrez@amd.com        Stats::Scalar localNumTLBHits;
11308Santhony.gutierrez@amd.com        Stats::Scalar localNumTLBMisses;
11308Santhony.gutierrez@amd.com        Stats::Formula localTLBMissRate;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // global_stats are as seen from the
11308Santhony.gutierrez@amd.com        // CU's perspective taking into account
11308Santhony.gutierrez@amd.com        // all coalesced requests.
11308Santhony.gutierrez@amd.com        Stats::Scalar globalNumTLBAccesses;
11308Santhony.gutierrez@amd.com        Stats::Scalar globalNumTLBHits;
11308Santhony.gutierrez@amd.com        Stats::Scalar globalNumTLBMisses;
11308Santhony.gutierrez@amd.com        Stats::Formula globalTLBMissRate;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // from the CU perspective (global)
11308Santhony.gutierrez@amd.com        Stats::Scalar accessCycles;
11308Santhony.gutierrez@amd.com        // from the CU perspective (global)
11308Santhony.gutierrez@amd.com        Stats::Scalar pageTableCycles;
11308Santhony.gutierrez@amd.com        Stats::Scalar numUniquePages;
11308Santhony.gutierrez@amd.com        // from the perspective of this TLB
11308Santhony.gutierrez@amd.com        Stats::Scalar localCycles;
11308Santhony.gutierrez@amd.com        // from the perspective of this TLB
11308Santhony.gutierrez@amd.com        Stats::Formula localLatency;
11308Santhony.gutierrez@amd.com        // I take the avg. per page and then
11308Santhony.gutierrez@amd.com        // the avg. over all pages.
11308Santhony.gutierrez@amd.com        Stats::Scalar avgReuseDistance;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void regStats();
11308Santhony.gutierrez@amd.com        void updatePageFootprint(Addr virt_page_addr);
11308Santhony.gutierrez@amd.com        void printAccessPattern();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Fault translateAtomic(RequestPtr req, ThreadContext *tc, Mode mode,
11308Santhony.gutierrez@amd.com                              int &latency);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void translateTiming(RequestPtr req, ThreadContext *tc,
11308Santhony.gutierrez@amd.com                             Translation *translation, Mode mode,
11308Santhony.gutierrez@amd.com                             int &latency);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Tick doMmuRegRead(ThreadContext *tc, Packet *pkt);
11308Santhony.gutierrez@amd.com        Tick doMmuRegWrite(ThreadContext *tc, Packet *pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        GpuTlbEntry *insert(Addr vpn, GpuTlbEntry &entry);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Checkpointing
11308Santhony.gutierrez@amd.com        virtual void serialize(CheckpointOut& cp) const;
11308Santhony.gutierrez@amd.com        virtual void unserialize(CheckpointIn& cp);
11308Santhony.gutierrez@amd.com        void issueTranslation();
11308Santhony.gutierrez@amd.com        enum tlbOutcome {TLB_HIT, TLB_MISS, PAGE_WALK, MISS_RETURN};
11308Santhony.gutierrez@amd.com        bool tlbLookup(RequestPtr req, ThreadContext *tc, bool update_stats);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void handleTranslationReturn(Addr addr, tlbOutcome outcome,
11308Santhony.gutierrez@amd.com                                     PacketPtr pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void handleFuncTranslationReturn(PacketPtr pkt, tlbOutcome outcome);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void pagingProtectionChecks(ThreadContext *tc, PacketPtr pkt,
11308Santhony.gutierrez@amd.com                                    GpuTlbEntry *tlb_entry, Mode mode);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void updatePhysAddresses(Addr virt_page_addr, GpuTlbEntry *tlb_entry,
11308Santhony.gutierrez@amd.com                                 Addr phys_page_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        void issueTLBLookup(PacketPtr pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // CpuSidePort is the TLB Port closer to the CPU/CU side
11308Santhony.gutierrez@amd.com        class CpuSidePort : public SlavePort
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com          public:
11308Santhony.gutierrez@amd.com            CpuSidePort(const std::string &_name, GpuTLB * gpu_TLB,
11308Santhony.gutierrez@amd.com                        PortID _index)
11308Santhony.gutierrez@amd.com                : SlavePort(_name, gpu_TLB), tlb(gpu_TLB), index(_index) { }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com          protected:
11308Santhony.gutierrez@amd.com            GpuTLB *tlb;
11308Santhony.gutierrez@amd.com            int index;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            virtual bool recvTimingReq(PacketPtr pkt);
11308Santhony.gutierrez@amd.com            virtual Tick recvAtomic(PacketPtr pkt) { return 0; }
11308Santhony.gutierrez@amd.com            virtual void recvFunctional(PacketPtr pkt);
11308Santhony.gutierrez@amd.com            virtual void recvRangeChange() { }
11308Santhony.gutierrez@amd.com            virtual void recvReqRetry();
11308Santhony.gutierrez@amd.com            virtual void recvRespRetry() { assert(false); }
11308Santhony.gutierrez@amd.com            virtual AddrRangeList getAddrRanges() const;
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * MemSidePort is the TLB Port closer to the memory side
11308Santhony.gutierrez@amd.com         * If this is a last level TLB then this port will not be connected.
11308Santhony.gutierrez@amd.com         *
11308Santhony.gutierrez@amd.com         * Future action item: if we ever do real page walks, then this port
11308Santhony.gutierrez@amd.com         * should be connected to a RubyPort.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        class MemSidePort : public MasterPort
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com          public:
11308Santhony.gutierrez@amd.com            MemSidePort(const std::string &_name, GpuTLB * gpu_TLB,
11308Santhony.gutierrez@amd.com                        PortID _index)
11308Santhony.gutierrez@amd.com                : MasterPort(_name, gpu_TLB), tlb(gpu_TLB), index(_index) { }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            std::deque<PacketPtr> retries;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com          protected:
11308Santhony.gutierrez@amd.com            GpuTLB *tlb;
11308Santhony.gutierrez@amd.com            int index;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            virtual bool recvTimingResp(PacketPtr pkt);
11308Santhony.gutierrez@amd.com            virtual Tick recvAtomic(PacketPtr pkt) { return 0; }
11308Santhony.gutierrez@amd.com            virtual void recvFunctional(PacketPtr pkt) { }
11308Santhony.gutierrez@amd.com            virtual void recvRangeChange() { }
11308Santhony.gutierrez@amd.com            virtual void recvReqRetry();
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // TLB ports on the cpu Side
11308Santhony.gutierrez@amd.com        std::vector<CpuSidePort*> cpuSidePort;
11308Santhony.gutierrez@amd.com        // TLB ports on the memory side
11308Santhony.gutierrez@amd.com        std::vector<MemSidePort*> memSidePort;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        BaseMasterPort &getMasterPort(const std::string &if_name,
11308Santhony.gutierrez@amd.com                                      PortID idx=InvalidPortID);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        BaseSlavePort &getSlavePort(const std::string &if_name,
11308Santhony.gutierrez@amd.com                                    PortID idx=InvalidPortID);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * TLB TranslationState: this currently is a somewhat bastardization of
11308Santhony.gutierrez@amd.com         * the usage of SenderState, whereby the receiver of a packet is not
11308Santhony.gutierrez@amd.com         * usually supposed to need to look at the contents of the senderState,
11308Santhony.gutierrez@amd.com         * you're really only supposed to look at what you pushed on, pop it
11308Santhony.gutierrez@amd.com         * off, and send it back.
11308Santhony.gutierrez@amd.com         *
11308Santhony.gutierrez@amd.com         * However, since there is state that we want to pass to the TLBs using
11308Santhony.gutierrez@amd.com         * the send/recv Timing/Functional/etc. APIs, which don't allow for new
11308Santhony.gutierrez@amd.com         * arguments, we need a common TLB senderState to pass between TLBs,
11308Santhony.gutierrez@amd.com         * both "forwards" and "backwards."
11308Santhony.gutierrez@amd.com         *
11308Santhony.gutierrez@amd.com         * So, basically, the rule is that any packet received by a TLB port
11308Santhony.gutierrez@amd.com         * (cpuside OR memside) must be safely castable to a TranslationState.
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        struct TranslationState : public Packet::SenderState
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com            // TLB mode, read or write
11308Santhony.gutierrez@amd.com            Mode tlbMode;
11308Santhony.gutierrez@amd.com            // Thread context associated with this req
11308Santhony.gutierrez@amd.com            ThreadContext *tc;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            /*
11308Santhony.gutierrez@amd.com            * TLB entry to be populated and passed back and filled in
11308Santhony.gutierrez@amd.com            * previous TLBs.  Equivalent to the data cache concept of
11308Santhony.gutierrez@amd.com            * "data return."
11308Santhony.gutierrez@amd.com            */
11308Santhony.gutierrez@amd.com            GpuTlbEntry *tlbEntry;
11308Santhony.gutierrez@amd.com            // Is this a TLB prefetch request?
11308Santhony.gutierrez@amd.com            bool prefetch;
11308Santhony.gutierrez@amd.com            // When was the req for this translation issued
11308Santhony.gutierrez@amd.com            uint64_t issueTime;
11308Santhony.gutierrez@amd.com            // Remember where this came from
11308Santhony.gutierrez@amd.com            std::vector<SlavePort*>ports;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            // keep track of #uncoalesced reqs per packet per TLB level;
11308Santhony.gutierrez@amd.com            // reqCnt per level >= reqCnt higher level
11308Santhony.gutierrez@amd.com            std::vector<int> reqCnt;
11308Santhony.gutierrez@amd.com            // TLB level this packet hit in; 0 if it hit in the page table
11308Santhony.gutierrez@amd.com            int hitLevel;
11308Santhony.gutierrez@amd.com            Packet::SenderState *saved;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            TranslationState(Mode tlb_mode, ThreadContext *_tc,
11308Santhony.gutierrez@amd.com                             bool _prefetch=false,
11308Santhony.gutierrez@amd.com                             Packet::SenderState *_saved=nullptr)
11308Santhony.gutierrez@amd.com                : tlbMode(tlb_mode), tc(_tc), tlbEntry(nullptr),
11308Santhony.gutierrez@amd.com                  prefetch(_prefetch), issueTime(0),
11308Santhony.gutierrez@amd.com                  hitLevel(0),saved(_saved) { }
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // maximum number of permitted coalesced requests per cycle
11308Santhony.gutierrez@amd.com        int maxCoalescedReqs;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Current number of outstandings coalesced requests.
11308Santhony.gutierrez@amd.com        // Should be <= maxCoalescedReqs
11308Santhony.gutierrez@amd.com        int outstandingReqs;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * A TLBEvent is scheduled after the TLB lookup and helps us take the
11308Santhony.gutierrez@amd.com         * appropriate actions:
11308Santhony.gutierrez@amd.com         *  (e.g., update TLB on a hit,
11308Santhony.gutierrez@amd.com         *  send request to lower level TLB on a miss,
11308Santhony.gutierrez@amd.com         *  or start a page walk if this was the last-level TLB).
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com        void translationReturn(Addr virtPageAddr, tlbOutcome outcome,
11308Santhony.gutierrez@amd.com                               PacketPtr pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        class TLBEvent : public Event
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com            private:
11308Santhony.gutierrez@amd.com                GpuTLB *tlb;
11308Santhony.gutierrez@amd.com                Addr virtPageAddr;
11308Santhony.gutierrez@amd.com                /**
11308Santhony.gutierrez@amd.com                 * outcome can be TLB_HIT, TLB_MISS, or PAGE_WALK
11308Santhony.gutierrez@amd.com                 */
11308Santhony.gutierrez@amd.com                tlbOutcome outcome;
11308Santhony.gutierrez@amd.com                PacketPtr pkt;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            public:
11308Santhony.gutierrez@amd.com                TLBEvent(GpuTLB *_tlb, Addr _addr, tlbOutcome outcome,
11308Santhony.gutierrez@amd.com                        PacketPtr _pkt);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                void process();
11308Santhony.gutierrez@amd.com                const char *description() const;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                // updateOutcome updates the tlbOutcome of a TLBEvent
11308Santhony.gutierrez@amd.com                void updateOutcome(tlbOutcome _outcome);
11308Santhony.gutierrez@amd.com                Addr getTLBEventVaddr();
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        std::unordered_map<Addr, TLBEvent*> translationReturnEvent;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // this FIFO queue keeps track of the virt. page addresses
11308Santhony.gutierrez@amd.com        // that are pending cleanup
11308Santhony.gutierrez@amd.com        std::queue<Addr> cleanupQueue;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // the cleanupEvent is scheduled after a TLBEvent triggers in order to
11308Santhony.gutierrez@amd.com        // free memory and do the required clean-up
11308Santhony.gutierrez@amd.com        void cleanup();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        EventWrapper<GpuTLB, &GpuTLB::cleanup> cleanupEvent;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        /**
11308Santhony.gutierrez@amd.com         * This hash map will use the virtual page address as a key
11308Santhony.gutierrez@amd.com         * and will keep track of total number of accesses per page
11308Santhony.gutierrez@amd.com         */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        struct AccessInfo
11308Santhony.gutierrez@amd.com        {
11308Santhony.gutierrez@amd.com            unsigned int lastTimeAccessed; // last access to this page
11308Santhony.gutierrez@amd.com            unsigned int accessesPerPage;
11308Santhony.gutierrez@amd.com            // need to divide it by accessesPerPage at the end
11308Santhony.gutierrez@amd.com            unsigned int totalReuseDistance;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            /**
11308Santhony.gutierrez@amd.com             * The field below will help us compute the access distance,
11308Santhony.gutierrez@amd.com             * that is the number of (coalesced) TLB accesses that
11308Santhony.gutierrez@amd.com             * happened in between each access to this page
11308Santhony.gutierrez@amd.com             *
11308Santhony.gutierrez@amd.com             * localTLBAccesses[x] is the value of localTLBNumAccesses
11308Santhony.gutierrez@amd.com             * when the page <Addr> was accessed for the <x>th time
11308Santhony.gutierrez@amd.com             */
11308Santhony.gutierrez@amd.com            std::vector<unsigned int> localTLBAccesses;
11308Santhony.gutierrez@amd.com            unsigned int sumDistance;
11308Santhony.gutierrez@amd.com            unsigned int meanDistance;
11308Santhony.gutierrez@amd.com        };
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        typedef std::unordered_map<Addr, AccessInfo> AccessPatternTable;
11308Santhony.gutierrez@amd.com        AccessPatternTable TLBFootprint;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Called at the end of simulation to dump page access stats.
11308Santhony.gutierrez@amd.com        void exitCallback();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        EventWrapper<GpuTLB, &GpuTLB::exitCallback> exitEvent;
11308Santhony.gutierrez@amd.com    };
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#endif // __GPU_TLB_HH__