ruby/system/GPUCoalescer.cc

11308Santhony.gutierrez@amd.com/*
11308Santhony.gutierrez@amd.com * Copyright (c) 2013-2015 Advanced Micro Devices, Inc.
11308Santhony.gutierrez@amd.com * All rights reserved.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * For use for simulation and test purposes only
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Redistribution and use in source and binary forms, with or without
11308Santhony.gutierrez@amd.com * modification, are permitted provided that the following conditions are met:
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 1. Redistributions of source code must retain the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 2. Redistributions in binary form must reproduce the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer in the documentation
11308Santhony.gutierrez@amd.com * and/or other materials provided with the distribution.
11308Santhony.gutierrez@amd.com *
12697Santhony.gutierrez@amd.com * 3. Neither the name of the copyright holder nor the names of its
12697Santhony.gutierrez@amd.com * contributors may be used to endorse or promote products derived from this
12697Santhony.gutierrez@amd.com * software without specific prior written permission.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
11308Santhony.gutierrez@amd.com * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
11308Santhony.gutierrez@amd.com * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
11308Santhony.gutierrez@amd.com * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
11308Santhony.gutierrez@amd.com * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
11308Santhony.gutierrez@amd.com * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
11308Santhony.gutierrez@amd.com * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
11308Santhony.gutierrez@amd.com * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
11308Santhony.gutierrez@amd.com * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
11308Santhony.gutierrez@amd.com * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
11308Santhony.gutierrez@amd.com * POSSIBILITY OF SUCH DAMAGE.
11308Santhony.gutierrez@amd.com *
12697Santhony.gutierrez@amd.com * Authors: Sooraj Puthoor
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.com
12334Sgabeblack@google.com#include "base/logging.hh"
11308Santhony.gutierrez@amd.com#include "base/str.hh"
11308Santhony.gutierrez@amd.com#include "config/the_isa.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#if THE_ISA == X86_ISA
11308Santhony.gutierrez@amd.com#include "arch/x86/insts/microldstop.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#endif // X86_ISA
11308Santhony.gutierrez@amd.com#include "mem/ruby/system/GPUCoalescer.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "cpu/testers/rubytest/RubyTester.hh"
11308Santhony.gutierrez@amd.com#include "debug/GPUCoalescer.hh"
11308Santhony.gutierrez@amd.com#include "debug/MemoryAccess.hh"
11308Santhony.gutierrez@amd.com#include "debug/ProtocolTrace.hh"
11308Santhony.gutierrez@amd.com#include "debug/RubyPort.hh"
11308Santhony.gutierrez@amd.com#include "debug/RubyStats.hh"
11308Santhony.gutierrez@amd.com#include "gpu-compute/shader.hh"
11308Santhony.gutierrez@amd.com#include "mem/packet.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/common/DataBlock.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/common/SubBlock.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/network/MessageBuffer.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/profiler/Profiler.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/slicc_interface/AbstractController.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/slicc_interface/RubyRequest.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/structures/CacheMemory.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/system/RubySystem.hh"
11308Santhony.gutierrez@amd.com#include "params/RubyGPUCoalescer.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comusing namespace std;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comGPUCoalescer *
11308Santhony.gutierrez@amd.comRubyGPUCoalescerParams::create()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return new GPUCoalescer(this);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comHSAScope
11308Santhony.gutierrez@amd.comreqScopeToHSAScope(Request* req)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    HSAScope accessScope = HSAScope_UNSPECIFIED;
11308Santhony.gutierrez@amd.com    if (req->isScoped()) {
11308Santhony.gutierrez@amd.com        if (req->isWavefrontScope()) {
11308Santhony.gutierrez@amd.com            accessScope = HSAScope_WAVEFRONT;
11308Santhony.gutierrez@amd.com        } else if (req->isWorkgroupScope()) {
11308Santhony.gutierrez@amd.com            accessScope = HSAScope_WORKGROUP;
11308Santhony.gutierrez@amd.com        } else if (req->isDeviceScope()) {
11308Santhony.gutierrez@amd.com            accessScope = HSAScope_DEVICE;
11308Santhony.gutierrez@amd.com        } else if (req->isSystemScope()) {
11308Santhony.gutierrez@amd.com            accessScope = HSAScope_SYSTEM;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            fatal("Bad scope type");
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    return accessScope;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comHSASegment
11308Santhony.gutierrez@amd.comreqSegmentToHSASegment(Request* req)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    HSASegment accessSegment = HSASegment_GLOBAL;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if (req->isGlobalSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_GLOBAL;
11308Santhony.gutierrez@amd.com    } else if (req->isGroupSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_GROUP;
11308Santhony.gutierrez@amd.com    } else if (req->isPrivateSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_PRIVATE;
11308Santhony.gutierrez@amd.com    } else if (req->isKernargSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_KERNARG;
11308Santhony.gutierrez@amd.com    } else if (req->isReadonlySegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_READONLY;
11308Santhony.gutierrez@amd.com    } else if (req->isSpillSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_SPILL;
11308Santhony.gutierrez@amd.com    } else if (req->isArgSegment()) {
11308Santhony.gutierrez@amd.com        accessSegment = HSASegment_ARG;
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        fatal("Bad segment type");
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return accessSegment;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comGPUCoalescer::GPUCoalescer(const Params *p)
12133Sspwilson2@wisc.edu    : RubyPort(p),
12133Sspwilson2@wisc.edu      issueEvent([this]{ completeIssue(); }, "Issue coalesced request",
12133Sspwilson2@wisc.edu                 false, Event::Progress_Event_Pri),
12133Sspwilson2@wisc.edu      deadlockCheckEvent([this]{ wakeup(); }, "GPUCoalescer deadlock check")
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_store_waiting_on_load_cycles = 0;
11308Santhony.gutierrez@amd.com    m_store_waiting_on_store_cycles = 0;
11308Santhony.gutierrez@amd.com    m_load_waiting_on_store_cycles = 0;
11308Santhony.gutierrez@amd.com    m_load_waiting_on_load_cycles = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_outstanding_count = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_max_outstanding_requests = 0;
11308Santhony.gutierrez@amd.com    m_deadlock_threshold = 0;
11308Santhony.gutierrez@amd.com    m_instCache_ptr = nullptr;
11308Santhony.gutierrez@amd.com    m_dataCache_ptr = nullptr;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_instCache_ptr = p->icache;
11308Santhony.gutierrez@amd.com    m_dataCache_ptr = p->dcache;
11308Santhony.gutierrez@amd.com    m_max_outstanding_requests = p->max_outstanding_requests;
11308Santhony.gutierrez@amd.com    m_deadlock_threshold = p->deadlock_threshold;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert(m_max_outstanding_requests > 0);
11308Santhony.gutierrez@amd.com    assert(m_deadlock_threshold > 0);
11308Santhony.gutierrez@amd.com    assert(m_instCache_ptr);
11308Santhony.gutierrez@amd.com    assert(m_dataCache_ptr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_data_cache_hit_latency = p->dcache_hit_latency;
11308Santhony.gutierrez@amd.com
11660Stushar@ece.gatech.edu    m_runningGarnetStandalone = p->garnet_standalone;
11308Santhony.gutierrez@amd.com    assumingRfOCoherence = p->assume_rfo;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comGPUCoalescer::~GPUCoalescer()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::wakeup()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // Check for deadlock of any of the requests
11308Santhony.gutierrez@amd.com    Cycles current_time = curCycle();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Check across all outstanding requests
11308Santhony.gutierrez@amd.com    int total_outstanding = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RequestTable::iterator read = m_readRequestTable.begin();
11308Santhony.gutierrez@amd.com    RequestTable::iterator read_end = m_readRequestTable.end();
11308Santhony.gutierrez@amd.com    for (; read != read_end; ++read) {
11308Santhony.gutierrez@amd.com        GPUCoalescerRequest* request = read->second;
11308Santhony.gutierrez@amd.com        if (current_time - request->issue_time < m_deadlock_threshold)
11308Santhony.gutierrez@amd.com            continue;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        panic("Possible Deadlock detected. Aborting!\n"
11308Santhony.gutierrez@amd.com             "version: %d request.paddr: 0x%x m_readRequestTable: %d "
11308Santhony.gutierrez@amd.com             "current time: %u issue_time: %d difference: %d\n", m_version,
11308Santhony.gutierrez@amd.com              request->pkt->getAddr(), m_readRequestTable.size(),
11308Santhony.gutierrez@amd.com              current_time * clockPeriod(), request->issue_time * clockPeriod(),
11308Santhony.gutierrez@amd.com              (current_time - request->issue_time)*clockPeriod());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RequestTable::iterator write = m_writeRequestTable.begin();
11308Santhony.gutierrez@amd.com    RequestTable::iterator write_end = m_writeRequestTable.end();
11308Santhony.gutierrez@amd.com    for (; write != write_end; ++write) {
11308Santhony.gutierrez@amd.com        GPUCoalescerRequest* request = write->second;
11308Santhony.gutierrez@amd.com        if (current_time - request->issue_time < m_deadlock_threshold)
11308Santhony.gutierrez@amd.com            continue;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        panic("Possible Deadlock detected. Aborting!\n"
11308Santhony.gutierrez@amd.com             "version: %d request.paddr: 0x%x m_writeRequestTable: %d "
11308Santhony.gutierrez@amd.com             "current time: %u issue_time: %d difference: %d\n", m_version,
11308Santhony.gutierrez@amd.com              request->pkt->getAddr(), m_writeRequestTable.size(),
11308Santhony.gutierrez@amd.com              current_time * clockPeriod(), request->issue_time * clockPeriod(),
11308Santhony.gutierrez@amd.com              (current_time - request->issue_time) * clockPeriod());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    total_outstanding += m_writeRequestTable.size();
11308Santhony.gutierrez@amd.com    total_outstanding += m_readRequestTable.size();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert(m_outstanding_count == total_outstanding);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if (m_outstanding_count > 0) {
11308Santhony.gutierrez@amd.com        // If there are still outstanding requests, keep checking
11308Santhony.gutierrez@amd.com        schedule(deadlockCheckEvent,
11308Santhony.gutierrez@amd.com                 m_deadlock_threshold * clockPeriod() +
11308Santhony.gutierrez@amd.com                 curTick());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::resetStats()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_latencyHist.reset();
11308Santhony.gutierrez@amd.com    m_missLatencyHist.reset();
11308Santhony.gutierrez@amd.com    for (int i = 0; i < RubyRequestType_NUM; i++) {
11308Santhony.gutierrez@amd.com        m_typeLatencyHist[i]->reset();
11308Santhony.gutierrez@amd.com        m_missTypeLatencyHist[i]->reset();
11308Santhony.gutierrez@amd.com        for (int j = 0; j < MachineType_NUM; j++) {
11308Santhony.gutierrez@amd.com            m_missTypeMachLatencyHist[i][j]->reset();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    for (int i = 0; i < MachineType_NUM; i++) {
11308Santhony.gutierrez@amd.com        m_missMachLatencyHist[i]->reset();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_IssueToInitialDelayHist[i]->reset();
11308Santhony.gutierrez@amd.com        m_InitialToForwardDelayHist[i]->reset();
11308Santhony.gutierrez@amd.com        m_ForwardToFirstResponseDelayHist[i]->reset();
11308Santhony.gutierrez@amd.com        m_FirstResponseToCompletionDelayHist[i]->reset();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::printProgress(ostream& out) const
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comRequestStatus
11308Santhony.gutierrez@amd.comGPUCoalescer::getRequestStatus(PacketPtr pkt, RubyRequestType request_type)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    Addr line_addr = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if (!m_mandatory_q_ptr->areNSlotsAvailable(1, clockEdge())) {
11308Santhony.gutierrez@amd.com        return RequestStatus_BufferFull;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11321Ssteve.reinhardt@amd.com    if (m_controller->isBlocked(line_addr) &&
11308Santhony.gutierrez@amd.com       request_type != RubyRequestType_Locked_RMW_Write) {
11308Santhony.gutierrez@amd.com        return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if ((request_type == RubyRequestType_ST) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC_RETURN) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC_NO_RETURN) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_RMW_Write) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Load_Linked) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Store_Conditional) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Locked_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Locked_RMW_Write) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_FLUSH)) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Check if there is any outstanding read request for the same
11308Santhony.gutierrez@amd.com        // cache line.
11308Santhony.gutierrez@amd.com        if (m_readRequestTable.count(line_addr) > 0) {
11308Santhony.gutierrez@amd.com            m_store_waiting_on_load_cycles++;
11308Santhony.gutierrez@amd.com            return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (m_writeRequestTable.count(line_addr) > 0) {
11308Santhony.gutierrez@amd.com          // There is an outstanding write request for the cache line
11308Santhony.gutierrez@amd.com          m_store_waiting_on_store_cycles++;
11308Santhony.gutierrez@amd.com          return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        // Check if there is any outstanding write request for the same
11308Santhony.gutierrez@amd.com        // cache line.
11308Santhony.gutierrez@amd.com        if (m_writeRequestTable.count(line_addr) > 0) {
11308Santhony.gutierrez@amd.com            m_load_waiting_on_store_cycles++;
11308Santhony.gutierrez@amd.com            return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (m_readRequestTable.count(line_addr) > 0) {
11308Santhony.gutierrez@amd.com            // There is an outstanding read request for the cache line
11308Santhony.gutierrez@amd.com            m_load_waiting_on_load_cycles++;
11308Santhony.gutierrez@amd.com            return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return RequestStatus_Ready;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// sets the kernelEndList
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::insertKernel(int wavefront_id, PacketPtr pkt)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // Don't know if this will happen or is possible
11308Santhony.gutierrez@amd.com    // but I just want to be careful and not have it become
11308Santhony.gutierrez@amd.com    // simulator hang in the future
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "inserting wf: %d to kernelEndlist\n", wavefront_id);
11308Santhony.gutierrez@amd.com    assert(kernelEndList.count(wavefront_id) == 0);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    kernelEndList[wavefront_id] = pkt;
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "kernelEndList->size() = %d\n",
11308Santhony.gutierrez@amd.com            kernelEndList.size());
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// Insert the request on the correct request table.  Return true if
11308Santhony.gutierrez@amd.com// the entry was already present.
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comGPUCoalescer::insertRequest(PacketPtr pkt, RubyRequestType request_type)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(getRequestStatus(pkt, request_type) == RequestStatus_Ready ||
11308Santhony.gutierrez@amd.com           pkt->req->isLockedRMW() ||
11308Santhony.gutierrez@amd.com           !m_mandatory_q_ptr->areNSlotsAvailable(1, clockEdge()));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    int total_outstanding M5_VAR_USED =
11308Santhony.gutierrez@amd.com        m_writeRequestTable.size() + m_readRequestTable.size();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert(m_outstanding_count == total_outstanding);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // See if we should schedule a deadlock check
11325Ssteve.reinhardt@amd.com    if (!deadlockCheckEvent.scheduled()) {
11308Santhony.gutierrez@amd.com        schedule(deadlockCheckEvent, m_deadlock_threshold + curTick());
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Addr line_addr = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com    if ((request_type == RubyRequestType_ST) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC_RETURN) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_ATOMIC_NO_RETURN) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_RMW_Write) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Load_Linked) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Store_Conditional) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Locked_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_Locked_RMW_Write) ||
11308Santhony.gutierrez@amd.com        (request_type == RubyRequestType_FLUSH)) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        pair<RequestTable::iterator, bool> r =
11308Santhony.gutierrez@amd.com          m_writeRequestTable.insert(RequestTable::value_type(line_addr,
11308Santhony.gutierrez@amd.com                                       (GPUCoalescerRequest*) NULL));
11308Santhony.gutierrez@amd.com        if (r.second) {
11308Santhony.gutierrez@amd.com            RequestTable::iterator i = r.first;
11308Santhony.gutierrez@amd.com            i->second = new GPUCoalescerRequest(pkt, request_type,
11308Santhony.gutierrez@amd.com                                                curCycle());
11308Santhony.gutierrez@amd.com            DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com                    "Inserting write request for paddr %#x for type %d\n",
11308Santhony.gutierrez@amd.com                    pkt->req->getPaddr(), i->second->m_type);
11308Santhony.gutierrez@amd.com            m_outstanding_count++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            return true;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        pair<RequestTable::iterator, bool> r =
11308Santhony.gutierrez@amd.com            m_readRequestTable.insert(RequestTable::value_type(line_addr,
11308Santhony.gutierrez@amd.com                                        (GPUCoalescerRequest*) NULL));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (r.second) {
11308Santhony.gutierrez@amd.com            RequestTable::iterator i = r.first;
11308Santhony.gutierrez@amd.com            i->second = new GPUCoalescerRequest(pkt, request_type,
11308Santhony.gutierrez@amd.com                                             curCycle());
11308Santhony.gutierrez@amd.com            DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com                    "Inserting read request for paddr %#x for type %d\n",
11308Santhony.gutierrez@amd.com                    pkt->req->getPaddr(), i->second->m_type);
11308Santhony.gutierrez@amd.com            m_outstanding_count++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            return true;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_outstandReqHist.sample(m_outstanding_count);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    total_outstanding = m_writeRequestTable.size() + m_readRequestTable.size();
11308Santhony.gutierrez@amd.com    assert(m_outstanding_count == total_outstanding);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return false;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::markRemoved()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_outstanding_count--;
11308Santhony.gutierrez@amd.com    assert(m_outstanding_count ==
11308Santhony.gutierrez@amd.com           m_writeRequestTable.size() + m_readRequestTable.size());
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::removeRequest(GPUCoalescerRequest* srequest)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(m_outstanding_count ==
11308Santhony.gutierrez@amd.com           m_writeRequestTable.size() + m_readRequestTable.size());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Addr line_addr = makeLineAddress(srequest->pkt->getAddr());
11308Santhony.gutierrez@amd.com    if ((srequest->m_type == RubyRequestType_ST) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_RMW_Write) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_Load_Linked) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_Store_Conditional) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_Locked_RMW_Read) ||
11308Santhony.gutierrez@amd.com        (srequest->m_type == RubyRequestType_Locked_RMW_Write)) {
11308Santhony.gutierrez@amd.com        m_writeRequestTable.erase(line_addr);
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        m_readRequestTable.erase(line_addr);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    markRemoved();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comGPUCoalescer::handleLlsc(Addr address, GPUCoalescerRequest* request)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    //
11308Santhony.gutierrez@amd.com    // The success flag indicates whether the LLSC operation was successful.
11308Santhony.gutierrez@amd.com    // LL ops will always succeed, but SC may fail if the cache line is no
11308Santhony.gutierrez@amd.com    // longer locked.
11308Santhony.gutierrez@amd.com    //
11308Santhony.gutierrez@amd.com    bool success = true;
11308Santhony.gutierrez@amd.com    if (request->m_type == RubyRequestType_Store_Conditional) {
11308Santhony.gutierrez@amd.com        if (!m_dataCache_ptr->isLocked(address, m_version)) {
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            // For failed SC requests, indicate the failure to the cpu by
11308Santhony.gutierrez@amd.com            // setting the extra data to zero.
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            request->pkt->req->setExtraData(0);
11308Santhony.gutierrez@amd.com            success = false;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            // For successful SC requests, indicate the success to the cpu by
11308Santhony.gutierrez@amd.com            // setting the extra data to one.
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            request->pkt->req->setExtraData(1);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // Independent of success, all SC operations must clear the lock
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        m_dataCache_ptr->clearLocked(address);
11308Santhony.gutierrez@amd.com    } else if (request->m_type == RubyRequestType_Load_Linked) {
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // Note: To fully follow Alpha LLSC semantics, should the LL clear any
11308Santhony.gutierrez@amd.com        // previously locked cache lines?
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        m_dataCache_ptr->setLocked(address, m_version);
11308Santhony.gutierrez@amd.com    } else if ((m_dataCache_ptr->isTagPresent(address)) &&
11308Santhony.gutierrez@amd.com               (m_dataCache_ptr->isLocked(address, m_version))) {
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // Normal writes should clear the locked address
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        m_dataCache_ptr->clearLocked(address);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    return success;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::writeCallback(Addr address, DataBlock& data)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    writeCallback(address, MachineType_NULL, data);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::writeCallback(Addr address,
11308Santhony.gutierrez@amd.com                         MachineType mach,
11308Santhony.gutierrez@amd.com                         DataBlock& data)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    writeCallback(address, mach, data, Cycles(0), Cycles(0), Cycles(0));
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::writeCallback(Addr address,
11308Santhony.gutierrez@amd.com                         MachineType mach,
11308Santhony.gutierrez@amd.com                         DataBlock& data,
11308Santhony.gutierrez@amd.com                         Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                         Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                         Cycles firstResponseTime)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    writeCallback(address, mach, data,
11308Santhony.gutierrez@amd.com                  initialRequestTime, forwardRequestTime, firstResponseTime,
11308Santhony.gutierrez@amd.com                  false);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::writeCallback(Addr address,
11308Santhony.gutierrez@amd.com                         MachineType mach,
11308Santhony.gutierrez@amd.com                         DataBlock& data,
11308Santhony.gutierrez@amd.com                         Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                         Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                         Cycles firstResponseTime,
11308Santhony.gutierrez@amd.com                         bool isRegion)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(address == makeLineAddress(address));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "write callback for address %#x\n", address);
11308Santhony.gutierrez@amd.com    assert(m_writeRequestTable.count(makeLineAddress(address)));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RequestTable::iterator i = m_writeRequestTable.find(address);
11308Santhony.gutierrez@amd.com    assert(i != m_writeRequestTable.end());
11308Santhony.gutierrez@amd.com    GPUCoalescerRequest* request = i->second;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_writeRequestTable.erase(i);
11308Santhony.gutierrez@amd.com    markRemoved();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert((request->m_type == RubyRequestType_ST) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_ATOMIC) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_ATOMIC_RETURN) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_ATOMIC_NO_RETURN) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_RMW_Read) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_RMW_Write) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_Load_Linked) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_Store_Conditional) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_Locked_RMW_Read) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_Locked_RMW_Write) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_FLUSH));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    //
11308Santhony.gutierrez@amd.com    // For Alpha, properly handle LL, SC, and write requests with respect to
11308Santhony.gutierrez@amd.com    // locked cache blocks.
11308Santhony.gutierrez@amd.com    //
11660Stushar@ece.gatech.edu    // Not valid for Garnet_standalone protocl
11308Santhony.gutierrez@amd.com    //
11308Santhony.gutierrez@amd.com    bool success = true;
11660Stushar@ece.gatech.edu    if (!m_runningGarnetStandalone)
11308Santhony.gutierrez@amd.com        success = handleLlsc(address, request);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if (request->m_type == RubyRequestType_Locked_RMW_Read) {
11308Santhony.gutierrez@amd.com        m_controller->blockOnQueue(address, m_mandatory_q_ptr);
11308Santhony.gutierrez@amd.com    } else if (request->m_type == RubyRequestType_Locked_RMW_Write) {
11308Santhony.gutierrez@amd.com        m_controller->unblock(address);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    hitCallback(request, mach, data, success,
11308Santhony.gutierrez@amd.com                request->issue_time, forwardRequestTime, firstResponseTime,
11308Santhony.gutierrez@amd.com                isRegion);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::readCallback(Addr address, DataBlock& data)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    readCallback(address, MachineType_NULL, data);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::readCallback(Addr address,
11308Santhony.gutierrez@amd.com                        MachineType mach,
11308Santhony.gutierrez@amd.com                        DataBlock& data)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    readCallback(address, mach, data, Cycles(0), Cycles(0), Cycles(0));
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::readCallback(Addr address,
11308Santhony.gutierrez@amd.com                        MachineType mach,
11308Santhony.gutierrez@amd.com                        DataBlock& data,
11308Santhony.gutierrez@amd.com                        Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                        Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                        Cycles firstResponseTime)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    readCallback(address, mach, data,
11308Santhony.gutierrez@amd.com                 initialRequestTime, forwardRequestTime, firstResponseTime,
11308Santhony.gutierrez@amd.com                 false);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::readCallback(Addr address,
11308Santhony.gutierrez@amd.com                        MachineType mach,
11308Santhony.gutierrez@amd.com                        DataBlock& data,
11308Santhony.gutierrez@amd.com                        Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                        Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                        Cycles firstResponseTime,
11308Santhony.gutierrez@amd.com                        bool isRegion)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(address == makeLineAddress(address));
11308Santhony.gutierrez@amd.com    assert(m_readRequestTable.count(makeLineAddress(address)));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "read callback for address %#x\n", address);
11308Santhony.gutierrez@amd.com    RequestTable::iterator i = m_readRequestTable.find(address);
11308Santhony.gutierrez@amd.com    assert(i != m_readRequestTable.end());
11308Santhony.gutierrez@amd.com    GPUCoalescerRequest* request = i->second;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_readRequestTable.erase(i);
11308Santhony.gutierrez@amd.com    markRemoved();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert((request->m_type == RubyRequestType_LD) ||
11308Santhony.gutierrez@amd.com           (request->m_type == RubyRequestType_IFETCH));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    hitCallback(request, mach, data, true,
11308Santhony.gutierrez@amd.com                request->issue_time, forwardRequestTime, firstResponseTime,
11308Santhony.gutierrez@amd.com                isRegion);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::hitCallback(GPUCoalescerRequest* srequest,
11308Santhony.gutierrez@amd.com                       MachineType mach,
11308Santhony.gutierrez@amd.com                       DataBlock& data,
11308Santhony.gutierrez@amd.com                       bool success,
11308Santhony.gutierrez@amd.com                       Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                       Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                       Cycles firstResponseTime,
11308Santhony.gutierrez@amd.com                       bool isRegion)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    PacketPtr pkt = srequest->pkt;
11308Santhony.gutierrez@amd.com    Addr request_address = pkt->getAddr();
11308Santhony.gutierrez@amd.com    Addr request_line_address = makeLineAddress(request_address);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RubyRequestType type = srequest->m_type;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Set this cache entry to the most recently used
11308Santhony.gutierrez@amd.com    if (type == RubyRequestType_IFETCH) {
11308Santhony.gutierrez@amd.com        if (m_instCache_ptr->isTagPresent(request_line_address))
11308Santhony.gutierrez@amd.com            m_instCache_ptr->setMRU(request_line_address);
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        if (m_dataCache_ptr->isTagPresent(request_line_address))
11308Santhony.gutierrez@amd.com            m_dataCache_ptr->setMRU(request_line_address);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    recordMissLatency(srequest, mach,
11308Santhony.gutierrez@amd.com                      initialRequestTime,
11308Santhony.gutierrez@amd.com                      forwardRequestTime,
11308Santhony.gutierrez@amd.com                      firstResponseTime,
11308Santhony.gutierrez@amd.com                      success, isRegion);
11308Santhony.gutierrez@amd.com    // update the data
11308Santhony.gutierrez@amd.com    //
11308Santhony.gutierrez@amd.com    // MUST AD DOING THIS FOR EACH REQUEST IN COALESCER
11308Santhony.gutierrez@amd.com    int len = reqCoalescer[request_line_address].size();
11308Santhony.gutierrez@amd.com    std::vector<PacketPtr> mylist;
11308Santhony.gutierrez@amd.com    for (int i = 0; i < len; ++i) {
11689Santhony.gutierrez@amd.com        PacketPtr pkt = reqCoalescer[request_line_address][i].pkt;
11689Santhony.gutierrez@amd.com        assert(type == reqCoalescer[request_line_address][i].primaryType);
11308Santhony.gutierrez@amd.com        request_address = pkt->getAddr();
11308Santhony.gutierrez@amd.com        request_line_address = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com        if (pkt->getPtr<uint8_t>()) {
11308Santhony.gutierrez@amd.com            if ((type == RubyRequestType_LD) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_ATOMIC) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_ATOMIC_RETURN) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_IFETCH) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_RMW_Read) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_Locked_RMW_Read) ||
11308Santhony.gutierrez@amd.com                (type == RubyRequestType_Load_Linked)) {
11308Santhony.gutierrez@amd.com                memcpy(pkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                       data.getData(getOffset(request_address),
11308Santhony.gutierrez@amd.com                                    pkt->getSize()),
11308Santhony.gutierrez@amd.com                       pkt->getSize());
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                data.setData(pkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                             getOffset(request_address), pkt->getSize());
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            DPRINTF(MemoryAccess,
11308Santhony.gutierrez@amd.com                    "WARNING.  Data not transfered from Ruby to M5 for type " \
11308Santhony.gutierrez@amd.com                    "%s\n",
11308Santhony.gutierrez@amd.com                    RubyRequestType_to_string(type));
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // If using the RubyTester, update the RubyTester sender state's
11308Santhony.gutierrez@amd.com        // subBlock with the recieved data.  The tester will later access
11308Santhony.gutierrez@amd.com        // this state.
11308Santhony.gutierrez@amd.com        // Note: RubyPort will access it's sender state before the
11308Santhony.gutierrez@amd.com        // RubyTester.
11308Santhony.gutierrez@amd.com        if (m_usingRubyTester) {
11308Santhony.gutierrez@amd.com            RubyPort::SenderState *requestSenderState =
11308Santhony.gutierrez@amd.com                safe_cast<RubyPort::SenderState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com            RubyTester::SenderState* testerSenderState =
11308Santhony.gutierrez@amd.com                safe_cast<RubyTester::SenderState*>(requestSenderState->predecessor);
11308Santhony.gutierrez@amd.com            testerSenderState->subBlock.mergeFrom(data);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        mylist.push_back(pkt);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    delete srequest;
11308Santhony.gutierrez@amd.com    reqCoalescer.erase(request_line_address);
11308Santhony.gutierrez@amd.com    assert(!reqCoalescer.count(request_line_address));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    completeHitCallback(mylist, len);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comGPUCoalescer::empty() const
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return m_writeRequestTable.empty() && m_readRequestTable.empty();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// Analyzes the packet to see if this request can be coalesced.
11308Santhony.gutierrez@amd.com// If request can be coalesced, this request is added to the reqCoalescer table
11308Santhony.gutierrez@amd.com// and makeRequest returns RequestStatus_Issued;
11308Santhony.gutierrez@amd.com// If this is the first request to a cacheline, request is added to both
11308Santhony.gutierrez@amd.com// newRequests queue and to the reqCoalescer table; makeRequest
11308Santhony.gutierrez@amd.com// returns RequestStatus_Issued.
11308Santhony.gutierrez@amd.com// If there is a pending request to this cacheline and this request
11308Santhony.gutierrez@amd.com// can't be coalesced, RequestStatus_Aliased is returned and
11308Santhony.gutierrez@amd.com// the packet needs to be reissued.
11308Santhony.gutierrez@amd.comRequestStatus
11308Santhony.gutierrez@amd.comGPUCoalescer::makeRequest(PacketPtr pkt)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // Check for GPU Barrier Kernel End or Kernel Begin
11308Santhony.gutierrez@amd.com    // Leave these to be handled by the child class
11308Santhony.gutierrez@amd.com    // Kernel End/Barrier = isFlush + isRelease
11308Santhony.gutierrez@amd.com    // Kernel Begin = isFlush + isAcquire
11308Santhony.gutierrez@amd.com    if (pkt->req->isKernel()) {
11308Santhony.gutierrez@amd.com        if (pkt->req->isAcquire()){
11308Santhony.gutierrez@amd.com            // This is a Kernel Begin leave handling to
11308Santhony.gutierrez@amd.com            // virtual xCoalescer::makeRequest
11308Santhony.gutierrez@amd.com            return RequestStatus_Issued;
11321Ssteve.reinhardt@amd.com        }else if (pkt->req->isRelease()) {
11308Santhony.gutierrez@amd.com            // This is a Kernel End leave handling to
11308Santhony.gutierrez@amd.com            // virtual xCoalescer::makeRequest
11308Santhony.gutierrez@amd.com            // If we are here then we didn't call
11308Santhony.gutierrez@amd.com            // a virtual version of this function
11308Santhony.gutierrez@amd.com            // so we will also schedule the callback
11308Santhony.gutierrez@amd.com            int wf_id = 0;
11308Santhony.gutierrez@amd.com            if (pkt->req->hasContextId()) {
11308Santhony.gutierrez@amd.com                wf_id = pkt->req->contextId();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com            insertKernel(wf_id, pkt);
11308Santhony.gutierrez@amd.com            newKernelEnds.push_back(wf_id);
11308Santhony.gutierrez@amd.com            if (!issueEvent.scheduled()) {
11308Santhony.gutierrez@amd.com                schedule(issueEvent, curTick());
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com            return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // If number of outstanding requests greater than the max allowed,
11308Santhony.gutierrez@amd.com    // return RequestStatus_BufferFull. This logic can be extended to
11308Santhony.gutierrez@amd.com    // support proper backpressure.
11308Santhony.gutierrez@amd.com    if (m_outstanding_count >= m_max_outstanding_requests) {
11308Santhony.gutierrez@amd.com        return RequestStatus_BufferFull;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RubyRequestType primary_type = RubyRequestType_NULL;
11308Santhony.gutierrez@amd.com    RubyRequestType secondary_type = RubyRequestType_NULL;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    if (pkt->isLLSC()) {
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // Alpha LL/SC instructions need to be handled carefully by the cache
11308Santhony.gutierrez@amd.com        // coherence protocol to ensure they follow the proper semantics. In
11308Santhony.gutierrez@amd.com        // particular, by identifying the operations as atomic, the protocol
11308Santhony.gutierrez@amd.com        // should understand that migratory sharing optimizations should not
11308Santhony.gutierrez@amd.com        // be performed (i.e. a load between the LL and SC should not steal
11308Santhony.gutierrez@amd.com        // away exclusive permission).
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        if (pkt->isWrite()) {
11308Santhony.gutierrez@amd.com            primary_type = RubyRequestType_Store_Conditional;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            assert(pkt->isRead());
11308Santhony.gutierrez@amd.com            primary_type = RubyRequestType_Load_Linked;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        secondary_type = RubyRequestType_ATOMIC;
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isLockedRMW()) {
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // x86 locked instructions are translated to store cache coherence
11308Santhony.gutierrez@amd.com        // requests because these requests should always be treated as read
11308Santhony.gutierrez@amd.com        // exclusive operations and should leverage any migratory sharing
11308Santhony.gutierrez@amd.com        // optimization built into the protocol.
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        if (pkt->isWrite()) {
11308Santhony.gutierrez@amd.com            primary_type = RubyRequestType_Locked_RMW_Write;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            assert(pkt->isRead());
11308Santhony.gutierrez@amd.com            primary_type = RubyRequestType_Locked_RMW_Read;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        secondary_type = RubyRequestType_ST;
11308Santhony.gutierrez@amd.com    } else if (pkt->isAtomicOp()) {
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        // GPU Atomic Operation
11308Santhony.gutierrez@amd.com        //
11308Santhony.gutierrez@amd.com        primary_type = RubyRequestType_ATOMIC;
11308Santhony.gutierrez@amd.com        secondary_type = RubyRequestType_ATOMIC;
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        if (pkt->isRead()) {
11308Santhony.gutierrez@amd.com            if (pkt->req->isInstFetch()) {
11308Santhony.gutierrez@amd.com                primary_type = secondary_type = RubyRequestType_IFETCH;
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com#if THE_ISA == X86_ISA
11308Santhony.gutierrez@amd.com                uint32_t flags = pkt->req->getFlags();
11308Santhony.gutierrez@amd.com                bool storeCheck = flags &
11308Santhony.gutierrez@amd.com                        (TheISA::StoreCheck << TheISA::FlagShift);
11308Santhony.gutierrez@amd.com#else
11308Santhony.gutierrez@amd.com                bool storeCheck = false;
11308Santhony.gutierrez@amd.com#endif // X86_ISA
11308Santhony.gutierrez@amd.com                if (storeCheck) {
11308Santhony.gutierrez@amd.com                    primary_type = RubyRequestType_RMW_Read;
11308Santhony.gutierrez@amd.com                    secondary_type = RubyRequestType_ST;
11308Santhony.gutierrez@amd.com                } else {
11308Santhony.gutierrez@amd.com                    primary_type = secondary_type = RubyRequestType_LD;
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else if (pkt->isWrite()) {
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            // Note: M5 packets do not differentiate ST from RMW_Write
11308Santhony.gutierrez@amd.com            //
11308Santhony.gutierrez@amd.com            primary_type = secondary_type = RubyRequestType_ST;
11308Santhony.gutierrez@amd.com        } else if (pkt->isFlush()) {
11308Santhony.gutierrez@amd.com            primary_type = secondary_type = RubyRequestType_FLUSH;
11308Santhony.gutierrez@amd.com        } else if (pkt->req->isRelease() || pkt->req->isAcquire()) {
11308Santhony.gutierrez@amd.com            if (assumingRfOCoherence) {
11308Santhony.gutierrez@amd.com                // If we reached here, this request must be a memFence
11308Santhony.gutierrez@amd.com                // and the protocol implements RfO, the coalescer can
11308Santhony.gutierrez@amd.com                // assume sequentially consistency and schedule the callback
11308Santhony.gutierrez@amd.com                // immediately.
11308Santhony.gutierrez@amd.com                // Currently the code implements fence callbacks
11308Santhony.gutierrez@amd.com                // by reusing the mechanism for kernel completions.
11308Santhony.gutierrez@amd.com                // This should be fixed.
11308Santhony.gutierrez@amd.com                int wf_id = 0;
11308Santhony.gutierrez@amd.com                if (pkt->req->hasContextId()) {
11308Santhony.gutierrez@amd.com                    wf_id = pkt->req->contextId();
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com                insertKernel(wf_id, pkt);
11308Santhony.gutierrez@amd.com                newKernelEnds.push_back(wf_id);
11308Santhony.gutierrez@amd.com                if (!issueEvent.scheduled()) {
11308Santhony.gutierrez@amd.com                    schedule(issueEvent, curTick());
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com                return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                // If not RfO, return issued here and let the child coalescer
11308Santhony.gutierrez@amd.com                // take care of it.
11308Santhony.gutierrez@amd.com                return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            panic("Unsupported ruby packet type\n");
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Check if there is any pending request to this cache line from
11308Santhony.gutierrez@amd.com    // previous cycles.
11308Santhony.gutierrez@amd.com    // If there is a pending request, return aliased. Since coalescing
11308Santhony.gutierrez@amd.com    // across time is not permitted, aliased requests are not coalesced.
11308Santhony.gutierrez@amd.com    // If a request for this address has already been issued, we must block
11308Santhony.gutierrez@amd.com    RequestStatus status = getRequestStatus(pkt, primary_type);
11308Santhony.gutierrez@amd.com    if (status != RequestStatus_Ready)
11308Santhony.gutierrez@amd.com        return status;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Addr line_addr = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Check if this request can be coalesced with previous
11308Santhony.gutierrez@amd.com    // requests from this cycle.
11308Santhony.gutierrez@amd.com    if (!reqCoalescer.count(line_addr)) {
11308Santhony.gutierrez@amd.com        // This is the first access to this cache line.
11308Santhony.gutierrez@amd.com        // A new request to the memory subsystem has to be
11308Santhony.gutierrez@amd.com        // made in the next cycle for this cache line, so
11308Santhony.gutierrez@amd.com        // add this line addr to the "newRequests" queue
11308Santhony.gutierrez@amd.com        newRequests.push_back(line_addr);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // There was a request to this cache line in this cycle,
11308Santhony.gutierrez@amd.com    // let us see if we can coalesce this request with the previous
11308Santhony.gutierrez@amd.com    // requests from this cycle
11308Santhony.gutierrez@amd.com    } else if (primary_type !=
11689Santhony.gutierrez@amd.com               reqCoalescer[line_addr][0].primaryType) {
11308Santhony.gutierrez@amd.com        // can't coalesce loads, stores and atomics!
11308Santhony.gutierrez@amd.com        return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isLockedRMW() ||
11689Santhony.gutierrez@amd.com               reqCoalescer[line_addr][0].pkt->req->isLockedRMW()) {
11308Santhony.gutierrez@amd.com        // can't coalesce locked accesses, but can coalesce atomics!
11308Santhony.gutierrez@amd.com        return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com    } else if (pkt->req->hasContextId() && pkt->req->isRelease() &&
11308Santhony.gutierrez@amd.com               pkt->req->contextId() !=
11689Santhony.gutierrez@amd.com               reqCoalescer[line_addr][0].pkt->req->contextId()) {
11308Santhony.gutierrez@amd.com        // can't coalesce releases from different wavefronts
11308Santhony.gutierrez@amd.com        return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // in addition to the packet, we need to save both request types
11689Santhony.gutierrez@amd.com    reqCoalescer[line_addr].emplace_back(pkt, primary_type, secondary_type);
11308Santhony.gutierrez@amd.com    if (!issueEvent.scheduled())
11308Santhony.gutierrez@amd.com        schedule(issueEvent, curTick());
11308Santhony.gutierrez@amd.com    // TODO: issue hardware prefetches here
11308Santhony.gutierrez@amd.com    return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::issueRequest(PacketPtr pkt, RubyRequestType secondary_type)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    int proc_id = -1;
11308Santhony.gutierrez@amd.com    if (pkt != NULL && pkt->req->hasContextId()) {
11308Santhony.gutierrez@amd.com        proc_id = pkt->req->contextId();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // If valid, copy the pc to the ruby request
11308Santhony.gutierrez@amd.com    Addr pc = 0;
11308Santhony.gutierrez@amd.com    if (pkt->req->hasPC()) {
11308Santhony.gutierrez@amd.com        pc = pkt->req->getPC();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // At the moment setting scopes only counts
11308Santhony.gutierrez@amd.com    // for GPU spill space accesses
11308Santhony.gutierrez@amd.com    // which is pkt->req->isStack()
11308Santhony.gutierrez@amd.com    // this scope is REPLACE since it
11308Santhony.gutierrez@amd.com    // does not need to be flushed at the end
11308Santhony.gutierrez@amd.com    // of a kernel Private and local may need
11308Santhony.gutierrez@amd.com    // to be visible at the end of the kernel
11308Santhony.gutierrez@amd.com    HSASegment accessSegment = reqSegmentToHSASegment(pkt->req);
11308Santhony.gutierrez@amd.com    HSAScope accessScope = reqScopeToHSAScope(pkt->req);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    Addr line_addr = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Creating WriteMask that records written bytes
11308Santhony.gutierrez@amd.com    // and atomic operations. This enables partial writes
11308Santhony.gutierrez@amd.com    // and partial reads of those writes
11308Santhony.gutierrez@amd.com    DataBlock dataBlock;
11308Santhony.gutierrez@amd.com    dataBlock.clear();
11308Santhony.gutierrez@amd.com    uint32_t blockSize = RubySystem::getBlockSizeBytes();
11308Santhony.gutierrez@amd.com    std::vector<bool> accessMask(blockSize,false);
11308Santhony.gutierrez@amd.com    std::vector< std::pair<int,AtomicOpFunctor*> > atomicOps;
11308Santhony.gutierrez@amd.com    uint32_t tableSize = reqCoalescer[line_addr].size();
11308Santhony.gutierrez@amd.com    for (int i = 0; i < tableSize; i++) {
11689Santhony.gutierrez@amd.com        PacketPtr tmpPkt = reqCoalescer[line_addr][i].pkt;
11308Santhony.gutierrez@amd.com        uint32_t tmpOffset = (tmpPkt->getAddr()) - line_addr;
11308Santhony.gutierrez@amd.com        uint32_t tmpSize = tmpPkt->getSize();
11308Santhony.gutierrez@amd.com        if (tmpPkt->isAtomicOp()) {
11308Santhony.gutierrez@amd.com            std::pair<int,AtomicOpFunctor *> tmpAtomicOp(tmpOffset,
11308Santhony.gutierrez@amd.com                                                        tmpPkt->getAtomicOp());
11308Santhony.gutierrez@amd.com            atomicOps.push_back(tmpAtomicOp);
11321Ssteve.reinhardt@amd.com        } else if (tmpPkt->isWrite()) {
11308Santhony.gutierrez@amd.com            dataBlock.setData(tmpPkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                              tmpOffset, tmpSize);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        for (int j = 0; j < tmpSize; j++) {
11308Santhony.gutierrez@amd.com            accessMask[tmpOffset + j] = true;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    std::shared_ptr<RubyRequest> msg;
11308Santhony.gutierrez@amd.com    if (pkt->isAtomicOp()) {
11308Santhony.gutierrez@amd.com        msg = std::make_shared<RubyRequest>(clockEdge(), pkt->getAddr(),
11308Santhony.gutierrez@amd.com                              pkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                              pkt->getSize(), pc, secondary_type,
11308Santhony.gutierrez@amd.com                              RubyAccessMode_Supervisor, pkt,
11308Santhony.gutierrez@amd.com                              PrefetchBit_No, proc_id, 100,
11308Santhony.gutierrez@amd.com                              blockSize, accessMask,
11308Santhony.gutierrez@amd.com                              dataBlock, atomicOps,
11308Santhony.gutierrez@amd.com                              accessScope, accessSegment);
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        msg = std::make_shared<RubyRequest>(clockEdge(), pkt->getAddr(),
11308Santhony.gutierrez@amd.com                              pkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                              pkt->getSize(), pc, secondary_type,
11308Santhony.gutierrez@amd.com                              RubyAccessMode_Supervisor, pkt,
11308Santhony.gutierrez@amd.com                              PrefetchBit_No, proc_id, 100,
11308Santhony.gutierrez@amd.com                              blockSize, accessMask,
11308Santhony.gutierrez@amd.com                              dataBlock,
11308Santhony.gutierrez@amd.com                              accessScope, accessSegment);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    DPRINTFR(ProtocolTrace, "%15s %3s %10s%20s %6s>%-6s %s %s\n",
11308Santhony.gutierrez@amd.com             curTick(), m_version, "Coal", "Begin", "", "",
11308Santhony.gutierrez@amd.com             printAddress(msg->getPhysicalAddress()),
11308Santhony.gutierrez@amd.com             RubyRequestType_to_string(secondary_type));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    fatal_if(secondary_type == RubyRequestType_IFETCH,
11308Santhony.gutierrez@amd.com             "there should not be any I-Fetch requests in the GPU Coalescer");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Send the message to the cache controller
11308Santhony.gutierrez@amd.com    fatal_if(m_data_cache_hit_latency == 0,
11308Santhony.gutierrez@amd.com             "should not have a latency of zero");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert(m_mandatory_q_ptr);
11308Santhony.gutierrez@amd.com    m_mandatory_q_ptr->enqueue(msg, clockEdge(), m_data_cache_hit_latency);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comtemplate <class KEY, class VALUE>
11308Santhony.gutierrez@amd.comstd::ostream &
11308Santhony.gutierrez@amd.comoperator<<(ostream &out, const std::unordered_map<KEY, VALUE> &map)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    out << "[";
11308Santhony.gutierrez@amd.com    for (auto i = map.begin(); i != map.end(); ++i)
11308Santhony.gutierrez@amd.com        out << " " << i->first << "=" << i->second;
11308Santhony.gutierrez@amd.com    out << " ]";
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return out;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::print(ostream& out) const
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    out << "[GPUCoalescer: " << m_version
11308Santhony.gutierrez@amd.com        << ", outstanding requests: " << m_outstanding_count
11308Santhony.gutierrez@amd.com        << ", read request table: " << m_readRequestTable
11308Santhony.gutierrez@amd.com        << ", write request table: " << m_writeRequestTable
11308Santhony.gutierrez@amd.com        << "]";
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// this can be called from setState whenever coherence permissions are
11308Santhony.gutierrez@amd.com// upgraded when invoked, coherence violations will be checked for the
11308Santhony.gutierrez@amd.com// given block
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::checkCoherence(Addr addr)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com#ifdef CHECK_COHERENCE
11308Santhony.gutierrez@amd.com    m_ruby_system->checkGlobalCoherenceInvariant(addr);
11308Santhony.gutierrez@amd.com#endif
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::recordRequestType(SequencerRequestType requestType) {
11308Santhony.gutierrez@amd.com    DPRINTF(RubyStats, "Recorded statistic: %s\n",
11308Santhony.gutierrez@amd.com            SequencerRequestType_to_string(requestType));
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::completeIssue()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // newRequests has the cacheline addresses of all the
11308Santhony.gutierrez@amd.com    // requests which need to be issued to the memory subsystem
11308Santhony.gutierrez@amd.com    // in this cycle
11308Santhony.gutierrez@amd.com    int len = newRequests.size();
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "Completing issue for %d new requests.\n", len);
11308Santhony.gutierrez@amd.com    for (int i = 0; i < len; ++i) {
11308Santhony.gutierrez@amd.com        // Get the requests from reqCoalescer table. Get only the
11308Santhony.gutierrez@amd.com        // first request for each cacheline, the remaining requests
11308Santhony.gutierrez@amd.com        // can be coalesced with the first request. So, only
11308Santhony.gutierrez@amd.com        // one request is issued per cacheline.
11308Santhony.gutierrez@amd.com        RequestDesc info = reqCoalescer[newRequests[i]][0];
11689Santhony.gutierrez@amd.com        PacketPtr pkt = info.pkt;
11308Santhony.gutierrez@amd.com        DPRINTF(GPUCoalescer, "Completing for newReq %d: paddr %#x\n",
11308Santhony.gutierrez@amd.com                i, pkt->req->getPaddr());
11308Santhony.gutierrez@amd.com        // Insert this request to the read/writeRequestTables. These tables
11308Santhony.gutierrez@amd.com        // are used to track aliased requests in makeRequest subroutine
11689Santhony.gutierrez@amd.com        bool found = insertRequest(pkt, info.primaryType);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (found) {
11308Santhony.gutierrez@amd.com            panic("GPUCoalescer::makeRequest should never be called if the "
11308Santhony.gutierrez@amd.com                  "request is already outstanding\n");
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // Issue request to ruby subsystem
11689Santhony.gutierrez@amd.com        issueRequest(pkt, info.secondaryType);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    newRequests.clear();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // have Kernel End releases been issued this cycle
11308Santhony.gutierrez@amd.com    len = newKernelEnds.size();
11308Santhony.gutierrez@amd.com    for (int i = 0; i < len; i++) {
11308Santhony.gutierrez@amd.com        kernelCallback(newKernelEnds[i]);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    newKernelEnds.clear();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::evictionCallback(Addr address)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    ruby_eviction_callback(address);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::kernelCallback(int wavefront_id)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(kernelEndList.count(wavefront_id));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    ruby_hit_callback(kernelEndList[wavefront_id]);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    kernelEndList.erase(wavefront_id);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::atomicCallback(Addr address,
11308Santhony.gutierrez@amd.com                             MachineType mach,
11308Santhony.gutierrez@amd.com                             const DataBlock& data)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    assert(address == makeLineAddress(address));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer, "atomic callback for address %#x\n", address);
11308Santhony.gutierrez@amd.com    assert(m_writeRequestTable.count(makeLineAddress(address)));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    RequestTable::iterator i = m_writeRequestTable.find(address);
11308Santhony.gutierrez@amd.com    assert(i != m_writeRequestTable.end());
11308Santhony.gutierrez@amd.com    GPUCoalescerRequest* srequest = i->second;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    m_writeRequestTable.erase(i);
11308Santhony.gutierrez@amd.com    markRemoved();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    assert((srequest->m_type == RubyRequestType_ATOMIC) ||
11308Santhony.gutierrez@amd.com           (srequest->m_type == RubyRequestType_ATOMIC_RETURN) ||
11308Santhony.gutierrez@amd.com           (srequest->m_type == RubyRequestType_ATOMIC_NO_RETURN));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Atomics don't write to cache, so there is no MRU update...
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    recordMissLatency(srequest, mach,
11308Santhony.gutierrez@amd.com                      srequest->issue_time, Cycles(0), Cycles(0), true, false);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    PacketPtr pkt = srequest->pkt;
11308Santhony.gutierrez@amd.com    Addr request_address = pkt->getAddr();
11308Santhony.gutierrez@amd.com    Addr request_line_address = makeLineAddress(pkt->getAddr());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    int len = reqCoalescer[request_line_address].size();
11308Santhony.gutierrez@amd.com    std::vector<PacketPtr> mylist;
11308Santhony.gutierrez@amd.com    for (int i = 0; i < len; ++i) {
11689Santhony.gutierrez@amd.com        PacketPtr pkt = reqCoalescer[request_line_address][i].pkt;
11308Santhony.gutierrez@amd.com        assert(srequest->m_type ==
11689Santhony.gutierrez@amd.com               reqCoalescer[request_line_address][i].primaryType);
11308Santhony.gutierrez@amd.com        request_address = (pkt->getAddr());
11308Santhony.gutierrez@amd.com        request_line_address = makeLineAddress(request_address);
11308Santhony.gutierrez@amd.com        if (pkt->getPtr<uint8_t>() &&
11308Santhony.gutierrez@amd.com            srequest->m_type != RubyRequestType_ATOMIC_NO_RETURN) {
11308Santhony.gutierrez@amd.com            /* atomics are done in memory, and return the data *before* the atomic op... */
11308Santhony.gutierrez@amd.com            memcpy(pkt->getPtr<uint8_t>(),
11308Santhony.gutierrez@amd.com                   data.getData(getOffset(request_address),
11308Santhony.gutierrez@amd.com                                pkt->getSize()),
11308Santhony.gutierrez@amd.com                   pkt->getSize());
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            DPRINTF(MemoryAccess,
11308Santhony.gutierrez@amd.com                    "WARNING.  Data not transfered from Ruby to M5 for type " \
11308Santhony.gutierrez@amd.com                    "%s\n",
11308Santhony.gutierrez@amd.com                    RubyRequestType_to_string(srequest->m_type));
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // If using the RubyTester, update the RubyTester sender state's
11308Santhony.gutierrez@amd.com        // subBlock with the recieved data.  The tester will later access
11308Santhony.gutierrez@amd.com        // this state.
11308Santhony.gutierrez@amd.com        // Note: RubyPort will access it's sender state before the
11308Santhony.gutierrez@amd.com        // RubyTester.
11308Santhony.gutierrez@amd.com        if (m_usingRubyTester) {
11308Santhony.gutierrez@amd.com            RubyPort::SenderState *requestSenderState =
11308Santhony.gutierrez@amd.com                safe_cast<RubyPort::SenderState*>(pkt->senderState);
11308Santhony.gutierrez@amd.com            RubyTester::SenderState* testerSenderState =
11308Santhony.gutierrez@amd.com                safe_cast<RubyTester::SenderState*>(requestSenderState->predecessor);
11308Santhony.gutierrez@amd.com            testerSenderState->subBlock.mergeFrom(data);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        mylist.push_back(pkt);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    delete srequest;
11308Santhony.gutierrez@amd.com    reqCoalescer.erase(request_line_address);
11308Santhony.gutierrez@amd.com    assert(!reqCoalescer.count(request_line_address));
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    completeHitCallback(mylist, len);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::recordCPReadCallBack(MachineID myMachID, MachineID senderMachID)
11308Santhony.gutierrez@amd.com{
11321Ssteve.reinhardt@amd.com    if (myMachID == senderMachID) {
11308Santhony.gutierrez@amd.com        CP_TCPLdHits++;
11321Ssteve.reinhardt@amd.com    } else if (machineIDToMachineType(senderMachID) == MachineType_TCP) {
11308Santhony.gutierrez@amd.com        CP_TCPLdTransfers++;
11321Ssteve.reinhardt@amd.com    } else if (machineIDToMachineType(senderMachID) == MachineType_TCC) {
11308Santhony.gutierrez@amd.com        CP_TCCLdHits++;
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        CP_LdMiss++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::recordCPWriteCallBack(MachineID myMachID, MachineID senderMachID)
11308Santhony.gutierrez@amd.com{
11321Ssteve.reinhardt@amd.com    if (myMachID == senderMachID) {
11308Santhony.gutierrez@amd.com        CP_TCPStHits++;
11321Ssteve.reinhardt@amd.com    } else if (machineIDToMachineType(senderMachID) == MachineType_TCP) {
11308Santhony.gutierrez@amd.com        CP_TCPStTransfers++;
11321Ssteve.reinhardt@amd.com    } else if (machineIDToMachineType(senderMachID) == MachineType_TCC) {
11308Santhony.gutierrez@amd.com        CP_TCCStHits++;
11308Santhony.gutierrez@amd.com    } else {
11308Santhony.gutierrez@amd.com        CP_StMiss++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::completeHitCallback(std::vector<PacketPtr> & mylist, int len)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    for (int i = 0; i < len; ++i) {
11308Santhony.gutierrez@amd.com        RubyPort::SenderState *ss =
11308Santhony.gutierrez@amd.com            safe_cast<RubyPort::SenderState *>(mylist[i]->senderState);
11308Santhony.gutierrez@amd.com        MemSlavePort *port = ss->port;
11308Santhony.gutierrez@amd.com        assert(port != NULL);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        mylist[i]->senderState = ss->predecessor;
11308Santhony.gutierrez@amd.com        delete ss;
11308Santhony.gutierrez@amd.com        port->hitCallback(mylist[i]);
11308Santhony.gutierrez@amd.com        trySendRetries();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    testDrainComplete();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comPacketPtr
11308Santhony.gutierrez@amd.comGPUCoalescer::mapAddrToPkt(Addr address)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    RequestTable::iterator i = m_readRequestTable.find(address);
11308Santhony.gutierrez@amd.com    assert(i != m_readRequestTable.end());
11308Santhony.gutierrez@amd.com    GPUCoalescerRequest* request = i->second;
11308Santhony.gutierrez@amd.com    return request->pkt;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::recordMissLatency(GPUCoalescerRequest* srequest,
11308Santhony.gutierrez@amd.com                                MachineType mach,
11308Santhony.gutierrez@amd.com                                Cycles initialRequestTime,
11308Santhony.gutierrez@amd.com                                Cycles forwardRequestTime,
11308Santhony.gutierrez@amd.com                                Cycles firstResponseTime,
11308Santhony.gutierrez@amd.com                                bool success, bool isRegion)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    RubyRequestType type = srequest->m_type;
11308Santhony.gutierrez@amd.com    Cycles issued_time = srequest->issue_time;
11308Santhony.gutierrez@amd.com    Cycles completion_time = curCycle();
11308Santhony.gutierrez@amd.com    assert(completion_time >= issued_time);
11308Santhony.gutierrez@amd.com    Cycles total_lat = completion_time - issued_time;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // cache stats (valid for RfO protocol only)
11308Santhony.gutierrez@amd.com    if (mach == MachineType_TCP) {
11308Santhony.gutierrez@amd.com        if (type == RubyRequestType_LD) {
11308Santhony.gutierrez@amd.com            GPU_TCPLdHits++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            GPU_TCPStHits++;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else if (mach == MachineType_L1Cache_wCC) {
11308Santhony.gutierrez@amd.com        if (type == RubyRequestType_LD) {
11308Santhony.gutierrez@amd.com            GPU_TCPLdTransfers++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            GPU_TCPStTransfers++;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else if (mach == MachineType_TCC) {
11308Santhony.gutierrez@amd.com        if (type == RubyRequestType_LD) {
11308Santhony.gutierrez@amd.com            GPU_TCCLdHits++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            GPU_TCCStHits++;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else  {
11308Santhony.gutierrez@amd.com        if (type == RubyRequestType_LD) {
11308Santhony.gutierrez@amd.com            GPU_LdMiss++;
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            GPU_StMiss++;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Profile all access latency, even zero latency accesses
11308Santhony.gutierrez@amd.com    m_latencyHist.sample(total_lat);
11308Santhony.gutierrez@amd.com    m_typeLatencyHist[type]->sample(total_lat);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // Profile the miss latency for all non-zero demand misses
11308Santhony.gutierrez@amd.com    if (total_lat != Cycles(0)) {
11308Santhony.gutierrez@amd.com        m_missLatencyHist.sample(total_lat);
11308Santhony.gutierrez@amd.com        m_missTypeLatencyHist[type]->sample(total_lat);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (mach != MachineType_NUM) {
11308Santhony.gutierrez@amd.com            m_missMachLatencyHist[mach]->sample(total_lat);
11308Santhony.gutierrez@amd.com            m_missTypeMachLatencyHist[type][mach]->sample(total_lat);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if ((issued_time <= initialRequestTime) &&
11308Santhony.gutierrez@amd.com                (initialRequestTime <= forwardRequestTime) &&
11308Santhony.gutierrez@amd.com                (forwardRequestTime <= firstResponseTime) &&
11308Santhony.gutierrez@amd.com                (firstResponseTime <= completion_time)) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                m_IssueToInitialDelayHist[mach]->sample(
11308Santhony.gutierrez@amd.com                    initialRequestTime - issued_time);
11308Santhony.gutierrez@amd.com                m_InitialToForwardDelayHist[mach]->sample(
11308Santhony.gutierrez@amd.com                    forwardRequestTime - initialRequestTime);
11308Santhony.gutierrez@amd.com                m_ForwardToFirstResponseDelayHist[mach]->sample(
11308Santhony.gutierrez@amd.com                    firstResponseTime - forwardRequestTime);
11308Santhony.gutierrez@amd.com                m_FirstResponseToCompletionDelayHist[mach]->sample(
11308Santhony.gutierrez@amd.com                    completion_time - firstResponseTime);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    DPRINTFR(ProtocolTrace, "%15s %3s %10s%20s %6s>%-6s %s %d cycles\n",
11308Santhony.gutierrez@amd.com             curTick(), m_version, "Coal",
11308Santhony.gutierrez@amd.com             success ? "Done" : "SC_Failed", "", "",
11308Santhony.gutierrez@amd.com             printAddress(srequest->pkt->getAddr()), total_lat);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comGPUCoalescer::regStats()
11308Santhony.gutierrez@amd.com{
11523Sdavid.guillen@arm.com    RubyPort::regStats();
11523Sdavid.guillen@arm.com
11308Santhony.gutierrez@amd.com    // These statistical variables are not for display.
11308Santhony.gutierrez@amd.com    // The profiler will collate these across different
11308Santhony.gutierrez@amd.com    // coalescers and display those collated statistics.
11308Santhony.gutierrez@amd.com    m_outstandReqHist.init(10);
11308Santhony.gutierrez@amd.com    m_latencyHist.init(10);
11308Santhony.gutierrez@amd.com    m_missLatencyHist.init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    for (int i = 0; i < RubyRequestType_NUM; i++) {
11308Santhony.gutierrez@amd.com        m_typeLatencyHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_typeLatencyHist[i]->init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_missTypeLatencyHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_missTypeLatencyHist[i]->init(10);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    for (int i = 0; i < MachineType_NUM; i++) {
11308Santhony.gutierrez@amd.com        m_missMachLatencyHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_missMachLatencyHist[i]->init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_IssueToInitialDelayHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_IssueToInitialDelayHist[i]->init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_InitialToForwardDelayHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_InitialToForwardDelayHist[i]->init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_ForwardToFirstResponseDelayHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_ForwardToFirstResponseDelayHist[i]->init(10);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        m_FirstResponseToCompletionDelayHist.push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com        m_FirstResponseToCompletionDelayHist[i]->init(10);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    for (int i = 0; i < RubyRequestType_NUM; i++) {
11308Santhony.gutierrez@amd.com        m_missTypeMachLatencyHist.push_back(std::vector<Stats::Histogram *>());
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        for (int j = 0; j < MachineType_NUM; j++) {
11308Santhony.gutierrez@amd.com            m_missTypeMachLatencyHist[i].push_back(new Stats::Histogram());
11308Santhony.gutierrez@amd.com            m_missTypeMachLatencyHist[i][j]->init(10);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // GPU cache stats
11308Santhony.gutierrez@amd.com    GPU_TCPLdHits
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcp_ld_hits")
11308Santhony.gutierrez@amd.com        .desc("loads that hit in the TCP")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_TCPLdTransfers
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcp_ld_transfers")
11308Santhony.gutierrez@amd.com        .desc("TCP to TCP load transfers")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_TCCLdHits
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcc_ld_hits")
11308Santhony.gutierrez@amd.com        .desc("loads that hit in the TCC")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_LdMiss
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_ld_misses")
11308Santhony.gutierrez@amd.com        .desc("loads that miss in the GPU")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GPU_TCPStHits
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcp_st_hits")
11308Santhony.gutierrez@amd.com        .desc("stores that hit in the TCP")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_TCPStTransfers
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcp_st_transfers")
11308Santhony.gutierrez@amd.com        .desc("TCP to TCP store transfers")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_TCCStHits
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_tcc_st_hits")
11308Santhony.gutierrez@amd.com        .desc("stores that hit in the TCC")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    GPU_StMiss
11308Santhony.gutierrez@amd.com        .name(name() + ".gpu_st_misses")
11308Santhony.gutierrez@amd.com        .desc("stores that miss in the GPU")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // CP cache stats
11308Santhony.gutierrez@amd.com    CP_TCPLdHits
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcp_ld_hits")
11308Santhony.gutierrez@amd.com        .desc("loads that hit in the TCP")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_TCPLdTransfers
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcp_ld_transfers")
11308Santhony.gutierrez@amd.com        .desc("TCP to TCP load transfers")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_TCCLdHits
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcc_ld_hits")
11308Santhony.gutierrez@amd.com        .desc("loads that hit in the TCC")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_LdMiss
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_ld_misses")
11308Santhony.gutierrez@amd.com        .desc("loads that miss in the GPU")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    CP_TCPStHits
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcp_st_hits")
11308Santhony.gutierrez@amd.com        .desc("stores that hit in the TCP")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_TCPStTransfers
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcp_st_transfers")
11308Santhony.gutierrez@amd.com        .desc("TCP to TCP store transfers")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_TCCStHits
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_tcc_st_hits")
11308Santhony.gutierrez@amd.com        .desc("stores that hit in the TCC")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com    CP_StMiss
11308Santhony.gutierrez@amd.com        .name(name() + ".cp_st_misses")
11308Santhony.gutierrez@amd.com        .desc("stores that miss in the GPU")
11308Santhony.gutierrez@amd.com        ;
11308Santhony.gutierrez@amd.com}