ruby/system/VIPERCoalescer.cc

11308Santhony.gutierrez@amd.com/*
11308Santhony.gutierrez@amd.com * Copyright (c) 2013-2015 Advanced Micro Devices, Inc.
11308Santhony.gutierrez@amd.com * All rights reserved.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * For use for simulation and test purposes only
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Redistribution and use in source and binary forms, with or without
11308Santhony.gutierrez@amd.com * modification, are permitted provided that the following conditions are met:
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 1. Redistributions of source code must retain the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 2. Redistributions in binary form must reproduce the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer in the documentation
11308Santhony.gutierrez@amd.com * and/or other materials provided with the distribution.
11308Santhony.gutierrez@amd.com *
12697Santhony.gutierrez@amd.com * 3. Neither the name of the copyright holder nor the names of its
12697Santhony.gutierrez@amd.com * contributors may be used to endorse or promote products derived from this
12697Santhony.gutierrez@amd.com * software without specific prior written permission.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
11308Santhony.gutierrez@amd.com * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
11308Santhony.gutierrez@amd.com * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
11308Santhony.gutierrez@amd.com * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
11308Santhony.gutierrez@amd.com * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
11308Santhony.gutierrez@amd.com * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
11308Santhony.gutierrez@amd.com * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
11308Santhony.gutierrez@amd.com * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
11308Santhony.gutierrez@amd.com * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
11308Santhony.gutierrez@amd.com * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
11308Santhony.gutierrez@amd.com * POSSIBILITY OF SUCH DAMAGE.
11308Santhony.gutierrez@amd.com *
12697Santhony.gutierrez@amd.com * Authors: Sooraj Puthoor
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.com
12334Sgabeblack@google.com#include "base/logging.hh"
11308Santhony.gutierrez@amd.com#include "base/str.hh"
11308Santhony.gutierrez@amd.com#include "config/the_isa.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#if THE_ISA == X86_ISA
11308Santhony.gutierrez@amd.com#include "arch/x86/insts/microldstop.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#endif // X86_ISA
11308Santhony.gutierrez@amd.com#include "mem/ruby/system/VIPERCoalescer.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "cpu/testers/rubytest/RubyTester.hh"
11308Santhony.gutierrez@amd.com#include "debug/GPUCoalescer.hh"
11308Santhony.gutierrez@amd.com#include "debug/MemoryAccess.hh"
11308Santhony.gutierrez@amd.com#include "mem/packet.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/common/SubBlock.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/network/MessageBuffer.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/profiler/Profiler.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/slicc_interface/AbstractController.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/slicc_interface/RubyRequest.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/structures/CacheMemory.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/system/GPUCoalescer.hh"
11308Santhony.gutierrez@amd.com#include "mem/ruby/system/RubySystem.hh"
11308Santhony.gutierrez@amd.com#include "params/VIPERCoalescer.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comusing namespace std;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comVIPERCoalescer *
11308Santhony.gutierrez@amd.comVIPERCoalescerParams::create()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return new VIPERCoalescer(this);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comVIPERCoalescer::VIPERCoalescer(const Params *p)
11308Santhony.gutierrez@amd.com    : GPUCoalescer(p)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_max_wb_per_cycle=p->max_wb_per_cycle;
11308Santhony.gutierrez@amd.com    m_max_inv_per_cycle=p->max_inv_per_cycle;
11308Santhony.gutierrez@amd.com    m_outstanding_inv = 0;
11308Santhony.gutierrez@amd.com    m_outstanding_wb = 0;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comVIPERCoalescer::~VIPERCoalescer()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// Analyzes the packet to see if this request can be coalesced.
11308Santhony.gutierrez@amd.com// If request can be coalesced, this request is added to the reqCoalescer table
11308Santhony.gutierrez@amd.com// and makeRequest returns RequestStatus_Issued;
11308Santhony.gutierrez@amd.com// If this is the first request to a cacheline, request is added to both
11308Santhony.gutierrez@amd.com// newRequests queue and to the reqCoalescer table; makeRequest
11308Santhony.gutierrez@amd.com// returns RequestStatus_Issued.
11308Santhony.gutierrez@amd.com// If there is a pending request to this cacheline and this request
11308Santhony.gutierrez@amd.com// can't be coalesced, RequestStatus_Aliased is returned and
11308Santhony.gutierrez@amd.com// the packet needs to be reissued.
11308Santhony.gutierrez@amd.comRequestStatus
11308Santhony.gutierrez@amd.comVIPERCoalescer::makeRequest(PacketPtr pkt)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    if (m_outstanding_wb | m_outstanding_inv) {
11308Santhony.gutierrez@amd.com        DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com                "There are %d Writebacks and %d Invalidatons\n",
11308Santhony.gutierrez@amd.com                m_outstanding_wb, m_outstanding_inv);
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    // Are we in the middle of a release
11308Santhony.gutierrez@amd.com    if ((m_outstanding_wb) > 0) {
11308Santhony.gutierrez@amd.com        if (pkt->req->isKernel()) {
11308Santhony.gutierrez@amd.com            // Everythign is fine
11308Santhony.gutierrez@amd.com            // Barriers and Kernel End scan coalesce
11308Santhony.gutierrez@amd.com            // If it is a Kerenl Begin flush the cache
11308Santhony.gutierrez@amd.com            if (pkt->req->isAcquire() && (m_outstanding_inv == 0)) {
11308Santhony.gutierrez@amd.com                invL1();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (pkt->req->isRelease()) {
11308Santhony.gutierrez@amd.com                insertKernel(pkt->req->contextId(), pkt);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com//        return RequestStatus_Aliased;
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isKernel() && pkt->req->isRelease()) {
11308Santhony.gutierrez@amd.com        // Flush Dirty Data on Kernel End
11308Santhony.gutierrez@amd.com        // isKernel + isRelease
11308Santhony.gutierrez@amd.com        insertKernel(pkt->req->contextId(), pkt);
11308Santhony.gutierrez@amd.com        wbL1();
11321Ssteve.reinhardt@amd.com        if (m_outstanding_wb == 0) {
11308Santhony.gutierrez@amd.com            for (auto it =  kernelEndList.begin(); it != kernelEndList.end(); it++) {
11308Santhony.gutierrez@amd.com                newKernelEnds.push_back(it->first);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com            completeIssue();
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    RequestStatus requestStatus = GPUCoalescer::makeRequest(pkt);
11308Santhony.gutierrez@amd.com    if (requestStatus!=RequestStatus_Issued) {
11308Santhony.gutierrez@amd.com        // Request not isssued
11308Santhony.gutierrez@amd.com        // enqueue Retry
11308Santhony.gutierrez@amd.com        DPRINTF(GPUCoalescer, "Request not issued by GPUCoaleser\n");
11308Santhony.gutierrez@amd.com        return requestStatus;
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isKernel() && pkt->req->isAcquire()) {
11308Santhony.gutierrez@amd.com        // Invalidate clean Data on Kernel Begin
11308Santhony.gutierrez@amd.com        // isKernel + isAcquire
11308Santhony.gutierrez@amd.com        invL1();
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isAcquire() && pkt->req->isRelease()) {
11308Santhony.gutierrez@amd.com        // Deschedule the AtomicAcqRel and
11308Santhony.gutierrez@amd.com        // Flush and Invalidate the L1 cache
11308Santhony.gutierrez@amd.com        invwbL1();
11308Santhony.gutierrez@amd.com        if (m_outstanding_wb > 0 && issueEvent.scheduled()) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUCoalescer, "issueEvent Descheduled\n");
11308Santhony.gutierrez@amd.com            deschedule(issueEvent);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isRelease()) {
11308Santhony.gutierrez@amd.com        // Deschedule the StoreRel and
11308Santhony.gutierrez@amd.com        // Flush the L1 cache
11308Santhony.gutierrez@amd.com        wbL1();
11308Santhony.gutierrez@amd.com        if (m_outstanding_wb > 0 && issueEvent.scheduled()) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUCoalescer, "issueEvent Descheduled\n");
11308Santhony.gutierrez@amd.com            deschedule(issueEvent);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    } else if (pkt->req->isAcquire()) {
11308Santhony.gutierrez@amd.com        // LoadAcq or AtomicAcq
11308Santhony.gutierrez@amd.com        // Invalidate the L1 cache
11308Santhony.gutierrez@amd.com        invL1();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    // Request was successful
11308Santhony.gutierrez@amd.com    if (m_outstanding_wb == 0) {
11308Santhony.gutierrez@amd.com        if (!issueEvent.scheduled()) {
11308Santhony.gutierrez@amd.com            DPRINTF(GPUCoalescer, "issueEvent Rescheduled\n");
11308Santhony.gutierrez@amd.com            schedule(issueEvent, curTick());
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    return RequestStatus_Issued;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comVIPERCoalescer::wbCallback(Addr addr)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_outstanding_wb--;
11308Santhony.gutierrez@amd.com    // if L1 Flush Complete
11308Santhony.gutierrez@amd.com    // attemnpt to schedule issueEvent
11308Santhony.gutierrez@amd.com    assert(((int) m_outstanding_wb) >= 0);
11308Santhony.gutierrez@amd.com    if (m_outstanding_wb == 0) {
11308Santhony.gutierrez@amd.com        for (auto it =  kernelEndList.begin(); it != kernelEndList.end(); it++) {
11308Santhony.gutierrez@amd.com            newKernelEnds.push_back(it->first);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        completeIssue();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    trySendRetries();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comVIPERCoalescer::invCallback(Addr addr)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    m_outstanding_inv--;
11308Santhony.gutierrez@amd.com    // if L1 Flush Complete
11308Santhony.gutierrez@amd.com    // attemnpt to schedule issueEvent
11308Santhony.gutierrez@amd.com    // This probably won't happen, since
11308Santhony.gutierrez@amd.com    // we dont wait on cache invalidations
11308Santhony.gutierrez@amd.com    if (m_outstanding_wb == 0) {
11308Santhony.gutierrez@amd.com        for (auto it =  kernelEndList.begin(); it != kernelEndList.end(); it++) {
11308Santhony.gutierrez@amd.com            newKernelEnds.push_back(it->first);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        completeIssue();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    trySendRetries();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com  * Invalidate L1 cache (Acquire)
11308Santhony.gutierrez@amd.com  */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comVIPERCoalescer::invL1()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    int size = m_dataCache_ptr->getNumBlocks();
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com            "There are %d Invalidations outstanding before Cache Walk\n",
11308Santhony.gutierrez@amd.com            m_outstanding_inv);
11308Santhony.gutierrez@amd.com    // Walk the cache
11308Santhony.gutierrez@amd.com    for (int i = 0; i < size; i++) {
11308Santhony.gutierrez@amd.com        Addr addr = m_dataCache_ptr->getAddressAtIdx(i);
11308Santhony.gutierrez@amd.com        // Evict Read-only data
14166Spablo.prieto@unican.es        RubyRequestType request_type = RubyRequestType_REPLACEMENT;
11308Santhony.gutierrez@amd.com        std::shared_ptr<RubyRequest> msg = std::make_shared<RubyRequest>(
11308Santhony.gutierrez@amd.com            clockEdge(), addr, (uint8_t*) 0, 0, 0,
14166Spablo.prieto@unican.es            request_type, RubyAccessMode_Supervisor,
11308Santhony.gutierrez@amd.com            nullptr);
11308Santhony.gutierrez@amd.com        assert(m_mandatory_q_ptr != NULL);
14166Spablo.prieto@unican.es        Tick latency = cyclesToTicks(
14166Spablo.prieto@unican.es                            m_controller->mandatoryQueueLatency(request_type));
14166Spablo.prieto@unican.es        assert(latency > 0);
14166Spablo.prieto@unican.es        m_mandatory_q_ptr->enqueue(msg, clockEdge(), latency);
11308Santhony.gutierrez@amd.com        m_outstanding_inv++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com            "There are %d Invalidatons outstanding after Cache Walk\n",
11308Santhony.gutierrez@amd.com            m_outstanding_inv);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com  * Writeback L1 cache (Release)
11308Santhony.gutierrez@amd.com  */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comVIPERCoalescer::wbL1()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    int size = m_dataCache_ptr->getNumBlocks();
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com            "There are %d Writebacks outstanding before Cache Walk\n",
11308Santhony.gutierrez@amd.com            m_outstanding_wb);
11308Santhony.gutierrez@amd.com    // Walk the cache
11308Santhony.gutierrez@amd.com    for (int i = 0; i < size; i++) {
11308Santhony.gutierrez@amd.com        Addr addr = m_dataCache_ptr->getAddressAtIdx(i);
11308Santhony.gutierrez@amd.com        // Write dirty data back
14166Spablo.prieto@unican.es        RubyRequestType request_type = RubyRequestType_FLUSH;
11308Santhony.gutierrez@amd.com        std::shared_ptr<RubyRequest> msg = std::make_shared<RubyRequest>(
11308Santhony.gutierrez@amd.com            clockEdge(), addr, (uint8_t*) 0, 0, 0,
14166Spablo.prieto@unican.es            request_type, RubyAccessMode_Supervisor,
11308Santhony.gutierrez@amd.com            nullptr);
11308Santhony.gutierrez@amd.com        assert(m_mandatory_q_ptr != NULL);
14166Spablo.prieto@unican.es        Tick latency = cyclesToTicks(
14166Spablo.prieto@unican.es                            m_controller->mandatoryQueueLatency(request_type));
14166Spablo.prieto@unican.es        assert(latency > 0);
14166Spablo.prieto@unican.es        m_mandatory_q_ptr->enqueue(msg, clockEdge(), latency);
11308Santhony.gutierrez@amd.com        m_outstanding_wb++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    DPRINTF(GPUCoalescer,
11308Santhony.gutierrez@amd.com            "There are %d Writebacks outstanding after Cache Walk\n",
11308Santhony.gutierrez@amd.com            m_outstanding_wb);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com  * Invalidate and Writeback L1 cache (Acquire&Release)
11308Santhony.gutierrez@amd.com  */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comVIPERCoalescer::invwbL1()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    int size = m_dataCache_ptr->getNumBlocks();
11308Santhony.gutierrez@amd.com    // Walk the cache
11321Ssteve.reinhardt@amd.com    for (int i = 0; i < size; i++) {
11308Santhony.gutierrez@amd.com        Addr addr = m_dataCache_ptr->getAddressAtIdx(i);
11308Santhony.gutierrez@amd.com        // Evict Read-only data
14166Spablo.prieto@unican.es        RubyRequestType request_type = RubyRequestType_REPLACEMENT;
11308Santhony.gutierrez@amd.com        std::shared_ptr<RubyRequest> msg = std::make_shared<RubyRequest>(
11308Santhony.gutierrez@amd.com            clockEdge(), addr, (uint8_t*) 0, 0, 0,
14166Spablo.prieto@unican.es            request_type, RubyAccessMode_Supervisor,
11308Santhony.gutierrez@amd.com            nullptr);
11308Santhony.gutierrez@amd.com        assert(m_mandatory_q_ptr != NULL);
14166Spablo.prieto@unican.es        Tick latency = cyclesToTicks(
14166Spablo.prieto@unican.es                            m_controller->mandatoryQueueLatency(request_type));
14166Spablo.prieto@unican.es        assert(latency > 0);
14166Spablo.prieto@unican.es        m_mandatory_q_ptr->enqueue(msg, clockEdge(), latency);
11308Santhony.gutierrez@amd.com        m_outstanding_inv++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    // Walk the cache
11321Ssteve.reinhardt@amd.com    for (int i = 0; i< size; i++) {
11308Santhony.gutierrez@amd.com        Addr addr = m_dataCache_ptr->getAddressAtIdx(i);
11308Santhony.gutierrez@amd.com        // Write dirty data back
14166Spablo.prieto@unican.es        RubyRequestType request_type = RubyRequestType_FLUSH;
11308Santhony.gutierrez@amd.com        std::shared_ptr<RubyRequest> msg = std::make_shared<RubyRequest>(
11308Santhony.gutierrez@amd.com            clockEdge(), addr, (uint8_t*) 0, 0, 0,
14166Spablo.prieto@unican.es            request_type, RubyAccessMode_Supervisor,
11308Santhony.gutierrez@amd.com            nullptr);
11308Santhony.gutierrez@amd.com        assert(m_mandatory_q_ptr != NULL);
14166Spablo.prieto@unican.es        Tick latency = cyclesToTicks(
14166Spablo.prieto@unican.es                m_controller->mandatoryQueueLatency(request_type));
14166Spablo.prieto@unican.es        assert(latency > 0);
14166Spablo.prieto@unican.es        m_mandatory_q_ptr->enqueue(msg, clockEdge(), latency);
11308Santhony.gutierrez@amd.com        m_outstanding_wb++;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com}