src/gpu-compute/lds_state.cc

11308Santhony.gutierrez@amd.com/*
11308Santhony.gutierrez@amd.com * Copyright (c) 2014-2015 Advanced Micro Devices, Inc.
11308Santhony.gutierrez@amd.com * All rights reserved.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * For use for simulation and test purposes only
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Redistribution and use in source and binary forms, with or without
11308Santhony.gutierrez@amd.com * modification, are permitted provided that the following conditions are met:
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 1. Redistributions of source code must retain the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 2. Redistributions in binary form must reproduce the above copyright notice,
11308Santhony.gutierrez@amd.com * this list of conditions and the following disclaimer in the documentation
11308Santhony.gutierrez@amd.com * and/or other materials provided with the distribution.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * 3. Neither the name of the copyright holder nor the names of its contributors
11308Santhony.gutierrez@amd.com * may be used to endorse or promote products derived from this software
11308Santhony.gutierrez@amd.com * without specific prior written permission.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
11308Santhony.gutierrez@amd.com * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
11308Santhony.gutierrez@amd.com * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
11308Santhony.gutierrez@amd.com * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
11308Santhony.gutierrez@amd.com * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
11308Santhony.gutierrez@amd.com * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
11308Santhony.gutierrez@amd.com * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
11308Santhony.gutierrez@amd.com * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
11308Santhony.gutierrez@amd.com * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
11308Santhony.gutierrez@amd.com * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
11308Santhony.gutierrez@amd.com * POSSIBILITY OF SUCH DAMAGE.
11308Santhony.gutierrez@amd.com *
11308Santhony.gutierrez@amd.com * Author: John Kalamatianos, Joe Gross
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "gpu-compute/lds_state.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include <array>
11308Santhony.gutierrez@amd.com#include <cstdio>
11308Santhony.gutierrez@amd.com#include <cstdlib>
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com#include "gpu-compute/compute_unit.hh"
11308Santhony.gutierrez@amd.com#include "gpu-compute/gpu_dyn_inst.hh"
11308Santhony.gutierrez@amd.com#include "gpu-compute/shader.hh"
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * the default constructor that works with SWIG
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comLdsState::LdsState(const Params *params) :
11308Santhony.gutierrez@amd.com    MemObject(params),
11308Santhony.gutierrez@amd.com    tickEvent(this),
11308Santhony.gutierrez@amd.com    cuPort(name() + ".port", this),
11308Santhony.gutierrez@amd.com    maximumSize(params->size),
11308Santhony.gutierrez@amd.com    range(params->range),
11308Santhony.gutierrez@amd.com    bankConflictPenalty(params->bankConflictPenalty),
11308Santhony.gutierrez@amd.com    banks(params->banks)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    fatal_if(params->banks <= 0,
11308Santhony.gutierrez@amd.com             "Number of LDS banks should be positive number");
11308Santhony.gutierrez@amd.com    fatal_if((params->banks & (params->banks - 1)) != 0,
11308Santhony.gutierrez@amd.com             "Number of LDS banks should be a power of 2");
11308Santhony.gutierrez@amd.com    fatal_if(params->size <= 0,
11308Santhony.gutierrez@amd.com             "cannot allocate an LDS with a size less than 1");
11308Santhony.gutierrez@amd.com    fatal_if(params->size % 2,
11308Santhony.gutierrez@amd.com          "the LDS should be an even number");
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * Needed by the SWIG compiler
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comLdsState *
11308Santhony.gutierrez@amd.comLdsStateParams::create()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return new LdsState(this);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * set the parent and name based on the parent
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comLdsState::setParent(ComputeUnit *x_parent)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // check that this gets assigned to the same thing each time
11308Santhony.gutierrez@amd.com    fatal_if(!x_parent, "x_parent should not be nullptr");
11308Santhony.gutierrez@amd.com    fatal_if(x_parent == parent,
11308Santhony.gutierrez@amd.com             "should not be setting the parent twice");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    parent = x_parent;
11308Santhony.gutierrez@amd.com    _name = x_parent->name() + ".LdsState";
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * derive the gpu mem packet from the packet and then count the bank conflicts
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comunsigned
11308Santhony.gutierrez@amd.comLdsState::countBankConflicts(PacketPtr packet, unsigned *bankAccesses)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    Packet::SenderState *baseSenderState = packet->senderState;
11308Santhony.gutierrez@amd.com    while (baseSenderState->predecessor) {
11308Santhony.gutierrez@amd.com        baseSenderState = baseSenderState->predecessor;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    const ComputeUnit::LDSPort::SenderState *senderState =
11308Santhony.gutierrez@amd.com            dynamic_cast<ComputeUnit::LDSPort::SenderState *>(baseSenderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    fatal_if(!senderState,
11308Santhony.gutierrez@amd.com             "did not get the right sort of sender state");
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GPUDynInstPtr gpuDynInst = senderState->getMemInst();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return countBankConflicts(gpuDynInst, bankAccesses);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com// Count the total number of bank conflicts for the local memory packet
11308Santhony.gutierrez@amd.comunsigned
11308Santhony.gutierrez@amd.comLdsState::countBankConflicts(GPUDynInstPtr gpuDynInst,
11308Santhony.gutierrez@amd.com                             unsigned *numBankAccesses)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    int bank_conflicts = 0;
11308Santhony.gutierrez@amd.com    std::vector<int> bank;
11308Santhony.gutierrez@amd.com    // the number of LDS banks being touched by the memory instruction
11308Santhony.gutierrez@amd.com    int numBanks = std::min(parent->wfSize(), banks);
11308Santhony.gutierrez@amd.com    // if the wavefront size is larger than the number of LDS banks, we
11308Santhony.gutierrez@amd.com    // need to iterate over all work items to calculate the total
11308Santhony.gutierrez@amd.com    // number of bank conflicts
11308Santhony.gutierrez@amd.com    int groups = (parent->wfSize() > numBanks) ?
11308Santhony.gutierrez@amd.com        (parent->wfSize() / numBanks) : 1;
11308Santhony.gutierrez@amd.com    for (int i = 0; i < groups; i++) {
11308Santhony.gutierrez@amd.com        // Address Array holding all the work item addresses of an instruction
11308Santhony.gutierrez@amd.com        std::vector<Addr> addr_array;
11308Santhony.gutierrez@amd.com        addr_array.resize(numBanks, 0);
11308Santhony.gutierrez@amd.com        bank.clear();
11308Santhony.gutierrez@amd.com        bank.resize(banks, 0);
11308Santhony.gutierrez@amd.com        int max_bank = 0;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        // populate the address array for all active work items
11308Santhony.gutierrez@amd.com        for (int j = 0; j < numBanks; j++) {
11308Santhony.gutierrez@amd.com            if (gpuDynInst->exec_mask[(i*numBanks)+j]) {
11308Santhony.gutierrez@amd.com                addr_array[j] = gpuDynInst->addr[(i*numBanks)+j];
11308Santhony.gutierrez@amd.com            } else {
11308Santhony.gutierrez@amd.com                addr_array[j] = std::numeric_limits<Addr>::max();
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com
11692Santhony.gutierrez@amd.com        if (gpuDynInst->isLoad() || gpuDynInst->isStore()) {
11308Santhony.gutierrez@amd.com            // mask identical addresses
11308Santhony.gutierrez@amd.com            for (int j = 0; j < numBanks; ++j) {
11308Santhony.gutierrez@amd.com                for (int j0 = 0; j0 < j; j0++) {
11308Santhony.gutierrez@amd.com                    if (addr_array[j] != std::numeric_limits<Addr>::max()
11308Santhony.gutierrez@amd.com                                    && addr_array[j] == addr_array[j0]) {
11308Santhony.gutierrez@amd.com                        addr_array[j] = std::numeric_limits<Addr>::max();
11308Santhony.gutierrez@amd.com                    }
11308Santhony.gutierrez@amd.com                }
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        // calculate bank conflicts
11308Santhony.gutierrez@amd.com        for (int j = 0; j < numBanks; ++j) {
11308Santhony.gutierrez@amd.com            if (addr_array[j] != std::numeric_limits<Addr>::max()) {
11308Santhony.gutierrez@amd.com                int bankId = addr_array[j] % banks;
11308Santhony.gutierrez@amd.com                bank[bankId]++;
11308Santhony.gutierrez@amd.com                max_bank = std::max(max_bank, bank[bankId]);
11308Santhony.gutierrez@amd.com                // Count the number of LDS banks accessed.
11308Santhony.gutierrez@amd.com                // Since we have masked identical addresses all remaining
11308Santhony.gutierrez@amd.com                // accesses will need to be serialized if they access
11308Santhony.gutierrez@amd.com                // the same bank (bank conflict).
11308Santhony.gutierrez@amd.com                (*numBankAccesses)++;
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com        bank_conflicts += max_bank;
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com    panic_if(bank_conflicts > parent->wfSize(),
11308Santhony.gutierrez@amd.com             "Max bank conflicts should match num of work items per instr");
11308Santhony.gutierrez@amd.com    return bank_conflicts;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * receive the packet from the CU
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comLdsState::CuSidePort::recvTimingReq(PacketPtr packet)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    return ownerLds->processPacket(packet);
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.comGPUDynInstPtr
11308Santhony.gutierrez@amd.comLdsState::getDynInstr(PacketPtr packet)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    ComputeUnit::LDSPort::SenderState *ss =
11308Santhony.gutierrez@amd.com        dynamic_cast<ComputeUnit::LDSPort::SenderState *>(
11308Santhony.gutierrez@amd.com                     packet->senderState);
11308Santhony.gutierrez@amd.com    return ss->getMemInst();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * process an incoming packet, add it to the return queue
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comLdsState::processPacket(PacketPtr packet)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    unsigned bankAccesses = 0;
11308Santhony.gutierrez@amd.com    // the number of conflicts this packet will have when accessing the LDS
11308Santhony.gutierrez@amd.com    unsigned bankConflicts = countBankConflicts(packet, &bankAccesses);
11308Santhony.gutierrez@amd.com    // count the total number of physical LDS bank accessed
11308Santhony.gutierrez@amd.com    parent->ldsBankAccesses += bankAccesses;
11308Santhony.gutierrez@amd.com    // count the LDS bank conflicts. A number set to 1 indicates one
11308Santhony.gutierrez@amd.com    // access per bank maximum so there are no bank conflicts
11308Santhony.gutierrez@amd.com    parent->ldsBankConflictDist.sample(bankConflicts-1);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    GPUDynInstPtr dynInst = getDynInstr(packet);
11308Santhony.gutierrez@amd.com    // account for the LDS bank conflict overhead
11692Santhony.gutierrez@amd.com    int busLength = (dynInst->isLoad()) ? parent->loadBusLength() :
11692Santhony.gutierrez@amd.com        (dynInst->isStore()) ? parent->storeBusLength() :
11308Santhony.gutierrez@amd.com        parent->loadBusLength();
11308Santhony.gutierrez@amd.com    // delay for accessing the LDS
11308Santhony.gutierrez@amd.com    Tick processingTime =
11308Santhony.gutierrez@amd.com        parent->shader->ticks(bankConflicts * bankConflictPenalty) +
11308Santhony.gutierrez@amd.com        parent->shader->ticks(busLength);
11308Santhony.gutierrez@amd.com    // choose (delay + last packet in queue) or (now + delay) as the time to
11308Santhony.gutierrez@amd.com    // return this
11308Santhony.gutierrez@amd.com    Tick doneAt = earliestReturnTime() + processingTime;
11308Santhony.gutierrez@amd.com    // then store it for processing
11308Santhony.gutierrez@amd.com    return returnQueuePush(std::make_pair(doneAt, packet));
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * add this to the queue of packets to be returned
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comLdsState::returnQueuePush(std::pair<Tick, PacketPtr> thePair)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // TODO add time limits (e.g. one packet per cycle) and queue size limits
11308Santhony.gutierrez@amd.com    // and implement flow control
11308Santhony.gutierrez@amd.com    returnQueue.push(thePair);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // if there is no set wakeup time, look through the queue
11308Santhony.gutierrez@amd.com    if (!tickEvent.scheduled()) {
11308Santhony.gutierrez@amd.com        process();
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return true;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * receive a packet in functional mode
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comLdsState::CuSidePort::recvFunctional(PacketPtr pkt)
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    fatal("not implemented");
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * receive a retry for a response
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comLdsState::CuSidePort::recvRespRetry()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    // TODO verify that this is the right way to do this
11308Santhony.gutierrez@amd.com    assert(ownerLds->isRetryResp());
11308Santhony.gutierrez@amd.com    ownerLds->setRetryResp(false);
11308Santhony.gutierrez@amd.com    ownerLds->process();
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * receive a retry
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comLdsState::CuSidePort::recvRetry()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    fatal("not implemented");
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * look for packets to return at this time
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.combool
11308Santhony.gutierrez@amd.comLdsState::process()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    Tick now = clockEdge();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // send back completed packets
11308Santhony.gutierrez@amd.com    while (!returnQueue.empty() && returnQueue.front().first <= now) {
11308Santhony.gutierrez@amd.com        PacketPtr packet = returnQueue.front().second;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        ComputeUnit::LDSPort::SenderState *ss =
11308Santhony.gutierrez@amd.com            dynamic_cast<ComputeUnit::LDSPort::SenderState *>(
11308Santhony.gutierrez@amd.com                            packet->senderState);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        GPUDynInstPtr gpuDynInst = ss->getMemInst();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        gpuDynInst->initiateAcc(gpuDynInst);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        packet->makeTimingResponse();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        returnQueue.pop();
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        bool success = cuPort.sendTimingResp(packet);
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (!success) {
11308Santhony.gutierrez@amd.com            retryResp = true;
11308Santhony.gutierrez@amd.com            panic("have not handled timing responses being NACK'd when sent"
11308Santhony.gutierrez@amd.com                            "back");
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    // determine the next wakeup time
11308Santhony.gutierrez@amd.com    if (!returnQueue.empty()) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        Tick next = returnQueue.front().first;
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com        if (tickEvent.scheduled()) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com            if (next < tickEvent.when()) {
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com                tickEvent.deschedule();
11308Santhony.gutierrez@amd.com                tickEvent.schedule(next);
11308Santhony.gutierrez@amd.com            }
11308Santhony.gutierrez@amd.com        } else {
11308Santhony.gutierrez@amd.com            tickEvent.schedule(next);
11308Santhony.gutierrez@amd.com        }
11308Santhony.gutierrez@amd.com    }
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com    return true;
11308Santhony.gutierrez@amd.com}
11308Santhony.gutierrez@amd.com
11308Santhony.gutierrez@amd.com/**
11308Santhony.gutierrez@amd.com * wake up at this time and perform specified actions
11308Santhony.gutierrez@amd.com */
11308Santhony.gutierrez@amd.comvoid
11308Santhony.gutierrez@amd.comLdsState::TickEvent::process()
11308Santhony.gutierrez@amd.com{
11308Santhony.gutierrez@amd.com    ldsState->process();
11308Santhony.gutierrez@amd.com}