mem/cache/base.cc

2810SN/A/*
2810SN/A * Copyright (c) 2003-2005 The Regents of The University of Michigan
2810SN/A * All rights reserved.
2810SN/A *
2810SN/A * Redistribution and use in source and binary forms, with or without
2810SN/A * modification, are permitted provided that the following conditions are
2810SN/A * met: redistributions of source code must retain the above copyright
2810SN/A * notice, this list of conditions and the following disclaimer;
2810SN/A * redistributions in binary form must reproduce the above copyright
2810SN/A * notice, this list of conditions and the following disclaimer in the
2810SN/A * documentation and/or other materials provided with the distribution;
2810SN/A * neither the name of the copyright holders nor the names of its
2810SN/A * contributors may be used to endorse or promote products derived from
2810SN/A * this software without specific prior written permission.
2810SN/A *
2810SN/A * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
2810SN/A * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
2810SN/A * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
2810SN/A * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
2810SN/A * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
2810SN/A * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
2810SN/A * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
2810SN/A * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
2810SN/A * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
2810SN/A * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
2810SN/A * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
2810SN/A *
2810SN/A * Authors: Erik Hallnor
2810SN/A */
2810SN/A
2810SN/A/**
2810SN/A * @file
2810SN/A * Definition of BaseCache functions.
2810SN/A */
2810SN/A
3348SN/A#include "cpu/base.hh"
3348SN/A#include "cpu/smt.hh"
8232Snate@binkert.org#include "debug/Cache.hh"
5338Sstever@gmail.com#include "mem/cache/base.hh"
5338Sstever@gmail.com#include "mem/cache/mshr.hh"
2810SN/A
2810SN/Ausing namespace std;
2810SN/A
4965SN/ABaseCache::CachePort::CachePort(const std::string &_name, BaseCache *_cache,
6122SSteve.Reinhardt@amd.com                                const std::string &_label)
5314SN/A    : SimpleTimingPort(_name, _cache), cache(_cache),
5314SN/A      label(_label), otherPort(NULL),
6122SSteve.Reinhardt@amd.com      blocked(false), mustSendRetry(false)
2810SN/A{
4475SN/A}
4475SN/A
4475SN/A
5034SN/ABaseCache::BaseCache(const Params *p)
5034SN/A    : MemObject(p),
5314SN/A      mshrQueue("MSHRs", p->mshrs, 4, MSHRQueue_MSHRs),
5314SN/A      writeBuffer("write buffer", p->write_buffers, p->mshrs+1000,
4628SN/A                  MSHRQueue_WriteBuffer),
5034SN/A      blkSize(p->block_size),
5034SN/A      hitLatency(p->latency),
5034SN/A      numTarget(p->tgts_per_mshr),
6122SSteve.Reinhardt@amd.com      forwardSnoops(p->forward_snoops),
8134SAli.Saidi@ARM.com      isTopLevel(p->is_top_level),
4626SN/A      blocked(0),
4626SN/A      noTargetMSHR(NULL),
5034SN/A      missCount(p->max_miss_count),
6122SSteve.Reinhardt@amd.com      drainEvent(NULL),
6978SLisa.Hsu@amd.com      addrRange(p->addr_range),
6978SLisa.Hsu@amd.com      _numCpus(p->num_cpus)
4458SN/A{
2810SN/A}
2810SN/A
2811SN/Avoid
2810SN/ABaseCache::CachePort::recvStatusChange(Port::Status status)
2810SN/A{
4458SN/A    if (status == Port::RangeChange) {
4458SN/A        otherPort->sendStatusChange(Port::RangeChange);
4458SN/A    }
2810SN/A}
2810SN/A
5314SN/A
5314SN/Abool
5314SN/ABaseCache::CachePort::checkFunctional(PacketPtr pkt)
5314SN/A{
5314SN/A    pkt->pushLabel(label);
5314SN/A    bool done = SimpleTimingPort::checkFunctional(pkt);
5314SN/A    pkt->popLabel();
5314SN/A    return done;
5314SN/A}
5314SN/A
5314SN/A
6227Snate@binkert.orgunsigned
6227Snate@binkert.orgBaseCache::CachePort::deviceBlockSize() const
2810SN/A{
2810SN/A    return cache->getBlockSize();
2810SN/A}
2810SN/A
3606SN/A
4458SN/Abool
4458SN/ABaseCache::CachePort::recvRetryCommon()
3013SN/A{
3236SN/A    assert(waitingOnRetry);
4458SN/A    waitingOnRetry = false;
4458SN/A    return false;
4458SN/A}
3246SN/A
3309SN/A
3013SN/Avoid
2810SN/ABaseCache::CachePort::setBlocked()
2810SN/A{
3013SN/A    assert(!blocked);
3013SN/A    DPRINTF(Cache, "Cache Blocking\n");
2810SN/A    blocked = true;
3013SN/A    //Clear the retry flag
3013SN/A    mustSendRetry = false;
2810SN/A}
2810SN/A
2810SN/Avoid
2810SN/ABaseCache::CachePort::clearBlocked()
2810SN/A{
3013SN/A    assert(blocked);
3013SN/A    DPRINTF(Cache, "Cache Unblocking\n");
3013SN/A    blocked = false;
2897SN/A    if (mustSendRetry)
2897SN/A    {
3013SN/A        DPRINTF(Cache, "Cache Sending Retry\n");
2897SN/A        mustSendRetry = false;
4666SN/A        SendRetryEvent *ev = new SendRetryEvent(this, true);
4666SN/A        // @TODO: need to find a better time (next bus cycle?)
8708Sandreas.hansson@arm.com        cache->schedule(ev, curTick() + 1);
2897SN/A    }
2810SN/A}
2810SN/A
2844SN/A
2810SN/Avoid
2858SN/ABaseCache::init()
2858SN/A{
2858SN/A    if (!cpuSidePort || !memSidePort)
2858SN/A        panic("Cache not hooked up on both sides\n");
2858SN/A    cpuSidePort->sendStatusChange(Port::RangeChange);
2858SN/A}
2858SN/A
4628SN/A
2858SN/Avoid
2810SN/ABaseCache::regStats()
2810SN/A{
2810SN/A    using namespace Stats;
2810SN/A
2810SN/A    // Hit statistics
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        hits[access_idx]
6978SLisa.Hsu@amd.com#if FULL_SYSTEM
6978SLisa.Hsu@amd.com            .init(_numCpus + 1)
6978SLisa.Hsu@amd.com#else
6978SLisa.Hsu@amd.com            .init(_numCpus)
6978SLisa.Hsu@amd.com#endif
2810SN/A            .name(name() + "." + cstr + "_hits")
2810SN/A            .desc("number of " + cstr + " hits")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A    }
2810SN/A
4871SN/A// These macros make it easier to sum the right subset of commands and
4871SN/A// to change the subset of commands that are considered "demand" vs
4871SN/A// "non-demand"
4871SN/A#define SUM_DEMAND(s) \
4871SN/A    (s[MemCmd::ReadReq] + s[MemCmd::WriteReq] + s[MemCmd::ReadExReq])
4871SN/A
4871SN/A// should writebacks be included here?  prior code was inconsistent...
4871SN/A#define SUM_NON_DEMAND(s) \
4871SN/A    (s[MemCmd::SoftPFReq] + s[MemCmd::HardPFReq])
4871SN/A
2810SN/A    demandHits
2810SN/A        .name(name() + ".demand_hits")
2810SN/A        .desc("number of demand (read+write) hits")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    demandHits = SUM_DEMAND(hits);
2810SN/A
2810SN/A    overallHits
2810SN/A        .name(name() + ".overall_hits")
2810SN/A        .desc("number of overall hits")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    overallHits = demandHits + SUM_NON_DEMAND(hits);
2810SN/A
2810SN/A    // Miss statistics
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        misses[access_idx]
6978SLisa.Hsu@amd.com#if FULL_SYSTEM
6978SLisa.Hsu@amd.com            .init(_numCpus + 1)
6978SLisa.Hsu@amd.com#else
6978SLisa.Hsu@amd.com            .init(_numCpus)
6978SLisa.Hsu@amd.com#endif
2810SN/A            .name(name() + "." + cstr + "_misses")
2810SN/A            .desc("number of " + cstr + " misses")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A    }
2810SN/A
2810SN/A    demandMisses
2810SN/A        .name(name() + ".demand_misses")
2810SN/A        .desc("number of demand (read+write) misses")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    demandMisses = SUM_DEMAND(misses);
2810SN/A
2810SN/A    overallMisses
2810SN/A        .name(name() + ".overall_misses")
2810SN/A        .desc("number of overall misses")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    overallMisses = demandMisses + SUM_NON_DEMAND(misses);
2810SN/A
2810SN/A    // Miss latency statistics
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        missLatency[access_idx]
2810SN/A            .init(maxThreadsPerCPU)
2810SN/A            .name(name() + "." + cstr + "_miss_latency")
2810SN/A            .desc("number of " + cstr + " miss cycles")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A    }
2810SN/A
2810SN/A    demandMissLatency
2810SN/A        .name(name() + ".demand_miss_latency")
2810SN/A        .desc("number of demand (read+write) miss cycles")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    demandMissLatency = SUM_DEMAND(missLatency);
2810SN/A
2810SN/A    overallMissLatency
2810SN/A        .name(name() + ".overall_miss_latency")
2810SN/A        .desc("number of overall miss cycles")
2810SN/A        .flags(total)
2810SN/A        ;
4871SN/A    overallMissLatency = demandMissLatency + SUM_NON_DEMAND(missLatency);
2810SN/A
2810SN/A    // access formulas
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        accesses[access_idx]
2810SN/A            .name(name() + "." + cstr + "_accesses")
2810SN/A            .desc("number of " + cstr + " accesses(hits+misses)")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A
2810SN/A        accesses[access_idx] = hits[access_idx] + misses[access_idx];
2810SN/A    }
2810SN/A
2810SN/A    demandAccesses
2810SN/A        .name(name() + ".demand_accesses")
2810SN/A        .desc("number of demand (read+write) accesses")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    demandAccesses = demandHits + demandMisses;
2810SN/A
2810SN/A    overallAccesses
2810SN/A        .name(name() + ".overall_accesses")
2810SN/A        .desc("number of overall (read+write) accesses")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    overallAccesses = overallHits + overallMisses;
2810SN/A
2810SN/A    // miss rate formulas
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        missRate[access_idx]
2810SN/A            .name(name() + "." + cstr + "_miss_rate")
2810SN/A            .desc("miss rate for " + cstr + " accesses")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A
2810SN/A        missRate[access_idx] = misses[access_idx] / accesses[access_idx];
2810SN/A    }
2810SN/A
2810SN/A    demandMissRate
2810SN/A        .name(name() + ".demand_miss_rate")
2810SN/A        .desc("miss rate for demand accesses")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    demandMissRate = demandMisses / demandAccesses;
2810SN/A
2810SN/A    overallMissRate
2810SN/A        .name(name() + ".overall_miss_rate")
2810SN/A        .desc("miss rate for overall accesses")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    overallMissRate = overallMisses / overallAccesses;
2810SN/A
2810SN/A    // miss latency formulas
4022SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4022SN/A        MemCmd cmd(access_idx);
4022SN/A        const string &cstr = cmd.toString();
2810SN/A
2810SN/A        avgMissLatency[access_idx]
2810SN/A            .name(name() + "." + cstr + "_avg_miss_latency")
2810SN/A            .desc("average " + cstr + " miss latency")
2810SN/A            .flags(total | nozero | nonan)
2810SN/A            ;
2810SN/A
2810SN/A        avgMissLatency[access_idx] =
2810SN/A            missLatency[access_idx] / misses[access_idx];
2810SN/A    }
2810SN/A
2810SN/A    demandAvgMissLatency
2810SN/A        .name(name() + ".demand_avg_miss_latency")
2810SN/A        .desc("average overall miss latency")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    demandAvgMissLatency = demandMissLatency / demandMisses;
2810SN/A
2810SN/A    overallAvgMissLatency
2810SN/A        .name(name() + ".overall_avg_miss_latency")
2810SN/A        .desc("average overall miss latency")
2810SN/A        .flags(total)
2810SN/A        ;
2810SN/A    overallAvgMissLatency = overallMissLatency / overallMisses;
2810SN/A
2810SN/A    blocked_cycles.init(NUM_BLOCKED_CAUSES);
2810SN/A    blocked_cycles
2810SN/A        .name(name() + ".blocked_cycles")
2810SN/A        .desc("number of cycles access was blocked")
2810SN/A        .subname(Blocked_NoMSHRs, "no_mshrs")
2810SN/A        .subname(Blocked_NoTargets, "no_targets")
2810SN/A        ;
2810SN/A
2810SN/A
2810SN/A    blocked_causes.init(NUM_BLOCKED_CAUSES);
2810SN/A    blocked_causes
2810SN/A        .name(name() + ".blocked")
2810SN/A        .desc("number of cycles access was blocked")
2810SN/A        .subname(Blocked_NoMSHRs, "no_mshrs")
2810SN/A        .subname(Blocked_NoTargets, "no_targets")
2810SN/A        ;
2810SN/A
2810SN/A    avg_blocked
2810SN/A        .name(name() + ".avg_blocked_cycles")
2810SN/A        .desc("average number of cycles each access was blocked")
2810SN/A        .subname(Blocked_NoMSHRs, "no_mshrs")
2810SN/A        .subname(Blocked_NoTargets, "no_targets")
2810SN/A        ;
2810SN/A
2810SN/A    avg_blocked = blocked_cycles / blocked_causes;
2810SN/A
2810SN/A    fastWrites
2810SN/A        .name(name() + ".fast_writes")
2810SN/A        .desc("number of fast writes performed")
2810SN/A        ;
2810SN/A
2810SN/A    cacheCopies
2810SN/A        .name(name() + ".cache_copies")
2810SN/A        .desc("number of cache copies performed")
2810SN/A        ;
2826SN/A
4626SN/A    writebacks
4626SN/A        .init(maxThreadsPerCPU)
4626SN/A        .name(name() + ".writebacks")
4626SN/A        .desc("number of writebacks")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A
4626SN/A    // MSHR statistics
4626SN/A    // MSHR hit statistics
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshr_hits[access_idx]
4626SN/A            .init(maxThreadsPerCPU)
4626SN/A            .name(name() + "." + cstr + "_mshr_hits")
4626SN/A            .desc("number of " + cstr + " MSHR hits")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A    }
4626SN/A
4626SN/A    demandMshrHits
4626SN/A        .name(name() + ".demand_mshr_hits")
4626SN/A        .desc("number of demand (read+write) MSHR hits")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    demandMshrHits = SUM_DEMAND(mshr_hits);
4626SN/A
4626SN/A    overallMshrHits
4626SN/A        .name(name() + ".overall_mshr_hits")
4626SN/A        .desc("number of overall MSHR hits")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    overallMshrHits = demandMshrHits + SUM_NON_DEMAND(mshr_hits);
4626SN/A
4626SN/A    // MSHR miss statistics
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshr_misses[access_idx]
4626SN/A            .init(maxThreadsPerCPU)
4626SN/A            .name(name() + "." + cstr + "_mshr_misses")
4626SN/A            .desc("number of " + cstr + " MSHR misses")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A    }
4626SN/A
4626SN/A    demandMshrMisses
4626SN/A        .name(name() + ".demand_mshr_misses")
4626SN/A        .desc("number of demand (read+write) MSHR misses")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    demandMshrMisses = SUM_DEMAND(mshr_misses);
4626SN/A
4626SN/A    overallMshrMisses
4626SN/A        .name(name() + ".overall_mshr_misses")
4626SN/A        .desc("number of overall MSHR misses")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    overallMshrMisses = demandMshrMisses + SUM_NON_DEMAND(mshr_misses);
4626SN/A
4626SN/A    // MSHR miss latency statistics
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshr_miss_latency[access_idx]
4626SN/A            .init(maxThreadsPerCPU)
4626SN/A            .name(name() + "." + cstr + "_mshr_miss_latency")
4626SN/A            .desc("number of " + cstr + " MSHR miss cycles")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A    }
4626SN/A
4626SN/A    demandMshrMissLatency
4626SN/A        .name(name() + ".demand_mshr_miss_latency")
4626SN/A        .desc("number of demand (read+write) MSHR miss cycles")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    demandMshrMissLatency = SUM_DEMAND(mshr_miss_latency);
4626SN/A
4626SN/A    overallMshrMissLatency
4626SN/A        .name(name() + ".overall_mshr_miss_latency")
4626SN/A        .desc("number of overall MSHR miss cycles")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    overallMshrMissLatency =
4871SN/A        demandMshrMissLatency + SUM_NON_DEMAND(mshr_miss_latency);
4626SN/A
4626SN/A    // MSHR uncacheable statistics
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshr_uncacheable[access_idx]
4626SN/A            .init(maxThreadsPerCPU)
4626SN/A            .name(name() + "." + cstr + "_mshr_uncacheable")
4626SN/A            .desc("number of " + cstr + " MSHR uncacheable")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A    }
4626SN/A
4626SN/A    overallMshrUncacheable
4626SN/A        .name(name() + ".overall_mshr_uncacheable_misses")
4626SN/A        .desc("number of overall MSHR uncacheable misses")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    overallMshrUncacheable =
4871SN/A        SUM_DEMAND(mshr_uncacheable) + SUM_NON_DEMAND(mshr_uncacheable);
4626SN/A
4626SN/A    // MSHR miss latency statistics
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshr_uncacheable_lat[access_idx]
4626SN/A            .init(maxThreadsPerCPU)
4626SN/A            .name(name() + "." + cstr + "_mshr_uncacheable_latency")
4626SN/A            .desc("number of " + cstr + " MSHR uncacheable cycles")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A    }
4626SN/A
4626SN/A    overallMshrUncacheableLatency
4626SN/A        .name(name() + ".overall_mshr_uncacheable_latency")
4626SN/A        .desc("number of overall MSHR uncacheable cycles")
4626SN/A        .flags(total)
4626SN/A        ;
4871SN/A    overallMshrUncacheableLatency =
4871SN/A        SUM_DEMAND(mshr_uncacheable_lat) +
4871SN/A        SUM_NON_DEMAND(mshr_uncacheable_lat);
4626SN/A
4626SN/A#if 0
4626SN/A    // MSHR access formulas
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshrAccesses[access_idx]
4626SN/A            .name(name() + "." + cstr + "_mshr_accesses")
4626SN/A            .desc("number of " + cstr + " mshr accesses(hits+misses)")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A        mshrAccesses[access_idx] =
4626SN/A            mshr_hits[access_idx] + mshr_misses[access_idx]
4626SN/A            + mshr_uncacheable[access_idx];
4626SN/A    }
4626SN/A
4626SN/A    demandMshrAccesses
4626SN/A        .name(name() + ".demand_mshr_accesses")
4626SN/A        .desc("number of demand (read+write) mshr accesses")
4626SN/A        .flags(total | nozero | nonan)
4626SN/A        ;
4626SN/A    demandMshrAccesses = demandMshrHits + demandMshrMisses;
4626SN/A
4626SN/A    overallMshrAccesses
4626SN/A        .name(name() + ".overall_mshr_accesses")
4626SN/A        .desc("number of overall (read+write) mshr accesses")
4626SN/A        .flags(total | nozero | nonan)
4626SN/A        ;
4626SN/A    overallMshrAccesses = overallMshrHits + overallMshrMisses
4626SN/A        + overallMshrUncacheable;
4626SN/A#endif
4626SN/A
4626SN/A    // MSHR miss rate formulas
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        mshrMissRate[access_idx]
4626SN/A            .name(name() + "." + cstr + "_mshr_miss_rate")
4626SN/A            .desc("mshr miss rate for " + cstr + " accesses")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A
4626SN/A        mshrMissRate[access_idx] =
4626SN/A            mshr_misses[access_idx] / accesses[access_idx];
4626SN/A    }
4626SN/A
4626SN/A    demandMshrMissRate
4626SN/A        .name(name() + ".demand_mshr_miss_rate")
4626SN/A        .desc("mshr miss rate for demand accesses")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A    demandMshrMissRate = demandMshrMisses / demandAccesses;
4626SN/A
4626SN/A    overallMshrMissRate
4626SN/A        .name(name() + ".overall_mshr_miss_rate")
4626SN/A        .desc("mshr miss rate for overall accesses")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A    overallMshrMissRate = overallMshrMisses / overallAccesses;
4626SN/A
4626SN/A    // mshrMiss latency formulas
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        avgMshrMissLatency[access_idx]
4626SN/A            .name(name() + "." + cstr + "_avg_mshr_miss_latency")
4626SN/A            .desc("average " + cstr + " mshr miss latency")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A
4626SN/A        avgMshrMissLatency[access_idx] =
4626SN/A            mshr_miss_latency[access_idx] / mshr_misses[access_idx];
4626SN/A    }
4626SN/A
4626SN/A    demandAvgMshrMissLatency
4626SN/A        .name(name() + ".demand_avg_mshr_miss_latency")
4626SN/A        .desc("average overall mshr miss latency")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A    demandAvgMshrMissLatency = demandMshrMissLatency / demandMshrMisses;
4626SN/A
4626SN/A    overallAvgMshrMissLatency
4626SN/A        .name(name() + ".overall_avg_mshr_miss_latency")
4626SN/A        .desc("average overall mshr miss latency")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A    overallAvgMshrMissLatency = overallMshrMissLatency / overallMshrMisses;
4626SN/A
4626SN/A    // mshrUncacheable latency formulas
4626SN/A    for (int access_idx = 0; access_idx < MemCmd::NUM_MEM_CMDS; ++access_idx) {
4626SN/A        MemCmd cmd(access_idx);
4626SN/A        const string &cstr = cmd.toString();
4626SN/A
4626SN/A        avgMshrUncacheableLatency[access_idx]
4626SN/A            .name(name() + "." + cstr + "_avg_mshr_uncacheable_latency")
4626SN/A            .desc("average " + cstr + " mshr uncacheable latency")
4626SN/A            .flags(total | nozero | nonan)
4626SN/A            ;
4626SN/A
4626SN/A        avgMshrUncacheableLatency[access_idx] =
4626SN/A            mshr_uncacheable_lat[access_idx] / mshr_uncacheable[access_idx];
4626SN/A    }
4626SN/A
4626SN/A    overallAvgMshrUncacheableLatency
4626SN/A        .name(name() + ".overall_avg_mshr_uncacheable_latency")
4626SN/A        .desc("average overall mshr uncacheable latency")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A    overallAvgMshrUncacheableLatency = overallMshrUncacheableLatency / overallMshrUncacheable;
4626SN/A
4626SN/A    mshr_cap_events
4626SN/A        .init(maxThreadsPerCPU)
4626SN/A        .name(name() + ".mshr_cap_events")
4626SN/A        .desc("number of times MSHR cap was activated")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A
4626SN/A    //software prefetching stats
4626SN/A    soft_prefetch_mshr_full
4626SN/A        .init(maxThreadsPerCPU)
4626SN/A        .name(name() + ".soft_prefetch_mshr_full")
4626SN/A        .desc("number of mshr full events for SW prefetching instrutions")
4626SN/A        .flags(total)
4626SN/A        ;
4626SN/A
4626SN/A    mshr_no_allocate_misses
4626SN/A        .name(name() +".no_allocate_misses")
4626SN/A        .desc("Number of misses that were no-allocate")
4626SN/A        ;
4626SN/A
2810SN/A}
3503SN/A
3503SN/Aunsigned int
3503SN/ABaseCache::drain(Event *de)
3503SN/A{
4626SN/A    int count = memSidePort->drain(de) + cpuSidePort->drain(de);
4626SN/A
3503SN/A    // Set status
4626SN/A    if (count != 0) {
3503SN/A        drainEvent = de;
3503SN/A
3503SN/A        changeState(SimObject::Draining);
4626SN/A        return count;
3503SN/A    }
3503SN/A
3503SN/A    changeState(SimObject::Drained);
3503SN/A    return 0;
3503SN/A}