]> git.karo-electronics.de Git - karo-tx-linux.git/commitdiff
powerpc/perf_counter: Make sure PMU gets enabled properly
authorPaul Mackerras <paulus@samba.org>
Wed, 14 Jan 2009 02:44:19 +0000 (13:44 +1100)
committerPaul Mackerras <paulus@samba.org>
Wed, 14 Jan 2009 02:44:19 +0000 (13:44 +1100)
This makes sure that we call the platform-specific ppc_md.enable_pmcs
function on each CPU before we try to use the PMU on that CPU.  If the
CPU goes off-line and then on-line, we need to do the enable_pmcs call
again, so we use the hw_perf_counter_setup hook to ensure that.  It gets
called as each CPU comes online, but it isn't called on the CPU that is
coming up, so this adds the CPU number as an argument to it (there were
no non-empty instances of hw_perf_counter_setup before).

This also arranges to set the pmcregs_in_use field of the lppaca (data
structure shared with the hypervisor) on each CPU when we are using the
PMU and clear it when we are not.  This allows the hypervisor to optimize
partition switches by not saving/restoring the PMU registers when we
aren't using the PMU.

Signed-off-by: Paul Mackerras <paulus@samba.org>
arch/powerpc/kernel/perf_counter.c
kernel/perf_counter.c

index df3fe057dee99364c4977bd4b8b9f044b9b3e4a5..85ad25923c2c384ba18fad76c70be928376dfa7b 100644 (file)
@@ -15,6 +15,7 @@
 #include <linux/hardirq.h>
 #include <asm/reg.h>
 #include <asm/pmc.h>
+#include <asm/machdep.h>
 
 struct cpu_hw_counters {
        int n_counters;
@@ -24,6 +25,7 @@ struct cpu_hw_counters {
        struct perf_counter *counter[MAX_HWCOUNTERS];
        unsigned int events[MAX_HWCOUNTERS];
        u64 mmcr[3];
+       u8 pmcs_enabled;
 };
 DEFINE_PER_CPU(struct cpu_hw_counters, cpu_hw_counters);
 
@@ -261,6 +263,15 @@ u64 hw_perf_save_disable(void)
                cpuhw->disabled = 1;
                cpuhw->n_added = 0;
 
+               /*
+                * Check if we ever enabled the PMU on this cpu.
+                */
+               if (!cpuhw->pmcs_enabled) {
+                       if (ppc_md.enable_pmcs)
+                               ppc_md.enable_pmcs();
+                       cpuhw->pmcs_enabled = 1;
+               }
+
                /*
                 * Set the 'freeze counters' bit.
                 * The barrier is to make sure the mtspr has been
@@ -305,6 +316,8 @@ void hw_perf_restore(u64 disable)
                mtspr(SPRN_MMCRA, cpuhw->mmcr[2]);
                mtspr(SPRN_MMCR1, cpuhw->mmcr[1]);
                mtspr(SPRN_MMCR0, cpuhw->mmcr[0]);
+               if (cpuhw->n_counters == 0)
+                       get_lppaca()->pmcregs_in_use = 0;
                goto out;
        }
 
@@ -323,6 +336,7 @@ void hw_perf_restore(u64 disable)
         * bit set and set the hardware counters to their initial values.
         * Then unfreeze the counters.
         */
+       get_lppaca()->pmcregs_in_use = 1;
        mtspr(SPRN_MMCRA, cpuhw->mmcr[2]);
        mtspr(SPRN_MMCR1, cpuhw->mmcr[1]);
        mtspr(SPRN_MMCR0, (cpuhw->mmcr[0] & ~(MMCR0_PMC1CE | MMCR0_PMCjCE))
@@ -741,6 +755,14 @@ static void perf_counter_interrupt(struct pt_regs *regs)
        }
 }
 
+void hw_perf_counter_setup(int cpu)
+{
+       struct cpu_hw_counters *cpuhw = &per_cpu(cpu_hw_counters, cpu);
+
+       memset(cpuhw, 0, sizeof(*cpuhw));
+       cpuhw->mmcr[0] = MMCR0_FC;
+}
+
 extern struct power_pmu ppc970_pmu;
 extern struct power_pmu power6_pmu;
 
index 3aef3062ff78b6bddc43f51e8e9cfbba87db4995..52f2f526248e826975e722567ccea3df419ac7a1 100644 (file)
@@ -46,7 +46,7 @@ hw_perf_counter_init(struct perf_counter *counter)
 
 u64 __weak hw_perf_save_disable(void)          { return 0; }
 void __weak hw_perf_restore(u64 ctrl)          { barrier(); }
-void __weak hw_perf_counter_setup(void)                { barrier(); }
+void __weak hw_perf_counter_setup(int cpu)     { barrier(); }
 int __weak hw_perf_group_sched_in(struct perf_counter *group_leader,
               struct perf_cpu_context *cpuctx,
               struct perf_counter_context *ctx, int cpu)
@@ -1598,7 +1598,7 @@ static void __cpuinit perf_counter_init_cpu(int cpu)
        cpuctx->max_pertask = perf_max_counters - perf_reserved_percpu;
        mutex_unlock(&perf_resource_mutex);
 
-       hw_perf_counter_setup();
+       hw_perf_counter_setup(cpu);
 }
 
 #ifdef CONFIG_HOTPLUG_CPU