]> git.karo-electronics.de Git - karo-tx-linux.git/blob - arch/x86/power/cpu.c
Merge branch 'x86-paravirt-for-linus' of git://git.kernel.org/pub/scm/linux/kernel...
[karo-tx-linux.git] / arch / x86 / power / cpu.c
1 /*
2  * Suspend support specific for i386/x86-64.
3  *
4  * Distribute under GPLv2
5  *
6  * Copyright (c) 2007 Rafael J. Wysocki <rjw@sisk.pl>
7  * Copyright (c) 2002 Pavel Machek <pavel@ucw.cz>
8  * Copyright (c) 2001 Patrick Mochel <mochel@osdl.org>
9  */
10
11 #include <linux/suspend.h>
12 #include <linux/export.h>
13 #include <linux/smp.h>
14 #include <linux/perf_event.h>
15
16 #include <asm/pgtable.h>
17 #include <asm/proto.h>
18 #include <asm/mtrr.h>
19 #include <asm/page.h>
20 #include <asm/mce.h>
21 #include <asm/xcr.h>
22 #include <asm/suspend.h>
23 #include <asm/debugreg.h>
24 #include <asm/fpu-internal.h> /* pcntxt_mask */
25 #include <asm/cpu.h>
26
27 #ifdef CONFIG_X86_32
28 static struct saved_context saved_context;
29
30 unsigned long saved_context_ebx;
31 unsigned long saved_context_esp, saved_context_ebp;
32 unsigned long saved_context_esi, saved_context_edi;
33 unsigned long saved_context_eflags;
34 #else
35 /* CONFIG_X86_64 */
36 struct saved_context saved_context;
37 #endif
38
39 /**
40  *      __save_processor_state - save CPU registers before creating a
41  *              hibernation image and before restoring the memory state from it
42  *      @ctxt - structure to store the registers contents in
43  *
44  *      NOTE: If there is a CPU register the modification of which by the
45  *      boot kernel (ie. the kernel used for loading the hibernation image)
46  *      might affect the operations of the restored target kernel (ie. the one
47  *      saved in the hibernation image), then its contents must be saved by this
48  *      function.  In other words, if kernel A is hibernated and different
49  *      kernel B is used for loading the hibernation image into memory, the
50  *      kernel A's __save_processor_state() function must save all registers
51  *      needed by kernel A, so that it can operate correctly after the resume
52  *      regardless of what kernel B does in the meantime.
53  */
54 static void __save_processor_state(struct saved_context *ctxt)
55 {
56 #ifdef CONFIG_X86_32
57         mtrr_save_fixed_ranges(NULL);
58 #endif
59         kernel_fpu_begin();
60
61         /*
62          * descriptor tables
63          */
64 #ifdef CONFIG_X86_32
65         store_idt(&ctxt->idt);
66 #else
67 /* CONFIG_X86_64 */
68         store_idt((struct desc_ptr *)&ctxt->idt_limit);
69 #endif
70         store_tr(ctxt->tr);
71
72         /* XMM0..XMM15 should be handled by kernel_fpu_begin(). */
73         /*
74          * segment registers
75          */
76 #ifdef CONFIG_X86_32
77         savesegment(es, ctxt->es);
78         savesegment(fs, ctxt->fs);
79         savesegment(gs, ctxt->gs);
80         savesegment(ss, ctxt->ss);
81 #else
82 /* CONFIG_X86_64 */
83         asm volatile ("movw %%ds, %0" : "=m" (ctxt->ds));
84         asm volatile ("movw %%es, %0" : "=m" (ctxt->es));
85         asm volatile ("movw %%fs, %0" : "=m" (ctxt->fs));
86         asm volatile ("movw %%gs, %0" : "=m" (ctxt->gs));
87         asm volatile ("movw %%ss, %0" : "=m" (ctxt->ss));
88
89         rdmsrl(MSR_FS_BASE, ctxt->fs_base);
90         rdmsrl(MSR_GS_BASE, ctxt->gs_base);
91         rdmsrl(MSR_KERNEL_GS_BASE, ctxt->gs_kernel_base);
92         mtrr_save_fixed_ranges(NULL);
93
94         rdmsrl(MSR_EFER, ctxt->efer);
95 #endif
96
97         /*
98          * control registers
99          */
100         ctxt->cr0 = read_cr0();
101         ctxt->cr2 = read_cr2();
102         ctxt->cr3 = read_cr3();
103 #ifdef CONFIG_X86_32
104         ctxt->cr4 = read_cr4_safe();
105 #else
106 /* CONFIG_X86_64 */
107         ctxt->cr4 = read_cr4();
108         ctxt->cr8 = read_cr8();
109 #endif
110         ctxt->misc_enable_saved = !rdmsrl_safe(MSR_IA32_MISC_ENABLE,
111                                                &ctxt->misc_enable);
112 }
113
114 /* Needed by apm.c */
115 void save_processor_state(void)
116 {
117         __save_processor_state(&saved_context);
118         x86_platform.save_sched_clock_state();
119 }
120 #ifdef CONFIG_X86_32
121 EXPORT_SYMBOL(save_processor_state);
122 #endif
123
124 static void do_fpu_end(void)
125 {
126         /*
127          * Restore FPU regs if necessary.
128          */
129         kernel_fpu_end();
130 }
131
132 static void fix_processor_context(void)
133 {
134         int cpu = smp_processor_id();
135         struct tss_struct *t = &per_cpu(init_tss, cpu);
136 #ifdef CONFIG_X86_64
137         struct desc_struct *desc = get_cpu_gdt_table(cpu);
138         tss_desc tss;
139 #endif
140         set_tss_desc(cpu, t);   /*
141                                  * This just modifies memory; should not be
142                                  * necessary. But... This is necessary, because
143                                  * 386 hardware has concept of busy TSS or some
144                                  * similar stupidity.
145                                  */
146
147 #ifdef CONFIG_X86_64
148         memcpy(&tss, &desc[GDT_ENTRY_TSS], sizeof(tss_desc));
149         tss.type = 0x9; /* The available 64-bit TSS (see AMD vol 2, pg 91 */
150         write_gdt_entry(desc, GDT_ENTRY_TSS, &tss, DESC_TSS);
151
152         syscall_init();                         /* This sets MSR_*STAR and related */
153 #endif
154         load_TR_desc();                         /* This does ltr */
155         load_LDT(&current->active_mm->context); /* This does lldt */
156 }
157
158 /**
159  *      __restore_processor_state - restore the contents of CPU registers saved
160  *              by __save_processor_state()
161  *      @ctxt - structure to load the registers contents from
162  */
163 static void __restore_processor_state(struct saved_context *ctxt)
164 {
165         if (ctxt->misc_enable_saved)
166                 wrmsrl(MSR_IA32_MISC_ENABLE, ctxt->misc_enable);
167         /*
168          * control registers
169          */
170         /* cr4 was introduced in the Pentium CPU */
171 #ifdef CONFIG_X86_32
172         if (ctxt->cr4)
173                 write_cr4(ctxt->cr4);
174 #else
175 /* CONFIG X86_64 */
176         wrmsrl(MSR_EFER, ctxt->efer);
177         write_cr8(ctxt->cr8);
178         write_cr4(ctxt->cr4);
179 #endif
180         write_cr3(ctxt->cr3);
181         write_cr2(ctxt->cr2);
182         write_cr0(ctxt->cr0);
183
184         /*
185          * now restore the descriptor tables to their proper values
186          * ltr is done i fix_processor_context().
187          */
188 #ifdef CONFIG_X86_32
189         load_idt(&ctxt->idt);
190 #else
191 /* CONFIG_X86_64 */
192         load_idt((const struct desc_ptr *)&ctxt->idt_limit);
193 #endif
194
195         /*
196          * segment registers
197          */
198 #ifdef CONFIG_X86_32
199         loadsegment(es, ctxt->es);
200         loadsegment(fs, ctxt->fs);
201         loadsegment(gs, ctxt->gs);
202         loadsegment(ss, ctxt->ss);
203
204         /*
205          * sysenter MSRs
206          */
207         if (boot_cpu_has(X86_FEATURE_SEP))
208                 enable_sep_cpu();
209 #else
210 /* CONFIG_X86_64 */
211         asm volatile ("movw %0, %%ds" :: "r" (ctxt->ds));
212         asm volatile ("movw %0, %%es" :: "r" (ctxt->es));
213         asm volatile ("movw %0, %%fs" :: "r" (ctxt->fs));
214         load_gs_index(ctxt->gs);
215         asm volatile ("movw %0, %%ss" :: "r" (ctxt->ss));
216
217         wrmsrl(MSR_FS_BASE, ctxt->fs_base);
218         wrmsrl(MSR_GS_BASE, ctxt->gs_base);
219         wrmsrl(MSR_KERNEL_GS_BASE, ctxt->gs_kernel_base);
220 #endif
221
222         /*
223          * restore XCR0 for xsave capable cpu's.
224          */
225         if (cpu_has_xsave)
226                 xsetbv(XCR_XFEATURE_ENABLED_MASK, pcntxt_mask);
227
228         fix_processor_context();
229
230         do_fpu_end();
231         x86_platform.restore_sched_clock_state();
232         mtrr_bp_restore();
233         perf_restore_debug_store();
234 }
235
236 /* Needed by apm.c */
237 void restore_processor_state(void)
238 {
239         __restore_processor_state(&saved_context);
240 }
241 #ifdef CONFIG_X86_32
242 EXPORT_SYMBOL(restore_processor_state);
243 #endif
244
245 /*
246  * When bsp_check() is called in hibernate and suspend, cpu hotplug
247  * is disabled already. So it's unnessary to handle race condition between
248  * cpumask query and cpu hotplug.
249  */
250 static int bsp_check(void)
251 {
252         if (cpumask_first(cpu_online_mask) != 0) {
253                 pr_warn("CPU0 is offline.\n");
254                 return -ENODEV;
255         }
256
257         return 0;
258 }
259
260 static int bsp_pm_callback(struct notifier_block *nb, unsigned long action,
261                            void *ptr)
262 {
263         int ret = 0;
264
265         switch (action) {
266         case PM_SUSPEND_PREPARE:
267         case PM_HIBERNATION_PREPARE:
268                 ret = bsp_check();
269                 break;
270 #ifdef CONFIG_DEBUG_HOTPLUG_CPU0
271         case PM_RESTORE_PREPARE:
272                 /*
273                  * When system resumes from hibernation, online CPU0 because
274                  * 1. it's required for resume and
275                  * 2. the CPU was online before hibernation
276                  */
277                 if (!cpu_online(0))
278                         _debug_hotplug_cpu(0, 1);
279                 break;
280         case PM_POST_RESTORE:
281                 /*
282                  * When a resume really happens, this code won't be called.
283                  *
284                  * This code is called only when user space hibernation software
285                  * prepares for snapshot device during boot time. So we just
286                  * call _debug_hotplug_cpu() to restore to CPU0's state prior to
287                  * preparing the snapshot device.
288                  *
289                  * This works for normal boot case in our CPU0 hotplug debug
290                  * mode, i.e. CPU0 is offline and user mode hibernation
291                  * software initializes during boot time.
292                  *
293                  * If CPU0 is online and user application accesses snapshot
294                  * device after boot time, this will offline CPU0 and user may
295                  * see different CPU0 state before and after accessing
296                  * the snapshot device. But hopefully this is not a case when
297                  * user debugging CPU0 hotplug. Even if users hit this case,
298                  * they can easily online CPU0 back.
299                  *
300                  * To simplify this debug code, we only consider normal boot
301                  * case. Otherwise we need to remember CPU0's state and restore
302                  * to that state and resolve racy conditions etc.
303                  */
304                 _debug_hotplug_cpu(0, 0);
305                 break;
306 #endif
307         default:
308                 break;
309         }
310         return notifier_from_errno(ret);
311 }
312
313 static int __init bsp_pm_check_init(void)
314 {
315         /*
316          * Set this bsp_pm_callback as lower priority than
317          * cpu_hotplug_pm_callback. So cpu_hotplug_pm_callback will be called
318          * earlier to disable cpu hotplug before bsp online check.
319          */
320         pm_notifier(bsp_pm_callback, -INT_MAX);
321         return 0;
322 }
323
324 core_initcall(bsp_pm_check_init);