]> git.karo-electronics.de Git - karo-tx-linux.git/blob - lib/raid6/algos.c
lib/raid6: Add AVX512 optimized gen_syndrome functions
[karo-tx-linux.git] / lib / raid6 / algos.c
1 /* -*- linux-c -*- ------------------------------------------------------- *
2  *
3  *   Copyright 2002 H. Peter Anvin - All Rights Reserved
4  *
5  *   This program is free software; you can redistribute it and/or modify
6  *   it under the terms of the GNU General Public License as published by
7  *   the Free Software Foundation, Inc., 53 Temple Place Ste 330,
8  *   Boston MA 02111-1307, USA; either version 2 of the License, or
9  *   (at your option) any later version; incorporated herein by reference.
10  *
11  * ----------------------------------------------------------------------- */
12
13 /*
14  * raid6/algos.c
15  *
16  * Algorithm list and algorithm selection for RAID-6
17  */
18
19 #include <linux/raid/pq.h>
20 #ifndef __KERNEL__
21 #include <sys/mman.h>
22 #include <stdio.h>
23 #else
24 #include <linux/module.h>
25 #include <linux/gfp.h>
26 #if !RAID6_USE_EMPTY_ZERO_PAGE
27 /* In .bss so it's zeroed */
28 const char raid6_empty_zero_page[PAGE_SIZE] __attribute__((aligned(256)));
29 EXPORT_SYMBOL(raid6_empty_zero_page);
30 #endif
31 #endif
32
33 struct raid6_calls raid6_call;
34 EXPORT_SYMBOL_GPL(raid6_call);
35
36 const struct raid6_calls * const raid6_algos[] = {
37 #if defined(__ia64__)
38         &raid6_intx16,
39         &raid6_intx32,
40 #endif
41 #if defined(__i386__) && !defined(__arch_um__)
42         &raid6_mmxx1,
43         &raid6_mmxx2,
44         &raid6_sse1x1,
45         &raid6_sse1x2,
46         &raid6_sse2x1,
47         &raid6_sse2x2,
48 #ifdef CONFIG_AS_AVX2
49         &raid6_avx2x1,
50         &raid6_avx2x2,
51 #endif
52 #ifdef CONFIG_AS_AVX512
53         &raid6_avx512x1,
54         &raid6_avx512x2,
55 #endif
56 #endif
57 #if defined(__x86_64__) && !defined(__arch_um__)
58         &raid6_sse2x1,
59         &raid6_sse2x2,
60         &raid6_sse2x4,
61 #ifdef CONFIG_AS_AVX2
62         &raid6_avx2x1,
63         &raid6_avx2x2,
64         &raid6_avx2x4,
65 #endif
66 #ifdef CONFIG_AS_AVX512
67         &raid6_avx512x1,
68         &raid6_avx512x2,
69         &raid6_avx512x4,
70 #endif
71 #endif
72 #ifdef CONFIG_ALTIVEC
73         &raid6_altivec1,
74         &raid6_altivec2,
75         &raid6_altivec4,
76         &raid6_altivec8,
77 #endif
78 #if defined(CONFIG_TILEGX)
79         &raid6_tilegx8,
80 #endif
81         &raid6_intx1,
82         &raid6_intx2,
83         &raid6_intx4,
84         &raid6_intx8,
85 #ifdef CONFIG_KERNEL_MODE_NEON
86         &raid6_neonx1,
87         &raid6_neonx2,
88         &raid6_neonx4,
89         &raid6_neonx8,
90 #endif
91         NULL
92 };
93
94 void (*raid6_2data_recov)(int, size_t, int, int, void **);
95 EXPORT_SYMBOL_GPL(raid6_2data_recov);
96
97 void (*raid6_datap_recov)(int, size_t, int, void **);
98 EXPORT_SYMBOL_GPL(raid6_datap_recov);
99
100 const struct raid6_recov_calls *const raid6_recov_algos[] = {
101 #ifdef CONFIG_AS_AVX2
102         &raid6_recov_avx2,
103 #endif
104 #ifdef CONFIG_AS_SSSE3
105         &raid6_recov_ssse3,
106 #endif
107         &raid6_recov_intx1,
108         NULL
109 };
110
111 #ifdef __KERNEL__
112 #define RAID6_TIME_JIFFIES_LG2  4
113 #else
114 /* Need more time to be stable in userspace */
115 #define RAID6_TIME_JIFFIES_LG2  9
116 #define time_before(x, y) ((x) < (y))
117 #endif
118
119 static inline const struct raid6_recov_calls *raid6_choose_recov(void)
120 {
121         const struct raid6_recov_calls *const *algo;
122         const struct raid6_recov_calls *best;
123
124         for (best = NULL, algo = raid6_recov_algos; *algo; algo++)
125                 if (!best || (*algo)->priority > best->priority)
126                         if (!(*algo)->valid || (*algo)->valid())
127                                 best = *algo;
128
129         if (best) {
130                 raid6_2data_recov = best->data2;
131                 raid6_datap_recov = best->datap;
132
133                 pr_info("raid6: using %s recovery algorithm\n", best->name);
134         } else
135                 pr_err("raid6: Yikes! No recovery algorithm found!\n");
136
137         return best;
138 }
139
140 static inline const struct raid6_calls *raid6_choose_gen(
141         void *(*const dptrs)[(65536/PAGE_SIZE)+2], const int disks)
142 {
143         unsigned long perf, bestgenperf, bestxorperf, j0, j1;
144         int start = (disks>>1)-1, stop = disks-3;       /* work on the second half of the disks */
145         const struct raid6_calls *const *algo;
146         const struct raid6_calls *best;
147
148         for (bestgenperf = 0, bestxorperf = 0, best = NULL, algo = raid6_algos; *algo; algo++) {
149                 if (!best || (*algo)->prefer >= best->prefer) {
150                         if ((*algo)->valid && !(*algo)->valid())
151                                 continue;
152
153                         perf = 0;
154
155                         preempt_disable();
156                         j0 = jiffies;
157                         while ((j1 = jiffies) == j0)
158                                 cpu_relax();
159                         while (time_before(jiffies,
160                                             j1 + (1<<RAID6_TIME_JIFFIES_LG2))) {
161                                 (*algo)->gen_syndrome(disks, PAGE_SIZE, *dptrs);
162                                 perf++;
163                         }
164                         preempt_enable();
165
166                         if (perf > bestgenperf) {
167                                 bestgenperf = perf;
168                                 best = *algo;
169                         }
170                         pr_info("raid6: %-8s gen() %5ld MB/s\n", (*algo)->name,
171                                (perf*HZ) >> (20-16+RAID6_TIME_JIFFIES_LG2));
172
173                         if (!(*algo)->xor_syndrome)
174                                 continue;
175
176                         perf = 0;
177
178                         preempt_disable();
179                         j0 = jiffies;
180                         while ((j1 = jiffies) == j0)
181                                 cpu_relax();
182                         while (time_before(jiffies,
183                                             j1 + (1<<RAID6_TIME_JIFFIES_LG2))) {
184                                 (*algo)->xor_syndrome(disks, start, stop,
185                                                       PAGE_SIZE, *dptrs);
186                                 perf++;
187                         }
188                         preempt_enable();
189
190                         if (best == *algo)
191                                 bestxorperf = perf;
192
193                         pr_info("raid6: %-8s xor() %5ld MB/s\n", (*algo)->name,
194                                 (perf*HZ) >> (20-16+RAID6_TIME_JIFFIES_LG2+1));
195                 }
196         }
197
198         if (best) {
199                 pr_info("raid6: using algorithm %s gen() %ld MB/s\n",
200                        best->name,
201                        (bestgenperf*HZ) >> (20-16+RAID6_TIME_JIFFIES_LG2));
202                 if (best->xor_syndrome)
203                         pr_info("raid6: .... xor() %ld MB/s, rmw enabled\n",
204                                (bestxorperf*HZ) >> (20-16+RAID6_TIME_JIFFIES_LG2+1));
205                 raid6_call = *best;
206         } else
207                 pr_err("raid6: Yikes!  No algorithm found!\n");
208
209         return best;
210 }
211
212
213 /* Try to pick the best algorithm */
214 /* This code uses the gfmul table as convenient data set to abuse */
215
216 int __init raid6_select_algo(void)
217 {
218         const int disks = (65536/PAGE_SIZE)+2;
219
220         const struct raid6_calls *gen_best;
221         const struct raid6_recov_calls *rec_best;
222         char *syndromes;
223         void *dptrs[(65536/PAGE_SIZE)+2];
224         int i;
225
226         for (i = 0; i < disks-2; i++)
227                 dptrs[i] = ((char *)raid6_gfmul) + PAGE_SIZE*i;
228
229         /* Normal code - use a 2-page allocation to avoid D$ conflict */
230         syndromes = (void *) __get_free_pages(GFP_KERNEL, 1);
231
232         if (!syndromes) {
233                 pr_err("raid6: Yikes!  No memory available.\n");
234                 return -ENOMEM;
235         }
236
237         dptrs[disks-2] = syndromes;
238         dptrs[disks-1] = syndromes + PAGE_SIZE;
239
240         /* select raid gen_syndrome function */
241         gen_best = raid6_choose_gen(&dptrs, disks);
242
243         /* select raid recover functions */
244         rec_best = raid6_choose_recov();
245
246         free_pages((unsigned long)syndromes, 1);
247
248         return gen_best && rec_best ? 0 : -EINVAL;
249 }
250
251 static void raid6_exit(void)
252 {
253         do { } while (0);
254 }
255
256 subsys_initcall(raid6_select_algo);
257 module_exit(raid6_exit);
258 MODULE_LICENSE("GPL");
259 MODULE_DESCRIPTION("RAID6 Q-syndrome calculations");