]> git.karo-electronics.de Git - karo-tx-linux.git/blob - fs/ramfs/file-nommu.c
nommu: ramfs: pages allocated to an inode's pagecache may get wrongly discarded
[karo-tx-linux.git] / fs / ramfs / file-nommu.c
1 /* file-nommu.c: no-MMU version of ramfs
2  *
3  * Copyright (C) 2005 Red Hat, Inc. All Rights Reserved.
4  * Written by David Howells (dhowells@redhat.com)
5  *
6  * This program is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU General Public License
8  * as published by the Free Software Foundation; either version
9  * 2 of the License, or (at your option) any later version.
10  */
11
12 #include <linux/module.h>
13 #include <linux/fs.h>
14 #include <linux/mm.h>
15 #include <linux/pagemap.h>
16 #include <linux/highmem.h>
17 #include <linux/init.h>
18 #include <linux/string.h>
19 #include <linux/backing-dev.h>
20 #include <linux/ramfs.h>
21 #include <linux/quotaops.h>
22 #include <linux/pagevec.h>
23 #include <linux/mman.h>
24
25 #include <asm/uaccess.h>
26 #include "internal.h"
27
28 static int ramfs_nommu_setattr(struct dentry *, struct iattr *);
29
30 const struct address_space_operations ramfs_aops = {
31         .readpage               = simple_readpage,
32         .write_begin            = simple_write_begin,
33         .write_end              = simple_write_end,
34         .set_page_dirty         = __set_page_dirty_no_writeback,
35 };
36
37 const struct file_operations ramfs_file_operations = {
38         .mmap                   = ramfs_nommu_mmap,
39         .get_unmapped_area      = ramfs_nommu_get_unmapped_area,
40         .read                   = do_sync_read,
41         .aio_read               = generic_file_aio_read,
42         .write                  = do_sync_write,
43         .aio_write              = generic_file_aio_write,
44         .fsync                  = simple_sync_file,
45         .splice_read            = generic_file_splice_read,
46         .splice_write           = generic_file_splice_write,
47         .llseek                 = generic_file_llseek,
48 };
49
50 const struct inode_operations ramfs_file_inode_operations = {
51         .setattr                = ramfs_nommu_setattr,
52         .getattr                = simple_getattr,
53 };
54
55 /*****************************************************************************/
56 /*
57  * add a contiguous set of pages into a ramfs inode when it's truncated from
58  * size 0 on the assumption that it's going to be used for an mmap of shared
59  * memory
60  */
61 int ramfs_nommu_expand_for_mapping(struct inode *inode, size_t newsize)
62 {
63         struct pagevec lru_pvec;
64         unsigned long npages, xpages, loop, limit;
65         struct page *pages;
66         unsigned order;
67         void *data;
68         int ret;
69
70         /* make various checks */
71         order = get_order(newsize);
72         if (unlikely(order >= MAX_ORDER))
73                 goto too_big;
74
75         limit = current->signal->rlim[RLIMIT_FSIZE].rlim_cur;
76         if (limit != RLIM_INFINITY && newsize > limit)
77                 goto fsize_exceeded;
78
79         if (newsize > inode->i_sb->s_maxbytes)
80                 goto too_big;
81
82         i_size_write(inode, newsize);
83
84         /* allocate enough contiguous pages to be able to satisfy the
85          * request */
86         pages = alloc_pages(mapping_gfp_mask(inode->i_mapping), order);
87         if (!pages)
88                 return -ENOMEM;
89
90         /* split the high-order page into an array of single pages */
91         xpages = 1UL << order;
92         npages = (newsize + PAGE_SIZE - 1) >> PAGE_SHIFT;
93
94         split_page(pages, order);
95
96         /* trim off any pages we don't actually require */
97         for (loop = npages; loop < xpages; loop++)
98                 __free_page(pages + loop);
99
100         /* clear the memory we allocated */
101         newsize = PAGE_SIZE * npages;
102         data = page_address(pages);
103         memset(data, 0, newsize);
104
105         /* attach all the pages to the inode's address space */
106         pagevec_init(&lru_pvec, 0);
107         for (loop = 0; loop < npages; loop++) {
108                 struct page *page = pages + loop;
109
110                 ret = add_to_page_cache(page, inode->i_mapping, loop, GFP_KERNEL);
111                 if (ret < 0)
112                         goto add_error;
113
114                 if (!pagevec_add(&lru_pvec, page))
115                         __pagevec_lru_add(&lru_pvec);
116
117                 /* prevent the page from being discarded on memory pressure */
118                 SetPageDirty(page);
119
120                 unlock_page(page);
121         }
122
123         pagevec_lru_add(&lru_pvec);
124         return 0;
125
126  fsize_exceeded:
127         send_sig(SIGXFSZ, current, 0);
128  too_big:
129         return -EFBIG;
130
131  add_error:
132         page_cache_release(pages + loop);
133         for (loop++; loop < npages; loop++)
134                 __free_page(pages + loop);
135         return ret;
136 }
137
138 /*****************************************************************************/
139 /*
140  * check that file shrinkage doesn't leave any VMAs dangling in midair
141  */
142 static int ramfs_nommu_check_mappings(struct inode *inode,
143                                       size_t newsize, size_t size)
144 {
145         struct vm_area_struct *vma;
146         struct prio_tree_iter iter;
147
148         /* search for VMAs that fall within the dead zone */
149         vma_prio_tree_foreach(vma, &iter, &inode->i_mapping->i_mmap,
150                               newsize >> PAGE_SHIFT,
151                               (size + PAGE_SIZE - 1) >> PAGE_SHIFT
152                               ) {
153                 /* found one - only interested if it's shared out of the page
154                  * cache */
155                 if (vma->vm_flags & VM_SHARED)
156                         return -ETXTBSY; /* not quite true, but near enough */
157         }
158
159         return 0;
160 }
161
162 /*****************************************************************************/
163 /*
164  *
165  */
166 static int ramfs_nommu_resize(struct inode *inode, loff_t newsize, loff_t size)
167 {
168         int ret;
169
170         /* assume a truncate from zero size is going to be for the purposes of
171          * shared mmap */
172         if (size == 0) {
173                 if (unlikely(newsize >> 32))
174                         return -EFBIG;
175
176                 return ramfs_nommu_expand_for_mapping(inode, newsize);
177         }
178
179         /* check that a decrease in size doesn't cut off any shared mappings */
180         if (newsize < size) {
181                 ret = ramfs_nommu_check_mappings(inode, newsize, size);
182                 if (ret < 0)
183                         return ret;
184         }
185
186         ret = vmtruncate(inode, newsize);
187
188         return ret;
189 }
190
191 /*****************************************************************************/
192 /*
193  * handle a change of attributes
194  * - we're specifically interested in a change of size
195  */
196 static int ramfs_nommu_setattr(struct dentry *dentry, struct iattr *ia)
197 {
198         struct inode *inode = dentry->d_inode;
199         unsigned int old_ia_valid = ia->ia_valid;
200         int ret = 0;
201
202         /* POSIX UID/GID verification for setting inode attributes */
203         ret = inode_change_ok(inode, ia);
204         if (ret)
205                 return ret;
206
207         /* by providing our own setattr() method, we skip this quotaism */
208         if ((old_ia_valid & ATTR_UID && ia->ia_uid != inode->i_uid) ||
209             (old_ia_valid & ATTR_GID && ia->ia_gid != inode->i_gid))
210                 ret = DQUOT_TRANSFER(inode, ia) ? -EDQUOT : 0;
211
212         /* pick out size-changing events */
213         if (ia->ia_valid & ATTR_SIZE) {
214                 loff_t size = i_size_read(inode);
215                 if (ia->ia_size != size) {
216                         ret = ramfs_nommu_resize(inode, ia->ia_size, size);
217                         if (ret < 0 || ia->ia_valid == ATTR_SIZE)
218                                 goto out;
219                 } else {
220                         /* we skipped the truncate but must still update
221                          * timestamps
222                          */
223                         ia->ia_valid |= ATTR_MTIME|ATTR_CTIME;
224                 }
225         }
226
227         ret = inode_setattr(inode, ia);
228  out:
229         ia->ia_valid = old_ia_valid;
230         return ret;
231 }
232
233 /*****************************************************************************/
234 /*
235  * try to determine where a shared mapping can be made
236  * - we require that:
237  *   - the pages to be mapped must exist
238  *   - the pages be physically contiguous in sequence
239  */
240 unsigned long ramfs_nommu_get_unmapped_area(struct file *file,
241                                             unsigned long addr, unsigned long len,
242                                             unsigned long pgoff, unsigned long flags)
243 {
244         unsigned long maxpages, lpages, nr, loop, ret;
245         struct inode *inode = file->f_path.dentry->d_inode;
246         struct page **pages = NULL, **ptr, *page;
247         loff_t isize;
248
249         if (!(flags & MAP_SHARED))
250                 return addr;
251
252         /* the mapping mustn't extend beyond the EOF */
253         lpages = (len + PAGE_SIZE - 1) >> PAGE_SHIFT;
254         isize = i_size_read(inode);
255
256         ret = -EINVAL;
257         maxpages = (isize + PAGE_SIZE - 1) >> PAGE_SHIFT;
258         if (pgoff >= maxpages)
259                 goto out;
260
261         if (maxpages - pgoff < lpages)
262                 goto out;
263
264         /* gang-find the pages */
265         ret = -ENOMEM;
266         pages = kzalloc(lpages * sizeof(struct page *), GFP_KERNEL);
267         if (!pages)
268                 goto out;
269
270         nr = find_get_pages(inode->i_mapping, pgoff, lpages, pages);
271         if (nr != lpages)
272                 goto out; /* leave if some pages were missing */
273
274         /* check the pages for physical adjacency */
275         ptr = pages;
276         page = *ptr++;
277         page++;
278         for (loop = lpages; loop > 1; loop--)
279                 if (*ptr++ != page++)
280                         goto out;
281
282         /* okay - all conditions fulfilled */
283         ret = (unsigned long) page_address(pages[0]);
284
285  out:
286         if (pages) {
287                 ptr = pages;
288                 for (loop = lpages; loop > 0; loop--)
289                         put_page(*ptr++);
290                 kfree(pages);
291         }
292
293         return ret;
294 }
295
296 /*****************************************************************************/
297 /*
298  * set up a mapping for shared memory segments
299  */
300 int ramfs_nommu_mmap(struct file *file, struct vm_area_struct *vma)
301 {
302         if (!(vma->vm_flags & VM_SHARED))
303                 return -ENOSYS;
304
305         file_accessed(file);
306         vma->vm_ops = &generic_file_vm_ops;
307         return 0;
308 }