]> git.karo-electronics.de Git - karo-tx-linux.git/blob - fs/gfs2/inode.c
Merge branch 'for-gfs2' into for-next
[karo-tx-linux.git] / fs / gfs2 / inode.c
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2011 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #include <linux/slab.h>
11 #include <linux/spinlock.h>
12 #include <linux/completion.h>
13 #include <linux/buffer_head.h>
14 #include <linux/namei.h>
15 #include <linux/mm.h>
16 #include <linux/xattr.h>
17 #include <linux/posix_acl.h>
18 #include <linux/gfs2_ondisk.h>
19 #include <linux/crc32.h>
20 #include <linux/fiemap.h>
21 #include <linux/security.h>
22 #include <asm/uaccess.h>
23
24 #include "gfs2.h"
25 #include "incore.h"
26 #include "acl.h"
27 #include "bmap.h"
28 #include "dir.h"
29 #include "xattr.h"
30 #include "glock.h"
31 #include "inode.h"
32 #include "meta_io.h"
33 #include "quota.h"
34 #include "rgrp.h"
35 #include "trans.h"
36 #include "util.h"
37 #include "super.h"
38 #include "glops.h"
39
40 struct gfs2_skip_data {
41         u64 no_addr;
42         int skipped;
43         int non_block;
44 };
45
46 static int iget_test(struct inode *inode, void *opaque)
47 {
48         struct gfs2_inode *ip = GFS2_I(inode);
49         struct gfs2_skip_data *data = opaque;
50
51         if (ip->i_no_addr == data->no_addr) {
52                 if (data->non_block &&
53                     inode->i_state & (I_FREEING|I_CLEAR|I_WILL_FREE)) {
54                         data->skipped = 1;
55                         return 0;
56                 }
57                 return 1;
58         }
59         return 0;
60 }
61
62 static int iget_set(struct inode *inode, void *opaque)
63 {
64         struct gfs2_inode *ip = GFS2_I(inode);
65         struct gfs2_skip_data *data = opaque;
66
67         if (data->skipped)
68                 return -ENOENT;
69         inode->i_ino = (unsigned long)(data->no_addr);
70         ip->i_no_addr = data->no_addr;
71         return 0;
72 }
73
74 struct inode *gfs2_ilookup(struct super_block *sb, u64 no_addr, int non_block)
75 {
76         unsigned long hash = (unsigned long)no_addr;
77         struct gfs2_skip_data data;
78
79         data.no_addr = no_addr;
80         data.skipped = 0;
81         data.non_block = non_block;
82         return ilookup5(sb, hash, iget_test, &data);
83 }
84
85 static struct inode *gfs2_iget(struct super_block *sb, u64 no_addr,
86                                int non_block)
87 {
88         struct gfs2_skip_data data;
89         unsigned long hash = (unsigned long)no_addr;
90
91         data.no_addr = no_addr;
92         data.skipped = 0;
93         data.non_block = non_block;
94         return iget5_locked(sb, hash, iget_test, iget_set, &data);
95 }
96
97 /**
98  * gfs2_set_iop - Sets inode operations
99  * @inode: The inode with correct i_mode filled in
100  *
101  * GFS2 lookup code fills in vfs inode contents based on info obtained
102  * from directory entry inside gfs2_inode_lookup().
103  */
104
105 static void gfs2_set_iop(struct inode *inode)
106 {
107         struct gfs2_sbd *sdp = GFS2_SB(inode);
108         umode_t mode = inode->i_mode;
109
110         if (S_ISREG(mode)) {
111                 inode->i_op = &gfs2_file_iops;
112                 if (gfs2_localflocks(sdp))
113                         inode->i_fop = &gfs2_file_fops_nolock;
114                 else
115                         inode->i_fop = &gfs2_file_fops;
116         } else if (S_ISDIR(mode)) {
117                 inode->i_op = &gfs2_dir_iops;
118                 if (gfs2_localflocks(sdp))
119                         inode->i_fop = &gfs2_dir_fops_nolock;
120                 else
121                         inode->i_fop = &gfs2_dir_fops;
122         } else if (S_ISLNK(mode)) {
123                 inode->i_op = &gfs2_symlink_iops;
124         } else {
125                 inode->i_op = &gfs2_file_iops;
126                 init_special_inode(inode, inode->i_mode, inode->i_rdev);
127         }
128 }
129
130 /**
131  * gfs2_inode_lookup - Lookup an inode
132  * @sb: The super block
133  * @no_addr: The inode number
134  * @type: The type of the inode
135  * non_block: Can we block on inodes that are being freed?
136  *
137  * Returns: A VFS inode, or an error
138  */
139
140 struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned int type,
141                                 u64 no_addr, u64 no_formal_ino, int non_block)
142 {
143         struct inode *inode;
144         struct gfs2_inode *ip;
145         struct gfs2_glock *io_gl = NULL;
146         int error;
147
148         inode = gfs2_iget(sb, no_addr, non_block);
149         ip = GFS2_I(inode);
150
151         if (!inode)
152                 return ERR_PTR(-ENOMEM);
153
154         if (inode->i_state & I_NEW) {
155                 struct gfs2_sbd *sdp = GFS2_SB(inode);
156                 ip->i_no_formal_ino = no_formal_ino;
157
158                 error = gfs2_glock_get(sdp, no_addr, &gfs2_inode_glops, CREATE, &ip->i_gl);
159                 if (unlikely(error))
160                         goto fail;
161                 ip->i_gl->gl_object = ip;
162
163                 error = gfs2_glock_get(sdp, no_addr, &gfs2_iopen_glops, CREATE, &io_gl);
164                 if (unlikely(error))
165                         goto fail_put;
166
167                 set_bit(GIF_INVALID, &ip->i_flags);
168                 error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &ip->i_iopen_gh);
169                 if (unlikely(error))
170                         goto fail_iopen;
171
172                 ip->i_iopen_gh.gh_gl->gl_object = ip;
173                 gfs2_glock_put(io_gl);
174                 io_gl = NULL;
175
176                 if (type == DT_UNKNOWN) {
177                         /* Inode glock must be locked already */
178                         error = gfs2_inode_refresh(GFS2_I(inode));
179                         if (error)
180                                 goto fail_refresh;
181                 } else {
182                         inode->i_mode = DT2IF(type);
183                 }
184
185                 gfs2_set_iop(inode);
186                 unlock_new_inode(inode);
187         }
188
189         return inode;
190
191 fail_refresh:
192         ip->i_iopen_gh.gh_flags |= GL_NOCACHE;
193         ip->i_iopen_gh.gh_gl->gl_object = NULL;
194         gfs2_glock_dq_uninit(&ip->i_iopen_gh);
195 fail_iopen:
196         if (io_gl)
197                 gfs2_glock_put(io_gl);
198 fail_put:
199         ip->i_gl->gl_object = NULL;
200         gfs2_glock_put(ip->i_gl);
201 fail:
202         iget_failed(inode);
203         return ERR_PTR(error);
204 }
205
206 struct inode *gfs2_lookup_by_inum(struct gfs2_sbd *sdp, u64 no_addr,
207                                   u64 *no_formal_ino, unsigned int blktype)
208 {
209         struct super_block *sb = sdp->sd_vfs;
210         struct gfs2_holder i_gh;
211         struct inode *inode = NULL;
212         int error;
213
214         /* Must not read in block until block type is verified */
215         error = gfs2_glock_nq_num(sdp, no_addr, &gfs2_inode_glops,
216                                   LM_ST_EXCLUSIVE, GL_SKIP, &i_gh);
217         if (error)
218                 return ERR_PTR(error);
219
220         error = gfs2_check_blk_type(sdp, no_addr, blktype);
221         if (error)
222                 goto fail;
223
224         inode = gfs2_inode_lookup(sb, DT_UNKNOWN, no_addr, 0, 1);
225         if (IS_ERR(inode))
226                 goto fail;
227
228         /* Two extra checks for NFS only */
229         if (no_formal_ino) {
230                 error = -ESTALE;
231                 if (GFS2_I(inode)->i_no_formal_ino != *no_formal_ino)
232                         goto fail_iput;
233
234                 error = -EIO;
235                 if (GFS2_I(inode)->i_diskflags & GFS2_DIF_SYSTEM)
236                         goto fail_iput;
237
238                 error = 0;
239         }
240
241 fail:
242         gfs2_glock_dq_uninit(&i_gh);
243         return error ? ERR_PTR(error) : inode;
244 fail_iput:
245         iput(inode);
246         goto fail;
247 }
248
249
250 struct inode *gfs2_lookup_simple(struct inode *dip, const char *name)
251 {
252         struct qstr qstr;
253         struct inode *inode;
254         gfs2_str2qstr(&qstr, name);
255         inode = gfs2_lookupi(dip, &qstr, 1);
256         /* gfs2_lookupi has inconsistent callers: vfs
257          * related routines expect NULL for no entry found,
258          * gfs2_lookup_simple callers expect ENOENT
259          * and do not check for NULL.
260          */
261         if (inode == NULL)
262                 return ERR_PTR(-ENOENT);
263         else
264                 return inode;
265 }
266
267
268 /**
269  * gfs2_lookupi - Look up a filename in a directory and return its inode
270  * @d_gh: An initialized holder for the directory glock
271  * @name: The name of the inode to look for
272  * @is_root: If 1, ignore the caller's permissions
273  * @i_gh: An uninitialized holder for the new inode glock
274  *
275  * This can be called via the VFS filldir function when NFS is doing
276  * a readdirplus and the inode which its intending to stat isn't
277  * already in cache. In this case we must not take the directory glock
278  * again, since the readdir call will have already taken that lock.
279  *
280  * Returns: errno
281  */
282
283 struct inode *gfs2_lookupi(struct inode *dir, const struct qstr *name,
284                            int is_root)
285 {
286         struct super_block *sb = dir->i_sb;
287         struct gfs2_inode *dip = GFS2_I(dir);
288         struct gfs2_holder d_gh;
289         int error = 0;
290         struct inode *inode = NULL;
291         int unlock = 0;
292
293         if (!name->len || name->len > GFS2_FNAMESIZE)
294                 return ERR_PTR(-ENAMETOOLONG);
295
296         if ((name->len == 1 && memcmp(name->name, ".", 1) == 0) ||
297             (name->len == 2 && memcmp(name->name, "..", 2) == 0 &&
298              dir == sb->s_root->d_inode)) {
299                 igrab(dir);
300                 return dir;
301         }
302
303         if (gfs2_glock_is_locked_by_me(dip->i_gl) == NULL) {
304                 error = gfs2_glock_nq_init(dip->i_gl, LM_ST_SHARED, 0, &d_gh);
305                 if (error)
306                         return ERR_PTR(error);
307                 unlock = 1;
308         }
309
310         if (!is_root) {
311                 error = gfs2_permission(dir, MAY_EXEC);
312                 if (error)
313                         goto out;
314         }
315
316         inode = gfs2_dir_search(dir, name, false);
317         if (IS_ERR(inode))
318                 error = PTR_ERR(inode);
319 out:
320         if (unlock)
321                 gfs2_glock_dq_uninit(&d_gh);
322         if (error == -ENOENT)
323                 return NULL;
324         return inode ? inode : ERR_PTR(error);
325 }
326
327 /**
328  * create_ok - OK to create a new on-disk inode here?
329  * @dip:  Directory in which dinode is to be created
330  * @name:  Name of new dinode
331  * @mode:
332  *
333  * Returns: errno
334  */
335
336 static int create_ok(struct gfs2_inode *dip, const struct qstr *name,
337                      umode_t mode)
338 {
339         int error;
340
341         error = gfs2_permission(&dip->i_inode, MAY_WRITE | MAY_EXEC);
342         if (error)
343                 return error;
344
345         /*  Don't create entries in an unlinked directory  */
346         if (!dip->i_inode.i_nlink)
347                 return -ENOENT;
348
349         if (dip->i_entries == (u32)-1)
350                 return -EFBIG;
351         if (S_ISDIR(mode) && dip->i_inode.i_nlink == (u32)-1)
352                 return -EMLINK;
353
354         return 0;
355 }
356
357 static void munge_mode_uid_gid(const struct gfs2_inode *dip,
358                                struct inode *inode)
359 {
360         if (GFS2_SB(&dip->i_inode)->sd_args.ar_suiddir &&
361             (dip->i_inode.i_mode & S_ISUID) &&
362             !uid_eq(dip->i_inode.i_uid, GLOBAL_ROOT_UID)) {
363                 if (S_ISDIR(inode->i_mode))
364                         inode->i_mode |= S_ISUID;
365                 else if (!uid_eq(dip->i_inode.i_uid, current_fsuid()))
366                         inode->i_mode &= ~07111;
367                 inode->i_uid = dip->i_inode.i_uid;
368         } else
369                 inode->i_uid = current_fsuid();
370
371         if (dip->i_inode.i_mode & S_ISGID) {
372                 if (S_ISDIR(inode->i_mode))
373                         inode->i_mode |= S_ISGID;
374                 inode->i_gid = dip->i_inode.i_gid;
375         } else
376                 inode->i_gid = current_fsgid();
377 }
378
379 static int alloc_dinode(struct gfs2_inode *ip, u32 flags, unsigned *dblocks)
380 {
381         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
382         struct gfs2_alloc_parms ap = { .target = *dblocks, .aflags = flags, };
383         int error;
384
385         error = gfs2_quota_lock_check(ip);
386         if (error)
387                 goto out;
388
389         error = gfs2_inplace_reserve(ip, &ap);
390         if (error)
391                 goto out_quota;
392
393         error = gfs2_trans_begin(sdp, (*dblocks * RES_RG_BIT) + RES_STATFS + RES_QUOTA, 0);
394         if (error)
395                 goto out_ipreserv;
396
397         error = gfs2_alloc_blocks(ip, &ip->i_no_addr, dblocks, 1, &ip->i_generation);
398         ip->i_no_formal_ino = ip->i_generation;
399         ip->i_inode.i_ino = ip->i_no_addr;
400         ip->i_goal = ip->i_no_addr;
401
402         gfs2_trans_end(sdp);
403
404 out_ipreserv:
405         gfs2_inplace_release(ip);
406 out_quota:
407         gfs2_quota_unlock(ip);
408 out:
409         return error;
410 }
411
412 static void gfs2_init_dir(struct buffer_head *dibh,
413                           const struct gfs2_inode *parent)
414 {
415         struct gfs2_dinode *di = (struct gfs2_dinode *)dibh->b_data;
416         struct gfs2_dirent *dent = (struct gfs2_dirent *)(di+1);
417
418         gfs2_qstr2dirent(&gfs2_qdot, GFS2_DIRENT_SIZE(gfs2_qdot.len), dent);
419         dent->de_inum = di->di_num; /* already GFS2 endian */
420         dent->de_type = cpu_to_be16(DT_DIR);
421
422         dent = (struct gfs2_dirent *)((char*)dent + GFS2_DIRENT_SIZE(1));
423         gfs2_qstr2dirent(&gfs2_qdotdot, dibh->b_size - GFS2_DIRENT_SIZE(1) - sizeof(struct gfs2_dinode), dent);
424         gfs2_inum_out(parent, dent);
425         dent->de_type = cpu_to_be16(DT_DIR);
426         
427 }
428
429 /**
430  * gfs2_init_xattr - Initialise an xattr block for a new inode
431  * @ip: The inode in question
432  *
433  * This sets up an empty xattr block for a new inode, ready to
434  * take any ACLs, LSM xattrs, etc.
435  */
436
437 static void gfs2_init_xattr(struct gfs2_inode *ip)
438 {
439         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
440         struct buffer_head *bh;
441         struct gfs2_ea_header *ea;
442
443         bh = gfs2_meta_new(ip->i_gl, ip->i_eattr);
444         gfs2_trans_add_meta(ip->i_gl, bh);
445         gfs2_metatype_set(bh, GFS2_METATYPE_EA, GFS2_FORMAT_EA);
446         gfs2_buffer_clear_tail(bh, sizeof(struct gfs2_meta_header));
447
448         ea = GFS2_EA_BH2FIRST(bh);
449         ea->ea_rec_len = cpu_to_be32(sdp->sd_jbsize);
450         ea->ea_type = GFS2_EATYPE_UNUSED;
451         ea->ea_flags = GFS2_EAFLAG_LAST;
452
453         brelse(bh);
454 }
455
456 /**
457  * init_dinode - Fill in a new dinode structure
458  * @dip: The directory this inode is being created in
459  * @ip: The inode
460  * @symname: The symlink destination (if a symlink)
461  * @bhp: The buffer head (returned to caller)
462  *
463  */
464
465 static void init_dinode(struct gfs2_inode *dip, struct gfs2_inode *ip,
466                         const char *symname)
467 {
468         struct gfs2_dinode *di;
469         struct buffer_head *dibh;
470
471         dibh = gfs2_meta_new(ip->i_gl, ip->i_no_addr);
472         gfs2_trans_add_meta(ip->i_gl, dibh);
473         di = (struct gfs2_dinode *)dibh->b_data;
474         gfs2_dinode_out(ip, di);
475
476         di->di_major = cpu_to_be32(MAJOR(ip->i_inode.i_rdev));
477         di->di_minor = cpu_to_be32(MINOR(ip->i_inode.i_rdev));
478         di->__pad1 = 0;
479         di->__pad2 = 0;
480         di->__pad3 = 0;
481         memset(&di->__pad4, 0, sizeof(di->__pad4));
482         memset(&di->di_reserved, 0, sizeof(di->di_reserved));
483         gfs2_buffer_clear_tail(dibh, sizeof(struct gfs2_dinode));
484
485         switch(ip->i_inode.i_mode & S_IFMT) {
486         case S_IFDIR:
487                 gfs2_init_dir(dibh, dip);
488                 break;
489         case S_IFLNK:
490                 memcpy(dibh->b_data + sizeof(struct gfs2_dinode), symname, ip->i_inode.i_size);
491                 break;
492         }
493
494         set_buffer_uptodate(dibh);
495         brelse(dibh);
496 }
497
498 /**
499  * gfs2_trans_da_blocks - Calculate number of blocks to link inode
500  * @dip: The directory we are linking into
501  * @da: The dir add information
502  * @nr_inodes: The number of inodes involved
503  *
504  * This calculate the number of blocks we need to reserve in a
505  * transaction to link @nr_inodes into a directory. In most cases
506  * @nr_inodes will be 2 (the directory plus the inode being linked in)
507  * but in case of rename, 4 may be required.
508  *
509  * Returns: Number of blocks
510  */
511
512 static unsigned gfs2_trans_da_blks(const struct gfs2_inode *dip,
513                                    const struct gfs2_diradd *da,
514                                    unsigned nr_inodes)
515 {
516         return da->nr_blocks + gfs2_rg_blocks(dip, da->nr_blocks) +
517                (nr_inodes * RES_DINODE) + RES_QUOTA + RES_STATFS;
518 }
519
520 static int link_dinode(struct gfs2_inode *dip, const struct qstr *name,
521                        struct gfs2_inode *ip, struct gfs2_diradd *da)
522 {
523         struct gfs2_sbd *sdp = GFS2_SB(&dip->i_inode);
524         struct gfs2_alloc_parms ap = { .target = da->nr_blocks, };
525         int error;
526
527         if (da->nr_blocks) {
528                 error = gfs2_quota_lock_check(dip);
529                 if (error)
530                         goto fail_quota_locks;
531
532                 error = gfs2_inplace_reserve(dip, &ap);
533                 if (error)
534                         goto fail_quota_locks;
535
536                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(dip, da, 2), 0);
537                 if (error)
538                         goto fail_ipreserv;
539         } else {
540                 error = gfs2_trans_begin(sdp, RES_LEAF + 2 * RES_DINODE, 0);
541                 if (error)
542                         goto fail_quota_locks;
543         }
544
545         error = gfs2_dir_add(&dip->i_inode, name, ip, da);
546         if (error)
547                 goto fail_end_trans;
548
549 fail_end_trans:
550         gfs2_trans_end(sdp);
551 fail_ipreserv:
552         gfs2_inplace_release(dip);
553 fail_quota_locks:
554         gfs2_quota_unlock(dip);
555         return error;
556 }
557
558 static int gfs2_initxattrs(struct inode *inode, const struct xattr *xattr_array,
559                     void *fs_info)
560 {
561         const struct xattr *xattr;
562         int err = 0;
563
564         for (xattr = xattr_array; xattr->name != NULL; xattr++) {
565                 err = __gfs2_xattr_set(inode, xattr->name, xattr->value,
566                                        xattr->value_len, 0,
567                                        GFS2_EATYPE_SECURITY);
568                 if (err < 0)
569                         break;
570         }
571         return err;
572 }
573
574 /**
575  * gfs2_create_inode - Create a new inode
576  * @dir: The parent directory
577  * @dentry: The new dentry
578  * @file: If non-NULL, the file which is being opened
579  * @mode: The permissions on the new inode
580  * @dev: For device nodes, this is the device number
581  * @symname: For symlinks, this is the link destination
582  * @size: The initial size of the inode (ignored for directories)
583  *
584  * Returns: 0 on success, or error code
585  */
586
587 static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,
588                              struct file *file,
589                              umode_t mode, dev_t dev, const char *symname,
590                              unsigned int size, int excl, int *opened)
591 {
592         const struct qstr *name = &dentry->d_name;
593         struct posix_acl *default_acl, *acl;
594         struct gfs2_holder ghs[2];
595         struct inode *inode = NULL;
596         struct gfs2_inode *dip = GFS2_I(dir), *ip;
597         struct gfs2_sbd *sdp = GFS2_SB(&dip->i_inode);
598         struct gfs2_glock *io_gl;
599         int error, free_vfs_inode = 0;
600         u32 aflags = 0;
601         unsigned blocks = 1;
602         struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };
603
604         if (!name->len || name->len > GFS2_FNAMESIZE)
605                 return -ENAMETOOLONG;
606
607         error = gfs2_rs_alloc(dip);
608         if (error)
609                 return error;
610
611         error = gfs2_rindex_update(sdp);
612         if (error)
613                 return error;
614
615         error = gfs2_glock_nq_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
616         if (error)
617                 goto fail;
618
619         error = create_ok(dip, name, mode);
620         if (error)
621                 goto fail_gunlock;
622
623         inode = gfs2_dir_search(dir, &dentry->d_name, !S_ISREG(mode) || excl);
624         error = PTR_ERR(inode);
625         if (!IS_ERR(inode)) {
626                 if (S_ISDIR(inode->i_mode)) {
627                         iput(inode);
628                         inode = ERR_PTR(-EISDIR);
629                         goto fail_gunlock;
630                 }
631                 d_instantiate(dentry, inode);
632                 error = 0;
633                 if (file) {
634                         if (S_ISREG(inode->i_mode))
635                                 error = finish_open(file, dentry, gfs2_open_common, opened);
636                         else
637                                 error = finish_no_open(file, NULL);
638                 }
639                 gfs2_glock_dq_uninit(ghs);
640                 return error;
641         } else if (error != -ENOENT) {
642                 goto fail_gunlock;
643         }
644
645         error = gfs2_diradd_alloc_required(dir, name, &da);
646         if (error < 0)
647                 goto fail_gunlock;
648
649         inode = new_inode(sdp->sd_vfs);
650         error = -ENOMEM;
651         if (!inode)
652                 goto fail_gunlock;
653
654         error = posix_acl_create(dir, &mode, &default_acl, &acl);
655         if (error)
656                 goto fail_free_vfs_inode;
657
658         ip = GFS2_I(inode);
659         error = gfs2_rs_alloc(ip);
660         if (error)
661                 goto fail_free_acls;
662
663         inode->i_mode = mode;
664         set_nlink(inode, S_ISDIR(mode) ? 2 : 1);
665         inode->i_rdev = dev;
666         inode->i_size = size;
667         inode->i_atime = inode->i_mtime = inode->i_ctime = CURRENT_TIME;
668         gfs2_set_inode_blocks(inode, 1);
669         munge_mode_uid_gid(dip, inode);
670         check_and_update_goal(dip);
671         ip->i_goal = dip->i_goal;
672         ip->i_diskflags = 0;
673         ip->i_eattr = 0;
674         ip->i_height = 0;
675         ip->i_depth = 0;
676         ip->i_entries = 0;
677
678         switch(mode & S_IFMT) {
679         case S_IFREG:
680                 if ((dip->i_diskflags & GFS2_DIF_INHERIT_JDATA) ||
681                     gfs2_tune_get(sdp, gt_new_files_jdata))
682                         ip->i_diskflags |= GFS2_DIF_JDATA;
683                 gfs2_set_aops(inode);
684                 break;
685         case S_IFDIR:
686                 ip->i_diskflags |= (dip->i_diskflags & GFS2_DIF_INHERIT_JDATA);
687                 ip->i_diskflags |= GFS2_DIF_JDATA;
688                 ip->i_entries = 2;
689                 break;
690         }
691         gfs2_set_inode_flags(inode);
692
693         if ((GFS2_I(sdp->sd_root_dir->d_inode) == dip) ||
694             (dip->i_diskflags & GFS2_DIF_TOPDIR))
695                 aflags |= GFS2_AF_ORLOV;
696
697         if (default_acl || acl)
698                 blocks++;
699
700         error = alloc_dinode(ip, aflags, &blocks);
701         if (error)
702                 goto fail_free_inode;
703
704         gfs2_set_inode_blocks(inode, blocks);
705
706         error = gfs2_glock_get(sdp, ip->i_no_addr, &gfs2_inode_glops, CREATE, &ip->i_gl);
707         if (error)
708                 goto fail_free_inode;
709
710         ip->i_gl->gl_object = ip;
711         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, GL_SKIP, ghs + 1);
712         if (error)
713                 goto fail_free_inode;
714
715         error = gfs2_trans_begin(sdp, blocks, 0);
716         if (error)
717                 goto fail_gunlock2;
718
719         if (blocks > 1) {
720                 ip->i_eattr = ip->i_no_addr + 1;
721                 gfs2_init_xattr(ip);
722         }
723         init_dinode(dip, ip, symname);
724         gfs2_trans_end(sdp);
725
726         error = gfs2_glock_get(sdp, ip->i_no_addr, &gfs2_iopen_glops, CREATE, &io_gl);
727         if (error)
728                 goto fail_gunlock2;
729
730         error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &ip->i_iopen_gh);
731         if (error)
732                 goto fail_gunlock2;
733
734         ip->i_iopen_gh.gh_gl->gl_object = ip;
735         gfs2_glock_put(io_gl);
736         gfs2_set_iop(inode);
737         insert_inode_hash(inode);
738
739         if (default_acl) {
740                 error = gfs2_set_acl(inode, default_acl, ACL_TYPE_DEFAULT);
741                 posix_acl_release(default_acl);
742         }
743         if (acl) {
744                 if (!error)
745                         error = gfs2_set_acl(inode, acl, ACL_TYPE_ACCESS);
746                 posix_acl_release(acl);
747         }
748
749         if (error)
750                 goto fail_gunlock3;
751
752         error = security_inode_init_security(&ip->i_inode, &dip->i_inode, name,
753                                              &gfs2_initxattrs, NULL);
754         if (error)
755                 goto fail_gunlock3;
756
757         error = link_dinode(dip, name, ip, &da);
758         if (error)
759                 goto fail_gunlock3;
760
761         mark_inode_dirty(inode);
762         d_instantiate(dentry, inode);
763         if (file) {
764                 *opened |= FILE_CREATED;
765                 error = finish_open(file, dentry, gfs2_open_common, opened);
766         }
767         gfs2_glock_dq_uninit(ghs);
768         gfs2_glock_dq_uninit(ghs + 1);
769         return error;
770
771 fail_gunlock3:
772         gfs2_glock_dq_uninit(ghs + 1);
773         if (ip->i_gl)
774                 gfs2_glock_put(ip->i_gl);
775         goto fail_gunlock;
776
777 fail_gunlock2:
778         gfs2_glock_dq_uninit(ghs + 1);
779 fail_free_inode:
780         if (ip->i_gl)
781                 gfs2_glock_put(ip->i_gl);
782         gfs2_rs_delete(ip, NULL);
783 fail_free_acls:
784         if (default_acl)
785                 posix_acl_release(default_acl);
786         if (acl)
787                 posix_acl_release(acl);
788 fail_free_vfs_inode:
789         free_vfs_inode = 1;
790 fail_gunlock:
791         gfs2_dir_no_add(&da);
792         gfs2_glock_dq_uninit(ghs);
793         if (inode && !IS_ERR(inode)) {
794                 clear_nlink(inode);
795                 if (!free_vfs_inode)
796                         mark_inode_dirty(inode);
797                 set_bit(free_vfs_inode ? GIF_FREE_VFS_INODE : GIF_ALLOC_FAILED,
798                         &GFS2_I(inode)->i_flags);
799                 iput(inode);
800         }
801 fail:
802         return error;
803 }
804
805 /**
806  * gfs2_create - Create a file
807  * @dir: The directory in which to create the file
808  * @dentry: The dentry of the new file
809  * @mode: The mode of the new file
810  *
811  * Returns: errno
812  */
813
814 static int gfs2_create(struct inode *dir, struct dentry *dentry,
815                        umode_t mode, bool excl)
816 {
817         return gfs2_create_inode(dir, dentry, NULL, S_IFREG | mode, 0, NULL, 0, excl, NULL);
818 }
819
820 /**
821  * __gfs2_lookup - Look up a filename in a directory and return its inode
822  * @dir: The directory inode
823  * @dentry: The dentry of the new inode
824  * @file: File to be opened
825  * @opened: atomic_open flags
826  *
827  *
828  * Returns: errno
829  */
830
831 static struct dentry *__gfs2_lookup(struct inode *dir, struct dentry *dentry,
832                                     struct file *file, int *opened)
833 {
834         struct inode *inode;
835         struct dentry *d;
836         struct gfs2_holder gh;
837         struct gfs2_glock *gl;
838         int error;
839
840         inode = gfs2_lookupi(dir, &dentry->d_name, 0);
841         if (inode == NULL) {
842                 d_add(dentry, NULL);
843                 return NULL;
844         }
845         if (IS_ERR(inode))
846                 return ERR_CAST(inode);
847
848         gl = GFS2_I(inode)->i_gl;
849         error = gfs2_glock_nq_init(gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
850         if (error) {
851                 iput(inode);
852                 return ERR_PTR(error);
853         }
854
855         d = d_splice_alias(inode, dentry);
856         if (IS_ERR(d)) {
857                 gfs2_glock_dq_uninit(&gh);
858                 return d;
859         }
860         if (file && S_ISREG(inode->i_mode))
861                 error = finish_open(file, dentry, gfs2_open_common, opened);
862
863         gfs2_glock_dq_uninit(&gh);
864         if (error) {
865                 dput(d);
866                 return ERR_PTR(error);
867         }
868         return d;
869 }
870
871 static struct dentry *gfs2_lookup(struct inode *dir, struct dentry *dentry,
872                                   unsigned flags)
873 {
874         return __gfs2_lookup(dir, dentry, NULL, NULL);
875 }
876
877 /**
878  * gfs2_link - Link to a file
879  * @old_dentry: The inode to link
880  * @dir: Add link to this directory
881  * @dentry: The name of the link
882  *
883  * Link the inode in "old_dentry" into the directory "dir" with the
884  * name in "dentry".
885  *
886  * Returns: errno
887  */
888
889 static int gfs2_link(struct dentry *old_dentry, struct inode *dir,
890                      struct dentry *dentry)
891 {
892         struct gfs2_inode *dip = GFS2_I(dir);
893         struct gfs2_sbd *sdp = GFS2_SB(dir);
894         struct inode *inode = old_dentry->d_inode;
895         struct gfs2_inode *ip = GFS2_I(inode);
896         struct gfs2_holder ghs[2];
897         struct buffer_head *dibh;
898         struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };
899         int error;
900
901         if (S_ISDIR(inode->i_mode))
902                 return -EPERM;
903
904         error = gfs2_rs_alloc(dip);
905         if (error)
906                 return error;
907
908         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
909         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + 1);
910
911         error = gfs2_glock_nq(ghs); /* parent */
912         if (error)
913                 goto out_parent;
914
915         error = gfs2_glock_nq(ghs + 1); /* child */
916         if (error)
917                 goto out_child;
918
919         error = -ENOENT;
920         if (inode->i_nlink == 0)
921                 goto out_gunlock;
922
923         error = gfs2_permission(dir, MAY_WRITE | MAY_EXEC);
924         if (error)
925                 goto out_gunlock;
926
927         error = gfs2_dir_check(dir, &dentry->d_name, NULL);
928         switch (error) {
929         case -ENOENT:
930                 break;
931         case 0:
932                 error = -EEXIST;
933         default:
934                 goto out_gunlock;
935         }
936
937         error = -EINVAL;
938         if (!dip->i_inode.i_nlink)
939                 goto out_gunlock;
940         error = -EFBIG;
941         if (dip->i_entries == (u32)-1)
942                 goto out_gunlock;
943         error = -EPERM;
944         if (IS_IMMUTABLE(inode) || IS_APPEND(inode))
945                 goto out_gunlock;
946         error = -EINVAL;
947         if (!ip->i_inode.i_nlink)
948                 goto out_gunlock;
949         error = -EMLINK;
950         if (ip->i_inode.i_nlink == (u32)-1)
951                 goto out_gunlock;
952
953         error = gfs2_diradd_alloc_required(dir, &dentry->d_name, &da);
954         if (error < 0)
955                 goto out_gunlock;
956
957         if (da.nr_blocks) {
958                 struct gfs2_alloc_parms ap = { .target = da.nr_blocks, };
959                 error = gfs2_quota_lock_check(dip);
960                 if (error)
961                         goto out_gunlock;
962
963                 error = gfs2_inplace_reserve(dip, &ap);
964                 if (error)
965                         goto out_gunlock_q;
966
967                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(dip, &da, 2), 0);
968                 if (error)
969                         goto out_ipres;
970         } else {
971                 error = gfs2_trans_begin(sdp, 2 * RES_DINODE + RES_LEAF, 0);
972                 if (error)
973                         goto out_ipres;
974         }
975
976         error = gfs2_meta_inode_buffer(ip, &dibh);
977         if (error)
978                 goto out_end_trans;
979
980         error = gfs2_dir_add(dir, &dentry->d_name, ip, &da);
981         if (error)
982                 goto out_brelse;
983
984         gfs2_trans_add_meta(ip->i_gl, dibh);
985         inc_nlink(&ip->i_inode);
986         ip->i_inode.i_ctime = CURRENT_TIME;
987         ihold(inode);
988         d_instantiate(dentry, inode);
989         mark_inode_dirty(inode);
990
991 out_brelse:
992         brelse(dibh);
993 out_end_trans:
994         gfs2_trans_end(sdp);
995 out_ipres:
996         if (da.nr_blocks)
997                 gfs2_inplace_release(dip);
998 out_gunlock_q:
999         if (da.nr_blocks)
1000                 gfs2_quota_unlock(dip);
1001 out_gunlock:
1002         gfs2_dir_no_add(&da);
1003         gfs2_glock_dq(ghs + 1);
1004 out_child:
1005         gfs2_glock_dq(ghs);
1006 out_parent:
1007         gfs2_holder_uninit(ghs);
1008         gfs2_holder_uninit(ghs + 1);
1009         return error;
1010 }
1011
1012 /*
1013  * gfs2_unlink_ok - check to see that a inode is still in a directory
1014  * @dip: the directory
1015  * @name: the name of the file
1016  * @ip: the inode
1017  *
1018  * Assumes that the lock on (at least) @dip is held.
1019  *
1020  * Returns: 0 if the parent/child relationship is correct, errno if it isn't
1021  */
1022
1023 static int gfs2_unlink_ok(struct gfs2_inode *dip, const struct qstr *name,
1024                           const struct gfs2_inode *ip)
1025 {
1026         int error;
1027
1028         if (IS_IMMUTABLE(&ip->i_inode) || IS_APPEND(&ip->i_inode))
1029                 return -EPERM;
1030
1031         if ((dip->i_inode.i_mode & S_ISVTX) &&
1032             !uid_eq(dip->i_inode.i_uid, current_fsuid()) &&
1033             !uid_eq(ip->i_inode.i_uid, current_fsuid()) && !capable(CAP_FOWNER))
1034                 return -EPERM;
1035
1036         if (IS_APPEND(&dip->i_inode))
1037                 return -EPERM;
1038
1039         error = gfs2_permission(&dip->i_inode, MAY_WRITE | MAY_EXEC);
1040         if (error)
1041                 return error;
1042
1043         error = gfs2_dir_check(&dip->i_inode, name, ip);
1044         if (error)
1045                 return error;
1046
1047         return 0;
1048 }
1049
1050 /**
1051  * gfs2_unlink_inode - Removes an inode from its parent dir and unlinks it
1052  * @dip: The parent directory
1053  * @name: The name of the entry in the parent directory
1054  * @inode: The inode to be removed
1055  *
1056  * Called with all the locks and in a transaction. This will only be
1057  * called for a directory after it has been checked to ensure it is empty.
1058  *
1059  * Returns: 0 on success, or an error
1060  */
1061
1062 static int gfs2_unlink_inode(struct gfs2_inode *dip,
1063                              const struct dentry *dentry)
1064 {
1065         struct inode *inode = dentry->d_inode;
1066         struct gfs2_inode *ip = GFS2_I(inode);
1067         int error;
1068
1069         error = gfs2_dir_del(dip, dentry);
1070         if (error)
1071                 return error;
1072
1073         ip->i_entries = 0;
1074         inode->i_ctime = CURRENT_TIME;
1075         if (S_ISDIR(inode->i_mode))
1076                 clear_nlink(inode);
1077         else
1078                 drop_nlink(inode);
1079         mark_inode_dirty(inode);
1080         if (inode->i_nlink == 0)
1081                 gfs2_unlink_di(inode);
1082         return 0;
1083 }
1084
1085
1086 /**
1087  * gfs2_unlink - Unlink an inode (this does rmdir as well)
1088  * @dir: The inode of the directory containing the inode to unlink
1089  * @dentry: The file itself
1090  *
1091  * This routine uses the type of the inode as a flag to figure out
1092  * whether this is an unlink or an rmdir.
1093  *
1094  * Returns: errno
1095  */
1096
1097 static int gfs2_unlink(struct inode *dir, struct dentry *dentry)
1098 {
1099         struct gfs2_inode *dip = GFS2_I(dir);
1100         struct gfs2_sbd *sdp = GFS2_SB(dir);
1101         struct inode *inode = dentry->d_inode;
1102         struct gfs2_inode *ip = GFS2_I(inode);
1103         struct gfs2_holder ghs[3];
1104         struct gfs2_rgrpd *rgd;
1105         int error;
1106
1107         error = gfs2_rindex_update(sdp);
1108         if (error)
1109                 return error;
1110
1111         error = -EROFS;
1112
1113         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
1114         gfs2_holder_init(ip->i_gl,  LM_ST_EXCLUSIVE, 0, ghs + 1);
1115
1116         rgd = gfs2_blk2rgrpd(sdp, ip->i_no_addr, 1);
1117         if (!rgd)
1118                 goto out_inodes;
1119
1120         gfs2_holder_init(rgd->rd_gl, LM_ST_EXCLUSIVE, 0, ghs + 2);
1121
1122
1123         error = gfs2_glock_nq(ghs); /* parent */
1124         if (error)
1125                 goto out_parent;
1126
1127         error = gfs2_glock_nq(ghs + 1); /* child */
1128         if (error)
1129                 goto out_child;
1130
1131         error = -ENOENT;
1132         if (inode->i_nlink == 0)
1133                 goto out_rgrp;
1134
1135         if (S_ISDIR(inode->i_mode)) {
1136                 error = -ENOTEMPTY;
1137                 if (ip->i_entries > 2 || inode->i_nlink > 2)
1138                         goto out_rgrp;
1139         }
1140
1141         error = gfs2_glock_nq(ghs + 2); /* rgrp */
1142         if (error)
1143                 goto out_rgrp;
1144
1145         error = gfs2_unlink_ok(dip, &dentry->d_name, ip);
1146         if (error)
1147                 goto out_gunlock;
1148
1149         error = gfs2_trans_begin(sdp, 2*RES_DINODE + 3*RES_LEAF + RES_RG_BIT, 0);
1150         if (error)
1151                 goto out_end_trans;
1152
1153         error = gfs2_unlink_inode(dip, dentry);
1154
1155 out_end_trans:
1156         gfs2_trans_end(sdp);
1157 out_gunlock:
1158         gfs2_glock_dq(ghs + 2);
1159 out_rgrp:
1160         gfs2_glock_dq(ghs + 1);
1161 out_child:
1162         gfs2_glock_dq(ghs);
1163 out_parent:
1164         gfs2_holder_uninit(ghs + 2);
1165 out_inodes:
1166         gfs2_holder_uninit(ghs + 1);
1167         gfs2_holder_uninit(ghs);
1168         return error;
1169 }
1170
1171 /**
1172  * gfs2_symlink - Create a symlink
1173  * @dir: The directory to create the symlink in
1174  * @dentry: The dentry to put the symlink in
1175  * @symname: The thing which the link points to
1176  *
1177  * Returns: errno
1178  */
1179
1180 static int gfs2_symlink(struct inode *dir, struct dentry *dentry,
1181                         const char *symname)
1182 {
1183         struct gfs2_sbd *sdp = GFS2_SB(dir);
1184         unsigned int size;
1185
1186         size = strlen(symname);
1187         if (size > sdp->sd_sb.sb_bsize - sizeof(struct gfs2_dinode) - 1)
1188                 return -ENAMETOOLONG;
1189
1190         return gfs2_create_inode(dir, dentry, NULL, S_IFLNK | S_IRWXUGO, 0, symname, size, 0, NULL);
1191 }
1192
1193 /**
1194  * gfs2_mkdir - Make a directory
1195  * @dir: The parent directory of the new one
1196  * @dentry: The dentry of the new directory
1197  * @mode: The mode of the new directory
1198  *
1199  * Returns: errno
1200  */
1201
1202 static int gfs2_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
1203 {
1204         struct gfs2_sbd *sdp = GFS2_SB(dir);
1205         unsigned dsize = sdp->sd_sb.sb_bsize - sizeof(struct gfs2_dinode);
1206         return gfs2_create_inode(dir, dentry, NULL, S_IFDIR | mode, 0, NULL, dsize, 0, NULL);
1207 }
1208
1209 /**
1210  * gfs2_mknod - Make a special file
1211  * @dir: The directory in which the special file will reside
1212  * @dentry: The dentry of the special file
1213  * @mode: The mode of the special file
1214  * @dev: The device specification of the special file
1215  *
1216  */
1217
1218 static int gfs2_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
1219                       dev_t dev)
1220 {
1221         return gfs2_create_inode(dir, dentry, NULL, mode, dev, NULL, 0, 0, NULL);
1222 }
1223
1224 /**
1225  * gfs2_atomic_open - Atomically open a file
1226  * @dir: The directory
1227  * @dentry: The proposed new entry
1228  * @file: The proposed new struct file
1229  * @flags: open flags
1230  * @mode: File mode
1231  * @opened: Flag to say whether the file has been opened or not
1232  *
1233  * Returns: error code or 0 for success
1234  */
1235
1236 static int gfs2_atomic_open(struct inode *dir, struct dentry *dentry,
1237                             struct file *file, unsigned flags,
1238                             umode_t mode, int *opened)
1239 {
1240         struct dentry *d;
1241         bool excl = !!(flags & O_EXCL);
1242
1243         if (!d_unhashed(dentry))
1244                 goto skip_lookup;
1245
1246         d = __gfs2_lookup(dir, dentry, file, opened);
1247         if (IS_ERR(d))
1248                 return PTR_ERR(d);
1249         if (d != NULL)
1250                 dentry = d;
1251         if (dentry->d_inode) {
1252                 if (!(*opened & FILE_OPENED))
1253                         return finish_no_open(file, d);
1254                 dput(d);
1255                 return 0;
1256         }
1257
1258         BUG_ON(d != NULL);
1259
1260 skip_lookup:
1261         if (!(flags & O_CREAT))
1262                 return -ENOENT;
1263
1264         return gfs2_create_inode(dir, dentry, file, S_IFREG | mode, 0, NULL, 0, excl, opened);
1265 }
1266
1267 /*
1268  * gfs2_ok_to_move - check if it's ok to move a directory to another directory
1269  * @this: move this
1270  * @to: to here
1271  *
1272  * Follow @to back to the root and make sure we don't encounter @this
1273  * Assumes we already hold the rename lock.
1274  *
1275  * Returns: errno
1276  */
1277
1278 static int gfs2_ok_to_move(struct gfs2_inode *this, struct gfs2_inode *to)
1279 {
1280         struct inode *dir = &to->i_inode;
1281         struct super_block *sb = dir->i_sb;
1282         struct inode *tmp;
1283         int error = 0;
1284
1285         igrab(dir);
1286
1287         for (;;) {
1288                 if (dir == &this->i_inode) {
1289                         error = -EINVAL;
1290                         break;
1291                 }
1292                 if (dir == sb->s_root->d_inode) {
1293                         error = 0;
1294                         break;
1295                 }
1296
1297                 tmp = gfs2_lookupi(dir, &gfs2_qdotdot, 1);
1298                 if (!tmp) {
1299                         error = -ENOENT;
1300                         break;
1301                 }
1302                 if (IS_ERR(tmp)) {
1303                         error = PTR_ERR(tmp);
1304                         break;
1305                 }
1306
1307                 iput(dir);
1308                 dir = tmp;
1309         }
1310
1311         iput(dir);
1312
1313         return error;
1314 }
1315
1316 /**
1317  * gfs2_rename - Rename a file
1318  * @odir: Parent directory of old file name
1319  * @odentry: The old dentry of the file
1320  * @ndir: Parent directory of new file name
1321  * @ndentry: The new dentry of the file
1322  *
1323  * Returns: errno
1324  */
1325
1326 static int gfs2_rename(struct inode *odir, struct dentry *odentry,
1327                        struct inode *ndir, struct dentry *ndentry)
1328 {
1329         struct gfs2_inode *odip = GFS2_I(odir);
1330         struct gfs2_inode *ndip = GFS2_I(ndir);
1331         struct gfs2_inode *ip = GFS2_I(odentry->d_inode);
1332         struct gfs2_inode *nip = NULL;
1333         struct gfs2_sbd *sdp = GFS2_SB(odir);
1334         struct gfs2_holder ghs[5], r_gh = { .gh_gl = NULL, };
1335         struct gfs2_rgrpd *nrgd;
1336         unsigned int num_gh;
1337         int dir_rename = 0;
1338         struct gfs2_diradd da = { .nr_blocks = 0, .save_loc = 0, };
1339         unsigned int x;
1340         int error;
1341
1342         if (ndentry->d_inode) {
1343                 nip = GFS2_I(ndentry->d_inode);
1344                 if (ip == nip)
1345                         return 0;
1346         }
1347
1348         error = gfs2_rindex_update(sdp);
1349         if (error)
1350                 return error;
1351
1352         error = gfs2_rs_alloc(ndip);
1353         if (error)
1354                 return error;
1355
1356         if (odip != ndip) {
1357                 error = gfs2_glock_nq_init(sdp->sd_rename_gl, LM_ST_EXCLUSIVE,
1358                                            0, &r_gh);
1359                 if (error)
1360                         goto out;
1361
1362                 if (S_ISDIR(ip->i_inode.i_mode)) {
1363                         dir_rename = 1;
1364                         /* don't move a dirctory into it's subdir */
1365                         error = gfs2_ok_to_move(ip, ndip);
1366                         if (error)
1367                                 goto out_gunlock_r;
1368                 }
1369         }
1370
1371         num_gh = 1;
1372         gfs2_holder_init(odip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
1373         if (odip != ndip) {
1374                 gfs2_holder_init(ndip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
1375                 num_gh++;
1376         }
1377         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
1378         num_gh++;
1379
1380         if (nip) {
1381                 gfs2_holder_init(nip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
1382                 num_gh++;
1383                 /* grab the resource lock for unlink flag twiddling 
1384                  * this is the case of the target file already existing
1385                  * so we unlink before doing the rename
1386                  */
1387                 nrgd = gfs2_blk2rgrpd(sdp, nip->i_no_addr, 1);
1388                 if (nrgd)
1389                         gfs2_holder_init(nrgd->rd_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh++);
1390         }
1391
1392         for (x = 0; x < num_gh; x++) {
1393                 error = gfs2_glock_nq(ghs + x);
1394                 if (error)
1395                         goto out_gunlock;
1396         }
1397
1398         error = -ENOENT;
1399         if (ip->i_inode.i_nlink == 0)
1400                 goto out_gunlock;
1401
1402         /* Check out the old directory */
1403
1404         error = gfs2_unlink_ok(odip, &odentry->d_name, ip);
1405         if (error)
1406                 goto out_gunlock;
1407
1408         /* Check out the new directory */
1409
1410         if (nip) {
1411                 error = gfs2_unlink_ok(ndip, &ndentry->d_name, nip);
1412                 if (error)
1413                         goto out_gunlock;
1414
1415                 if (nip->i_inode.i_nlink == 0) {
1416                         error = -EAGAIN;
1417                         goto out_gunlock;
1418                 }
1419
1420                 if (S_ISDIR(nip->i_inode.i_mode)) {
1421                         if (nip->i_entries < 2) {
1422                                 gfs2_consist_inode(nip);
1423                                 error = -EIO;
1424                                 goto out_gunlock;
1425                         }
1426                         if (nip->i_entries > 2) {
1427                                 error = -ENOTEMPTY;
1428                                 goto out_gunlock;
1429                         }
1430                 }
1431         } else {
1432                 error = gfs2_permission(ndir, MAY_WRITE | MAY_EXEC);
1433                 if (error)
1434                         goto out_gunlock;
1435
1436                 error = gfs2_dir_check(ndir, &ndentry->d_name, NULL);
1437                 switch (error) {
1438                 case -ENOENT:
1439                         error = 0;
1440                         break;
1441                 case 0:
1442                         error = -EEXIST;
1443                 default:
1444                         goto out_gunlock;
1445                 };
1446
1447                 if (odip != ndip) {
1448                         if (!ndip->i_inode.i_nlink) {
1449                                 error = -ENOENT;
1450                                 goto out_gunlock;
1451                         }
1452                         if (ndip->i_entries == (u32)-1) {
1453                                 error = -EFBIG;
1454                                 goto out_gunlock;
1455                         }
1456                         if (S_ISDIR(ip->i_inode.i_mode) &&
1457                             ndip->i_inode.i_nlink == (u32)-1) {
1458                                 error = -EMLINK;
1459                                 goto out_gunlock;
1460                         }
1461                 }
1462         }
1463
1464         /* Check out the dir to be renamed */
1465
1466         if (dir_rename) {
1467                 error = gfs2_permission(odentry->d_inode, MAY_WRITE);
1468                 if (error)
1469                         goto out_gunlock;
1470         }
1471
1472         if (nip == NULL) {
1473                 error = gfs2_diradd_alloc_required(ndir, &ndentry->d_name, &da);
1474                 if (error)
1475                         goto out_gunlock;
1476         }
1477
1478         if (da.nr_blocks) {
1479                 struct gfs2_alloc_parms ap = { .target = da.nr_blocks, };
1480                 error = gfs2_quota_lock_check(ndip);
1481                 if (error)
1482                         goto out_gunlock;
1483
1484                 error = gfs2_inplace_reserve(ndip, &ap);
1485                 if (error)
1486                         goto out_gunlock_q;
1487
1488                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(ndip, &da, 4) +
1489                                          4 * RES_LEAF + 4, 0);
1490                 if (error)
1491                         goto out_ipreserv;
1492         } else {
1493                 error = gfs2_trans_begin(sdp, 4 * RES_DINODE +
1494                                          5 * RES_LEAF + 4, 0);
1495                 if (error)
1496                         goto out_gunlock;
1497         }
1498
1499         /* Remove the target file, if it exists */
1500
1501         if (nip)
1502                 error = gfs2_unlink_inode(ndip, ndentry);
1503
1504         if (dir_rename) {
1505                 error = gfs2_dir_mvino(ip, &gfs2_qdotdot, ndip, DT_DIR);
1506                 if (error)
1507                         goto out_end_trans;
1508         } else {
1509                 struct buffer_head *dibh;
1510                 error = gfs2_meta_inode_buffer(ip, &dibh);
1511                 if (error)
1512                         goto out_end_trans;
1513                 ip->i_inode.i_ctime = CURRENT_TIME;
1514                 gfs2_trans_add_meta(ip->i_gl, dibh);
1515                 gfs2_dinode_out(ip, dibh->b_data);
1516                 brelse(dibh);
1517         }
1518
1519         error = gfs2_dir_del(odip, odentry);
1520         if (error)
1521                 goto out_end_trans;
1522
1523         error = gfs2_dir_add(ndir, &ndentry->d_name, ip, &da);
1524         if (error)
1525                 goto out_end_trans;
1526
1527 out_end_trans:
1528         gfs2_trans_end(sdp);
1529 out_ipreserv:
1530         if (da.nr_blocks)
1531                 gfs2_inplace_release(ndip);
1532 out_gunlock_q:
1533         if (da.nr_blocks)
1534                 gfs2_quota_unlock(ndip);
1535 out_gunlock:
1536         gfs2_dir_no_add(&da);
1537         while (x--) {
1538                 gfs2_glock_dq(ghs + x);
1539                 gfs2_holder_uninit(ghs + x);
1540         }
1541 out_gunlock_r:
1542         if (r_gh.gh_gl)
1543                 gfs2_glock_dq_uninit(&r_gh);
1544 out:
1545         return error;
1546 }
1547
1548 /**
1549  * gfs2_follow_link - Follow a symbolic link
1550  * @dentry: The dentry of the link
1551  * @nd: Data that we pass to vfs_follow_link()
1552  *
1553  * This can handle symlinks of any size.
1554  *
1555  * Returns: 0 on success or error code
1556  */
1557
1558 static void *gfs2_follow_link(struct dentry *dentry, struct nameidata *nd)
1559 {
1560         struct gfs2_inode *ip = GFS2_I(dentry->d_inode);
1561         struct gfs2_holder i_gh;
1562         struct buffer_head *dibh;
1563         unsigned int size;
1564         char *buf;
1565         int error;
1566
1567         gfs2_holder_init(ip->i_gl, LM_ST_SHARED, 0, &i_gh);
1568         error = gfs2_glock_nq(&i_gh);
1569         if (error) {
1570                 gfs2_holder_uninit(&i_gh);
1571                 nd_set_link(nd, ERR_PTR(error));
1572                 return NULL;
1573         }
1574
1575         size = (unsigned int)i_size_read(&ip->i_inode);
1576         if (size == 0) {
1577                 gfs2_consist_inode(ip);
1578                 buf = ERR_PTR(-EIO);
1579                 goto out;
1580         }
1581
1582         error = gfs2_meta_inode_buffer(ip, &dibh);
1583         if (error) {
1584                 buf = ERR_PTR(error);
1585                 goto out;
1586         }
1587
1588         buf = kzalloc(size + 1, GFP_NOFS);
1589         if (!buf)
1590                 buf = ERR_PTR(-ENOMEM);
1591         else
1592                 memcpy(buf, dibh->b_data + sizeof(struct gfs2_dinode), size);
1593         brelse(dibh);
1594 out:
1595         gfs2_glock_dq_uninit(&i_gh);
1596         nd_set_link(nd, buf);
1597         return NULL;
1598 }
1599
1600 /**
1601  * gfs2_permission -
1602  * @inode: The inode
1603  * @mask: The mask to be tested
1604  * @flags: Indicates whether this is an RCU path walk or not
1605  *
1606  * This may be called from the VFS directly, or from within GFS2 with the
1607  * inode locked, so we look to see if the glock is already locked and only
1608  * lock the glock if its not already been done.
1609  *
1610  * Returns: errno
1611  */
1612
1613 int gfs2_permission(struct inode *inode, int mask)
1614 {
1615         struct gfs2_inode *ip;
1616         struct gfs2_holder i_gh;
1617         struct gfs2_sbd *sdp = GFS2_SB(inode);
1618         int error;
1619         int unlock = 0;
1620         int frozen_root = 0;
1621
1622
1623         ip = GFS2_I(inode);
1624         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
1625                 if (unlikely(gfs2_glock_is_held_excl(sdp->sd_freeze_gl) &&
1626                              inode == sdp->sd_root_dir->d_inode &&
1627                              atomic_inc_not_zero(&sdp->sd_frozen_root)))
1628                         frozen_root = 1;
1629                 else {
1630                         if (mask & MAY_NOT_BLOCK)
1631                                 return -ECHILD;
1632                         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &i_gh);
1633                         if (error)
1634                                 return error;
1635                         unlock = 1;
1636                 }
1637         }
1638
1639         if ((mask & MAY_WRITE) && IS_IMMUTABLE(inode))
1640                 error = -EACCES;
1641         else
1642                 error = generic_permission(inode, mask);
1643         if (unlock)
1644                 gfs2_glock_dq_uninit(&i_gh);
1645         else if (frozen_root && atomic_dec_and_test(&sdp->sd_frozen_root))
1646                 wake_up(&sdp->sd_frozen_root_wait);
1647
1648         return error;
1649 }
1650
1651 static int __gfs2_setattr_simple(struct inode *inode, struct iattr *attr)
1652 {
1653         setattr_copy(inode, attr);
1654         mark_inode_dirty(inode);
1655         return 0;
1656 }
1657
1658 /**
1659  * gfs2_setattr_simple -
1660  * @ip:
1661  * @attr:
1662  *
1663  * Returns: errno
1664  */
1665
1666 int gfs2_setattr_simple(struct inode *inode, struct iattr *attr)
1667 {
1668         int error;
1669
1670         if (current->journal_info)
1671                 return __gfs2_setattr_simple(inode, attr);
1672
1673         error = gfs2_trans_begin(GFS2_SB(inode), RES_DINODE, 0);
1674         if (error)
1675                 return error;
1676
1677         error = __gfs2_setattr_simple(inode, attr);
1678         gfs2_trans_end(GFS2_SB(inode));
1679         return error;
1680 }
1681
1682 static int setattr_chown(struct inode *inode, struct iattr *attr)
1683 {
1684         struct gfs2_inode *ip = GFS2_I(inode);
1685         struct gfs2_sbd *sdp = GFS2_SB(inode);
1686         kuid_t ouid, nuid;
1687         kgid_t ogid, ngid;
1688         int error;
1689
1690         ouid = inode->i_uid;
1691         ogid = inode->i_gid;
1692         nuid = attr->ia_uid;
1693         ngid = attr->ia_gid;
1694
1695         if (!(attr->ia_valid & ATTR_UID) || uid_eq(ouid, nuid))
1696                 ouid = nuid = NO_UID_QUOTA_CHANGE;
1697         if (!(attr->ia_valid & ATTR_GID) || gid_eq(ogid, ngid))
1698                 ogid = ngid = NO_GID_QUOTA_CHANGE;
1699
1700         error = get_write_access(inode);
1701         if (error)
1702                 return error;
1703
1704         error = gfs2_rs_alloc(ip);
1705         if (error)
1706                 goto out;
1707
1708         error = gfs2_rindex_update(sdp);
1709         if (error)
1710                 goto out;
1711
1712         error = gfs2_quota_lock(ip, nuid, ngid);
1713         if (error)
1714                 goto out;
1715
1716         if (!uid_eq(ouid, NO_UID_QUOTA_CHANGE) ||
1717             !gid_eq(ogid, NO_GID_QUOTA_CHANGE)) {
1718                 error = gfs2_quota_check(ip, nuid, ngid);
1719                 if (error)
1720                         goto out_gunlock_q;
1721         }
1722
1723         error = gfs2_trans_begin(sdp, RES_DINODE + 2 * RES_QUOTA, 0);
1724         if (error)
1725                 goto out_gunlock_q;
1726
1727         error = gfs2_setattr_simple(inode, attr);
1728         if (error)
1729                 goto out_end_trans;
1730
1731         if (!uid_eq(ouid, NO_UID_QUOTA_CHANGE) ||
1732             !gid_eq(ogid, NO_GID_QUOTA_CHANGE)) {
1733                 u64 blocks = gfs2_get_inode_blocks(&ip->i_inode);
1734                 gfs2_quota_change(ip, -blocks, ouid, ogid);
1735                 gfs2_quota_change(ip, blocks, nuid, ngid);
1736         }
1737
1738 out_end_trans:
1739         gfs2_trans_end(sdp);
1740 out_gunlock_q:
1741         gfs2_quota_unlock(ip);
1742 out:
1743         put_write_access(inode);
1744         return error;
1745 }
1746
1747 /**
1748  * gfs2_setattr - Change attributes on an inode
1749  * @dentry: The dentry which is changing
1750  * @attr: The structure describing the change
1751  *
1752  * The VFS layer wants to change one or more of an inodes attributes.  Write
1753  * that change out to disk.
1754  *
1755  * Returns: errno
1756  */
1757
1758 static int gfs2_setattr(struct dentry *dentry, struct iattr *attr)
1759 {
1760         struct inode *inode = dentry->d_inode;
1761         struct gfs2_inode *ip = GFS2_I(inode);
1762         struct gfs2_holder i_gh;
1763         int error;
1764
1765         error = gfs2_rs_alloc(ip);
1766         if (error)
1767                 return error;
1768
1769         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &i_gh);
1770         if (error)
1771                 return error;
1772
1773         error = -EPERM;
1774         if (IS_IMMUTABLE(inode) || IS_APPEND(inode))
1775                 goto out;
1776
1777         error = inode_change_ok(inode, attr);
1778         if (error)
1779                 goto out;
1780
1781         if (attr->ia_valid & ATTR_SIZE)
1782                 error = gfs2_setattr_size(inode, attr->ia_size);
1783         else if (attr->ia_valid & (ATTR_UID | ATTR_GID))
1784                 error = setattr_chown(inode, attr);
1785         else {
1786                 error = gfs2_setattr_simple(inode, attr);
1787                 if (!error && attr->ia_valid & ATTR_MODE)
1788                         error = posix_acl_chmod(inode, inode->i_mode);
1789         }
1790
1791 out:
1792         if (!error)
1793                 mark_inode_dirty(inode);
1794         gfs2_glock_dq_uninit(&i_gh);
1795         return error;
1796 }
1797
1798 /**
1799  * gfs2_getattr - Read out an inode's attributes
1800  * @mnt: The vfsmount the inode is being accessed from
1801  * @dentry: The dentry to stat
1802  * @stat: The inode's stats
1803  *
1804  * This may be called from the VFS directly, or from within GFS2 with the
1805  * inode locked, so we look to see if the glock is already locked and only
1806  * lock the glock if its not already been done. Note that its the NFS
1807  * readdirplus operation which causes this to be called (from filldir)
1808  * with the glock already held.
1809  *
1810  * Returns: errno
1811  */
1812
1813 static int gfs2_getattr(struct vfsmount *mnt, struct dentry *dentry,
1814                         struct kstat *stat)
1815 {
1816         struct inode *inode = dentry->d_inode;
1817         struct gfs2_inode *ip = GFS2_I(inode);
1818         struct gfs2_holder gh;
1819         struct gfs2_sbd *sdp = GFS2_SB(inode);
1820         int error;
1821         int unlock = 0;
1822         int frozen_root = 0;
1823
1824         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
1825                 if (unlikely(gfs2_glock_is_held_excl(sdp->sd_freeze_gl) &&
1826                              inode == sdp->sd_root_dir->d_inode &&
1827                              atomic_inc_not_zero(&sdp->sd_frozen_root)))
1828                         frozen_root = 1;
1829                 else {
1830                         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
1831                         if (error)
1832                                 return error;
1833                         unlock = 1;
1834                 }
1835         }
1836
1837         generic_fillattr(inode, stat);
1838         if (unlock)
1839                 gfs2_glock_dq_uninit(&gh);
1840         else if (frozen_root && atomic_dec_and_test(&sdp->sd_frozen_root))
1841                 wake_up(&sdp->sd_frozen_root_wait);
1842
1843         return 0;
1844 }
1845
1846 static int gfs2_setxattr(struct dentry *dentry, const char *name,
1847                          const void *data, size_t size, int flags)
1848 {
1849         struct inode *inode = dentry->d_inode;
1850         struct gfs2_inode *ip = GFS2_I(inode);
1851         struct gfs2_holder gh;
1852         int ret;
1853
1854         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
1855         ret = gfs2_glock_nq(&gh);
1856         if (ret == 0) {
1857                 ret = gfs2_rs_alloc(ip);
1858                 if (ret == 0)
1859                         ret = generic_setxattr(dentry, name, data, size, flags);
1860                 gfs2_glock_dq(&gh);
1861         }
1862         gfs2_holder_uninit(&gh);
1863         return ret;
1864 }
1865
1866 static ssize_t gfs2_getxattr(struct dentry *dentry, const char *name,
1867                              void *data, size_t size)
1868 {
1869         struct inode *inode = dentry->d_inode;
1870         struct gfs2_inode *ip = GFS2_I(inode);
1871         struct gfs2_holder gh;
1872         int ret;
1873
1874         /* For selinux during lookup */
1875         if (gfs2_glock_is_locked_by_me(ip->i_gl))
1876                 return generic_getxattr(dentry, name, data, size);
1877
1878         gfs2_holder_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
1879         ret = gfs2_glock_nq(&gh);
1880         if (ret == 0) {
1881                 ret = generic_getxattr(dentry, name, data, size);
1882                 gfs2_glock_dq(&gh);
1883         }
1884         gfs2_holder_uninit(&gh);
1885         return ret;
1886 }
1887
1888 static int gfs2_removexattr(struct dentry *dentry, const char *name)
1889 {
1890         struct inode *inode = dentry->d_inode;
1891         struct gfs2_inode *ip = GFS2_I(inode);
1892         struct gfs2_holder gh;
1893         int ret;
1894
1895         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
1896         ret = gfs2_glock_nq(&gh);
1897         if (ret == 0) {
1898                 ret = gfs2_rs_alloc(ip);
1899                 if (ret == 0)
1900                         ret = generic_removexattr(dentry, name);
1901                 gfs2_glock_dq(&gh);
1902         }
1903         gfs2_holder_uninit(&gh);
1904         return ret;
1905 }
1906
1907 static int gfs2_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,
1908                        u64 start, u64 len)
1909 {
1910         struct gfs2_inode *ip = GFS2_I(inode);
1911         struct gfs2_holder gh;
1912         int ret;
1913
1914         ret = fiemap_check_flags(fieinfo, FIEMAP_FLAG_SYNC);
1915         if (ret)
1916                 return ret;
1917
1918         mutex_lock(&inode->i_mutex);
1919
1920         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, 0, &gh);
1921         if (ret)
1922                 goto out;
1923
1924         if (gfs2_is_stuffed(ip)) {
1925                 u64 phys = ip->i_no_addr << inode->i_blkbits;
1926                 u64 size = i_size_read(inode);
1927                 u32 flags = FIEMAP_EXTENT_LAST|FIEMAP_EXTENT_NOT_ALIGNED|
1928                             FIEMAP_EXTENT_DATA_INLINE;
1929                 phys += sizeof(struct gfs2_dinode);
1930                 phys += start;
1931                 if (start + len > size)
1932                         len = size - start;
1933                 if (start < size)
1934                         ret = fiemap_fill_next_extent(fieinfo, start, phys,
1935                                                       len, flags);
1936                 if (ret == 1)
1937                         ret = 0;
1938         } else {
1939                 ret = __generic_block_fiemap(inode, fieinfo, start, len,
1940                                              gfs2_block_map);
1941         }
1942
1943         gfs2_glock_dq_uninit(&gh);
1944 out:
1945         mutex_unlock(&inode->i_mutex);
1946         return ret;
1947 }
1948
1949 const struct inode_operations gfs2_file_iops = {
1950         .permission = gfs2_permission,
1951         .setattr = gfs2_setattr,
1952         .getattr = gfs2_getattr,
1953         .setxattr = gfs2_setxattr,
1954         .getxattr = gfs2_getxattr,
1955         .listxattr = gfs2_listxattr,
1956         .removexattr = gfs2_removexattr,
1957         .fiemap = gfs2_fiemap,
1958         .get_acl = gfs2_get_acl,
1959         .set_acl = gfs2_set_acl,
1960 };
1961
1962 const struct inode_operations gfs2_dir_iops = {
1963         .create = gfs2_create,
1964         .lookup = gfs2_lookup,
1965         .link = gfs2_link,
1966         .unlink = gfs2_unlink,
1967         .symlink = gfs2_symlink,
1968         .mkdir = gfs2_mkdir,
1969         .rmdir = gfs2_unlink,
1970         .mknod = gfs2_mknod,
1971         .rename = gfs2_rename,
1972         .permission = gfs2_permission,
1973         .setattr = gfs2_setattr,
1974         .getattr = gfs2_getattr,
1975         .setxattr = gfs2_setxattr,
1976         .getxattr = gfs2_getxattr,
1977         .listxattr = gfs2_listxattr,
1978         .removexattr = gfs2_removexattr,
1979         .fiemap = gfs2_fiemap,
1980         .get_acl = gfs2_get_acl,
1981         .set_acl = gfs2_set_acl,
1982         .atomic_open = gfs2_atomic_open,
1983 };
1984
1985 const struct inode_operations gfs2_symlink_iops = {
1986         .readlink = generic_readlink,
1987         .follow_link = gfs2_follow_link,
1988         .put_link = kfree_put_link,
1989         .permission = gfs2_permission,
1990         .setattr = gfs2_setattr,
1991         .getattr = gfs2_getattr,
1992         .setxattr = gfs2_setxattr,
1993         .getxattr = gfs2_getxattr,
1994         .listxattr = gfs2_listxattr,
1995         .removexattr = gfs2_removexattr,
1996         .fiemap = gfs2_fiemap,
1997 };
1998