]> git.karo-electronics.de Git - karo-tx-linux.git/blob - fs/read_write.c
System call wrapper special cases
[karo-tx-linux.git] / fs / read_write.c
1 /*
2  *  linux/fs/read_write.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  */
6
7 #include <linux/slab.h> 
8 #include <linux/stat.h>
9 #include <linux/fcntl.h>
10 #include <linux/file.h>
11 #include <linux/uio.h>
12 #include <linux/smp_lock.h>
13 #include <linux/fsnotify.h>
14 #include <linux/security.h>
15 #include <linux/module.h>
16 #include <linux/syscalls.h>
17 #include <linux/pagemap.h>
18 #include <linux/splice.h>
19 #include "read_write.h"
20
21 #include <asm/uaccess.h>
22 #include <asm/unistd.h>
23
24 const struct file_operations generic_ro_fops = {
25         .llseek         = generic_file_llseek,
26         .read           = do_sync_read,
27         .aio_read       = generic_file_aio_read,
28         .mmap           = generic_file_readonly_mmap,
29         .splice_read    = generic_file_splice_read,
30 };
31
32 EXPORT_SYMBOL(generic_ro_fops);
33
34 loff_t
35 generic_file_llseek_unlocked(struct file *file, loff_t offset, int origin)
36 {
37         loff_t retval;
38         struct inode *inode = file->f_mapping->host;
39
40         switch (origin) {
41                 case SEEK_END:
42                         offset += inode->i_size;
43                         break;
44                 case SEEK_CUR:
45                         offset += file->f_pos;
46         }
47         retval = -EINVAL;
48         if (offset>=0 && offset<=inode->i_sb->s_maxbytes) {
49                 /* Special lock needed here? */
50                 if (offset != file->f_pos) {
51                         file->f_pos = offset;
52                         file->f_version = 0;
53                 }
54                 retval = offset;
55         }
56         return retval;
57 }
58 EXPORT_SYMBOL(generic_file_llseek_unlocked);
59
60 loff_t generic_file_llseek(struct file *file, loff_t offset, int origin)
61 {
62         loff_t n;
63         mutex_lock(&file->f_dentry->d_inode->i_mutex);
64         n = generic_file_llseek_unlocked(file, offset, origin);
65         mutex_unlock(&file->f_dentry->d_inode->i_mutex);
66         return n;
67 }
68 EXPORT_SYMBOL(generic_file_llseek);
69
70 loff_t no_llseek(struct file *file, loff_t offset, int origin)
71 {
72         return -ESPIPE;
73 }
74 EXPORT_SYMBOL(no_llseek);
75
76 loff_t default_llseek(struct file *file, loff_t offset, int origin)
77 {
78         loff_t retval;
79
80         lock_kernel();
81         switch (origin) {
82                 case SEEK_END:
83                         offset += i_size_read(file->f_path.dentry->d_inode);
84                         break;
85                 case SEEK_CUR:
86                         offset += file->f_pos;
87         }
88         retval = -EINVAL;
89         if (offset >= 0) {
90                 if (offset != file->f_pos) {
91                         file->f_pos = offset;
92                         file->f_version = 0;
93                 }
94                 retval = offset;
95         }
96         unlock_kernel();
97         return retval;
98 }
99 EXPORT_SYMBOL(default_llseek);
100
101 loff_t vfs_llseek(struct file *file, loff_t offset, int origin)
102 {
103         loff_t (*fn)(struct file *, loff_t, int);
104
105         fn = no_llseek;
106         if (file->f_mode & FMODE_LSEEK) {
107                 fn = default_llseek;
108                 if (file->f_op && file->f_op->llseek)
109                         fn = file->f_op->llseek;
110         }
111         return fn(file, offset, origin);
112 }
113 EXPORT_SYMBOL(vfs_llseek);
114
115 asmlinkage long sys_lseek(unsigned int fd, off_t offset, unsigned int origin)
116 {
117         off_t retval;
118         struct file * file;
119         int fput_needed;
120
121         retval = -EBADF;
122         file = fget_light(fd, &fput_needed);
123         if (!file)
124                 goto bad;
125
126         retval = -EINVAL;
127         if (origin <= SEEK_MAX) {
128                 loff_t res = vfs_llseek(file, offset, origin);
129                 retval = res;
130                 if (res != (loff_t)retval)
131                         retval = -EOVERFLOW;    /* LFS: should only happen on 32 bit platforms */
132         }
133         fput_light(file, fput_needed);
134 bad:
135         return retval;
136 }
137
138 #ifdef __ARCH_WANT_SYS_LLSEEK
139 asmlinkage long sys_llseek(unsigned int fd, unsigned long offset_high,
140                            unsigned long offset_low, loff_t __user * result,
141                            unsigned int origin)
142 {
143         int retval;
144         struct file * file;
145         loff_t offset;
146         int fput_needed;
147
148         retval = -EBADF;
149         file = fget_light(fd, &fput_needed);
150         if (!file)
151                 goto bad;
152
153         retval = -EINVAL;
154         if (origin > SEEK_MAX)
155                 goto out_putf;
156
157         offset = vfs_llseek(file, ((loff_t) offset_high << 32) | offset_low,
158                         origin);
159
160         retval = (int)offset;
161         if (offset >= 0) {
162                 retval = -EFAULT;
163                 if (!copy_to_user(result, &offset, sizeof(offset)))
164                         retval = 0;
165         }
166 out_putf:
167         fput_light(file, fput_needed);
168 bad:
169         return retval;
170 }
171 #endif
172
173 /*
174  * rw_verify_area doesn't like huge counts. We limit
175  * them to something that fits in "int" so that others
176  * won't have to do range checks all the time.
177  */
178 #define MAX_RW_COUNT (INT_MAX & PAGE_CACHE_MASK)
179
180 int rw_verify_area(int read_write, struct file *file, loff_t *ppos, size_t count)
181 {
182         struct inode *inode;
183         loff_t pos;
184         int retval = -EINVAL;
185
186         inode = file->f_path.dentry->d_inode;
187         if (unlikely((ssize_t) count < 0))
188                 return retval;
189         pos = *ppos;
190         if (unlikely((pos < 0) || (loff_t) (pos + count) < 0))
191                 return retval;
192
193         if (unlikely(inode->i_flock && mandatory_lock(inode))) {
194                 retval = locks_mandatory_area(
195                         read_write == READ ? FLOCK_VERIFY_READ : FLOCK_VERIFY_WRITE,
196                         inode, file, pos, count);
197                 if (retval < 0)
198                         return retval;
199         }
200         retval = security_file_permission(file,
201                                 read_write == READ ? MAY_READ : MAY_WRITE);
202         if (retval)
203                 return retval;
204         return count > MAX_RW_COUNT ? MAX_RW_COUNT : count;
205 }
206
207 static void wait_on_retry_sync_kiocb(struct kiocb *iocb)
208 {
209         set_current_state(TASK_UNINTERRUPTIBLE);
210         if (!kiocbIsKicked(iocb))
211                 schedule();
212         else
213                 kiocbClearKicked(iocb);
214         __set_current_state(TASK_RUNNING);
215 }
216
217 ssize_t do_sync_read(struct file *filp, char __user *buf, size_t len, loff_t *ppos)
218 {
219         struct iovec iov = { .iov_base = buf, .iov_len = len };
220         struct kiocb kiocb;
221         ssize_t ret;
222
223         init_sync_kiocb(&kiocb, filp);
224         kiocb.ki_pos = *ppos;
225         kiocb.ki_left = len;
226
227         for (;;) {
228                 ret = filp->f_op->aio_read(&kiocb, &iov, 1, kiocb.ki_pos);
229                 if (ret != -EIOCBRETRY)
230                         break;
231                 wait_on_retry_sync_kiocb(&kiocb);
232         }
233
234         if (-EIOCBQUEUED == ret)
235                 ret = wait_on_sync_kiocb(&kiocb);
236         *ppos = kiocb.ki_pos;
237         return ret;
238 }
239
240 EXPORT_SYMBOL(do_sync_read);
241
242 ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)
243 {
244         ssize_t ret;
245
246         if (!(file->f_mode & FMODE_READ))
247                 return -EBADF;
248         if (!file->f_op || (!file->f_op->read && !file->f_op->aio_read))
249                 return -EINVAL;
250         if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))
251                 return -EFAULT;
252
253         ret = rw_verify_area(READ, file, pos, count);
254         if (ret >= 0) {
255                 count = ret;
256                 if (file->f_op->read)
257                         ret = file->f_op->read(file, buf, count, pos);
258                 else
259                         ret = do_sync_read(file, buf, count, pos);
260                 if (ret > 0) {
261                         fsnotify_access(file->f_path.dentry);
262                         add_rchar(current, ret);
263                 }
264                 inc_syscr(current);
265         }
266
267         return ret;
268 }
269
270 EXPORT_SYMBOL(vfs_read);
271
272 ssize_t do_sync_write(struct file *filp, const char __user *buf, size_t len, loff_t *ppos)
273 {
274         struct iovec iov = { .iov_base = (void __user *)buf, .iov_len = len };
275         struct kiocb kiocb;
276         ssize_t ret;
277
278         init_sync_kiocb(&kiocb, filp);
279         kiocb.ki_pos = *ppos;
280         kiocb.ki_left = len;
281
282         for (;;) {
283                 ret = filp->f_op->aio_write(&kiocb, &iov, 1, kiocb.ki_pos);
284                 if (ret != -EIOCBRETRY)
285                         break;
286                 wait_on_retry_sync_kiocb(&kiocb);
287         }
288
289         if (-EIOCBQUEUED == ret)
290                 ret = wait_on_sync_kiocb(&kiocb);
291         *ppos = kiocb.ki_pos;
292         return ret;
293 }
294
295 EXPORT_SYMBOL(do_sync_write);
296
297 ssize_t vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)
298 {
299         ssize_t ret;
300
301         if (!(file->f_mode & FMODE_WRITE))
302                 return -EBADF;
303         if (!file->f_op || (!file->f_op->write && !file->f_op->aio_write))
304                 return -EINVAL;
305         if (unlikely(!access_ok(VERIFY_READ, buf, count)))
306                 return -EFAULT;
307
308         ret = rw_verify_area(WRITE, file, pos, count);
309         if (ret >= 0) {
310                 count = ret;
311                 if (file->f_op->write)
312                         ret = file->f_op->write(file, buf, count, pos);
313                 else
314                         ret = do_sync_write(file, buf, count, pos);
315                 if (ret > 0) {
316                         fsnotify_modify(file->f_path.dentry);
317                         add_wchar(current, ret);
318                 }
319                 inc_syscw(current);
320         }
321
322         return ret;
323 }
324
325 EXPORT_SYMBOL(vfs_write);
326
327 static inline loff_t file_pos_read(struct file *file)
328 {
329         return file->f_pos;
330 }
331
332 static inline void file_pos_write(struct file *file, loff_t pos)
333 {
334         file->f_pos = pos;
335 }
336
337 asmlinkage long sys_read(unsigned int fd, char __user * buf, size_t count)
338 {
339         struct file *file;
340         ssize_t ret = -EBADF;
341         int fput_needed;
342
343         file = fget_light(fd, &fput_needed);
344         if (file) {
345                 loff_t pos = file_pos_read(file);
346                 ret = vfs_read(file, buf, count, &pos);
347                 file_pos_write(file, pos);
348                 fput_light(file, fput_needed);
349         }
350
351         return ret;
352 }
353
354 asmlinkage long sys_write(unsigned int fd, const char __user * buf, size_t count)
355 {
356         struct file *file;
357         ssize_t ret = -EBADF;
358         int fput_needed;
359
360         file = fget_light(fd, &fput_needed);
361         if (file) {
362                 loff_t pos = file_pos_read(file);
363                 ret = vfs_write(file, buf, count, &pos);
364                 file_pos_write(file, pos);
365                 fput_light(file, fput_needed);
366         }
367
368         return ret;
369 }
370
371 SYSCALL_DEFINE(pread64)(unsigned int fd, char __user *buf,
372                         size_t count, loff_t pos)
373 {
374         struct file *file;
375         ssize_t ret = -EBADF;
376         int fput_needed;
377
378         if (pos < 0)
379                 return -EINVAL;
380
381         file = fget_light(fd, &fput_needed);
382         if (file) {
383                 ret = -ESPIPE;
384                 if (file->f_mode & FMODE_PREAD)
385                         ret = vfs_read(file, buf, count, &pos);
386                 fput_light(file, fput_needed);
387         }
388
389         return ret;
390 }
391 #ifdef CONFIG_HAVE_SYSCALL_WRAPPERS
392 asmlinkage long SyS_pread64(long fd, long buf, long count, loff_t pos)
393 {
394         return SYSC_pread64((unsigned int) fd, (char __user *) buf,
395                             (size_t) count, pos);
396 }
397 SYSCALL_ALIAS(sys_pread64, SyS_pread64);
398 #endif
399
400 SYSCALL_DEFINE(pwrite64)(unsigned int fd, const char __user *buf,
401                          size_t count, loff_t pos)
402 {
403         struct file *file;
404         ssize_t ret = -EBADF;
405         int fput_needed;
406
407         if (pos < 0)
408                 return -EINVAL;
409
410         file = fget_light(fd, &fput_needed);
411         if (file) {
412                 ret = -ESPIPE;
413                 if (file->f_mode & FMODE_PWRITE)  
414                         ret = vfs_write(file, buf, count, &pos);
415                 fput_light(file, fput_needed);
416         }
417
418         return ret;
419 }
420 #ifdef CONFIG_HAVE_SYSCALL_WRAPPERS
421 asmlinkage long SyS_pwrite64(long fd, long buf, long count, loff_t pos)
422 {
423         return SYSC_pwrite64((unsigned int) fd, (const char __user *) buf,
424                              (size_t) count, pos);
425 }
426 SYSCALL_ALIAS(sys_pwrite64, SyS_pwrite64);
427 #endif
428
429 /*
430  * Reduce an iovec's length in-place.  Return the resulting number of segments
431  */
432 unsigned long iov_shorten(struct iovec *iov, unsigned long nr_segs, size_t to)
433 {
434         unsigned long seg = 0;
435         size_t len = 0;
436
437         while (seg < nr_segs) {
438                 seg++;
439                 if (len + iov->iov_len >= to) {
440                         iov->iov_len = to - len;
441                         break;
442                 }
443                 len += iov->iov_len;
444                 iov++;
445         }
446         return seg;
447 }
448 EXPORT_SYMBOL(iov_shorten);
449
450 ssize_t do_sync_readv_writev(struct file *filp, const struct iovec *iov,
451                 unsigned long nr_segs, size_t len, loff_t *ppos, iov_fn_t fn)
452 {
453         struct kiocb kiocb;
454         ssize_t ret;
455
456         init_sync_kiocb(&kiocb, filp);
457         kiocb.ki_pos = *ppos;
458         kiocb.ki_left = len;
459         kiocb.ki_nbytes = len;
460
461         for (;;) {
462                 ret = fn(&kiocb, iov, nr_segs, kiocb.ki_pos);
463                 if (ret != -EIOCBRETRY)
464                         break;
465                 wait_on_retry_sync_kiocb(&kiocb);
466         }
467
468         if (ret == -EIOCBQUEUED)
469                 ret = wait_on_sync_kiocb(&kiocb);
470         *ppos = kiocb.ki_pos;
471         return ret;
472 }
473
474 /* Do it by hand, with file-ops */
475 ssize_t do_loop_readv_writev(struct file *filp, struct iovec *iov,
476                 unsigned long nr_segs, loff_t *ppos, io_fn_t fn)
477 {
478         struct iovec *vector = iov;
479         ssize_t ret = 0;
480
481         while (nr_segs > 0) {
482                 void __user *base;
483                 size_t len;
484                 ssize_t nr;
485
486                 base = vector->iov_base;
487                 len = vector->iov_len;
488                 vector++;
489                 nr_segs--;
490
491                 nr = fn(filp, base, len, ppos);
492
493                 if (nr < 0) {
494                         if (!ret)
495                                 ret = nr;
496                         break;
497                 }
498                 ret += nr;
499                 if (nr != len)
500                         break;
501         }
502
503         return ret;
504 }
505
506 /* A write operation does a read from user space and vice versa */
507 #define vrfy_dir(type) ((type) == READ ? VERIFY_WRITE : VERIFY_READ)
508
509 ssize_t rw_copy_check_uvector(int type, const struct iovec __user * uvector,
510                               unsigned long nr_segs, unsigned long fast_segs,
511                               struct iovec *fast_pointer,
512                               struct iovec **ret_pointer)
513   {
514         unsigned long seg;
515         ssize_t ret;
516         struct iovec *iov = fast_pointer;
517
518         /*
519          * SuS says "The readv() function *may* fail if the iovcnt argument
520          * was less than or equal to 0, or greater than {IOV_MAX}.  Linux has
521          * traditionally returned zero for zero segments, so...
522          */
523         if (nr_segs == 0) {
524                 ret = 0;
525                 goto out;
526         }
527
528         /*
529          * First get the "struct iovec" from user memory and
530          * verify all the pointers
531          */
532         if (nr_segs > UIO_MAXIOV) {
533                 ret = -EINVAL;
534                 goto out;
535         }
536         if (nr_segs > fast_segs) {
537                 iov = kmalloc(nr_segs*sizeof(struct iovec), GFP_KERNEL);
538                 if (iov == NULL) {
539                         ret = -ENOMEM;
540                         goto out;
541                 }
542         }
543         if (copy_from_user(iov, uvector, nr_segs*sizeof(*uvector))) {
544                 ret = -EFAULT;
545                 goto out;
546         }
547
548         /*
549          * According to the Single Unix Specification we should return EINVAL
550          * if an element length is < 0 when cast to ssize_t or if the
551          * total length would overflow the ssize_t return value of the
552          * system call.
553          */
554         ret = 0;
555         for (seg = 0; seg < nr_segs; seg++) {
556                 void __user *buf = iov[seg].iov_base;
557                 ssize_t len = (ssize_t)iov[seg].iov_len;
558
559                 /* see if we we're about to use an invalid len or if
560                  * it's about to overflow ssize_t */
561                 if (len < 0 || (ret + len < ret)) {
562                         ret = -EINVAL;
563                         goto out;
564                 }
565                 if (unlikely(!access_ok(vrfy_dir(type), buf, len))) {
566                         ret = -EFAULT;
567                         goto out;
568                 }
569
570                 ret += len;
571         }
572 out:
573         *ret_pointer = iov;
574         return ret;
575 }
576
577 static ssize_t do_readv_writev(int type, struct file *file,
578                                const struct iovec __user * uvector,
579                                unsigned long nr_segs, loff_t *pos)
580 {
581         size_t tot_len;
582         struct iovec iovstack[UIO_FASTIOV];
583         struct iovec *iov = iovstack;
584         ssize_t ret;
585         io_fn_t fn;
586         iov_fn_t fnv;
587
588         if (!file->f_op) {
589                 ret = -EINVAL;
590                 goto out;
591         }
592
593         ret = rw_copy_check_uvector(type, uvector, nr_segs,
594                         ARRAY_SIZE(iovstack), iovstack, &iov);
595         if (ret <= 0)
596                 goto out;
597
598         tot_len = ret;
599         ret = rw_verify_area(type, file, pos, tot_len);
600         if (ret < 0)
601                 goto out;
602
603         fnv = NULL;
604         if (type == READ) {
605                 fn = file->f_op->read;
606                 fnv = file->f_op->aio_read;
607         } else {
608                 fn = (io_fn_t)file->f_op->write;
609                 fnv = file->f_op->aio_write;
610         }
611
612         if (fnv)
613                 ret = do_sync_readv_writev(file, iov, nr_segs, tot_len,
614                                                 pos, fnv);
615         else
616                 ret = do_loop_readv_writev(file, iov, nr_segs, pos, fn);
617
618 out:
619         if (iov != iovstack)
620                 kfree(iov);
621         if ((ret + (type == READ)) > 0) {
622                 if (type == READ)
623                         fsnotify_access(file->f_path.dentry);
624                 else
625                         fsnotify_modify(file->f_path.dentry);
626         }
627         return ret;
628 }
629
630 ssize_t vfs_readv(struct file *file, const struct iovec __user *vec,
631                   unsigned long vlen, loff_t *pos)
632 {
633         if (!(file->f_mode & FMODE_READ))
634                 return -EBADF;
635         if (!file->f_op || (!file->f_op->aio_read && !file->f_op->read))
636                 return -EINVAL;
637
638         return do_readv_writev(READ, file, vec, vlen, pos);
639 }
640
641 EXPORT_SYMBOL(vfs_readv);
642
643 ssize_t vfs_writev(struct file *file, const struct iovec __user *vec,
644                    unsigned long vlen, loff_t *pos)
645 {
646         if (!(file->f_mode & FMODE_WRITE))
647                 return -EBADF;
648         if (!file->f_op || (!file->f_op->aio_write && !file->f_op->write))
649                 return -EINVAL;
650
651         return do_readv_writev(WRITE, file, vec, vlen, pos);
652 }
653
654 EXPORT_SYMBOL(vfs_writev);
655
656 asmlinkage long
657 sys_readv(unsigned long fd, const struct iovec __user *vec, unsigned long vlen)
658 {
659         struct file *file;
660         ssize_t ret = -EBADF;
661         int fput_needed;
662
663         file = fget_light(fd, &fput_needed);
664         if (file) {
665                 loff_t pos = file_pos_read(file);
666                 ret = vfs_readv(file, vec, vlen, &pos);
667                 file_pos_write(file, pos);
668                 fput_light(file, fput_needed);
669         }
670
671         if (ret > 0)
672                 add_rchar(current, ret);
673         inc_syscr(current);
674         return ret;
675 }
676
677 asmlinkage long
678 sys_writev(unsigned long fd, const struct iovec __user *vec, unsigned long vlen)
679 {
680         struct file *file;
681         ssize_t ret = -EBADF;
682         int fput_needed;
683
684         file = fget_light(fd, &fput_needed);
685         if (file) {
686                 loff_t pos = file_pos_read(file);
687                 ret = vfs_writev(file, vec, vlen, &pos);
688                 file_pos_write(file, pos);
689                 fput_light(file, fput_needed);
690         }
691
692         if (ret > 0)
693                 add_wchar(current, ret);
694         inc_syscw(current);
695         return ret;
696 }
697
698 static ssize_t do_sendfile(int out_fd, int in_fd, loff_t *ppos,
699                            size_t count, loff_t max)
700 {
701         struct file * in_file, * out_file;
702         struct inode * in_inode, * out_inode;
703         loff_t pos;
704         ssize_t retval;
705         int fput_needed_in, fput_needed_out, fl;
706
707         /*
708          * Get input file, and verify that it is ok..
709          */
710         retval = -EBADF;
711         in_file = fget_light(in_fd, &fput_needed_in);
712         if (!in_file)
713                 goto out;
714         if (!(in_file->f_mode & FMODE_READ))
715                 goto fput_in;
716         retval = -EINVAL;
717         in_inode = in_file->f_path.dentry->d_inode;
718         if (!in_inode)
719                 goto fput_in;
720         if (!in_file->f_op || !in_file->f_op->splice_read)
721                 goto fput_in;
722         retval = -ESPIPE;
723         if (!ppos)
724                 ppos = &in_file->f_pos;
725         else
726                 if (!(in_file->f_mode & FMODE_PREAD))
727                         goto fput_in;
728         retval = rw_verify_area(READ, in_file, ppos, count);
729         if (retval < 0)
730                 goto fput_in;
731         count = retval;
732
733         /*
734          * Get output file, and verify that it is ok..
735          */
736         retval = -EBADF;
737         out_file = fget_light(out_fd, &fput_needed_out);
738         if (!out_file)
739                 goto fput_in;
740         if (!(out_file->f_mode & FMODE_WRITE))
741                 goto fput_out;
742         retval = -EINVAL;
743         if (!out_file->f_op || !out_file->f_op->sendpage)
744                 goto fput_out;
745         out_inode = out_file->f_path.dentry->d_inode;
746         retval = rw_verify_area(WRITE, out_file, &out_file->f_pos, count);
747         if (retval < 0)
748                 goto fput_out;
749         count = retval;
750
751         if (!max)
752                 max = min(in_inode->i_sb->s_maxbytes, out_inode->i_sb->s_maxbytes);
753
754         pos = *ppos;
755         retval = -EINVAL;
756         if (unlikely(pos < 0))
757                 goto fput_out;
758         if (unlikely(pos + count > max)) {
759                 retval = -EOVERFLOW;
760                 if (pos >= max)
761                         goto fput_out;
762                 count = max - pos;
763         }
764
765         fl = 0;
766 #if 0
767         /*
768          * We need to debate whether we can enable this or not. The
769          * man page documents EAGAIN return for the output at least,
770          * and the application is arguably buggy if it doesn't expect
771          * EAGAIN on a non-blocking file descriptor.
772          */
773         if (in_file->f_flags & O_NONBLOCK)
774                 fl = SPLICE_F_NONBLOCK;
775 #endif
776         retval = do_splice_direct(in_file, ppos, out_file, count, fl);
777
778         if (retval > 0) {
779                 add_rchar(current, retval);
780                 add_wchar(current, retval);
781         }
782
783         inc_syscr(current);
784         inc_syscw(current);
785         if (*ppos > max)
786                 retval = -EOVERFLOW;
787
788 fput_out:
789         fput_light(out_file, fput_needed_out);
790 fput_in:
791         fput_light(in_file, fput_needed_in);
792 out:
793         return retval;
794 }
795
796 asmlinkage long sys_sendfile(int out_fd, int in_fd, off_t __user *offset, size_t count)
797 {
798         loff_t pos;
799         off_t off;
800         ssize_t ret;
801
802         if (offset) {
803                 if (unlikely(get_user(off, offset)))
804                         return -EFAULT;
805                 pos = off;
806                 ret = do_sendfile(out_fd, in_fd, &pos, count, MAX_NON_LFS);
807                 if (unlikely(put_user(pos, offset)))
808                         return -EFAULT;
809                 return ret;
810         }
811
812         return do_sendfile(out_fd, in_fd, NULL, count, 0);
813 }
814
815 asmlinkage long sys_sendfile64(int out_fd, int in_fd, loff_t __user *offset, size_t count)
816 {
817         loff_t pos;
818         ssize_t ret;
819
820         if (offset) {
821                 if (unlikely(copy_from_user(&pos, offset, sizeof(loff_t))))
822                         return -EFAULT;
823                 ret = do_sendfile(out_fd, in_fd, &pos, count, 0);
824                 if (unlikely(put_user(pos, offset)))
825                         return -EFAULT;
826                 return ret;
827         }
828
829         return do_sendfile(out_fd, in_fd, NULL, count, 0);
830 }