]> git.karo-electronics.de Git - karo-tx-linux.git/blob - net/l2tp/l2tp_ip.c
889f5d13d7ba342b5ea2a2c447b1c6858b553de2
[karo-tx-linux.git] / net / l2tp / l2tp_ip.c
1 /*
2  * L2TPv3 IP encapsulation support
3  *
4  * Copyright (c) 2008,2009,2010 Katalix Systems Ltd
5  *
6  *      This program is free software; you can redistribute it and/or
7  *      modify it under the terms of the GNU General Public License
8  *      as published by the Free Software Foundation; either version
9  *      2 of the License, or (at your option) any later version.
10  */
11
12 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
13
14 #include <linux/icmp.h>
15 #include <linux/module.h>
16 #include <linux/skbuff.h>
17 #include <linux/random.h>
18 #include <linux/socket.h>
19 #include <linux/l2tp.h>
20 #include <linux/in.h>
21 #include <net/sock.h>
22 #include <net/ip.h>
23 #include <net/icmp.h>
24 #include <net/udp.h>
25 #include <net/inet_common.h>
26 #include <net/inet_hashtables.h>
27 #include <net/tcp_states.h>
28 #include <net/protocol.h>
29 #include <net/xfrm.h>
30
31 #include "l2tp_core.h"
32
33 struct l2tp_ip_sock {
34         /* inet_sock has to be the first member of l2tp_ip_sock */
35         struct inet_sock        inet;
36
37         u32                     conn_id;
38         u32                     peer_conn_id;
39 };
40
41 static DEFINE_RWLOCK(l2tp_ip_lock);
42 static struct hlist_head l2tp_ip_table;
43 static struct hlist_head l2tp_ip_bind_table;
44
45 static inline struct l2tp_ip_sock *l2tp_ip_sk(const struct sock *sk)
46 {
47         return (struct l2tp_ip_sock *)sk;
48 }
49
50 static struct sock *__l2tp_ip_bind_lookup(struct net *net, __be32 laddr, int dif, u32 tunnel_id)
51 {
52         struct hlist_node *node;
53         struct sock *sk;
54
55         sk_for_each_bound(sk, node, &l2tp_ip_bind_table) {
56                 struct inet_sock *inet = inet_sk(sk);
57                 struct l2tp_ip_sock *l2tp = l2tp_ip_sk(sk);
58
59                 if (l2tp == NULL)
60                         continue;
61
62                 if ((l2tp->conn_id == tunnel_id) &&
63                     net_eq(sock_net(sk), net) &&
64                     !(inet->inet_rcv_saddr && inet->inet_rcv_saddr != laddr) &&
65                     !(sk->sk_bound_dev_if && sk->sk_bound_dev_if != dif))
66                         goto found;
67         }
68
69         sk = NULL;
70 found:
71         return sk;
72 }
73
74 static inline struct sock *l2tp_ip_bind_lookup(struct net *net, __be32 laddr, int dif, u32 tunnel_id)
75 {
76         struct sock *sk = __l2tp_ip_bind_lookup(net, laddr, dif, tunnel_id);
77         if (sk)
78                 sock_hold(sk);
79
80         return sk;
81 }
82
83 /* When processing receive frames, there are two cases to
84  * consider. Data frames consist of a non-zero session-id and an
85  * optional cookie. Control frames consist of a regular L2TP header
86  * preceded by 32-bits of zeros.
87  *
88  * L2TPv3 Session Header Over IP
89  *
90  *  0                   1                   2                   3
91  *  0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
92  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
93  * |                           Session ID                          |
94  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
95  * |               Cookie (optional, maximum 64 bits)...
96  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
97  *                                                                 |
98  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
99  *
100  * L2TPv3 Control Message Header Over IP
101  *
102  *  0                   1                   2                   3
103  *  0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
104  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
105  * |                      (32 bits of zeros)                       |
106  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
107  * |T|L|x|x|S|x|x|x|x|x|x|x|  Ver  |             Length            |
108  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
109  * |                     Control Connection ID                     |
110  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
111  * |               Ns              |               Nr              |
112  * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
113  *
114  * All control frames are passed to userspace.
115  */
116 static int l2tp_ip_recv(struct sk_buff *skb)
117 {
118         struct sock *sk;
119         u32 session_id;
120         u32 tunnel_id;
121         unsigned char *ptr, *optr;
122         struct l2tp_session *session;
123         struct l2tp_tunnel *tunnel = NULL;
124         int length;
125
126         /* Point to L2TP header */
127         optr = ptr = skb->data;
128
129         if (!pskb_may_pull(skb, 4))
130                 goto discard;
131
132         session_id = ntohl(*((__be32 *) ptr));
133         ptr += 4;
134
135         /* RFC3931: L2TP/IP packets have the first 4 bytes containing
136          * the session_id. If it is 0, the packet is a L2TP control
137          * frame and the session_id value can be discarded.
138          */
139         if (session_id == 0) {
140                 __skb_pull(skb, 4);
141                 goto pass_up;
142         }
143
144         /* Ok, this is a data packet. Lookup the session. */
145         session = l2tp_session_find(&init_net, NULL, session_id);
146         if (session == NULL)
147                 goto discard;
148
149         tunnel = session->tunnel;
150         if (tunnel == NULL)
151                 goto discard;
152
153         /* Trace packet contents, if enabled */
154         if (tunnel->debug & L2TP_MSG_DATA) {
155                 length = min(32u, skb->len);
156                 if (!pskb_may_pull(skb, length))
157                         goto discard;
158
159                 pr_debug("%s: ip recv\n", tunnel->name);
160                 print_hex_dump_bytes("", DUMP_PREFIX_OFFSET, ptr, length);
161         }
162
163         l2tp_recv_common(session, skb, ptr, optr, 0, skb->len, tunnel->recv_payload_hook);
164
165         return 0;
166
167 pass_up:
168         /* Get the tunnel_id from the L2TP header */
169         if (!pskb_may_pull(skb, 12))
170                 goto discard;
171
172         if ((skb->data[0] & 0xc0) != 0xc0)
173                 goto discard;
174
175         tunnel_id = ntohl(*(__be32 *) &skb->data[4]);
176         tunnel = l2tp_tunnel_find(&init_net, tunnel_id);
177         if (tunnel != NULL)
178                 sk = tunnel->sock;
179         else {
180                 struct iphdr *iph = (struct iphdr *) skb_network_header(skb);
181
182                 read_lock_bh(&l2tp_ip_lock);
183                 sk = __l2tp_ip_bind_lookup(&init_net, iph->daddr, 0, tunnel_id);
184                 read_unlock_bh(&l2tp_ip_lock);
185         }
186
187         if (sk == NULL)
188                 goto discard;
189
190         sock_hold(sk);
191
192         if (!xfrm4_policy_check(sk, XFRM_POLICY_IN, skb))
193                 goto discard_put;
194
195         nf_reset(skb);
196
197         return sk_receive_skb(sk, skb, 1);
198
199 discard_put:
200         sock_put(sk);
201
202 discard:
203         kfree_skb(skb);
204         return 0;
205 }
206
207 static int l2tp_ip_open(struct sock *sk)
208 {
209         /* Prevent autobind. We don't have ports. */
210         inet_sk(sk)->inet_num = IPPROTO_L2TP;
211
212         write_lock_bh(&l2tp_ip_lock);
213         sk_add_node(sk, &l2tp_ip_table);
214         write_unlock_bh(&l2tp_ip_lock);
215
216         return 0;
217 }
218
219 static void l2tp_ip_close(struct sock *sk, long timeout)
220 {
221         write_lock_bh(&l2tp_ip_lock);
222         hlist_del_init(&sk->sk_bind_node);
223         sk_del_node_init(sk);
224         write_unlock_bh(&l2tp_ip_lock);
225         sk_common_release(sk);
226 }
227
228 static void l2tp_ip_destroy_sock(struct sock *sk)
229 {
230         struct sk_buff *skb;
231
232         while ((skb = __skb_dequeue_tail(&sk->sk_write_queue)) != NULL)
233                 kfree_skb(skb);
234
235         sk_refcnt_debug_dec(sk);
236 }
237
238 static int l2tp_ip_bind(struct sock *sk, struct sockaddr *uaddr, int addr_len)
239 {
240         struct inet_sock *inet = inet_sk(sk);
241         struct sockaddr_l2tpip *addr = (struct sockaddr_l2tpip *) uaddr;
242         int ret = -EINVAL;
243         int chk_addr_ret;
244
245         ret = -EADDRINUSE;
246         read_lock_bh(&l2tp_ip_lock);
247         if (__l2tp_ip_bind_lookup(&init_net, addr->l2tp_addr.s_addr, sk->sk_bound_dev_if, addr->l2tp_conn_id))
248                 goto out_in_use;
249
250         read_unlock_bh(&l2tp_ip_lock);
251
252         lock_sock(sk);
253         if (sk->sk_state != TCP_CLOSE || addr_len < sizeof(struct sockaddr_l2tpip))
254                 goto out;
255
256         chk_addr_ret = inet_addr_type(&init_net, addr->l2tp_addr.s_addr);
257         ret = -EADDRNOTAVAIL;
258         if (addr->l2tp_addr.s_addr && chk_addr_ret != RTN_LOCAL &&
259             chk_addr_ret != RTN_MULTICAST && chk_addr_ret != RTN_BROADCAST)
260                 goto out;
261
262         if (addr->l2tp_addr.s_addr)
263                 inet->inet_rcv_saddr = inet->inet_saddr = addr->l2tp_addr.s_addr;
264         if (chk_addr_ret == RTN_MULTICAST || chk_addr_ret == RTN_BROADCAST)
265                 inet->inet_saddr = 0;  /* Use device */
266         sk_dst_reset(sk);
267
268         l2tp_ip_sk(sk)->conn_id = addr->l2tp_conn_id;
269
270         write_lock_bh(&l2tp_ip_lock);
271         sk_add_bind_node(sk, &l2tp_ip_bind_table);
272         sk_del_node_init(sk);
273         write_unlock_bh(&l2tp_ip_lock);
274         ret = 0;
275 out:
276         release_sock(sk);
277
278         return ret;
279
280 out_in_use:
281         read_unlock_bh(&l2tp_ip_lock);
282
283         return ret;
284 }
285
286 static int l2tp_ip_connect(struct sock *sk, struct sockaddr *uaddr, int addr_len)
287 {
288         struct sockaddr_l2tpip *lsa = (struct sockaddr_l2tpip *) uaddr;
289         int rc;
290
291         if (addr_len < sizeof(*lsa))
292                 return -EINVAL;
293
294         if (ipv4_is_multicast(lsa->l2tp_addr.s_addr))
295                 return -EINVAL;
296
297         rc = ip4_datagram_connect(sk, uaddr, addr_len);
298         if (rc < 0)
299                 return rc;
300
301         lock_sock(sk);
302
303         l2tp_ip_sk(sk)->peer_conn_id = lsa->l2tp_conn_id;
304
305         write_lock_bh(&l2tp_ip_lock);
306         hlist_del_init(&sk->sk_bind_node);
307         sk_add_bind_node(sk, &l2tp_ip_bind_table);
308         write_unlock_bh(&l2tp_ip_lock);
309
310         release_sock(sk);
311         return rc;
312 }
313
314 static int l2tp_ip_getname(struct socket *sock, struct sockaddr *uaddr,
315                            int *uaddr_len, int peer)
316 {
317         struct sock *sk         = sock->sk;
318         struct inet_sock *inet  = inet_sk(sk);
319         struct l2tp_ip_sock *lsk = l2tp_ip_sk(sk);
320         struct sockaddr_l2tpip *lsa = (struct sockaddr_l2tpip *)uaddr;
321
322         memset(lsa, 0, sizeof(*lsa));
323         lsa->l2tp_family = AF_INET;
324         if (peer) {
325                 if (!inet->inet_dport)
326                         return -ENOTCONN;
327                 lsa->l2tp_conn_id = lsk->peer_conn_id;
328                 lsa->l2tp_addr.s_addr = inet->inet_daddr;
329         } else {
330                 __be32 addr = inet->inet_rcv_saddr;
331                 if (!addr)
332                         addr = inet->inet_saddr;
333                 lsa->l2tp_conn_id = lsk->conn_id;
334                 lsa->l2tp_addr.s_addr = addr;
335         }
336         *uaddr_len = sizeof(*lsa);
337         return 0;
338 }
339
340 static int l2tp_ip_backlog_recv(struct sock *sk, struct sk_buff *skb)
341 {
342         int rc;
343
344         /* Charge it to the socket, dropping if the queue is full. */
345         rc = sock_queue_rcv_skb(sk, skb);
346         if (rc < 0)
347                 goto drop;
348
349         return 0;
350
351 drop:
352         IP_INC_STATS(&init_net, IPSTATS_MIB_INDISCARDS);
353         kfree_skb(skb);
354         return -1;
355 }
356
357 /* Userspace will call sendmsg() on the tunnel socket to send L2TP
358  * control frames.
359  */
360 static int l2tp_ip_sendmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg, size_t len)
361 {
362         struct sk_buff *skb;
363         int rc;
364         struct inet_sock *inet = inet_sk(sk);
365         struct rtable *rt = NULL;
366         struct flowi4 *fl4;
367         int connected = 0;
368         __be32 daddr;
369
370         lock_sock(sk);
371
372         rc = -ENOTCONN;
373         if (sock_flag(sk, SOCK_DEAD))
374                 goto out;
375
376         /* Get and verify the address. */
377         if (msg->msg_name) {
378                 struct sockaddr_l2tpip *lip = (struct sockaddr_l2tpip *) msg->msg_name;
379                 rc = -EINVAL;
380                 if (msg->msg_namelen < sizeof(*lip))
381                         goto out;
382
383                 if (lip->l2tp_family != AF_INET) {
384                         rc = -EAFNOSUPPORT;
385                         if (lip->l2tp_family != AF_UNSPEC)
386                                 goto out;
387                 }
388
389                 daddr = lip->l2tp_addr.s_addr;
390         } else {
391                 rc = -EDESTADDRREQ;
392                 if (sk->sk_state != TCP_ESTABLISHED)
393                         goto out;
394
395                 daddr = inet->inet_daddr;
396                 connected = 1;
397         }
398
399         /* Allocate a socket buffer */
400         rc = -ENOMEM;
401         skb = sock_wmalloc(sk, 2 + NET_SKB_PAD + sizeof(struct iphdr) +
402                            4 + len, 0, GFP_KERNEL);
403         if (!skb)
404                 goto error;
405
406         /* Reserve space for headers, putting IP header on 4-byte boundary. */
407         skb_reserve(skb, 2 + NET_SKB_PAD);
408         skb_reset_network_header(skb);
409         skb_reserve(skb, sizeof(struct iphdr));
410         skb_reset_transport_header(skb);
411
412         /* Insert 0 session_id */
413         *((__be32 *) skb_put(skb, 4)) = 0;
414
415         /* Copy user data into skb */
416         rc = memcpy_fromiovec(skb_put(skb, len), msg->msg_iov, len);
417         if (rc < 0) {
418                 kfree_skb(skb);
419                 goto error;
420         }
421
422         fl4 = &inet->cork.fl.u.ip4;
423         if (connected)
424                 rt = (struct rtable *) __sk_dst_check(sk, 0);
425
426         rcu_read_lock();
427         if (rt == NULL) {
428                 const struct ip_options_rcu *inet_opt;
429
430                 inet_opt = rcu_dereference(inet->inet_opt);
431
432                 /* Use correct destination address if we have options. */
433                 if (inet_opt && inet_opt->opt.srr)
434                         daddr = inet_opt->opt.faddr;
435
436                 /* If this fails, retransmit mechanism of transport layer will
437                  * keep trying until route appears or the connection times
438                  * itself out.
439                  */
440                 rt = ip_route_output_ports(sock_net(sk), fl4, sk,
441                                            daddr, inet->inet_saddr,
442                                            inet->inet_dport, inet->inet_sport,
443                                            sk->sk_protocol, RT_CONN_FLAGS(sk),
444                                            sk->sk_bound_dev_if);
445                 if (IS_ERR(rt))
446                         goto no_route;
447                 if (connected)
448                         sk_setup_caps(sk, &rt->dst);
449                 else
450                         dst_release(&rt->dst); /* safe since we hold rcu_read_lock */
451         }
452
453         /* We dont need to clone dst here, it is guaranteed to not disappear.
454          *  __dev_xmit_skb() might force a refcount if needed.
455          */
456         skb_dst_set_noref(skb, &rt->dst);
457
458         /* Queue the packet to IP for output */
459         rc = ip_queue_xmit(skb, &inet->cork.fl);
460         rcu_read_unlock();
461
462 error:
463         if (rc >= 0)
464                 rc = len;
465
466 out:
467         release_sock(sk);
468         return rc;
469
470 no_route:
471         rcu_read_unlock();
472         IP_INC_STATS(sock_net(sk), IPSTATS_MIB_OUTNOROUTES);
473         kfree_skb(skb);
474         rc = -EHOSTUNREACH;
475         goto out;
476 }
477
478 static int l2tp_ip_recvmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg,
479                            size_t len, int noblock, int flags, int *addr_len)
480 {
481         struct inet_sock *inet = inet_sk(sk);
482         size_t copied = 0;
483         int err = -EOPNOTSUPP;
484         struct sockaddr_in *sin = (struct sockaddr_in *)msg->msg_name;
485         struct sk_buff *skb;
486
487         if (flags & MSG_OOB)
488                 goto out;
489
490         if (addr_len)
491                 *addr_len = sizeof(*sin);
492
493         skb = skb_recv_datagram(sk, flags, noblock, &err);
494         if (!skb)
495                 goto out;
496
497         copied = skb->len;
498         if (len < copied) {
499                 msg->msg_flags |= MSG_TRUNC;
500                 copied = len;
501         }
502
503         err = skb_copy_datagram_iovec(skb, 0, msg->msg_iov, copied);
504         if (err)
505                 goto done;
506
507         sock_recv_timestamp(msg, sk, skb);
508
509         /* Copy the address. */
510         if (sin) {
511                 sin->sin_family = AF_INET;
512                 sin->sin_addr.s_addr = ip_hdr(skb)->saddr;
513                 sin->sin_port = 0;
514                 memset(&sin->sin_zero, 0, sizeof(sin->sin_zero));
515         }
516         if (inet->cmsg_flags)
517                 ip_cmsg_recv(msg, skb);
518         if (flags & MSG_TRUNC)
519                 copied = skb->len;
520 done:
521         skb_free_datagram(sk, skb);
522 out:
523         return err ? err : copied;
524 }
525
526 static struct proto l2tp_ip_prot = {
527         .name              = "L2TP/IP",
528         .owner             = THIS_MODULE,
529         .init              = l2tp_ip_open,
530         .close             = l2tp_ip_close,
531         .bind              = l2tp_ip_bind,
532         .connect           = l2tp_ip_connect,
533         .disconnect        = udp_disconnect,
534         .ioctl             = udp_ioctl,
535         .destroy           = l2tp_ip_destroy_sock,
536         .setsockopt        = ip_setsockopt,
537         .getsockopt        = ip_getsockopt,
538         .sendmsg           = l2tp_ip_sendmsg,
539         .recvmsg           = l2tp_ip_recvmsg,
540         .backlog_rcv       = l2tp_ip_backlog_recv,
541         .hash              = inet_hash,
542         .unhash            = inet_unhash,
543         .obj_size          = sizeof(struct l2tp_ip_sock),
544 #ifdef CONFIG_COMPAT
545         .compat_setsockopt = compat_ip_setsockopt,
546         .compat_getsockopt = compat_ip_getsockopt,
547 #endif
548 };
549
550 static const struct proto_ops l2tp_ip_ops = {
551         .family            = PF_INET,
552         .owner             = THIS_MODULE,
553         .release           = inet_release,
554         .bind              = inet_bind,
555         .connect           = inet_dgram_connect,
556         .socketpair        = sock_no_socketpair,
557         .accept            = sock_no_accept,
558         .getname           = l2tp_ip_getname,
559         .poll              = datagram_poll,
560         .ioctl             = inet_ioctl,
561         .listen            = sock_no_listen,
562         .shutdown          = inet_shutdown,
563         .setsockopt        = sock_common_setsockopt,
564         .getsockopt        = sock_common_getsockopt,
565         .sendmsg           = inet_sendmsg,
566         .recvmsg           = sock_common_recvmsg,
567         .mmap              = sock_no_mmap,
568         .sendpage          = sock_no_sendpage,
569 #ifdef CONFIG_COMPAT
570         .compat_setsockopt = compat_sock_common_setsockopt,
571         .compat_getsockopt = compat_sock_common_getsockopt,
572 #endif
573 };
574
575 static struct inet_protosw l2tp_ip_protosw = {
576         .type           = SOCK_DGRAM,
577         .protocol       = IPPROTO_L2TP,
578         .prot           = &l2tp_ip_prot,
579         .ops            = &l2tp_ip_ops,
580         .no_check       = 0,
581 };
582
583 static struct net_protocol l2tp_ip_protocol __read_mostly = {
584         .handler        = l2tp_ip_recv,
585 };
586
587 static int __init l2tp_ip_init(void)
588 {
589         int err;
590
591         pr_info("L2TP IP encapsulation support (L2TPv3)\n");
592
593         err = proto_register(&l2tp_ip_prot, 1);
594         if (err != 0)
595                 goto out;
596
597         err = inet_add_protocol(&l2tp_ip_protocol, IPPROTO_L2TP);
598         if (err)
599                 goto out1;
600
601         inet_register_protosw(&l2tp_ip_protosw);
602         return 0;
603
604 out1:
605         proto_unregister(&l2tp_ip_prot);
606 out:
607         return err;
608 }
609
610 static void __exit l2tp_ip_exit(void)
611 {
612         inet_unregister_protosw(&l2tp_ip_protosw);
613         inet_del_protocol(&l2tp_ip_protocol, IPPROTO_L2TP);
614         proto_unregister(&l2tp_ip_prot);
615 }
616
617 module_init(l2tp_ip_init);
618 module_exit(l2tp_ip_exit);
619
620 MODULE_LICENSE("GPL");
621 MODULE_AUTHOR("James Chapman <jchapman@katalix.com>");
622 MODULE_DESCRIPTION("L2TP over IP");
623 MODULE_VERSION("1.0");
624
625 /* Use the value of SOCK_DGRAM (2) directory, because __stringify doesn't like
626  * enums
627  */
628 MODULE_ALIAS_NET_PF_PROTO_TYPE(PF_INET, 2, IPPROTO_L2TP);