Linux 3.19: Use mgs_iter in struct msghdr
[openafs.git] / src / rx / LINUX / rx_knet.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * rx_knet.c - RX kernel send, receive and timer routines.
12  *
13  * Linux implementation.
14  */
15 #include <afsconfig.h>
16 #include "afs/param.h"
17
18
19 #include <linux/version.h>
20 #include "rx/rx_kcommon.h"
21 #include "rx.h"
22 #include "rx_atomic.h"
23 #include "rx_globals.h"
24 #include "rx_stats.h"
25 #include "rx_peer.h"
26 #include "rx_packet.h"
27 #include "rx_internal.h"
28 #include <asm/uaccess.h>
29 #ifdef AFS_RXERRQ_ENV
30 #include <linux/errqueue.h>
31 #include <linux/icmp.h>
32 #endif
33
34 #include "osi_compat.h"
35
36 /* rxk_NewSocket
37  * open and bind RX socket
38  */
39 osi_socket *
40 rxk_NewSocketHost(afs_uint32 ahost, short aport)
41 {
42     struct socket *sockp;
43     struct sockaddr_in myaddr;
44     int code;
45 #ifdef AFS_ADAPT_PMTU
46     int pmtu = IP_PMTUDISC_WANT;
47 #else
48     int pmtu = IP_PMTUDISC_DONT;
49 #endif
50
51 #ifdef HAVE_LINUX_SOCK_CREATE_KERN
52     code = sock_create_kern(AF_INET, SOCK_DGRAM, IPPROTO_UDP, &sockp);
53 #elif defined(LINUX_KERNEL_SOCK_CREATE_V)
54     code = sock_create(AF_INET, SOCK_DGRAM, IPPROTO_UDP, &sockp, 0);
55 #else
56     code = sock_create(AF_INET, SOCK_DGRAM, IPPROTO_UDP, &sockp);
57 #endif
58     if (code < 0)
59         return NULL;
60
61     /* Bind socket */
62     myaddr.sin_family = AF_INET;
63     myaddr.sin_addr.s_addr = ahost;
64     myaddr.sin_port = aport;
65     code =
66         sockp->ops->bind(sockp, (struct sockaddr *)&myaddr, sizeof(myaddr));
67
68     if (code < 0) {
69         printk("sock_release(rx_socket) FIXME\n");
70         return NULL;
71     }
72
73     kernel_setsockopt(sockp, SOL_IP, IP_MTU_DISCOVER, (char *)&pmtu,
74                       sizeof(pmtu));
75 #ifdef AFS_RXERRQ_ENV
76     {
77         int recverr = 1;
78         kernel_setsockopt(sockp, SOL_IP, IP_RECVERR, (char *)&recverr,
79                           sizeof(recverr));
80     }
81 #endif
82     return (osi_socket *)sockp;
83 }
84
85 osi_socket *
86 rxk_NewSocket(short aport)
87 {
88     return rxk_NewSocketHost(htonl(INADDR_ANY), aport);
89 }
90
91 /* free socket allocated by osi_NetSocket */
92 int
93 rxk_FreeSocket(struct socket *asocket)
94 {
95     AFS_STATCNT(osi_FreeSocket);
96     return 0;
97 }
98
99 #ifdef AFS_RXERRQ_ENV
100 static int
101 osi_HandleSocketError(osi_socket so, char *cmsgbuf, size_t cmsgbuf_len)
102 {
103     struct msghdr msg;
104     struct cmsghdr *cmsg;
105     struct sock_extended_err *err;
106     struct sockaddr_in addr;
107     int code;
108     struct socket *sop = (struct socket *)so;
109
110     msg.msg_name = &addr;
111     msg.msg_namelen = sizeof(addr);
112     msg.msg_control = cmsgbuf;
113     msg.msg_controllen = cmsgbuf_len;
114     msg.msg_flags = 0;
115
116     code = kernel_recvmsg(sop, &msg, NULL, 0, 0,
117                           MSG_ERRQUEUE|MSG_DONTWAIT|MSG_TRUNC);
118
119     if (code < 0 || !(msg.msg_flags & MSG_ERRQUEUE))
120         return 0;
121
122     /* kernel_recvmsg changes msg_control to point at the _end_ of the buffer,
123      * and msg_controllen is set to the number of bytes remaining */
124     msg.msg_controllen = ((char*)msg.msg_control - (char*)cmsgbuf);
125     msg.msg_control = cmsgbuf;
126
127     for (cmsg = CMSG_FIRSTHDR(&msg); cmsg && CMSG_OK(&msg, cmsg);
128          cmsg = CMSG_NXTHDR(&msg, cmsg)) {
129
130         if (cmsg->cmsg_level != SOL_IP || cmsg->cmsg_type != IP_RECVERR) {
131             continue;
132         }
133
134         err = CMSG_DATA(cmsg);
135         rxi_ProcessNetError(err, addr.sin_addr.s_addr, addr.sin_port);
136     }
137
138     return 1;
139 }
140 #endif
141
142 static void
143 do_handlesocketerror(osi_socket so)
144 {
145 #ifdef AFS_RXERRQ_ENV
146     char *cmsgbuf;
147     size_t cmsgbuf_len;
148
149     cmsgbuf_len = 256;
150     cmsgbuf = rxi_Alloc(cmsgbuf_len);
151     if (!cmsgbuf) {
152         return;
153     }
154
155     while (osi_HandleSocketError(so, cmsgbuf, cmsgbuf_len))
156         ;
157
158     rxi_Free(cmsgbuf, cmsgbuf_len);
159 #endif
160 }
161
162 /* osi_NetSend
163  *
164  * Return codes:
165  * 0 = success
166  * non-zero = failure
167  */
168 int
169 osi_NetSend(osi_socket sop, struct sockaddr_in *to, struct iovec *iovec,
170             int iovcnt, afs_int32 size, int istack)
171 {
172     struct msghdr msg;
173     int code;
174
175
176     msg.msg_name = to;
177     msg.msg_namelen = sizeof(*to);
178     msg.msg_control = NULL;
179     msg.msg_controllen = 0;
180     msg.msg_flags = 0;
181
182     code = kernel_sendmsg(sop, &msg, (struct kvec *) iovec, iovcnt, size);
183
184     if (code < 0) {
185         do_handlesocketerror(sop);
186     }
187
188     return (code < 0) ? code : 0;
189 }
190
191
192 /* osi_NetReceive
193  * OS dependent part of kernel RX listener thread.
194  *
195  * Arguments:
196  *      so      socket to receive on, typically rx_socket
197  *      from    pointer to a sockaddr_in. 
198  *      iov     array of iovecs to fill in.
199  *      iovcnt  how many iovecs there are.
200  *      lengthp IN/OUT in: total space available in iovecs. out: size of read.
201  *
202  * Return
203  * 0 if successful
204  * error code (such as EINTER) if not
205  *
206  * Environment
207  *      Note that the maximum number of iovecs is 2 + RX_MAXWVECS. This is
208  *      so we have a little space to look for packets larger than 
209  *      rx_maxReceiveSize.
210  */
211 int rxk_lastSocketError;
212 int rxk_nSocketErrors;
213 int
214 osi_NetReceive(osi_socket so, struct sockaddr_in *from, struct iovec *iov,
215                int iovcnt, int *lengthp)
216 {
217     struct msghdr msg;
218     int code;
219     struct iovec tmpvec[RX_MAXWVECS + 2];
220     struct socket *sop = (struct socket *)so;
221
222     if (iovcnt > RX_MAXWVECS + 2) {
223         osi_Panic("Too many (%d) iovecs passed to osi_NetReceive\n", iovcnt);
224     }
225
226     memcpy(tmpvec, iov, iovcnt * sizeof(struct iovec));
227     msg.msg_name = from;
228 #if defined(STRUCT_MSGHDR_HAS_MSG_ITER)
229     msg.msg_iter.iov = tmpvec;
230     msg.msg_iter.nr_segs = iovcnt;
231 #else
232     msg.msg_iov = tmpvec;
233     msg.msg_iovlen = iovcnt;
234 #endif
235     msg.msg_control = NULL;
236     msg.msg_controllen = 0;
237     msg.msg_flags = 0;
238
239     code = kernel_recvmsg(sop, &msg, (struct kvec *)tmpvec, iovcnt,
240                           *lengthp, 0);
241     if (code < 0) {
242         afs_try_to_freeze();
243
244         /* Clear the error before using the socket again.
245          * Oh joy, Linux has hidden header files as well. It appears we can
246          * simply call again and have it clear itself via sock_error().
247          */
248         flush_signals(current); /* We don't want no stinkin' signals. */
249         rxk_lastSocketError = code;
250         rxk_nSocketErrors++;
251
252         do_handlesocketerror(so);
253     } else {
254         *lengthp = code;
255         code = 0;
256     }
257
258     return code;
259 }
260
261 void
262 osi_StopListener(void)
263 {
264     extern struct task_struct *rxk_ListenerTask;
265
266     while (rxk_ListenerTask) {
267         if (rxk_ListenerTask) {
268             flush_signals(rxk_ListenerTask);
269             force_sig(SIGKILL, rxk_ListenerTask);
270         }
271         if (!rxk_ListenerTask)
272             break;
273         afs_osi_Sleep(&rxk_ListenerTask);
274     }
275     sock_release(rx_socket);
276     rx_socket = NULL;
277 }
278