abstract rx if structure access
[openafs.git] / src / rx / LINUX / rx_knet.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * rx_knet.c - RX kernel send, receive and timer routines.
12  *
13  * Linux implementation.
14  */
15 #include <afsconfig.h>
16 #include "afs/param.h"
17
18
19 #include <linux/version.h>
20 #ifdef AFS_LINUX22_ENV
21 #include "rx/rx_kcommon.h"
22 #if defined(AFS_LINUX24_ENV)
23 #include "h/smp_lock.h"
24 #endif
25 #include <asm/uaccess.h>
26 #ifdef ADAPT_PMTU
27 #include <linux/errqueue.h>
28 #include <linux/icmp.h>
29 #endif
30
31 /* rxk_NewSocket
32  * open and bind RX socket
33  */
34 osi_socket *
35 rxk_NewSocketHost(afs_uint32 ahost, short aport)
36 {
37     struct socket *sockp;
38     struct sockaddr_in myaddr;
39     int code;
40     KERNEL_SPACE_DECL;
41 #ifdef ADAPT_PMTU
42     int pmtu = IP_PMTUDISC_WANT;
43     int do_recverr = 1;
44 #else
45     int pmtu = IP_PMTUDISC_DONT;
46 #endif
47
48     /* We need a better test for this. if you need it back, tell us
49      * how to detect it. 
50      */
51 #ifdef LINUX_KERNEL_SOCK_CREATE_V
52     code = sock_create(AF_INET, SOCK_DGRAM, IPPROTO_UDP, &sockp, 0);
53 #else
54     code = sock_create(AF_INET, SOCK_DGRAM, IPPROTO_UDP, &sockp);
55 #endif
56     if (code < 0)
57         return NULL;
58
59     /* Bind socket */
60     myaddr.sin_family = AF_INET;
61     myaddr.sin_addr.s_addr = ahost;
62     myaddr.sin_port = aport;
63     code =
64         sockp->ops->bind(sockp, (struct sockaddr *)&myaddr, sizeof(myaddr));
65
66     if (code < 0) {
67 #if defined(AFS_LINUX24_ENV)
68         printk("sock_release(rx_socket) FIXME\n");
69 #else
70         sock_release(sockp);
71 #endif
72         return NULL;
73     }
74
75     TO_USER_SPACE();
76     sockp->ops->setsockopt(sockp, SOL_IP, IP_MTU_DISCOVER, (char *)&pmtu,
77                            sizeof(pmtu));
78 #ifdef ADAPT_PMTU
79     sockp->ops->setsockopt(sockp, SOL_IP, IP_RECVERR, (char *)&do_recverr,
80                            sizeof(do_recverr));
81 #endif
82     TO_KERNEL_SPACE();
83     return (osi_socket *)sockp;
84 }
85
86 osi_socket *
87 rxk_NewSocket(short aport)
88 {
89     return rxk_NewSocketHost(htonl(INADDR_ANY), aport);
90 }
91
92 /* free socket allocated by osi_NetSocket */
93 int
94 rxk_FreeSocket(struct socket *asocket)
95 {
96     AFS_STATCNT(osi_FreeSocket);
97     return 0;
98 }
99
100 #ifdef ADAPT_PMTU
101 void
102 handle_socket_error(osi_socket so)
103 {
104     KERNEL_SPACE_DECL;
105     struct msghdr msg;
106     struct cmsghdr *cmsg;
107     struct sock_extended_err *err;
108     struct sockaddr_in addr;
109     struct sockaddr *offender;
110     char *controlmsgbuf;
111     int code;
112     struct socket *sop = (struct socket *)so;
113
114     if (!(controlmsgbuf=rxi_Alloc(256)))
115         return;
116     msg.msg_name = &addr;
117     msg.msg_namelen = sizeof(addr);
118     msg.msg_iov = NULL;
119     msg.msg_iovlen = 0;
120     msg.msg_control = controlmsgbuf;
121     msg.msg_controllen = 256;
122     msg.msg_flags = 0;
123
124     TO_USER_SPACE();
125     code = sock_recvmsg(sop, &msg, 256, MSG_ERRQUEUE|MSG_DONTWAIT|MSG_TRUNC);
126     TO_KERNEL_SPACE();
127
128     if (code < 0 || !(msg.msg_flags & MSG_ERRQUEUE))
129         goto out;
130
131     for (cmsg = CMSG_FIRSTHDR(&msg); cmsg; cmsg = CMSG_NXTHDR(&msg, cmsg)) {
132         if (CMSG_OK(&msg, cmsg) && cmsg->cmsg_level == SOL_IP &&
133             cmsg->cmsg_type == IP_RECVERR)
134             break;
135     }
136     if (!cmsg)
137         goto out;
138     err = CMSG_DATA(cmsg);
139     offender = SO_EE_OFFENDER(err);
140     
141     if (offender->sa_family != AF_INET)
142        goto out;
143
144     memcpy(&addr, offender, sizeof(addr));
145
146     if (err->ee_origin == SO_EE_ORIGIN_ICMP &&
147         err->ee_type == ICMP_DEST_UNREACH &&
148         err->ee_code == ICMP_FRAG_NEEDED) {
149         rxi_SetPeerMtu(ntohl(addr.sin_addr.s_addr), ntohs(addr.sin_port),
150                        err->ee_info);
151     }
152     /* other DEST_UNREACH's and TIME_EXCEEDED should be dealt with too */
153
154 out:
155     rxi_Free(controlmsgbuf, 256);
156     return;
157 }
158 #endif
159
160 /* osi_NetSend
161  *
162  * Return codes:
163  * 0 = success
164  * non-zero = failure
165  */
166 int
167 osi_NetSend(osi_socket sop, struct sockaddr_in *to, struct iovec *iovec,
168             int iovcnt, afs_int32 size, int istack)
169 {
170     KERNEL_SPACE_DECL;
171     struct msghdr msg;
172     int code;
173 #ifdef ADAPT_PMTU
174     int sockerr;
175     size_t esize;
176
177     while (1) {
178         sockerr=0;
179         esize = sizeof(sockerr);
180         TO_USER_SPACE();
181         sop->ops->getsockopt(sop, SOL_SOCKET, SO_ERROR, (char *)&sockerr,
182                            &esize);
183         TO_KERNEL_SPACE();
184         if (sockerr == 0)
185            break;
186         handle_socket_error(sop);
187     }
188 #endif
189
190     msg.msg_iovlen = iovcnt;
191     msg.msg_iov = iovec;
192     msg.msg_name = to;
193     msg.msg_namelen = sizeof(*to);
194     msg.msg_control = NULL;
195     msg.msg_controllen = 0;
196     msg.msg_flags = 0;
197
198     TO_USER_SPACE();
199     code = sock_sendmsg(sop, &msg, size);
200     TO_KERNEL_SPACE();
201     return (code < 0) ? code : 0;
202 }
203
204
205 /* osi_NetReceive
206  * OS dependent part of kernel RX listener thread.
207  *
208  * Arguments:
209  *      so      socket to receive on, typically rx_socket
210  *      from    pointer to a sockaddr_in. 
211  *      iov     array of iovecs to fill in.
212  *      iovcnt  how many iovecs there are.
213  *      lengthp IN/OUT in: total space available in iovecs. out: size of read.
214  *
215  * Return
216  * 0 if successful
217  * error code (such as EINTER) if not
218  *
219  * Environment
220  *      Note that the maximum number of iovecs is 2 + RX_MAXWVECS. This is
221  *      so we have a little space to look for packets larger than 
222  *      rx_maxReceiveSize.
223  */
224 int rxk_lastSocketError;
225 int rxk_nSocketErrors;
226 int
227 osi_NetReceive(osi_socket so, struct sockaddr_in *from, struct iovec *iov,
228                int iovcnt, int *lengthp)
229 {
230     KERNEL_SPACE_DECL;
231     struct msghdr msg;
232     int code;
233 #ifdef ADAPT_PMTU
234     int sockerr;
235     size_t esize;
236 #endif
237     struct iovec tmpvec[RX_MAXWVECS + 2];
238     struct socket *sop = (struct socket *)so;
239
240     if (iovcnt > RX_MAXWVECS + 2) {
241         osi_Panic("Too many (%d) iovecs passed to osi_NetReceive\n", iovcnt);
242     }
243 #ifdef ADAPT_PMTU
244     while (1) {
245         sockerr=0;
246         esize = sizeof(sockerr);
247         TO_USER_SPACE();
248         sop->ops->getsockopt(sop, SOL_SOCKET, SO_ERROR, (char *)&sockerr,
249                            &esize);
250         TO_KERNEL_SPACE();
251         if (sockerr == 0)
252            break;
253         handle_socket_error(so);
254     }
255 #endif
256     memcpy(tmpvec, iov, iovcnt * sizeof(struct iovec));
257     msg.msg_name = from;
258     msg.msg_iov = tmpvec;
259     msg.msg_iovlen = iovcnt;
260     msg.msg_control = NULL;
261     msg.msg_controllen = 0;
262     msg.msg_flags = 0;
263
264     TO_USER_SPACE();
265     code = sock_recvmsg(sop, &msg, *lengthp, 0);
266     TO_KERNEL_SPACE();
267
268     if (code < 0) {
269 #ifdef AFS_LINUX26_ENV
270 #ifdef CONFIG_PM
271         if (
272 #ifdef PF_FREEZE
273             current->flags & PF_FREEZE
274 #else
275 #if defined(STRUCT_TASK_STRUCT_HAS_TODO)
276             !current->todo
277 #else
278 #if defined(STRUCT_TASK_STRUCT_HAS_THREAD_INFO)
279             test_ti_thread_flag(current->thread_info, TIF_FREEZE)
280 #else
281             test_ti_thread_flag(task_thread_info(current), TIF_FREEZE)
282 #endif
283 #endif
284 #endif
285             )
286 #ifdef LINUX_REFRIGERATOR_TAKES_PF_FREEZE
287             refrigerator(PF_FREEZE);
288 #else
289             refrigerator();
290 #endif
291             set_current_state(TASK_INTERRUPTIBLE);
292 #endif
293 #endif
294
295         /* Clear the error before using the socket again.
296          * Oh joy, Linux has hidden header files as well. It appears we can
297          * simply call again and have it clear itself via sock_error().
298          */
299 #ifdef AFS_LINUX22_ENV
300         flush_signals(current); /* We don't want no stinkin' signals. */
301 #else
302         current->signal = 0;    /* We don't want no stinkin' signals. */
303 #endif
304         rxk_lastSocketError = code;
305         rxk_nSocketErrors++;
306     } else {
307         *lengthp = code;
308         code = 0;
309     }
310
311     return code;
312 }
313 #ifdef EXPORTED_TASKLIST_LOCK
314 extern rwlock_t tasklist_lock __attribute__((weak));
315 #endif
316 void
317 osi_StopListener(void)
318 {
319     extern struct task_struct *rxk_ListenerTask;
320
321     while (rxk_ListenerTask) {
322         if (rxk_ListenerTask) {
323             flush_signals(rxk_ListenerTask);
324             force_sig(SIGKILL, rxk_ListenerTask);
325         }
326         if (!rxk_ListenerTask)
327             break;
328         afs_osi_Sleep(&rxk_ListenerTask);
329     }
330     sock_release(rx_socket);
331     rx_socket = NULL;
332 }
333
334 #endif /* AFS_LINUX22_ENV */