c451f8087daec9a1552877ae89ab4fcc6723abf8
[openafs.git] / src / rx / rx_packet.h
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #ifndef _RX_PACKET_
11 #define _RX_PACKET_
12
13 #if defined(AFS_NT40_ENV)
14 #include "rx_xmit_nt.h"
15 #endif
16 #ifndef AFS_NT40_ENV
17 #include <sys/uio.h>
18 #endif /* !AFS_NT40_ENV */
19 /* this file includes the macros and decls which depend on packet
20  * format, and related packet manipulation macros.  Note that code
21  * which runs at NETPRI should not sleep, or AIX will panic */
22 /* There are some assumptions that various code makes -- I'll try to
23  * express them all here:
24  * 1.  rx_ReceiveAckPacket assumes that it can get an entire ack
25  * contiguous in the first iovec.  As a result, the iovec buffers must
26  * be >= sizeof (struct rx_ackpacket)
27  * 2. All callers of rx_Pullup besides rx_ReceiveAckPacket try to pull
28  * up less data than rx_ReceiveAckPacket does.
29  * 3. rx_GetInt32 and rx_PutInt32 (and the slow versions of same) assume
30  * that the iovec buffers are all integral multiples of the word size,
31  * and that the offsets are as well.
32  */
33
34
35 #if defined(AFS_NT40_ENV)
36 # ifndef MIN
37 #  define MIN(a,b)  ((a)<(b)?(a):(b))
38 # endif
39 # ifndef MAX
40 #  define MAX(a,b)  ((a)>(b)?(a):(b))
41 # endif
42 #else /* AFS_NT40_ENV */
43 # if !defined(AFS_DARWIN_ENV) && !defined(AFS_USR_DARWIN_ENV)   \
44     && !defined(AFS_XBSD_ENV) && !defined(AFS_USR_FBSD_ENV)     \
45     && !defined(AFS_USR_DFBSD_ENV) && !defined(AFS_LINUX20_ENV)
46 #  include <sys/sysmacros.h>    /* MIN, MAX on most commercial UNIX */
47 # endif
48 /* Linux 3.7 doesn't have sys/param.h in kernel space, and afs/param.h ensures
49  * that MIN and MAX are available for kernel builds. */
50 # if !(defined(AFS_LINUX26_ENV) && defined(KERNEL))
51 #  include <sys/param.h>        /* MIN, MAX elsewhere */
52 # endif
53 #endif /* !AFS_NT40_ENV */
54
55 #define IPv6_HDR_SIZE           40      /* IPv6 Header */
56 #define IPv6_FRAG_HDR_SIZE       8      /* IPv6 Fragment Header */
57 #define UDP_HDR_SIZE             8      /* UDP Header */
58 #define RX_IP_SIZE              (IPv6_HDR_SIZE + IPv6_FRAG_HDR_SIZE)
59 #define _RX_IPUDP_SIZE          (RX_IP_SIZE + UDP_HDR_SIZE)
60
61 /* REMOTE_PACKET_SIZE is currently the same as local.  This is because REMOTE
62  * is defined much too generally for my tastes, and includes the case of
63  * multiple class C nets connected with a router within one campus or MAN.
64  * I don't want to make local performance suffer just because of some
65  * out-dated protocol that used to be in use on the NSFANET that's
66  * practically unused anymore.  Any modern IP implementation will be
67  * using MTU discovery, and even old routers shouldn't frag packets
68  * when sending from one connected network directly to another.  Maybe
69  * the next release of RX will do MTU discovery. */
70
71 /* MTUXXX the various "MAX" params here must be rationalized.  From now on,
72  * the MAX packet size will be the maximum receive size, but the maximum send
73  * size will be larger than that. */
74
75 #ifdef notdef
76 /*  some sample MTUs
77            4352   what FDDI(RFC1188) uses... Larger?
78            4096   VJ's recommendation for FDDI
79           17914   what IBM 16MB TR  uses
80            8166   IEEE 802.4
81            4464   IEEE 802.5 MAX
82            2002   IEEE 802.5 Recommended
83            1500   what Ethernet uses
84            1492   what 802.3 uses ( 8 bytes for 802.2 SAP )
85            9180   Classical IP over ATM (RFC2225)
86 */
87
88 /* * * * these are the old defines
89 */
90 #define RX_MAX_PACKET_SIZE      (RX_MAX_DL_MTU -RX_IPUDP_SIZE)
91
92 #define RX_MAX_PACKET_DATA_SIZE (RX_MAX_PACKET_SIZE-RX_HEADER_SIZE)
93 #ifdef AFS_HPUX_ENV
94 /* HPUX by default uses an 802.3 size, and it's not evident from SIOCGIFCONF */
95 #define RX_LOCAL_PACKET_SIZE    (1492 - RX_IPUDP_SIZE)
96 #define RX_REMOTE_PACKET_SIZE   (1492 - RX_IPUDP_SIZE)
97 #else
98 #define RX_LOCAL_PACKET_SIZE    RX_MAX_PACKET_SIZE      /* For hosts on same net */
99 #define RX_REMOTE_PACKET_SIZE   RX_MAX_PACKET_SIZE      /* see note above */
100 #endif
101 #endif /* notdef */
102
103 /* These are the new, streamlined ones.
104  */
105 #define RX_HEADER_SIZE          sizeof (struct rx_header)
106
107 /* The minimum MTU for an IP network is 576 bytes including headers */
108 #define RX_MIN_PACKET_SIZE      (576 - RX_IPUDP_SIZE)
109 #define RX_PP_PACKET_SIZE       RX_MIN_PACKET_SIZE
110 #define _RX_MIN_PACKET_SIZE      (576 - _RX_IPUDP_SIZE)
111 #define _RX_PP_PACKET_SIZE      _RX_MIN_PACKET_SIZE
112
113 #define OLD_MAX_PACKET_SIZE     (1500 - RX_IPUDP_SIZE)
114 #define _OLD_MAX_PACKET_SIZE    (1500 - _RX_IPUDP_SIZE)
115
116 /* if the other guy is not on the local net, use this size */
117 #define RX_REMOTE_PACKET_SIZE   (1500 - RX_IPUDP_SIZE)
118 #define _RX_REMOTE_PACKET_SIZE  (1500 - _RX_IPUDP_SIZE)
119
120 /* for now, never send more data than this */
121 #define RX_MAX_PACKET_SIZE      16384
122 #define RX_MAX_PACKET_DATA_SIZE (16384 - RX_HEADER_SIZE)
123
124 /* Packet types, for rx_packet.type */
125 #define RX_PACKET_TYPE_DATA         1   /* A vanilla data packet */
126 #define RX_PACKET_TYPE_ACK          2   /* Acknowledge packet */
127 #define RX_PACKET_TYPE_BUSY         3   /* Busy: can't accept call immediately; try later */
128 #define RX_PACKET_TYPE_ABORT        4   /* Abort packet.  No response needed. */
129 #define RX_PACKET_TYPE_ACKALL       5   /* Acknowledges receipt of all packets */
130 #define RX_PACKET_TYPE_CHALLENGE    6   /* Challenge client's identity: request credentials */
131 #define RX_PACKET_TYPE_RESPONSE     7   /* Respond to challenge packet */
132 #define RX_PACKET_TYPE_DEBUG        8   /* Get debug information */
133
134 #define RX_PACKET_TYPE_PARAMS       9   /* exchange size params (showUmine) */
135 #define RX_PACKET_TYPE_VERSION     13   /* get AFS version */
136
137 /* Flags for rx_header flags field */
138 #define RX_CLIENT_INITIATED     1       /* Packet is sent/received from client side of call */
139 #define RX_REQUEST_ACK          2       /* Peer requests acknowledgement */
140 #define RX_LAST_PACKET          4       /* This is the last packet from this side of the call */
141 #define RX_MORE_PACKETS         8       /* There are more packets following this,
142                                          * i.e. the next sequence number seen by
143                                          * the receiver should be greater than
144                                          * this one, rather than a resend of an
145                                          * earlier sequence number */
146 #define RX_SLOW_START_OK        32      /* Set this flag in an ack packet to
147                                          * inform the sender that slow start is
148                                          * supported by the receiver. */
149 #define RX_JUMBO_PACKET         32      /* Set this flag in a data packet to
150                                          * indicate that more packets follow
151                                          * this packet in the datagram */
152
153 /* The following flags are preset per packet, i.e. they don't change
154  * on retransmission of the packet */
155 #define RX_PRESET_FLAGS         (RX_CLIENT_INITIATED | RX_LAST_PACKET)
156
157
158 /*
159  * Flags for the packet structure itself, housekeeping for the
160  * most part.  These live in rx_packet->flags.
161  */
162 #define RX_PKTFLAG_ACKED        0x01
163 #ifdef RX_TRACK_PACKETS
164 #define RX_PKTFLAG_FREE         0x02
165 #define RX_PKTFLAG_TQ           0x04
166 #define RX_PKTFLAG_RQ           0x08
167 #define RX_PKTFLAG_IOVQ         0x10
168 #define RX_PKTFLAG_CP           0x20
169 #endif
170 #define RX_PKTFLAG_SENT         0x40
171
172 /* The rx part of the header of a packet, in host form */
173 struct rx_header {
174     afs_uint32 epoch;           /* Start time of client process */
175     afs_uint32 cid;             /* Connection id (defined by client) */
176     afs_uint32 callNumber;      /* Current call number */
177     afs_uint32 seq;             /* Sequence number of this packet, within this call */
178     afs_uint32 serial;          /* Serial number of this packet: a new serial
179                                  * number is stamped on each packet sent out */
180     u_char type;                /* RX packet type */
181     u_char flags;               /* Flags, defined below */
182     u_char userStatus;          /* User defined status information,
183                                  * returned/set by macros
184                                  * rx_Get/SetLocal/RemoteStatus */
185     u_char securityIndex;       /* Which service-defined security method to use */
186     u_short serviceId;          /* service this packet is directed _to_ */
187     /* This spare is now used for packet header checkksum.  see
188      * rxi_ReceiveDataPacket and packet cksum macros above for details. */
189     u_short spare;
190 };
191
192 /* The abbreviated header for jumbo packets. Most fields in the
193  * jumbo packet headers are either the same as or can be quickly
194  * derived from their counterparts in the main packet header.
195  */
196 struct rx_jumboHeader {
197     u_char flags;               /* Flags, defined below */
198     u_char spare1;
199     u_short cksum;              /* packet header checksum */
200 };
201
202
203
204 /*
205  * The values for the RX buffer sizes are calculated to ensure efficient
206  * use of network resources when sending AFS 3.5 jumbograms over Ethernet,
207  * 802.3, FDDI, and ATM networks running IPv4 or IPv6. Changing these
208  * values may affect interoperability with AFS 3.5 clients.
209  */
210
211 /*
212  * We always transmit jumbo grams so that each packet starts at the
213  * beginning of a packet buffer. Because of the requirement that all
214  * segments of a 3.4a jumbogram contain multiples of eight bytes, the
215  * receivers iovec has RX_HEADERSIZE bytes in the first element,
216  * RX_FIRSTBUFFERSIZE bytes in the second element, and RX_CBUFFERSIZE
217  * bytes in each successive entry.  All packets in a jumbogram
218  * except for the last must contain RX_JUMBOBUFFERSIZE bytes of data
219  * so the receiver can split the AFS 3.5 jumbograms back into packets
220  * without having to copy any of the data.
221  */
222 #define RX_JUMBOBUFFERSIZE 1412
223 #define RX_JUMBOHEADERSIZE 4
224 /*
225  * RX_FIRSTBUFFERSIZE must be larger than the largest ack packet,
226  * the largest possible challenge or response packet.
227  * Both Firstbuffersize and cbuffersize must be integral multiples of 8,
228  * so the security header and trailer stuff works for rxkad_crypt.  yuck.
229  */
230 #define RX_FIRSTBUFFERSIZE (RX_JUMBOBUFFERSIZE+RX_JUMBOHEADERSIZE)
231 /*
232  * The size of a continuation buffer is buffer is the same as the
233  * size of the first buffer, which must also the size of a jumbo packet
234  * buffer plus the size of a jumbo packet header. */
235 #define RX_CBUFFERSIZE (RX_JUMBOBUFFERSIZE+RX_JUMBOHEADERSIZE)
236 /*
237  * Add an extra four bytes of slop at the end of each buffer.
238  */
239 #define RX_EXTRABUFFERSIZE 4
240
241 #ifndef RX_MAXWVECS
242 #error RX_MAXWVECS not defined
243 #endif
244
245 struct rx_packet {
246     struct opr_queue entry;     /* Packets are chained using opr_queue */
247     struct clock timeSent;      /* When this packet was transmitted last */
248     afs_uint32 firstSerial;     /* Original serial number of this packet */
249     struct clock firstSent;     /* When this packet was transmitted first */
250     struct rx_header header;    /* The internal packet header */
251     unsigned int niovecs;       /* # of iovecs that potentially have data */
252     unsigned int aiovecs;       /* # of allocated iovecs */
253     struct iovec wirevec[RX_MAXWVECS + 1];      /* the new form of the packet */
254
255     u_char flags;               /* Flags for local state of this packet */
256     u_char unused;              /* was backoff, now just here for alignment */
257     u_short length;             /* Data length */
258     /* NT port relies on the fact that the next two are physically adjacent.
259      * If that assumption changes change sendmsg and recvmsg in rx_xmit_nt.c .
260      * The jumbo datagram code also relies on the next two being
261      * physically adjacent.
262      * The Linux port uses this knowledge as well in osi_NetSend.
263      *
264      * The extradata field is padding in case the recvmsg implementation
265      * writes beyond the end of the final iovec buffer.  We do not know
266      * what platforms had this problem so we are reluctant to remove it.
267      * the extradata must be adjacent to localdata.
268      * See rxk_ReadPacket and rxi_ReadPacket.
269      */
270     afs_uint32 wirehead[RX_HEADER_SIZE / sizeof(afs_int32)];
271     afs_uint32 localdata[RX_CBUFFERSIZE / sizeof(afs_int32)];
272     afs_uint32 extradata[RX_EXTRABUFFERSIZE / sizeof(afs_int32)];
273
274 #ifdef RXDEBUG_PACKET
275     /* For debugging */
276     struct rx_packet *allNextp; /* A list of all packets */
277     afs_uint32  packetId;       /* An unique id number for debugging */
278 #endif
279 };
280
281 /* Macro to convert continuation buffer pointers to packet pointers */
282 #define RX_CBUF_TO_PACKET(CP, PP) \
283     ((struct rx_packet *) \
284      ((char *)(CP) - ((char *)(&(PP)->localdata[0])-(char *)(PP))))
285
286 /* This is the address of the data portion of the packet.  Any encryption
287  * headers will be at this address, the actual data, for a data packet, will
288  * start at this address + the connection's security header size. */
289 #define rx_DataOf(packet)               ((char *) (packet)->wirevec[1].iov_base)
290 #define rx_GetDataSize(packet)          ((packet)->length)
291 #define rx_SetDataSize(packet, size)    ((packet)->length = (size))
292
293 /* These macros used in conjunction with reuse of packet header spare as a
294  * packet cksum for rxkad security module. */
295 #define rx_GetPacketCksum(packet)        ((packet)->header.spare)
296 #define rx_SetPacketCksum(packet, cksum) ((packet)->header.spare = (cksum))
297
298 #ifdef KERNEL
299 #define rxi_OverQuota(packetclass) (rx_nFreePackets - 1 < rx_packetQuota[packetclass])
300 #define rxi_OverQuota2(packetclass,num_alloc) (rx_nFreePackets - (num_alloc) < rx_packetQuota[packetclass])
301 #endif /* KERNEL */
302
303 /* this returns an afs_int32 from byte offset o in packet p.  offset must
304  * always be aligned properly for an afs_int32, I'm leaving this up to the
305  * caller. */
306 #define rx_GetInt32(p,off) (( (off) >= (p)->wirevec[1].iov_len) ? \
307    rx_SlowGetInt32((p), (off)) :  \
308   *((afs_int32 *)((char *)((p)->wirevec[1].iov_base) + (off))))
309
310 #define rx_PutInt32(p,off,b) { \
311        if ((off) >= (p)->wirevec[1].iov_len) \
312           rx_SlowPutInt32((p), (off), (b));   \
313        else *((afs_int32 *)((char *)((p)->wirevec[1].iov_base) + (off))) = b; }
314
315 #define rx_data(p, o, l) ((l=((struct rx_packet*)(p))->wirevec[(o+1)].iov_len),\
316   (((struct rx_packet*)(p))->wirevec[(o+1)].iov_base))
317
318
319 /* copy data into an RX packet */
320 #define rx_packetwrite(p, off, len, in)               \
321   ( (off) + (len) > (p)->wirevec[1].iov_len ?         \
322     rx_SlowWritePacket(p, off, len, (char*)(in)) :             \
323     ((memcpy((char*)((p)->wirevec[1].iov_base)+(off), (char *)(in), (len))),0))
324
325 /* copy data from an RX packet */
326 #define rx_packetread(p, off, len, out)               \
327   ( (off) + (len) > (p)->wirevec[1].iov_len ?         \
328     rx_SlowReadPacket(p, off, len, (char*)(out)) :             \
329     ((memcpy((char *)(out), (char*)((p)->wirevec[1].iov_base)+(off), (len))),0))
330
331 #define rx_computelen(p,l) { unsigned int i; \
332    for (l=0, i=1; i < p->niovecs; i++ ) l += p->wirevec[i].iov_len; }
333
334 /* return what the actual contiguous space is: should be min(length,size) */
335 /* The things that call this really want something like ...pullup MTUXXX  */
336 #define rx_Contiguous(p) \
337     MIN((unsigned) (p)->length, (unsigned) ((p)->wirevec[1].iov_len))
338
339 #ifndef TRUE
340 #define TRUE 1
341 #define FALSE 0
342 #endif
343
344 /* === packet-ized down to here, the following macros work temporarily */
345 /* Unfortunately, they know that the cbuf stuff isn't there. */
346
347 /* try to ensure that rx_DataOf will return a contiguous space at
348  * least size bytes long */
349 /* return what the actual contiguous space is: should be min(length,size) */
350 #define rx_Pullup(p,size)       /* this idea here is that this will make a guarantee */
351
352
353 /* The offset of the actual user's data in the packet, skipping any
354  * security header */
355 /* DEPRECATED */
356 #define rx_UserDataOf(conn, packet)     (((char *) (packet)->wirevec[1].iov_base) + (conn)->securityHeaderSize)
357
358 #ifdef AFS_NT40_ENV
359 /* Debugging for Windows Cache Manager - fs memdump */
360 int rx_DumpPackets(FILE *outputFile, char *cookie);
361 #endif /* AFS_NT40_ENV */
362
363 #endif /* _RX_PACKET_ */