rx-retain-windowing-per-peer-20080508
[openafs.git] / src / rx / rx.h
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #ifdef KDUMP_RX_LOCK
11 /* kdump for SGI needs MP and SP versions of rx_serverQueueEntry,
12  * rx_peer, rx_connection and rx_call structs. rx.h gets included a
13  * second time to pick up mp_ versions of those structs. Currently
14  * the affected struct's have #ifdef's in them for the second pass.
15  * This should change once we start using only ANSI compilers.
16  * Actually, kdump does not use rx_serverQueueEntry, but I'm including
17  * it for completeness.
18  */
19 #undef _RX_
20 #endif
21
22 #ifndef _RX_
23 #define _RX_
24
25 #ifndef KDUMP_RX_LOCK
26 #ifdef  KERNEL
27 #include "rx_kmutex.h"
28 #include "rx_kernel.h"
29 #include "rx_clock.h"
30 #include "rx_event.h"
31 #include "rx_queue.h"
32 #include "rx_packet.h"
33 #include "rx_misc.h"
34 #include "rx_multi.h"
35 #if defined (AFS_OBSD_ENV) && !defined (MLEN)
36 #include "sys/mbuf.h"
37 #endif
38 #include "netinet/in.h"
39 #include "sys/socket.h"
40 #else /* KERNEL */
41 # include <sys/types.h>
42 # include <stdio.h>
43 # include <string.h>
44 #ifdef AFS_PTHREAD_ENV
45 # include "rx_pthread.h"
46 #else
47 # include "rx_lwp.h"
48 #endif
49 #ifdef AFS_NT40_ENV
50 #include <malloc.h>
51 #include <winsock2.h>
52 #include <ws2tcpip.h>
53 #endif
54 # include "rx_user.h"
55 # include "rx_clock.h"
56 # include "rx_event.h"
57 # include "rx_packet.h"
58 # include "rx_misc.h"
59 # include "rx_null.h"
60 # include "rx_multi.h"
61 #ifndef AFS_NT40_ENV
62 # include <netinet/in.h>
63 # include <sys/socket.h>
64 #endif
65 #endif /* KERNEL */
66
67
68 /* Configurable parameters */
69 #define RX_IDLE_DEAD_TIME       60      /* default idle dead time */
70 #define RX_MAX_SERVICES         20      /* Maximum number of services that may be installed */
71 #if defined(KERNEL) && defined(AFS_AIX51_ENV) && defined(__64__)
72 #define RX_DEFAULT_STACK_SIZE   24000
73 #else
74 #define RX_DEFAULT_STACK_SIZE   16000   /* Default process stack size; overriden by rx_SetStackSize */
75 #endif
76
77 /* This parameter should not normally be changed */
78 #define RX_PROCESS_PRIORITY     LWP_NORMAL_PRIORITY
79
80 /* backoff is fixed point binary.  Ie, units of 1/4 seconds */
81 #define MAXBACKOFF 0x1F
82
83 #define ADDRSPERSITE 16
84
85 #ifndef KDUMP_RX_LOCK
86 /* Bottom n-bits of the Call Identifier give the call number */
87 #define RX_MAXCALLS 4           /* Power of 2; max async calls per connection */
88 #define RX_CIDSHIFT 2           /* Log2(RX_MAXCALLS) */
89 #define RX_CHANNELMASK (RX_MAXCALLS-1)
90 #define RX_CIDMASK  (~RX_CHANNELMASK)
91 #endif /* !KDUMP_RX_LOCK */
92
93 #ifndef KERNEL
94 typedef void (*rx_destructor_t) (void *);
95 int rx_KeyCreate(rx_destructor_t);
96 osi_socket rxi_GetHostUDPSocket(u_int host, u_short port);
97 osi_socket rxi_GetUDPSocket(u_short port);
98 #endif /* KERNEL */
99
100
101 int ntoh_syserr_conv(int error);
102
103 #define RX_WAIT     1
104 #define RX_DONTWAIT 0
105
106 #define rx_ConnectionOf(call)           ((call)->conn)
107 #define rx_PeerOf(conn)                 ((conn)->peer)
108 #define rx_HostOf(peer)                 ((peer)->host)
109 #define rx_PortOf(peer)                 ((peer)->port)
110 #define rx_SetLocalStatus(call, status) ((call)->localStatus = (status))
111 #define rx_GetLocalStatus(call, status) ((call)->localStatus)
112 #define rx_GetRemoteStatus(call)        ((call)->remoteStatus)
113 #define rx_Error(call)                  ((call)->error)
114 #define rx_ConnError(conn)              ((conn)->error)
115 #define rx_IsServerConn(conn)           ((conn)->type == RX_SERVER_CONNECTION)
116 #define rx_IsClientConn(conn)           ((conn)->type == RX_CLIENT_CONNECTION)
117 /* Don't use these; use the IsServerConn style */
118 #define rx_ServerConn(conn)             ((conn)->type == RX_SERVER_CONNECTION)
119 #define rx_ClientConn(conn)             ((conn)->type == RX_CLIENT_CONNECTION)
120 #define rx_IsUsingPktCksum(conn)        ((conn)->flags & RX_CONN_USING_PACKET_CKSUM)
121 #define rx_ServiceIdOf(conn)            ((conn)->serviceId)
122 #define rx_SecurityClassOf(conn)        ((conn)->securityIndex)
123 #define rx_SecurityObjectOf(conn)       ((conn)->securityObject)
124
125 /*******************
126  * Macros callable by the user to further define attributes of a
127  * service.  Must be called before rx_StartServer
128  */
129
130 /* Set the service stack size.  This currently just sets the stack
131  * size for all processes to be the maximum seen, so far */
132 #define rx_SetStackSize(service, stackSize) \
133   rx_stackSize = (((stackSize) > rx_stackSize)? stackSize: rx_stackSize)
134
135 /* Set minimum number of processes guaranteed to be available for this
136  * service at all times */
137 #define rx_SetMinProcs(service, min) ((service)->minProcs = (min))
138
139 /* Set maximum number of processes that will be made available to this
140  * service (also a guarantee that this number will be made available
141  * if there is no competition) */
142 #define rx_SetMaxProcs(service, max) ((service)->maxProcs = (max))
143
144 /* Define a procedure to be called just before a server connection is destroyed */
145 #define rx_SetDestroyConnProc(service,proc) ((service)->destroyConnProc = (proc))
146
147 /* Define procedure to set service dead time */
148 #define rx_SetIdleDeadTime(service,time) ((service)->idleDeadTime = (time))
149
150 /* Define procedures for getting and setting before and after execute-request procs */
151 #define rx_SetAfterProc(service,proc) ((service)->afterProc = (proc))
152 #define rx_SetBeforeProc(service,proc) ((service)->beforeProc = (proc))
153 #define rx_GetAfterProc(service) ((service)->afterProc)
154 #define rx_GetBeforeProc(service) ((service)->beforeProc)
155
156 /* Define a procedure to be called when a server connection is created */
157 #define rx_SetNewConnProc(service, proc) ((service)->newConnProc = (proc))
158
159 /* NOTE:  We'll probably redefine the following three routines, again, sometime. */
160
161 /* Set the connection dead time for any connections created for this service (server only) */
162 #define rx_SetServiceDeadTime(service, seconds) ((service)->secondsUntilDead = (seconds))
163
164 /* Enable or disable asymmetric client checking for a service */
165 #define rx_SetCheckReach(service, x) ((service)->checkReach = (x))
166
167 /* Set connection hard and idle timeouts for a connection */
168 #define rx_SetConnHardDeadTime(conn, seconds) ((conn)->hardDeadTime = (seconds))
169 #define rx_SetConnIdleDeadTime(conn, seconds) ((conn)->idleDeadTime = (seconds))
170
171 /* Set the overload threshold and the overload error */
172 #define rx_SetBusyThreshold(threshold, code) (rx_BusyThreshold=(threshold),rx_BusyError=(code))
173
174 /* If this flag is set,no new requests are processed by rx, all new requests are
175 returned with an error code of RX_CALL_DEAD ( transient error ) */
176 #define rx_SetRxTranquil()              (rx_tranquil = 1)
177 #define rx_ClearRxTranquil()            (rx_tranquil = 0)
178
179 /* Set the threshold and time to delay aborts for consecutive errors */
180 #define rx_SetCallAbortThreshold(A) (rxi_callAbortThreshhold = (A))
181 #define rx_SetCallAbortDelay(A) (rxi_callAbortDelay = (A))
182 #define rx_SetConnAbortThreshold(A) (rxi_connAbortThreshhold = (A))
183 #define rx_SetConnAbortDelay(A) (rxi_connAbortDelay = (A))
184
185 #define rx_GetCallAbortCode(call) ((call)->abortCode)
186 #define rx_SetCallAbortCode(call, code) ((call)->abortCode = (code))
187
188 #define cpspace(call) ((call)->curlen)
189 #define cppos(call) ((call)->curpos)
190
191 #define rx_Read(call, buf, nbytes)   rx_ReadProc(call, buf, nbytes)
192 #define rx_Read32(call, value)   rx_ReadProc32(call, value)
193 #define rx_Readv(call, iov, nio, maxio, nbytes) \
194    rx_ReadvProc(call, iov, nio, maxio, nbytes)
195 #define rx_Write(call, buf, nbytes) rx_WriteProc(call, buf, nbytes)
196 #define rx_Write32(call, value) rx_WriteProc32(call, value)
197 #define rx_Writev(call, iov, nio, nbytes) \
198    rx_WritevProc(call, iov, nio, nbytes)
199
200 /* This is the maximum size data packet that can be sent on this connection, accounting for security module-specific overheads. */
201 #define rx_MaxUserDataSize(call)                ((call)->MTU - RX_HEADER_SIZE - (call)->conn->securityHeaderSize - (call)->conn->securityMaxTrailerSize)
202
203 /* Macros to turn the hot thread feature on and off. Enabling hot threads
204  * allows the listener thread to trade places with an idle worker thread,
205  * which moves the context switch from listener to worker out of the
206  * critical path.
207  */
208 #define rx_EnableHotThread()            (rx_enable_hot_thread = 1)
209 #define rx_DisableHotThread()           (rx_enable_hot_thread = 0)
210
211 #define rx_PutConnection(conn) rx_DestroyConnection(conn)
212
213 /* A connection is an authenticated communication path, allowing 
214    limited multiple asynchronous conversations. */
215 #ifdef KDUMP_RX_LOCK
216 struct rx_connection_rx_lock {
217     struct rx_connection_rx_lock *next; /*  on hash chain _or_ free list */
218     struct rx_peer_rx_lock *peer;
219 #else
220 struct rx_connection {
221     struct rx_connection *next; /*  on hash chain _or_ free list */
222     struct rx_peer *peer;
223 #endif
224 #ifdef  RX_ENABLE_LOCKS
225     afs_kmutex_t conn_call_lock;        /* locks conn_call_cv */
226     afs_kcondvar_t conn_call_cv;
227     afs_kmutex_t conn_data_lock;        /* locks packet data */
228 #endif
229     afs_uint32 epoch;           /* Process start time of client side of connection */
230     afs_uint32 cid;             /* Connection id (call channel is bottom bits) */
231     afs_int32 error;            /* If this connection is in error, this is it */
232 #ifdef KDUMP_RX_LOCK
233     struct rx_call_rx_lock *call[RX_MAXCALLS];
234 #else
235     struct rx_call *call[RX_MAXCALLS];
236 #endif
237     afs_uint32 callNumber[RX_MAXCALLS]; /* Current call numbers */
238     afs_uint32 rwind[RX_MAXCALLS];
239     u_short twind[RX_MAXCALLS];
240     afs_uint32 serial;          /* Next outgoing packet serial number */
241     afs_uint32 lastSerial;      /* # of last packet received, for computing skew */
242     afs_int32 maxSerial;        /* largest serial number seen on incoming packets */
243 /*    afs_int32 maxPacketSize;    max packet size should be per-connection since */
244     /* peer process could be restarted on us. Includes RX Header.       */
245     struct rxevent *challengeEvent;     /* Scheduled when the server is challenging a     */
246     struct rxevent *delayedAbortEvent;  /* Scheduled to throttle looping client */
247     struct rxevent *checkReachEvent;    /* Scheduled when checking reachability */
248     int abortCount;             /* count of abort messages sent */
249     /* client-- to retransmit the challenge */
250     struct rx_service *service; /* used by servers only */
251     u_short serviceId;          /* To stamp on requests (clients only) */
252     afs_uint32 refCount;                /* Reference count */
253     u_char flags;               /* Defined below */
254     u_char type;                /* Type of connection, defined below */
255     u_char secondsUntilPing;    /* how often to ping for each active call */
256     u_char securityIndex;       /* corresponds to the security class of the */
257     /* securityObject for this conn */
258     struct rx_securityClass *securityObject;    /* Security object for this connection */
259     void *securityData;         /* Private data for this conn's security class */
260     u_short securityHeaderSize; /* Length of security module's packet header data */
261     u_short securityMaxTrailerSize;     /* Length of security module's packet trailer data */
262
263     int timeout;                /* Overall timeout per call (seconds) for this conn */
264     int lastSendTime;           /* Last send time for this connection */
265     u_short secondsUntilDead;   /* Maximum silence from peer before RX_CALL_DEAD */
266     u_short hardDeadTime;       /* hard max for call execution */
267     u_short idleDeadTime;       /* max time a call can be idle (no data) */
268     u_char ackRate;             /* how many packets between ack requests */
269     u_char makeCallWaiters;     /* how many rx_NewCalls are waiting */
270     int nSpecific;              /* number entries in specific data */
271     void **specific;            /* pointer to connection specific data */
272 };
273
274
275 /* A service is installed by rx_NewService, and specifies a service type that
276  * is exported by this process.  Incoming calls are stamped with the service
277  * type, and must match an installed service for the call to be accepted.
278  * Each service exported has a (port,serviceId) pair to uniquely identify it.
279  * It is also named:  this is intended to allow a remote statistics gathering
280  * program to retrieve per service statistics without having to know the local
281  * service id's.  Each service has a number of
282  */
283
284 /* security objects (instances of security classes) which implement
285  * various types of end-to-end security protocols for connections made
286  * to this service.  Finally, there are two parameters controlling the
287  * number of requests which may be executed in parallel by this
288  * service: minProcs is the number of requests to this service which
289  * are guaranteed to be able to run in parallel at any time; maxProcs
290  * has two meanings: it limits the total number of requests which may
291  * execute in parallel and it also guarantees that that many requests
292  * may be handled in parallel if no other service is handling any
293  * requests. */
294
295 struct rx_service {
296     u_short serviceId;          /* Service number */
297     afs_uint32 serviceHost;     /* IP address for this service */
298     u_short servicePort;        /* UDP port for this service */
299     char *serviceName;          /* Name of the service */
300     osi_socket socket;          /* socket structure or file descriptor */
301     u_short nRequestsRunning;   /* Number of requests currently in progress */
302     u_short nSecurityObjects;   /* Number of entries in security objects array */
303     struct rx_securityClass **securityObjects;  /* Array of security class objects */
304       afs_int32(*executeRequestProc) (struct rx_call * acall);  /* Routine to call when an rpc request is received */
305     void (*destroyConnProc) (struct rx_connection * tcon);      /* Routine to call when a server connection is destroyed */
306     void (*newConnProc) (struct rx_connection * tcon);  /* Routine to call when a server connection is created */
307     void (*beforeProc) (struct rx_call * acall);        /* routine to call before a call is executed */
308     void (*afterProc) (struct rx_call * acall, afs_int32 code); /* routine to call after a call is executed */
309     u_short maxProcs;           /* Maximum procs to be used for this service */
310     u_short minProcs;           /* Minimum # of requests guaranteed executable simultaneously */
311     u_short connDeadTime;       /* Seconds until a client of this service will be declared dead, if it is not responding */
312     u_short idleDeadTime;       /* Time a server will wait for I/O to start up again */
313     u_char checkReach;          /* Check for asymmetric clients? */
314 };
315
316 #endif /* KDUMP_RX_LOCK */
317
318 /* A server puts itself on an idle queue for a service using an
319  * instance of the following structure.  When a call arrives, the call
320  * structure pointer is placed in "newcall", the routine to execute to
321  * service the request is placed in executeRequestProc, and the
322  * process is woken up.  The queue entry's address is used for the
323  * sleep/wakeup. If socketp is non-null, then this thread is willing
324  * to become a listener thread. A thread sets *socketp to -1 before
325  * sleeping. If *socketp is not -1 when the thread awakes, it is now
326  * the listener thread for *socketp. When socketp is non-null, tno
327  * contains the server's threadID, which is used to make decitions in GetCall.
328  */
329 #ifdef KDUMP_RX_LOCK
330 struct rx_serverQueueEntry_rx_lock {
331 #else
332 struct rx_serverQueueEntry {
333 #endif
334     struct rx_queue queueItemHeader;
335 #ifdef KDUMP_RX_LOCK
336     struct rx_call_rx_lock *newcall;
337 #else
338     struct rx_call *newcall;
339 #endif
340 #ifdef  RX_ENABLE_LOCKS
341     afs_kmutex_t lock;
342     afs_kcondvar_t cv;
343 #endif
344     int tno;
345     osi_socket *socketp;
346 };
347
348
349 /* A peer refers to a peer process, specified by a (host,port) pair.  There may be more than one peer on a given host. */
350 #ifdef KDUMP_RX_LOCK
351 struct rx_peer_rx_lock {
352     struct rx_peer_rx_lock *next;       /* Next in hash conflict or free list */
353 #else
354 struct rx_peer {
355     struct rx_peer *next;       /* Next in hash conflict or free list */
356 #endif
357 #ifdef RX_ENABLE_LOCKS
358     afs_kmutex_t peer_lock;     /* Lock peer */
359 #endif                          /* RX_ENABLE_LOCKS */
360     afs_uint32 host;            /* Remote IP address, in net byte order */
361     u_short port;               /* Remote UDP port, in net byte order */
362
363     /* interface mtu probably used for this host  -  includes RX Header */
364     u_short ifMTU;              /* doesn't include IP header */
365
366     /* For garbage collection */
367     afs_uint32 idleWhen;        /* When the refcountwent to zero */
368     afs_uint32 refCount;                /* Reference count for this structure */
369
370     /* Congestion control parameters */
371     u_char burstSize;           /* Reinitialization size for the burst parameter */
372     u_char burst;               /* Number of packets that can be transmitted right now, without pausing */
373     struct clock burstWait;     /* Delay until new burst is allowed */
374     struct rx_queue congestionQueue;    /* Calls that are waiting for non-zero burst value */
375     int rtt;                    /* Round trip time, measured in milliseconds/8 */
376     int rtt_dev;                /* rtt smoothed error, in milliseconds/4 */
377     struct clock timeout;       /* Current retransmission delay */
378     int nSent;                  /* Total number of distinct data packets sent, not including retransmissions */
379     int reSends;                /* Total number of retransmissions for this peer, since this structure was created */
380
381 /* Skew: if a packet is received N packets later than expected (based
382  * on packet serial numbers), then we define it to have a skew of N.
383  * The maximum skew values allow us to decide when a packet hasn't
384  * been received yet because it is out-of-order, as opposed to when it
385  * is likely to have been dropped. */
386     afs_uint32 inPacketSkew;    /* Maximum skew on incoming packets */
387     afs_uint32 outPacketSkew;   /* Peer-reported max skew on our sent packets */
388     int rateFlag;               /* Flag for rate testing (-no 0yes +decrement) */
389
390     /* the "natural" MTU, excluding IP,UDP headers, is negotiated by the endpoints */
391     u_short natMTU;
392     u_short maxMTU;
393     /* negotiated maximum number of packets to send in a single datagram. */
394     u_short maxDgramPackets;
395     /* local maximum number of packets to send in a single datagram. */
396     u_short ifDgramPackets;
397     /*
398      * MTU, cwind, and nDgramPackets are used to initialize
399      * slow start parameters for new calls. These values are set whenever a
400      * call sends a retransmission and at the end of each call.
401      * congestSeq is incremented each time the congestion parameters are
402      * changed by a call recovering from a dropped packet. A call used
403      * MAX when updating congestion parameters if it started with the
404      * current congestion sequence number, otherwise it uses MIN.
405      */
406     u_short MTU;                /* MTU for AFS 3.4a jumboGrams */
407     u_short cwind;              /* congestion window */
408     u_short nDgramPackets;      /* number packets per AFS 3.5 jumbogram */
409     u_short congestSeq;         /* Changed when a call retransmits */
410     afs_hyper_t bytesSent;      /* Number of bytes sent to this peer */
411     afs_hyper_t bytesReceived;  /* Number of bytes received from this peer */
412     struct rx_queue rpcStats;   /* rpc statistic list */
413     int lastReachTime;          /* Last time we verified reachability */
414 };
415
416
417 #ifndef KDUMP_RX_LOCK
418 /* Flag bits for connection structure */
419 #define RX_CONN_MAKECALL_WAITING    1   /* rx_MakeCall is waiting for a channel */
420 #define RX_CONN_DESTROY_ME          2   /* Destroy *client* connection after last call */
421 #define RX_CONN_USING_PACKET_CKSUM  4   /* non-zero header.spare field seen */
422 #define RX_CONN_KNOW_WINDOW         8   /* window size negotiation works */
423 #define RX_CONN_RESET              16   /* connection is reset, remove */
424 #define RX_CONN_BUSY               32   /* connection is busy; don't delete */
425 #define RX_CONN_ATTACHWAIT         64   /* attach waiting for peer->lastReach */
426
427 /* Type of connection, client or server */
428 #define RX_CLIENT_CONNECTION    0
429 #define RX_SERVER_CONNECTION    1
430 #endif /* !KDUMP_RX_LOCK */
431
432 /* Call structure:  only instantiated for active calls and dallying server calls.  The permanent call state (i.e. the call number as well as state shared with other calls associated with this connection) is maintained in the connection structure. */
433 #ifdef KDUMP_RX_LOCK
434 struct rx_call_rx_lock {
435 #else
436 struct rx_call {
437 #endif
438     struct rx_queue queue_item_header;  /* Call can be on various queues (one-at-a-time) */
439     struct rx_queue tq;         /* Transmit packet queue */
440     struct rx_queue rq;         /* Receive packet queue */
441     /*
442      * The following fields are accessed while the call is unlocked.
443      * These fields are used by the caller/server thread to marshall
444      * and unmarshall RPC data. The only time they may be changed by
445      * other threads is when the RX_CALL_IOVEC_WAIT flag is set. 
446      * 
447      * NOTE: Be sure that these fields start and end on a double
448      *       word boundary. Otherwise threads that are changing
449      *       adjacent fields will cause problems.
450      */
451     struct rx_queue iovq;       /* readv/writev packet queue */
452     u_short nLeft;              /* Number bytes left in first receive packet */
453     u_short curvec;             /* current iovec in currentPacket */
454     u_short curlen;             /* bytes remaining in curvec */
455     u_short nFree;              /* Number bytes free in last send packet */
456     struct rx_packet *currentPacket;    /* Current packet being assembled or being read */
457     char *curpos;               /* current position in curvec */
458     /*
459      * End of fields accessed with call unlocked
460      */
461     u_char channel;             /* Index of call, within connection */
462     u_char state;               /* Current call state as defined below */
463     u_char mode;                /* Current mode of a call in ACTIVE state */
464 #ifdef  RX_ENABLE_LOCKS
465     afs_kmutex_t lock;          /* lock covers data as well as mutexes. */
466     afs_kmutex_t *call_queue_lock;      /* points to lock for queue we're on,
467                                          * if any. */
468     afs_kcondvar_t cv_twind;
469     afs_kcondvar_t cv_rq;
470     afs_kcondvar_t cv_tq;
471 #endif
472 #ifdef KDUMP_RX_LOCK
473     struct rx_connection_rx_lock *conn; /* Parent connection for call */
474 #else
475     struct rx_connection *conn; /* Parent connection for this call */
476 #endif
477     afs_uint32 *callNumber;     /* Pointer to call number field within connection */
478     afs_uint32 flags;           /* Some random flags */
479     u_char localStatus;         /* Local user status sent out of band */
480     u_char remoteStatus;        /* Remote user status received out of band */
481     afs_int32 error;            /* Error condition for this call */
482     afs_uint32 timeout;         /* High level timeout for this call */
483     afs_uint32 rnext;           /* Next sequence number expected to be read by rx_ReadData */
484     afs_uint32 rprev;           /* Previous packet received; used for deciding what the next packet to be received should be, in order to decide whether a negative acknowledge should be sent */
485     afs_uint32 rwind;           /* The receive window:  the peer must not send packets with sequence numbers >= rnext+rwind */
486     afs_uint32 tfirst;          /* First unacknowledged transmit packet number */
487     afs_uint32 tnext;           /* Next transmit sequence number to use */
488     u_short twind;              /* The transmit window:  we cannot assign a sequence number to a packet >= tfirst + twind */
489     u_short cwind;              /* The congestion window */
490     u_short nSoftAcked;         /* Number soft acked transmit packets */
491     u_short nextCwind;          /* The congestion window after recovery */
492     u_short nCwindAcks;         /* Number acks received at current cwind */
493     u_short ssthresh;           /* The slow start threshold */
494     u_short nDgramPackets;      /* Packets per AFS 3.5 jumbogram */
495     u_short nAcks;              /* The number of consecttive acks */
496     u_short nNacks;             /* Number packets acked that follow the
497                                  * first negatively acked packet */
498     u_short nSoftAcks;          /* The number of delayed soft acks */
499     u_short nHardAcks;          /* The number of delayed hard acks */
500     u_short congestSeq;         /* Peer's congestion sequence counter */
501     struct rxevent *resendEvent;        /* If this is non-Null, there is a retransmission event pending */
502     struct rxevent *timeoutEvent;       /* If this is non-Null, then there is an overall timeout for this call */
503     struct rxevent *keepAliveEvent;     /* Scheduled periodically in active calls to keep call alive */
504     struct rxevent *delayedAckEvent;    /* Scheduled after all packets are received to send an ack if a reply or new call is not generated soon */
505     struct rxevent *delayedAbortEvent;  /* Scheduled to throttle looping client */
506     int abortCode;              /* error code from last RPC */
507     int abortCount;             /* number of times last error was sent */
508     u_int lastSendTime;         /* Last time a packet was sent on this call */
509     u_int lastReceiveTime;      /* Last time a packet was received for this call */
510     void (*arrivalProc) (register struct rx_call * call, register void * mh, register int index);       /* Procedure to call when reply is received */
511     void *arrivalProcHandle;    /* Handle to pass to replyFunc */
512     int arrivalProcArg;         /* Additional arg to pass to reply Proc */
513     afs_uint32 lastAcked;       /* last packet "hard" acked by receiver */
514     afs_uint32 startWait;       /* time server began waiting for input data/send quota */
515     struct clock traceWait;     /* time server began waiting for input data/send quota */
516     struct clock traceStart;    /* time the call started running */
517     u_short MTU;                /* size of packets currently sending */
518 #ifdef RX_ENABLE_LOCKS
519     short refCount;             /* Used to keep calls from disappearring
520                                  * when we get them from a queue. */
521 #endif                          /* RX_ENABLE_LOCKS */
522 /* Call refcount modifiers */
523 #define RX_CALL_REFCOUNT_BEGIN  0       /* GetCall/NewCall/EndCall */
524 #define RX_CALL_REFCOUNT_RESEND 1       /* resend event */
525 #define RX_CALL_REFCOUNT_DELAY  2       /* delayed ack */
526 #define RX_CALL_REFCOUNT_ALIVE  3       /* keep alive event */
527 #define RX_CALL_REFCOUNT_PACKET 4       /* waiting for packets. */
528 #define RX_CALL_REFCOUNT_SEND   5       /* rxi_Send */
529 #define RX_CALL_REFCOUNT_ACKALL 6       /* rxi_AckAll */
530 #define RX_CALL_REFCOUNT_ABORT  7       /* delayed abort */
531 #define RX_CALL_REFCOUNT_MAX    8       /* array size. */
532 #ifdef RX_REFCOUNT_CHECK
533     short refCDebug[RX_CALL_REFCOUNT_MAX];
534 #endif                          /* RX_REFCOUNT_CHECK */
535     int iovNBytes;              /* byte count for current iovec */
536     int iovMax;                 /* number elements in current iovec */
537     int iovNext;                /* next entry in current iovec */
538     struct iovec *iov;          /* current iovec */
539     struct clock queueTime;     /* time call was queued */
540     struct clock startTime;     /* time call was started */
541     afs_hyper_t bytesSent;      /* Number bytes sent */
542     afs_hyper_t bytesRcvd;      /* Number bytes received */
543     u_short tqWaiters;
544 };
545
546 #ifndef KDUMP_RX_LOCK
547 /* Major call states */
548 #define RX_STATE_NOTINIT  0     /* Call structure has never been initialized */
549 #define RX_STATE_PRECALL  1     /* Server-only:  call is not in progress, but packets have arrived */
550 #define RX_STATE_ACTIVE   2     /* An active call; a process is dealing with this call */
551 #define RX_STATE_DALLY    3     /* Dallying after process is done with call */
552 #define RX_STATE_HOLD     4     /* Waiting for acks on reply data packets */
553
554 /* Call modes:  the modes of a call in RX_STATE_ACTIVE state (process attached) */
555 #define RX_MODE_SENDING   1     /* Sending or ready to send */
556 #define RX_MODE_RECEIVING 2     /* Receiving or ready to receive */
557 #define RX_MODE_ERROR     3     /* Something in error for current conversation */
558 #define RX_MODE_EOF       4     /* Server has flushed (or client has read) last reply packet */
559
560 /* Flags */
561 #define RX_CALL_READER_WAIT        1    /* Reader is waiting for next packet */
562 #define RX_CALL_WAIT_WINDOW_ALLOC  2    /* Sender is waiting for window to allocate buffers */
563 #define RX_CALL_WAIT_WINDOW_SEND   4    /* Sender is waiting for window to send buffers */
564 #define RX_CALL_WAIT_PACKETS       8    /* Sender is waiting for packet buffers */
565 #define RX_CALL_WAIT_PROC         16    /* Waiting for a process to be assigned */
566 #define RX_CALL_RECEIVE_DONE      32    /* All packets received on this call */
567 #define RX_CALL_CLEARED           64    /* Receive queue cleared in precall state */
568 #define RX_CALL_TQ_BUSY          128    /* Call's Xmit Queue is busy; don't modify */
569 #define RX_CALL_TQ_CLEARME       256    /* Need to clear this call's TQ later */
570 #define RX_CALL_TQ_SOME_ACKED    512    /* rxi_Start needs to discard ack'd packets. */
571 #define RX_CALL_TQ_WAIT         1024    /* Reader is waiting for TQ_BUSY to be reset */
572 #define RX_CALL_FAST_RECOVER    2048    /* call is doing congestion recovery */
573 #define RX_CALL_FAST_RECOVER_WAIT 4096  /* thread is waiting to start recovery */
574 #define RX_CALL_SLOW_START_OK   8192    /* receiver acks every other packet */
575 #define RX_CALL_IOVEC_WAIT      16384   /* waiting thread is using an iovec */
576 #define RX_CALL_HAVE_LAST       32768   /* Last packet has been received */
577 #define RX_CALL_NEED_START      0x10000 /* tells rxi_Start to start again */
578
579 /* Maximum number of acknowledgements in an acknowledge packet */
580 #define RX_MAXACKS          255
581
582 /* The structure of the data portion of an acknowledge packet: An acknowledge
583  * packet is in network byte order at all times.  An acknowledgement is always
584  * prompted for a specific reason by a specific incoming packet.  This reason
585  * is reported in "reason" and the packet's sequence number in the packet
586  * header.seq.  In addition to this information, all of the current
587  * acknowledgement information about this call is placed in the packet.
588  * "FirstPacket" is the sequence number of the first packet represented in an
589  * array of bytes, "acks", containing acknowledgement information for a number
590  * of consecutive packets.  All packets prior to FirstPacket are implicitly
591  * acknowledged: the sender need no longer be concerned about them.  Packets
592  * from firstPacket+nAcks and on are not acknowledged.  Packets in the range
593  * [firstPacket,firstPacket+nAcks) are each acknowledged explicitly.  The
594  * acknowledgement may be RX_NACK if the packet is not (currently) at the
595  * receiver (it may have never been received, or received and then later
596  * dropped), or it may be RX_ACK if the packet is queued up waiting to be read
597  * by the upper level software.  RX_ACK does not imply that the packet may not
598  * be dropped before it is read; it does imply that the sender should stop
599  * retransmitting the packet until notified otherwise.  The field
600  * previousPacket identifies the previous packet received by the peer.  This
601  * was used in a previous version of this software, and could be used in the
602  * future.  The serial number in the data part of the ack packet corresponds to
603  * the serial number oof the packet which prompted the acknowledge.  Any
604  * packets which are explicitly not acknowledged, and which were last
605  * transmitted with a serial number less than the provided serial number,
606  * should be retransmitted immediately.  Actually, this is slightly inaccurate:
607  * packets are not necessarily received in order.  When packets are habitually
608  * transmitted out of order, this is allowed for in the retransmission
609  * algorithm by introducing the notion of maximum packet skew: the degree of
610  * out-of-orderness of the packets received on the wire.  This number is
611  * communicated from the receiver to the sender in ack packets. */
612
613 struct rx_ackPacket {
614     u_short bufferSpace;        /* Number of packet buffers available.  That is:  the number of buffers that the sender of the ack packet is willing to provide for data, on this or subsequent calls.  Lying is permissable. */
615     u_short maxSkew;            /* Maximum difference between serial# of packet acknowledged and highest packet yet received */
616     afs_uint32 firstPacket;     /* The first packet in the list of acknowledged packets */
617     afs_uint32 previousPacket;  /* The previous packet number received (obsolete?) */
618     afs_uint32 serial;          /* Serial number of the packet which prompted the acknowledge */
619     u_char reason;              /* Reason for the acknowledge of ackPacket, defined below */
620     u_char nAcks;               /* Number of acknowledgements */
621     u_char acks[RX_MAXACKS];    /* Up to RX_MAXACKS packet acknowledgements, defined below */
622     /* Packets <firstPacket are implicitly acknowledged and may be discarded by the sender.  Packets >= firstPacket+nAcks are implicitly NOT acknowledged.  No packets with sequence numbers >= firstPacket should be discarded by the sender (they may thrown out at any time by the receiver) */
623 };
624
625 #define FIRSTACKOFFSET 4
626
627 /* Reason for acknowledge message */
628 #define RX_ACK_REQUESTED        1       /* Peer requested an ack on this packet */
629 #define RX_ACK_DUPLICATE        2       /* Duplicate packet */
630 #define RX_ACK_OUT_OF_SEQUENCE  3       /* Packet out of sequence */
631 #define RX_ACK_EXCEEDS_WINDOW   4       /* Packet sequence number higher than window; discarded */
632 #define RX_ACK_NOSPACE          5       /* No buffer space at all */
633 #define RX_ACK_PING             6       /* This is a keep-alive ack */
634 #define RX_ACK_PING_RESPONSE    7       /* Ack'ing because we were pinged */
635 #define RX_ACK_DELAY            8       /* Ack generated since nothing has happened since receiving packet */
636 #define RX_ACK_IDLE             9       /* Similar to RX_ACK_DELAY, but can 
637                                          * be used to compute RTT */
638
639 /* Packet acknowledgement type */
640 #define RX_ACK_TYPE_NACK        0       /* I Don't have this packet */
641 #define RX_ACK_TYPE_ACK         1       /* I have this packet, although I may discard it later */
642
643 /* The packet size transmitted for an acknowledge is adjusted to reflect the actual size of the acks array.  This macro defines the size */
644 #define rx_AckDataSize(nAcks) (3 + nAcks + offsetof(struct rx_ackPacket, acks[0]))
645
646 #define RX_CHALLENGE_TIMEOUT    2       /* Number of seconds before another authentication request packet is generated */
647 #define RX_CHALLENGE_MAXTRIES   50      /* Max # of times we resend challenge */
648 #define RX_CHECKREACH_TIMEOUT   2       /* Number of seconds before another ping is generated */
649 #define RX_CHECKREACH_TTL       60      /* Re-check reachability this often */
650
651 /* RX error codes.  RX uses error codes from -1 to -64.  Rxgen may use other error codes < -64; user programs are expected to return positive error codes */
652
653 /* Something bad happened to the connection; temporary loss of communication */
654 #define RX_CALL_DEAD                (-1)
655
656 /* An invalid operation, such as a client attempting to send data after having received the beginning of a reply from the server */
657 #define RX_INVALID_OPERATION        (-2)
658
659 /* An optional timeout per call may be specified */
660 #define RX_CALL_TIMEOUT             (-3)
661
662 /* End of data on a read */
663 #define RX_EOF                      (-4)
664
665 /* Some sort of low-level protocol error */
666 #define RX_PROTOCOL_ERROR           (-5)
667
668 /* Generic user abort code; used when no more specific error code needs to be communicated.  For example, multi rx clients use this code to abort a multi rx call */
669 #define RX_USER_ABORT               (-6)
670
671 /* Port already in use (from rx_Init) */
672 #define RX_ADDRINUSE                (-7)
673
674 /* EMSGSIZE returned from network.  Packet too big, must fragment */
675 #define RX_MSGSIZE                  (-8)
676
677 /* transient failure detected ( possibly the server is restarting ) */
678 /* this shud be equal to VRESTARTING ( util/errors.h ) for old clients to work */
679 #define RX_RESTARTING               (-100)
680
681 struct rx_securityObjectStats {
682     char type;                  /* 0:unk 1:null,2:vab 3:kad */
683     char level;
684     char sparec[10];            /* force correct alignment */
685     afs_int32 flags;            /* 1=>unalloc, 2=>auth, 4=>expired */
686     afs_uint32 expires;
687     afs_uint32 packetsReceived;
688     afs_uint32 packetsSent;
689     afs_uint32 bytesReceived;
690     afs_uint32 bytesSent;
691     short spares[4];
692     afs_int32 sparel[8];
693 };
694
695 /* Configuration settings */
696
697 /* Enum for storing configuration variables which can be set via the 
698  * SetConfiguration method in the rx_securityClass, below
699  */
700
701 typedef enum {
702      RXS_CONFIG_FLAGS /* afs_uint32 set of bitwise flags */
703 } rx_securityConfigVariables;
704
705 /* For the RXS_CONFIG_FLAGS, the following bit values are defined */
706
707 /* Disable the principal name contains dot check in rxkad */
708 #define RXS_CONFIG_FLAGS_DISABLE_DOTCHECK       0x01
709
710 /* XXXX (rewrite this description) A security class object contains a set of
711  * procedures and some private data to implement a security model for rx
712  * connections.  These routines are called by rx as appropriate.  Rx knows
713  * nothing about the internal details of any particular security model, or
714  * about security state.  Rx does maintain state per connection on behalf of
715  * the security class.  Each security class implementation is also expected to
716  * provide routines to create these objects.  Rx provides a basic routine to
717  * allocate one of these objects; this routine must be called by the class. */
718 struct rx_securityClass {
719     struct rx_securityOps {
720         int (*op_Close) (struct rx_securityClass * aobj);
721         int (*op_NewConnection) (struct rx_securityClass * aobj,
722                                  struct rx_connection * aconn);
723         int (*op_PreparePacket) (struct rx_securityClass * aobj,
724                                  struct rx_call * acall,
725                                  struct rx_packet * apacket);
726         int (*op_SendPacket) (struct rx_securityClass * aobj,
727                               struct rx_call * acall,
728                               struct rx_packet * apacket);
729         int (*op_CheckAuthentication) (struct rx_securityClass * aobj,
730                                        struct rx_connection * aconn);
731         int (*op_CreateChallenge) (struct rx_securityClass * aobj,
732                                    struct rx_connection * aconn);
733         int (*op_GetChallenge) (struct rx_securityClass * aobj,
734                                 struct rx_connection * aconn,
735                                 struct rx_packet * apacket);
736         int (*op_GetResponse) (struct rx_securityClass * aobj,
737                                struct rx_connection * aconn,
738                                struct rx_packet * apacket);
739         int (*op_CheckResponse) (struct rx_securityClass * aobj,
740                                  struct rx_connection * aconn,
741                                  struct rx_packet * apacket);
742         int (*op_CheckPacket) (struct rx_securityClass * aobj,
743                                struct rx_call * acall,
744                                struct rx_packet * apacket);
745         int (*op_DestroyConnection) (struct rx_securityClass * aobj,
746                                      struct rx_connection * aconn);
747         int (*op_GetStats) (struct rx_securityClass * aobj,
748                             struct rx_connection * aconn,
749                             struct rx_securityObjectStats * astats);
750         int (*op_SetConfiguration) (struct rx_securityClass * aobj,
751                                     struct rx_connection * aconn,
752                                     rx_securityConfigVariables atype,
753                                     void * avalue,
754                                     void ** acurrentValue);
755         int (*op_Spare2) (void);
756         int (*op_Spare3) (void);
757     } *ops;
758     void *privateData;
759     int refCount;
760 };
761
762 #define RXS_OP(obj,op,args) ((obj && (obj->ops->op_ ## op)) ? (*(obj)->ops->op_ ## op)args : 0)
763
764 #define RXS_Close(obj) RXS_OP(obj,Close,(obj))
765 #define RXS_NewConnection(obj,conn) RXS_OP(obj,NewConnection,(obj,conn))
766 #define RXS_PreparePacket(obj,call,packet) RXS_OP(obj,PreparePacket,(obj,call,packet))
767 #define RXS_SendPacket(obj,call,packet) RXS_OP(obj,SendPacket,(obj,call,packet))
768 #define RXS_CheckAuthentication(obj,conn) RXS_OP(obj,CheckAuthentication,(obj,conn))
769 #define RXS_CreateChallenge(obj,conn) RXS_OP(obj,CreateChallenge,(obj,conn))
770 #define RXS_GetChallenge(obj,conn,packet) RXS_OP(obj,GetChallenge,(obj,conn,packet))
771 #define RXS_GetResponse(obj,conn,packet) RXS_OP(obj,GetResponse,(obj,conn,packet))
772 #define RXS_CheckResponse(obj,conn,packet) RXS_OP(obj,CheckResponse,(obj,conn,packet))
773 #define RXS_CheckPacket(obj,call,packet) RXS_OP(obj,CheckPacket,(obj,call,packet))
774 #define RXS_DestroyConnection(obj,conn) RXS_OP(obj,DestroyConnection,(obj,conn))
775 #define RXS_GetStats(obj,conn,stats) RXS_OP(obj,GetStats,(obj,conn,stats))
776 #define RXS_SetConfiguration(obj, conn, type, value, currentValue) RXS_OP(obj, SetConfiguration,(obj,conn,type,value,currentValue))
777
778
779 /* Structure for keeping rx statistics.  Note that this structure is returned
780  * by rxdebug, so, for compatibility reasons, new fields should be appended (or
781  * spares used), the rxdebug protocol checked, if necessary, and the PrintStats
782  * code should be updated as well.
783  *
784  * Clearly we assume that ntohl will work on these structures so sizeof(int)
785  * must equal sizeof(afs_int32). */
786
787 struct rx_stats {               /* General rx statistics */
788     int packetRequests;         /* Number of packet allocation requests */
789     int receivePktAllocFailures;
790     int sendPktAllocFailures;
791     int specialPktAllocFailures;
792     int socketGreedy;           /* Whether SO_GREEDY succeeded */
793     int bogusPacketOnRead;      /* Number of inappropriately short packets received */
794     int bogusHost;              /* Host address from bogus packets */
795     int noPacketOnRead;         /* Number of read packets attempted when there was actually no packet to read off the wire */
796     int noPacketBuffersOnRead;  /* Number of dropped data packets due to lack of packet buffers */
797     int selects;                /* Number of selects waiting for packet or timeout */
798     int sendSelects;            /* Number of selects forced when sending packet */
799     int packetsRead[RX_N_PACKET_TYPES]; /* Total number of packets read, per type */
800     int dataPacketsRead;        /* Number of unique data packets read off the wire */
801     int ackPacketsRead;         /* Number of ack packets read */
802     int dupPacketsRead;         /* Number of duplicate data packets read */
803     int spuriousPacketsRead;    /* Number of inappropriate data packets */
804     int packetsSent[RX_N_PACKET_TYPES]; /* Number of rxi_Sends: packets sent over the wire, per type */
805     int ackPacketsSent;         /* Number of acks sent */
806     int pingPacketsSent;        /* Total number of ping packets sent */
807     int abortPacketsSent;       /* Total number of aborts */
808     int busyPacketsSent;        /* Total number of busies sent received */
809     int dataPacketsSent;        /* Number of unique data packets sent */
810     int dataPacketsReSent;      /* Number of retransmissions */
811     int dataPacketsPushed;      /* Number of retransmissions pushed early by a NACK */
812     int ignoreAckedPacket;      /* Number of packets with acked flag, on rxi_Start */
813     struct clock totalRtt;      /* Total round trip time measured (use to compute average) */
814     struct clock minRtt;        /* Minimum round trip time measured */
815     struct clock maxRtt;        /* Maximum round trip time measured */
816     int nRttSamples;            /* Total number of round trip samples */
817     int nServerConns;           /* Total number of server connections */
818     int nClientConns;           /* Total number of client connections */
819     int nPeerStructs;           /* Total number of peer structures */
820     int nCallStructs;           /* Total number of call structures allocated */
821     int nFreeCallStructs;       /* Total number of previously allocated free call structures */
822     int netSendFailures;
823     afs_int32 fatalErrors;
824     int ignorePacketDally;      /* packets dropped because call is in dally state */
825     int receiveCbufPktAllocFailures;
826     int sendCbufPktAllocFailures;
827     int nBusies;
828     int spares[4];
829 };
830
831 /* structures for debug input and output packets */
832
833 /* debug input types */
834 struct rx_debugIn {
835     afs_int32 type;
836     afs_int32 index;
837 };
838
839 /* Invalid rx debug package type */
840 #define RX_DEBUGI_BADTYPE     (-8)
841
842 #define RX_DEBUGI_VERSION_MINIMUM ('L') /* earliest real version */
843 #define RX_DEBUGI_VERSION     ('R')     /* Latest version */
844     /* first version w/ secStats */
845 #define RX_DEBUGI_VERSION_W_SECSTATS ('L')
846     /* version M is first supporting GETALLCONN and RXSTATS type */
847 #define RX_DEBUGI_VERSION_W_GETALLCONN ('M')
848 #define RX_DEBUGI_VERSION_W_RXSTATS ('M')
849     /* last version with unaligned debugConn */
850 #define RX_DEBUGI_VERSION_W_UNALIGNED_CONN ('L')
851 #define RX_DEBUGI_VERSION_W_WAITERS ('N')
852 #define RX_DEBUGI_VERSION_W_IDLETHREADS ('O')
853 #define RX_DEBUGI_VERSION_W_NEWPACKETTYPES ('P')
854 #define RX_DEBUGI_VERSION_W_GETPEER ('Q')
855 #define RX_DEBUGI_VERSION_W_WAITED ('R')
856
857 #define RX_DEBUGI_GETSTATS      1       /* get basic rx stats */
858 #define RX_DEBUGI_GETCONN       2       /* get connection info */
859 #define RX_DEBUGI_GETALLCONN    3       /* get even uninteresting conns */
860 #define RX_DEBUGI_RXSTATS       4       /* get all rx stats */
861 #define RX_DEBUGI_GETPEER       5       /* get all peer structs */
862
863 struct rx_debugStats {
864     afs_int32 nFreePackets;
865     afs_int32 packetReclaims;
866     afs_int32 callsExecuted;
867     char waitingForPackets;
868     char usedFDs;
869     char version;
870     char spare1;
871     afs_int32 nWaiting;
872     afs_int32 idleThreads;      /* Number of server threads that are idle */
873     afs_int32 nWaited;
874     afs_int32 spare2[7];
875 };
876
877 struct rx_debugConn_vL {
878     afs_int32 host;
879     afs_int32 cid;
880     afs_int32 serial;
881     afs_int32 callNumber[RX_MAXCALLS];
882     afs_int32 error;
883     short port;
884     char flags;
885     char type;
886     char securityIndex;
887     char callState[RX_MAXCALLS];
888     char callMode[RX_MAXCALLS];
889     char callFlags[RX_MAXCALLS];
890     char callOther[RX_MAXCALLS];
891     /* old style getconn stops here */
892     struct rx_securityObjectStats secStats;
893     afs_int32 sparel[10];
894 };
895
896 struct rx_debugConn {
897     afs_int32 host;
898     afs_int32 cid;
899     afs_int32 serial;
900     afs_int32 callNumber[RX_MAXCALLS];
901     afs_int32 error;
902     short port;
903     char flags;
904     char type;
905     char securityIndex;
906     char sparec[3];             /* force correct alignment */
907     char callState[RX_MAXCALLS];
908     char callMode[RX_MAXCALLS];
909     char callFlags[RX_MAXCALLS];
910     char callOther[RX_MAXCALLS];
911     /* old style getconn stops here */
912     struct rx_securityObjectStats secStats;
913     afs_int32 epoch;
914     afs_int32 natMTU;
915     afs_int32 sparel[9];
916 };
917
918 struct rx_debugPeer {
919     afs_uint32 host;
920     u_short port;
921     u_short ifMTU;
922     afs_uint32 idleWhen;
923     short refCount;
924     u_char burstSize;
925     u_char burst;
926     struct clock burstWait;
927     afs_int32 rtt;
928     afs_int32 rtt_dev;
929     struct clock timeout;
930     afs_int32 nSent;
931     afs_int32 reSends;
932     afs_int32 inPacketSkew;
933     afs_int32 outPacketSkew;
934     afs_int32 rateFlag;
935     u_short natMTU;
936     u_short maxMTU;
937     u_short maxDgramPackets;
938     u_short ifDgramPackets;
939     u_short MTU;
940     u_short cwind;
941     u_short nDgramPackets;
942     u_short congestSeq;
943     afs_hyper_t bytesSent;
944     afs_hyper_t bytesReceived;
945     afs_int32 sparel[10];
946 };
947
948 #define RX_OTHER_IN     1       /* packets avail in in queue */
949 #define RX_OTHER_OUT    2       /* packets avail in out queue */
950
951
952
953 /* Only include this once, even when re-loading for kdump. */
954 #ifndef _CALL_REF_DEFINED_
955 #define _CALL_REF_DEFINED_
956
957 #ifdef RX_ENABLE_LOCKS
958 #ifdef RX_REFCOUNT_CHECK
959 /* RX_REFCOUNT_CHECK is used to test for call refcount leaks by event
960  * type.
961  */
962 extern int rx_callHoldType;
963 #define CALL_HOLD(call, type) do { \
964                                  call->refCount++; \
965                                  call->refCDebug[type]++; \
966                                  if (call->refCDebug[type] > 50)  {\
967                                      rx_callHoldType = type; \
968                                      osi_Panic("Huge call refCount"); \
969                                                                } \
970                              } while (0)
971 #define CALL_RELE(call, type) do { \
972                                  call->refCount--; \
973                                  call->refCDebug[type]--; \
974                                  if (call->refCDebug[type] > 50) {\
975                                      rx_callHoldType = type; \
976                                      osi_Panic("Negative call refCount"); \
977                                                               } \
978                              } while (0)
979 #else /* RX_REFCOUNT_CHECK */
980 #define CALL_HOLD(call, type)    call->refCount++
981 #define CALL_RELE(call, type)    call->refCount--
982 #endif /* RX_REFCOUNT_CHECK */
983
984 #else /* RX_ENABLE_LOCKS */
985 #define CALL_HOLD(call, type)
986 #define CALL_RELE(call, type)
987 #endif /* RX_ENABLE_LOCKS */
988
989 #endif /* _CALL_REF_DEFINED_ */
990
991 #define RX_SERVER_DEBUG_SEC_STATS               0x1
992 #define RX_SERVER_DEBUG_ALL_CONN                0x2
993 #define RX_SERVER_DEBUG_RX_STATS                0x4
994 #define RX_SERVER_DEBUG_WAITER_CNT              0x8
995 #define RX_SERVER_DEBUG_IDLE_THREADS            0x10
996 #define RX_SERVER_DEBUG_OLD_CONN                0x20
997 #define RX_SERVER_DEBUG_NEW_PACKETS             0x40
998 #define RX_SERVER_DEBUG_ALL_PEER                0x80
999 #define RX_SERVER_DEBUG_WAITED_CNT              0x100
1000
1001 #define AFS_RX_STATS_CLEAR_ALL                  0xffffffff
1002 #define AFS_RX_STATS_CLEAR_INVOCATIONS          0x1
1003 #define AFS_RX_STATS_CLEAR_BYTES_SENT           0x2
1004 #define AFS_RX_STATS_CLEAR_BYTES_RCVD           0x4
1005 #define AFS_RX_STATS_CLEAR_QUEUE_TIME_SUM       0x8
1006 #define AFS_RX_STATS_CLEAR_QUEUE_TIME_SQUARE    0x10
1007 #define AFS_RX_STATS_CLEAR_QUEUE_TIME_MIN       0x20
1008 #define AFS_RX_STATS_CLEAR_QUEUE_TIME_MAX       0x40
1009 #define AFS_RX_STATS_CLEAR_EXEC_TIME_SUM        0x80
1010 #define AFS_RX_STATS_CLEAR_EXEC_TIME_SQUARE     0x100
1011 #define AFS_RX_STATS_CLEAR_EXEC_TIME_MIN        0x200
1012 #define AFS_RX_STATS_CLEAR_EXEC_TIME_MAX        0x400
1013
1014 typedef struct rx_function_entry_v1 {
1015     afs_uint32 remote_peer;
1016     afs_uint32 remote_port;
1017     afs_uint32 remote_is_server;
1018     afs_uint32 interfaceId;
1019     afs_uint32 func_total;
1020     afs_uint32 func_index;
1021     afs_hyper_t invocations;
1022     afs_hyper_t bytes_sent;
1023     afs_hyper_t bytes_rcvd;
1024     struct clock queue_time_sum;
1025     struct clock queue_time_sum_sqr;
1026     struct clock queue_time_min;
1027     struct clock queue_time_max;
1028     struct clock execution_time_sum;
1029     struct clock execution_time_sum_sqr;
1030     struct clock execution_time_min;
1031     struct clock execution_time_max;
1032 } rx_function_entry_v1_t, *rx_function_entry_v1_p;
1033
1034 /*
1035  * If you need to change rx_function_entry, you should probably create a brand
1036  * new structure.  Keeping the old structure will allow backwards compatibility
1037  * with old clients (even if it is only used to calculate allocation size).
1038  * If you do change the size or the format, you'll need to bump
1039  * RX_STATS_RETRIEVAL_VERSION.  This allows some primitive form
1040  * of versioning a la rxdebug.
1041  */
1042
1043 #define RX_STATS_RETRIEVAL_VERSION 1    /* latest version */
1044 #define RX_STATS_RETRIEVAL_FIRST_EDITION 1      /* first implementation */
1045
1046 typedef struct rx_interface_stat {
1047     struct rx_queue queue_header;
1048     struct rx_queue all_peers;
1049     rx_function_entry_v1_t stats[1];    /* make sure this is aligned correctly */
1050 } rx_interface_stat_t, *rx_interface_stat_p;
1051
1052 #define RX_STATS_SERVICE_ID 409
1053
1054 #ifdef AFS_NT40_ENV
1055 #define rx_MutexIncrement(object, mutex) InterlockedIncrement(&object)
1056 #define rx_MutexAdd(object, addend, mutex) InterlockedAdd(&object, addend)
1057 #define rx_MutexDecrement(object, mutex) InterlockedDecrement(&object)
1058 #define rx_MutexAdd1Increment2(object1, addend, object2, mutex) \
1059     do { \
1060         MUTEX_ENTER(&mutex); \
1061         object1 += addend; \
1062         InterlockedIncrement(&object2); \
1063         MUTEX_EXIT(&mutex); \
1064     } while (0)
1065 #define rx_MutexAdd1Decrement2(object1, addend, object2, mutex) \
1066     do { \
1067         MUTEX_ENTER(&mutex); \
1068         object1 += addend; \
1069         InterlockedDecrement(&object2); \
1070         MUTEX_EXIT(&mutex); \
1071     } while (0)
1072 #else
1073 #define rx_MutexIncrement(object, mutex) \
1074     do { \
1075         MUTEX_ENTER(&mutex); \
1076         object++; \
1077         MUTEX_EXIT(&mutex); \
1078     } while(0)
1079 #define rx_MutexAdd(object, addend, mutex) \
1080     do { \
1081         MUTEX_ENTER(&mutex); \
1082         object += addend; \
1083         MUTEX_EXIT(&mutex); \
1084     } while(0)
1085 #define rx_MutexAdd1Increment2(object1, addend, object2, mutex) \
1086     do { \
1087         MUTEX_ENTER(&mutex); \
1088         object1 += addend; \
1089         object2++; \
1090         MUTEX_EXIT(&mutex); \
1091     } while(0)
1092 #define rx_MutexAdd1Decrement2(object1, addend, object2, mutex) \
1093     do { \
1094         MUTEX_ENTER(&mutex); \
1095         object1 += addend; \
1096         object2--; \
1097         MUTEX_EXIT(&mutex); \
1098     } while(0)
1099 #define rx_MutexDecrement(object, mutex) \
1100     do { \
1101         MUTEX_ENTER(&mutex); \
1102         object--; \
1103         MUTEX_EXIT(&mutex); \
1104     } while(0)
1105 #endif 
1106
1107 #endif /* _RX_   End of rx.h */
1108
1109 #ifdef  KERNEL
1110 #include "rx/rx_prototypes.h"
1111 #else
1112 #include "rx_prototypes.h"
1113 #endif
1114
1115 #endif /* !KDUMP_RX_LOCK */