linux-warning-reduction-20090318
[openafs.git] / src / rx / rx.c
index dc3817f..8a9deeb 100644 (file)
@@ -69,6 +69,7 @@ RCSID
 #include "rx_kernel.h"
 #include "rx_clock.h"
 #include "rx_queue.h"
+#include "rx_internal.h"
 #include "rx.h"
 #include "rx_globals.h"
 #include "rx_trace.h"
@@ -85,6 +86,7 @@ extern afs_int32 afs_termState;
 #else /* KERNEL */
 # include <sys/types.h>
 # include <string.h>
+# include <stdarg.h>
 # include <errno.h>
 #ifdef AFS_NT40_ENV
 # include <stdlib.h>
@@ -99,6 +101,7 @@ extern afs_int32 afs_termState;
 # include <netinet/in.h>
 # include <sys/time.h>
 #endif
+# include "rx_internal.h"
 # include "rx.h"
 # include "rx_user.h"
 # include "rx_clock.h"
@@ -108,13 +111,22 @@ extern afs_int32 afs_termState;
 # include <afs/rxgen_consts.h>
 #endif /* KERNEL */
 
-int (*registerProgram) () = 0;
-int (*swapNameProgram) () = 0;
+#ifndef KERNEL
+#ifdef AFS_PTHREAD_ENV
+#ifndef AFS_NT40_ENV
+int (*registerProgram) (pid_t, char *) = 0;
+int (*swapNameProgram) (pid_t, const char *, char *) = 0;
+#endif
+#else
+int (*registerProgram) (PROCESS, char *) = 0;
+int (*swapNameProgram) (PROCESS, const char *, char *) = 0;
+#endif
+#endif
 
 /* Local static routines */
-static void rxi_DestroyConnectionNoLock(register struct rx_connection *conn);
+static void rxi_DestroyConnectionNoLock(struct rx_connection *conn);
 #ifdef RX_ENABLE_LOCKS
-static void rxi_SetAcksInTransmitQueue(register struct rx_call *call);
+static void rxi_SetAcksInTransmitQueue(struct rx_call *call);
 #endif
 
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
@@ -152,62 +164,55 @@ static unsigned int rxi_rpc_process_stat_cnt;
  * to ease NT porting
  */
 
-extern pthread_mutex_t rx_stats_mutex;
-extern pthread_mutex_t des_init_mutex;
-extern pthread_mutex_t des_random_mutex;
-extern pthread_mutex_t rx_clock_mutex;
-extern pthread_mutex_t rxi_connCacheMutex;
-extern pthread_mutex_t rx_event_mutex;
-extern pthread_mutex_t osi_malloc_mutex;
-extern pthread_mutex_t event_handler_mutex;
-extern pthread_mutex_t listener_mutex;
-extern pthread_mutex_t rx_if_init_mutex;
-extern pthread_mutex_t rx_if_mutex;
-extern pthread_mutex_t rxkad_client_uid_mutex;
-extern pthread_mutex_t rxkad_random_mutex;
-
-extern pthread_cond_t rx_event_handler_cond;
-extern pthread_cond_t rx_listener_cond;
-
-static pthread_mutex_t epoch_mutex;
-static pthread_mutex_t rx_init_mutex;
-static pthread_mutex_t rx_debug_mutex;
+extern afs_kmutex_t rx_stats_mutex;
+extern afs_kmutex_t rx_waiting_mutex;
+extern afs_kmutex_t rx_quota_mutex;
+extern afs_kmutex_t rx_pthread_mutex;
+extern afs_kmutex_t rx_packets_mutex;
+extern afs_kmutex_t des_init_mutex;
+extern afs_kmutex_t des_random_mutex;
+extern afs_kmutex_t rx_clock_mutex;
+extern afs_kmutex_t rxi_connCacheMutex;
+extern afs_kmutex_t rx_event_mutex;
+extern afs_kmutex_t osi_malloc_mutex;
+extern afs_kmutex_t event_handler_mutex;
+extern afs_kmutex_t listener_mutex;
+extern afs_kmutex_t rx_if_init_mutex;
+extern afs_kmutex_t rx_if_mutex;
+extern afs_kmutex_t rxkad_client_uid_mutex;
+extern afs_kmutex_t rxkad_random_mutex;
+
+extern afs_kcondvar_t rx_event_handler_cond;
+extern afs_kcondvar_t rx_listener_cond;
+
+static afs_kmutex_t epoch_mutex;
+static afs_kmutex_t rx_init_mutex;
+static afs_kmutex_t rx_debug_mutex;
+static afs_kmutex_t rx_rpc_stats;
 
 static void
 rxi_InitPthread(void)
 {
-    assert(pthread_mutex_init(&rx_clock_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init(&rx_stats_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init
-          (&rxi_connCacheMutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init(&rx_init_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init(&epoch_mutex, (const pthread_mutexattr_t *)0) ==
-          0);
-    assert(pthread_mutex_init(&rx_event_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init(&des_init_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init
-          (&des_random_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init
-          (&osi_malloc_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init
-          (&event_handler_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init(&listener_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
-    assert(pthread_mutex_init
-          (&rx_if_init_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init(&rx_if_mutex, (const pthread_mutexattr_t *)0) ==
-          0);
-    assert(pthread_mutex_init
-          (&rxkad_client_uid_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init
-          (&rxkad_random_mutex, (const pthread_mutexattr_t *)0) == 0);
-    assert(pthread_mutex_init(&rx_debug_mutex, (const pthread_mutexattr_t *)0)
-          == 0);
+    MUTEX_INIT(&rx_clock_mutex, "clock", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_stats_mutex, "stats", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_waiting_mutex, "waiting", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_quota_mutex, "quota", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_pthread_mutex, "pthread", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_packets_mutex, "packets", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&epoch_mutex, "epoch", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_init_mutex, "init", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_event_mutex, "event", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&des_init_mutex, "des", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&des_random_mutex, "random", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&osi_malloc_mutex, "malloc", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&event_handler_mutex, "event handler", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rxi_connCacheMutex, "conn cache", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&listener_mutex, "listener", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_if_init_mutex, "if init", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_if_mutex, "if", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rxkad_client_uid_mutex, "uid", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rxkad_random_mutex, "rxkad random", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_debug_mutex, "debug", MUTEX_DEFAULT, 0);
 
     assert(pthread_cond_init
           (&rx_event_handler_cond, (const pthread_condattr_t *)0) == 0);
@@ -217,6 +222,25 @@ rxi_InitPthread(void)
     assert(pthread_key_create(&rx_ts_info_key, NULL) == 0);
  
     rxkad_global_stats_init();
+
+    MUTEX_INIT(&rx_rpc_stats, "rx_rpc_stats", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_freePktQ_lock, "rx_freePktQ_lock", MUTEX_DEFAULT, 0);
+#ifdef RX_ENABLE_LOCKS
+#ifdef RX_LOCKS_DB
+    rxdb_init();
+#endif /* RX_LOCKS_DB */
+    MUTEX_INIT(&freeSQEList_lock, "freeSQEList lock", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_freeCallQueue_lock, "rx_freeCallQueue_lock", MUTEX_DEFAULT,
+              0);
+    CV_INIT(&rx_waitingForPackets_cv, "rx_waitingForPackets_cv", CV_DEFAULT,
+           0);
+    MUTEX_INIT(&rx_peerHashTable_lock, "rx_peerHashTable_lock", MUTEX_DEFAULT,
+              0);
+    MUTEX_INIT(&rx_connHashTable_lock, "rx_connHashTable_lock", MUTEX_DEFAULT,
+              0);
+    MUTEX_INIT(&rx_serverPool_lock, "rx_serverPool_lock", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rxi_keyCreate_lock, "rxi_keyCreate_lock", MUTEX_DEFAULT, 0);
+#endif /* RX_ENABLE_LOCKS */
 }
 
 pthread_once_t rx_once_init = PTHREAD_ONCE_INIT;
@@ -224,19 +248,40 @@ pthread_once_t rx_once_init = PTHREAD_ONCE_INIT;
 assert(pthread_once(&rx_once_init, rxi_InitPthread)==0)
 /*
  * The rx_stats_mutex mutex protects the following global variables:
- * rxi_dataQuota
- * rxi_minDeficit
- * rxi_availProcs
- * rxi_totalMin
  * rxi_lowConnRefCount
  * rxi_lowPeerRefCount
  * rxi_nCalls
  * rxi_Alloccnt
  * rxi_Allocsize
- * rx_nFreePackets
  * rx_tq_debug
  * rx_stats
  */
+
+/*
+ * The rx_quota_mutex mutex protects the following global variables:
+ * rxi_dataQuota
+ * rxi_minDeficit
+ * rxi_availProcs
+ * rxi_totalMin
+ */
+
+/* 
+ * The rx_freePktQ_lock protects the following global variables:
+ * rx_nFreePackets 
+ */
+
+/*
+ * The rx_packets_mutex mutex protects the following global variables:
+ * rx_nPackets
+ * rx_TSFPQLocalMax
+ * rx_TSFPQGlobSize
+ * rx_TSFPQMaxProcs
+ */
+
+/*
+ * The rx_pthread_mutex mutex protects the following global variables:
+ * rxi_pthread_hinum
+ */
 #else
 #define INIT_PTHREAD_LOCKS
 #endif
@@ -264,9 +309,10 @@ assert(pthread_once(&rx_once_init, rxi_InitPthread)==0)
  * to manipulate the queue.
  */
 
-#ifdef RX_ENABLE_LOCKS
+#if defined(RX_ENABLE_LOCKS) && defined(KERNEL)
 static afs_kmutex_t rx_rpc_stats;
-void rxi_StartUnlocked();
+void rxi_StartUnlocked(struct rxevent *event, void *call,
+                       void *arg1, int istack);
 #endif
 
 /* We keep a "last conn pointer" in rxi_FindConnection. The odds are 
@@ -337,8 +383,8 @@ struct rx_serverQueueEntry *rx_waitingForPacket = 0;
  * rx_epoch
  */
 
-#define LOCK_EPOCH assert(pthread_mutex_lock(&epoch_mutex)==0)
-#define UNLOCK_EPOCH assert(pthread_mutex_unlock(&epoch_mutex)==0)
+#define LOCK_EPOCH MUTEX_ENTER(&epoch_mutex)
+#define UNLOCK_EPOCH MUTEX_EXIT(&epoch_mutex)
 #else
 #define LOCK_EPOCH
 #define UNLOCK_EPOCH
@@ -368,8 +414,8 @@ int rxinit_status = 1;
  * rxinit_status
  */
 
-#define LOCK_RX_INIT assert(pthread_mutex_lock(&rx_init_mutex)==0)
-#define UNLOCK_RX_INIT assert(pthread_mutex_unlock(&rx_init_mutex)==0)
+#define LOCK_RX_INIT MUTEX_ENTER(&rx_init_mutex)
+#define UNLOCK_RX_INIT MUTEX_EXIT(&rx_init_mutex)
 #else
 #define LOCK_RX_INIT
 #define UNLOCK_RX_INIT
@@ -419,11 +465,15 @@ rx_InitHost(u_int host, u_int port)
        UNLOCK_RX_INIT;
        return RX_ADDRINUSE;
     }
-#ifdef RX_ENABLE_LOCKS
+#if defined(RX_ENABLE_LOCKS) && defined(KERNEL)
 #ifdef RX_LOCKS_DB
     rxdb_init();
 #endif /* RX_LOCKS_DB */
     MUTEX_INIT(&rx_stats_mutex, "rx_stats_mutex", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_waiting_mutex, "rx_waiting_mutex", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_quota_mutex, "rx_quota_mutex", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_pthread_mutex, "rx_pthread_mutex", MUTEX_DEFAULT, 0);
+    MUTEX_INIT(&rx_packets_mutex, "rx_packets_mutex", MUTEX_DEFAULT, 0);
     MUTEX_INIT(&rx_rpc_stats, "rx_rpc_stats", MUTEX_DEFAULT, 0);
     MUTEX_INIT(&rx_freePktQ_lock, "rx_freePktQ_lock", MUTEX_DEFAULT, 0);
     MUTEX_INIT(&freeSQEList_lock, "freeSQEList lock", MUTEX_DEFAULT, 0);
@@ -436,19 +486,16 @@ rx_InitHost(u_int host, u_int port)
     MUTEX_INIT(&rx_connHashTable_lock, "rx_connHashTable_lock", MUTEX_DEFAULT,
               0);
     MUTEX_INIT(&rx_serverPool_lock, "rx_serverPool_lock", MUTEX_DEFAULT, 0);
-#ifndef KERNEL
-    MUTEX_INIT(&rxi_keyCreate_lock, "rxi_keyCreate_lock", MUTEX_DEFAULT, 0);
-#endif /* !KERNEL */
-#if defined(KERNEL) && defined(AFS_HPUX110_ENV)
+#if defined(AFS_HPUX110_ENV)
     if (!uniprocessor)
        rx_sleepLock = alloc_spinlock(LAST_HELD_ORDER - 10, "rx_sleepLock");
-#endif /* KERNEL && AFS_HPUX110_ENV */
-#endif /* RX_ENABLE_LOCKS */
+#endif /* AFS_HPUX110_ENV */
+#endif /* RX_ENABLE_LOCKS && KERNEL */
 
     rxi_nCalls = 0;
     rx_connDeadTime = 12;
     rx_tranquil = 0;           /* reset flag */
-    memset((char *)&rx_stats, 0, sizeof(struct rx_stats));
+    memset((char *)&rx_stats, 0, sizeof(struct rx_statistics));
     htable = (char *)
        osi_Alloc(rx_hashTableSize * sizeof(struct rx_connection *));
     PIN(htable, rx_hashTableSize * sizeof(struct rx_connection *));    /* XXXXX */
@@ -489,7 +536,11 @@ rx_InitHost(u_int host, u_int port)
        rx_port = 0;
 #else
        struct sockaddr_in addr;
-       int addrlen = sizeof(addr);
+#ifdef AFS_NT40_ENV
+        int addrlen = sizeof(addr);
+#else
+       socklen_t addrlen = sizeof(addr);
+#endif
        if (getsockname((int)rx_socket, (struct sockaddr *)&addr, &addrlen)) {
            rx_Finalize();
            return -1;
@@ -504,9 +555,7 @@ rx_InitHost(u_int host, u_int port)
     rx_SetEpoch(tv.tv_sec);    /* Start time of this package, rxkad
                                 * will provide a randomer value. */
 #endif
-    MUTEX_ENTER(&rx_stats_mutex);
-    rxi_dataQuota += rx_extraQuota;    /* + extra pkts caller asked to rsrv */
-    MUTEX_EXIT(&rx_stats_mutex);
+    rx_MutexAdd(rxi_dataQuota, rx_extraQuota, rx_quota_mutex); /* + extra pkts caller asked to rsrv */
     /* *Slightly* random start time for the cid.  This is just to help
      * out with the hashing function at the peer */
     rx_nextCid = ((tv.tv_sec ^ tv.tv_usec) << RX_CIDSHIFT);
@@ -557,7 +606,7 @@ rx_Init(u_int port)
  * rx_serverPool_lock is held.  Return quota using ReturnToServerPool().
  */
 static int
-QuotaOK(register struct rx_service *aservice)
+QuotaOK(struct rx_service *aservice)
 {
     /* check if over max quota */
     if (aservice->nRequestsRunning >= aservice->maxProcs) {
@@ -568,7 +617,8 @@ QuotaOK(register struct rx_service *aservice)
     /* otherwise, can use only if there are enough to allow everyone
      * to go to their min quota after this guy starts.
      */
-    MUTEX_ENTER(&rx_stats_mutex);
+
+    MUTEX_ENTER(&rx_quota_mutex);
     if ((aservice->nRequestsRunning < aservice->minProcs)
        || (rxi_availProcs > rxi_minDeficit)) {
        aservice->nRequestsRunning++;
@@ -577,28 +627,28 @@ QuotaOK(register struct rx_service *aservice)
        if (aservice->nRequestsRunning <= aservice->minProcs)
            rxi_minDeficit--;
        rxi_availProcs--;
-       MUTEX_EXIT(&rx_stats_mutex);
+       MUTEX_EXIT(&rx_quota_mutex);
        return 1;
     }
-    MUTEX_EXIT(&rx_stats_mutex);
+    MUTEX_EXIT(&rx_quota_mutex);
 
     return 0;
 }
 
 static void
-ReturnToServerPool(register struct rx_service *aservice)
+ReturnToServerPool(struct rx_service *aservice)
 {
     aservice->nRequestsRunning--;
-    MUTEX_ENTER(&rx_stats_mutex);
+    MUTEX_ENTER(&rx_quota_mutex);
     if (aservice->nRequestsRunning < aservice->minProcs)
        rxi_minDeficit++;
     rxi_availProcs++;
-    MUTEX_EXIT(&rx_stats_mutex);
+    MUTEX_EXIT(&rx_quota_mutex);
 }
 
 #else /* RX_ENABLE_LOCKS */
 static int
-QuotaOK(register struct rx_service *aservice)
+QuotaOK(struct rx_service *aservice)
 {
     int rc = 0;
     /* under min quota, we're OK */
@@ -625,8 +675,8 @@ QuotaOK(register struct rx_service *aservice)
 void
 rxi_StartServerProcs(int nExistingProcs)
 {
-    register struct rx_service *service;
-    register int i;
+    struct rx_service *service;
+    int i;
     int maxdiff = 0;
     int nProcs = 0;
 
@@ -674,8 +724,8 @@ rx_StartClientThread(void)
 void
 rx_StartServer(int donateMe)
 {
-    register struct rx_service *service;
-    register int i;
+    struct rx_service *service;
+    int i;
     SPLVAR;
     clock_NewTime();
 
@@ -694,17 +744,17 @@ rx_StartServer(int donateMe)
        service = rx_services[i];
        if (service == (struct rx_service *)0)
            break;
-       MUTEX_ENTER(&rx_stats_mutex);
+       MUTEX_ENTER(&rx_quota_mutex);
        rxi_totalMin += service->minProcs;
        /* below works even if a thread is running, since minDeficit would
         * still have been decremented and later re-incremented.
         */
        rxi_minDeficit += service->minProcs;
-       MUTEX_EXIT(&rx_stats_mutex);
+       MUTEX_EXIT(&rx_quota_mutex);
     }
 
     /* Turn on reaping of idle server connections */
-    rxi_ReapConnections();
+    rxi_ReapConnections(NULL, NULL, NULL);
 
     USERPRI;
 
@@ -741,102 +791,108 @@ rx_StartServer(int donateMe)
  * specified security object to implement the security model for this
  * connection. */
 struct rx_connection *
-rx_NewConnection(register afs_uint32 shost, u_short sport, u_short sservice,
-                register struct rx_securityClass *securityObject,
+rx_NewConnection(afs_uint32 shost, u_short sport, u_short sservice,
+                struct rx_securityClass *securityObject,
                 int serviceSecurityIndex)
 {
     int hashindex, i;
-    afs_int32 cid, cix, nclones;
-    register struct rx_connection *conn, *tconn, *ptconn;
+    afs_int32 cix, nclones;
+    struct rx_connection *conn, *tconn, *ptconn;
 
     SPLVAR;
 
     clock_NewTime();
     dpf(("rx_NewConnection(host %x, port %u, service %u, securityObject %x, serviceSecurityIndex %d)\n", ntohl(shost), ntohs(sport), sservice, securityObject, serviceSecurityIndex));
 
-       conn = tconn = 0;
-       nclones = rx_max_clones_per_connection;
-
-    /* Vasilsi said: "NETPRI protects Cid and Alloc", but can this be true in
-     * the case of kmem_alloc? */
-
     NETPRI;
     MUTEX_ENTER(&rx_connHashTable_lock);
 
-    /* send in the clones */
-    for(cix = 0; cix <= nclones; ++cix) {
-         
-         ptconn = tconn;
-         tconn = rxi_AllocConnection();
-         tconn->type = RX_CLIENT_CONNECTION;
-         tconn->epoch = rx_epoch;
-         tconn->peer = rxi_FindPeer(shost, sport, 0, 1);
-         tconn->serviceId = sservice;
-         tconn->securityObject = securityObject;
-         tconn->securityData = (void *) 0;
-         tconn->securityIndex = serviceSecurityIndex;
-         tconn->ackRate = RX_FAST_ACK_RATE;
-         tconn->nSpecific = 0;
-         tconn->specific = NULL;
-         tconn->challengeEvent = NULL;
-         tconn->delayedAbortEvent = NULL;
-         tconn->abortCount = 0;
-         tconn->error = 0;
-    for (i = 0; i < RX_MAXCALLS; i++) {
-       tconn->twind[i] = rx_initSendWindow;
-       tconn->rwind[i] = rx_initReceiveWindow;
-    }
-         tconn->parent = 0;
-         tconn->next_clone = 0;
-         tconn->nclones = nclones;
-         rx_SetConnDeadTime(tconn, rx_connDeadTime);
-               
-         if(cix == 0) {
-               conn = tconn;
-         } else {
-               tconn->flags |= RX_CLONED_CONNECTION;
-               tconn->parent = conn;
-               ptconn->next_clone = tconn;
-         }
-
-         /* generic connection setup */
-#ifdef RX_ENABLE_LOCKS
-         MUTEX_INIT(&tconn->conn_call_lock, "conn call lock", MUTEX_DEFAULT, 0);
-         MUTEX_INIT(&tconn->conn_data_lock, "conn data lock", MUTEX_DEFAULT, 0);
-         CV_INIT(&tconn->conn_call_cv, "conn call cv", CV_DEFAULT, 0);
+    /* 
+     * allocate the connection and all of its clones.
+     * clones are flagged as such and have their 
+     * parent set to the 0th connection object.
+     */
+    for (nclones = rx_max_clones_per_connection, 
+            conn = tconn = 0, 
+            cix = 0; 
+        cix <= nclones; 
+        ++cix, ptconn = tconn) {
+       
+       tconn = rxi_AllocConnection();
+       tconn->cid = (rx_nextCid += RX_MAXCALLS);
+       tconn->type = RX_CLIENT_CONNECTION;
+       tconn->epoch = rx_epoch;
+       tconn->peer = rxi_FindPeer(shost, sport, 0, 1);
+       tconn->serviceId = sservice;
+       tconn->securityObject = securityObject;
+       tconn->securityData = (void *) 0;
+       tconn->securityIndex = serviceSecurityIndex;
+       tconn->ackRate = RX_FAST_ACK_RATE;
+       tconn->nSpecific = 0;
+       tconn->specific = NULL;
+       tconn->challengeEvent = NULL;
+       tconn->delayedAbortEvent = NULL;
+       tconn->abortCount = 0;
+       tconn->error = 0;
+       
+       for (i = 0; i < RX_MAXCALLS; i++) {
+           tconn->twind[i] = rx_initSendWindow;
+           tconn->rwind[i] = rx_initReceiveWindow;
+       }
+       
+       if (cix == 0) {
+           conn = tconn;
+           conn->nclones = nclones;
+           conn->parent = 0;
+           conn->next_clone = 0;
+           rx_SetConnDeadTime(conn, rx_connDeadTime);
+       } else {
+           tconn->nclones = 0;
+           tconn->flags |= RX_CLONED_CONNECTION;
+           tconn->parent = conn;
+           ptconn->next_clone = tconn;
+           tconn->secondsUntilDead = 0;
+           tconn->secondsUntilPing = 0;
+       }
+       /* generic connection setup */ 
+#ifdef        RX_ENABLE_LOCKS
+       MUTEX_INIT(&tconn->conn_call_lock, "conn call lock", MUTEX_DEFAULT,
+                  0);
+        MUTEX_INIT(&tconn->conn_data_lock, "conn data lock", MUTEX_DEFAULT,
+                  0);
+       CV_INIT(&tconn->conn_call_cv, "conn call cv", CV_DEFAULT, 0);
 #endif
-         cid = (rx_nextCid += RX_MAXCALLS);
-         tconn->cid = cid;
-         RXS_NewConnection(securityObject, tconn);
-         hashindex =
-               CONN_HASH(shost, sport, tconn->cid, tconn->epoch, 
-                                 RX_CLIENT_CONNECTION);
-         tconn->refCount++; /* no lock required since only this thread knows */
-         tconn->next = rx_connHashTable[hashindex];
-         rx_connHashTable[hashindex] = tconn;
-         rx_MutexIncrement(rx_stats.nClientConns, rx_stats_mutex);     
+       RXS_NewConnection(securityObject, tconn);
+       hashindex =
+           CONN_HASH(shost, sport, tconn->cid, tconn->epoch,
+                     RX_CLIENT_CONNECTION);
+       rx_AtomicIncrement_NL(tconn->refCount); /* no lock required since only this thread knows */
+       tconn->next = rx_connHashTable[hashindex];
+       rx_connHashTable[hashindex] = tconn;
+        if (rx_stats_active)
+            rx_AtomicIncrement(rx_stats.nClientConns, rx_stats_mutex);
     }
-    
+       
     MUTEX_EXIT(&rx_connHashTable_lock);
     USERPRI;
     return conn;
 }
 
 void
-rx_SetConnDeadTime(register struct rx_connection *conn, register int seconds)
+rx_SetConnDeadTime(struct rx_connection *conn, int seconds)
 {
-  /* The idea is to set the dead time to a value that allows several
-   * keepalives to be dropped without timing out the connection. */
-  struct rx_connection *tconn;
-  tconn = conn;
-  do {
-       tconn->secondsUntilDead = MAX(seconds, 6);
-       tconn->secondsUntilPing = tconn->secondsUntilDead / 6;
-  } while(tconn->next_clone && (tconn = tconn->next_clone));
+    /* The idea is to set the dead time to a value that allows several
+     * keepalives to be dropped without timing out the connection. */
+    struct rx_connection *tconn =
+        (rx_IsClonedConn(conn)) ? conn->parent : conn;
+    
+    tconn->secondsUntilDead = MAX(seconds, 6);
+    tconn->secondsUntilPing = rx_ConnSecondsUntilDead(tconn) / 6;
 }
 
-int rxi_lowPeerRefCount = 0;
-int rxi_lowConnRefCount = 0;
+rx_atomic_t rxi_lowPeerRefCount = 0;
+rx_atomic_t rxi_lowConnRefCount = 0;
 
 /*
  * Cleanup a connection that was destroyed in rxi_DestroyConnectioNoLock.
@@ -858,22 +914,24 @@ rxi_CleanupConnection(struct rx_connection *conn)
      * idle (refCount == 0) after rx_idlePeerTime (60 seconds) have passed.
      */
     MUTEX_ENTER(&rx_peerHashTable_lock);
-    if (conn->peer->refCount < 2) {
+    if (rx_AtomicDecrement_NL(conn->peer->refCount) < 1) {
        conn->peer->idleWhen = clock_Sec();
-       if (conn->peer->refCount < 1) {
-           conn->peer->refCount = 1;
-           MUTEX_ENTER(&rx_stats_mutex);
-           rxi_lowPeerRefCount++;
-           MUTEX_EXIT(&rx_stats_mutex);
+       if (rx_AtomicPeek_NL(conn->peer->refCount) < 0) {
+           rx_AtomicSwap_NL(&conn->peer->refCount, 0);
+            dpf(("UNDERCOUNT(peer %x)\n", conn->peer));
+           if (rx_stats_active)
+                rx_AtomicIncrement(rxi_lowPeerRefCount, rx_stats_mutex);
        }
     }
-    conn->peer->refCount--;
     MUTEX_EXIT(&rx_peerHashTable_lock);
 
-    if (conn->type == RX_SERVER_CONNECTION)
-       rx_MutexDecrement(rx_stats.nServerConns, rx_stats_mutex);
-    else
-       rx_MutexDecrement(rx_stats.nClientConns, rx_stats_mutex);
+    if (rx_stats_active) 
+    {
+        if (conn->type == RX_SERVER_CONNECTION)
+            rx_AtomicDecrement(rx_stats.nServerConns, rx_stats_mutex);
+        else
+            rx_AtomicDecrement(rx_stats.nClientConns, rx_stats_mutex);
+    }
 #ifndef KERNEL
     if (conn->specific) {
        int i;
@@ -897,52 +955,57 @@ rxi_CleanupConnection(struct rx_connection *conn)
 
 /* Destroy the specified connection */
 void
-rxi_DestroyConnection(register struct rx_connection *conn)
+rxi_DestroyConnection(struct rx_connection *conn)
 {
-  register struct rx_connection *tconn, *dtconn;
-
-  MUTEX_ENTER(&rx_connHashTable_lock);
-  
-  if(!(conn->flags & RX_CLONED_CONNECTION)) {
+    struct rx_connection *tconn, *dtconn;
+    
+    MUTEX_ENTER(&rx_connHashTable_lock);
+    
+    /* destroy any clones that might exist */
+    if (!rx_IsClonedConn(conn)) {
        tconn = conn->next_clone;
-       conn->next_clone = 0; /* once */
-       do {
-         if(tconn) {
-               dtconn = tconn;
-               tconn = tconn->next_clone;
-               rxi_DestroyConnectionNoLock(dtconn);
-               /* destroyed? */
-               if (dtconn == rx_connCleanup_list) {
-                 rx_connCleanup_list = rx_connCleanup_list->next;
-                 MUTEX_EXIT(&rx_connHashTable_lock);
-                 /* rxi_CleanupConnection will free tconn */   
-                 rxi_CleanupConnection(dtconn);
-                 MUTEX_ENTER(&rx_connHashTable_lock);
-                 (conn->nclones)--;
-               }
-         }
-       } while(tconn);
-  }
-
-  rxi_DestroyConnectionNoLock(conn);
-  /* conn should be at the head of the cleanup list */
-  if (conn == rx_connCleanup_list) {
+       conn->next_clone = 0;   /* once */
+       
+       while (tconn) {
+           dtconn = tconn;
+           tconn = tconn->next_clone;
+           rxi_DestroyConnectionNoLock(dtconn);
+           /*
+            * if destroyed dtconn will be the head of
+            * rx_connCleanup_list.  Remove it and clean 
+            * it up now as no one else is holding a 
+            * reference to it.
+            */
+           if (dtconn == rx_connCleanup_list) {
+               rx_connCleanup_list = rx_connCleanup_list->next;
+               MUTEX_EXIT(&rx_connHashTable_lock);
+               /* rxi_CleanupConnection will free dtconn */
+               rxi_CleanupConnection(dtconn);
+               MUTEX_ENTER(&rx_connHashTable_lock);
+               (conn->nclones)--;
+           }
+       }                       /* while(tconn) */
+    }
+    /* !rx_IsCloned */
+    rxi_DestroyConnectionNoLock(conn);
+    /* conn should be at the head of the cleanup list */
+    if (conn == rx_connCleanup_list) {
        rx_connCleanup_list = rx_connCleanup_list->next;
        MUTEX_EXIT(&rx_connHashTable_lock);
        rxi_CleanupConnection(conn);
-  }
+    }
 #ifdef RX_ENABLE_LOCKS
-  else {
+    else {
        MUTEX_EXIT(&rx_connHashTable_lock);
-  }
+    }
 #endif /* RX_ENABLE_LOCKS */
 }
 
 static void
-rxi_DestroyConnectionNoLock(register struct rx_connection *conn)
+rxi_DestroyConnectionNoLock(struct rx_connection *conn)
 {
-    register struct rx_connection **conn_ptr;
-    register int havecalls = 0;
+    struct rx_connection **conn_ptr;
+    int havecalls = 0;
     struct rx_packet *packet;
     int i;
     SPLVAR;
@@ -951,15 +1014,15 @@ rxi_DestroyConnectionNoLock(register struct rx_connection *conn)
 
     NETPRI;
     MUTEX_ENTER(&conn->conn_data_lock);
-    if (conn->refCount > 0)
-       conn->refCount--;
-    else {
-       MUTEX_ENTER(&rx_stats_mutex);
-       rxi_lowConnRefCount++;
-       MUTEX_EXIT(&rx_stats_mutex);
+    /* This requires the atomic type to be signed */
+    if (rx_AtomicDecrement_NL(conn->refCount) < 0) {
+        dpf(("UNDERCOUNT(conn %x)\n", conn));
+        if (rx_stats_active) {
+           rx_AtomicIncrement(rxi_lowConnRefCount, rx_stats_mutex);
+        }
     }
 
-    if ((conn->refCount > 0) || (conn->flags & RX_CONN_BUSY)) {
+    if ((rx_AtomicPeek_NL(conn->refCount) > 0) || (conn->flags & RX_CONN_BUSY)) {
        /* Busy; wait till the last guy before proceeding */
        MUTEX_EXIT(&conn->conn_data_lock);
        USERPRI;
@@ -980,7 +1043,7 @@ rxi_DestroyConnectionNoLock(register struct rx_connection *conn)
 
     /* Check for extant references to this connection */
     for (i = 0; i < RX_MAXCALLS; i++) {
-       register struct rx_call *call = conn->call[i];
+       struct rx_call *call = conn->call[i];
        if (call) {
            havecalls = 1;
            if (conn->type == RX_CLIENT_CONNECTION) {
@@ -1016,9 +1079,7 @@ rxi_DestroyConnectionNoLock(register struct rx_connection *conn)
     if (havecalls) {
        /* Don't destroy the connection if there are any call
         * structures still in use */
-       MUTEX_ENTER(&conn->conn_data_lock);
-       conn->flags |= RX_CONN_DESTROY_ME;
-       MUTEX_EXIT(&conn->conn_data_lock);
+        rx_MutexOr(conn->flags, RX_CONN_DESTROY_ME, conn->conn_data_lock);
        USERPRI;
        return;
     }
@@ -1067,7 +1128,7 @@ rxi_DestroyConnectionNoLock(register struct rx_connection *conn)
 
 /* Externally available version */
 void
-rx_DestroyConnection(register struct rx_connection *conn)
+rx_DestroyConnection(struct rx_connection *conn)
 {
     SPLVAR;
 
@@ -1077,17 +1138,16 @@ rx_DestroyConnection(register struct rx_connection *conn)
 }
 
 void
-rx_GetConnection(register struct rx_connection *conn)
+rx_GetConnection(struct rx_connection *conn)
 {
     SPLVAR;
 
     NETPRI;
-    MUTEX_ENTER(&conn->conn_data_lock);
-    conn->refCount++;
-    MUTEX_EXIT(&conn->conn_data_lock);
+    rx_AtomicIncrement(conn->refCount, conn->conn_data_lock);
     USERPRI;
 }
 
+#ifdef  AFS_GLOBAL_RXLOCK_KERNEL
 /* Wait for the transmit queue to no longer be busy. 
  * requires the call->lock to be held */
 static void rxi_WaitforTQBusy(struct rx_call *call) {
@@ -1106,6 +1166,8 @@ static void rxi_WaitforTQBusy(struct rx_call *call) {
        }
     }
 }
+#endif
+
 /* Start a new rx remote procedure call, on the specified connection.
  * If wait is set to 1, wait for a free call channel; otherwise return
  * 0.  Maxtime gives the maximum number of seconds this call may take,
@@ -1116,11 +1178,10 @@ static void rxi_WaitforTQBusy(struct rx_call *call) {
  * state and before we go to sleep.
  */
 struct rx_call *
-rx_NewCall(register struct rx_connection *conn)
+rx_NewCall(struct rx_connection *conn)
 {
-    register int i;
-    register struct rx_call *call;
-       register struct rx_connection *tconn;
+    int i;
+    struct rx_call *call;
     struct clock queueTime;
     SPLVAR;
 
@@ -1158,56 +1219,53 @@ rx_NewCall(register struct rx_connection *conn)
 #else
         osi_rxSleep(conn);
 #endif
-       MUTEX_ENTER(&conn->conn_data_lock);
-       conn->makeCallWaiters--;
-    } 
-    MUTEX_EXIT(&conn->conn_data_lock);
+        rx_MutexDecrement(conn->makeCallWaiters, conn->conn_data_lock);
+    } else {
+        MUTEX_EXIT(&conn->conn_data_lock);
+    }
 
-       /* search for next free call on this connection or 
-        * its clones, if any */
+    /* search for next free call on this connection or 
+     * its clones, if any */
     for (;;) {
-               tconn = conn;
-               do {
-                       for (i = 0; i < RX_MAXCALLS; i++) {
-                               call = tconn->call[i];
-                               if (call) {
-                                       MUTEX_ENTER(&call->lock);
-                                       if (call->state == RX_STATE_DALLY) {
-                                               rxi_ResetCall(call, 0);
-                                               (*call->callNumber)++;
-                                               goto f_call;
-                                       }
-                                       MUTEX_EXIT(&call->lock);
-                               } else {
-                                       call = rxi_NewCall(tconn, i);
-                                       goto f_call;
-                               }
-                       } /* for i < RX_MAXCALLS */
-               } while (tconn->next_clone && (tconn = tconn->next_clone));
-
-       f_call:
-
-               if (i < RX_MAXCALLS) {
-                       break;
-               }
-
-               /* to be here, all available calls for this connection (and all
-                * its clones) must be in use */
-
-               MUTEX_ENTER(&conn->conn_data_lock);
-               conn->flags |= RX_CONN_MAKECALL_WAITING;
-               conn->makeCallWaiters++;
-               MUTEX_EXIT(&conn->conn_data_lock);
-
+       struct rx_connection *tconn;
+       
+       for (tconn = conn; tconn; tconn = tconn->next_clone) {
+           for (i = 0; i < RX_MAXCALLS; i++) {
+               call = tconn->call[i];
+               if (call) {
+                   MUTEX_ENTER(&call->lock);
+                   if (call->state == RX_STATE_DALLY) {
+                       rxi_ResetCall(call, 0);
+                       (*call->callNumber)++;
+                       goto have_call;
+                   }
+                   MUTEX_EXIT(&call->lock);
+               } else {
+                   call = rxi_NewCall(tconn, i);
+                   goto have_call;
+              }
+           }                   /* for i < RX_MAXCALLS */
+       }
+       
+       /* 
+        * to be here, all available calls for this connection (and all
+        * of its clones) must be in use 
+        */
+       
+       MUTEX_ENTER(&conn->conn_data_lock);
+       conn->flags |= RX_CONN_MAKECALL_WAITING;
+       conn->makeCallWaiters++;
+       MUTEX_EXIT(&conn->conn_data_lock);
+       
 #ifdef RX_ENABLE_LOCKS
-               CV_WAIT(&conn->conn_call_cv, &conn->conn_call_lock);
+       CV_WAIT(&conn->conn_call_cv, &conn->conn_call_lock);
 #else
-               osi_rxSleep(conn);
+       osi_rxSleep(conn);
 #endif
-               MUTEX_ENTER(&conn->conn_data_lock);
-               conn->makeCallWaiters--;
-               MUTEX_EXIT(&conn->conn_data_lock);
+       rx_MutexDecrement(conn->makeCallWaiters, conn->conn_data_lock);
     } /* for ;; */
+
+ have_call:
     /*
      * Wake up anyone else who might be giving us a chance to
      * run (see code above that avoids resource starvation).
@@ -1222,7 +1280,7 @@ rx_NewCall(register struct rx_connection *conn)
 
     /* Client is initially in send mode */
     call->state = RX_STATE_ACTIVE;
-    call->error = conn->error;
+    call->error = rx_ConnError(conn);
     if (call->error)
        call->mode = RX_MODE_ERROR;
     else
@@ -1246,21 +1304,21 @@ rx_NewCall(register struct rx_connection *conn)
     MUTEX_ENTER(&call->lock);
     rxi_WaitforTQBusy(call);
     if (call->flags & RX_CALL_TQ_CLEARME) {
-       rxi_ClearTransmitQueue(call, 0);
-       queue_Init(&call->tq);
+       rxi_ClearTransmitQueue(call, 1);
+       /*queue_Init(&call->tq);*/
     }
     MUTEX_EXIT(&call->lock);
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
 
     dpf(("rx_NewCall(call %x)\n", call));
     return call;
-}
+}                              /* rx_NewCall */
 
 int
-rxi_HasActiveCalls(register struct rx_connection *aconn)
+rxi_HasActiveCalls(struct rx_connection *aconn)
 {
-    register int i;
-    register struct rx_call *tcall;
+    int i;
+    struct rx_call *tcall;
     SPLVAR;
 
     NETPRI;
@@ -1278,11 +1336,11 @@ rxi_HasActiveCalls(register struct rx_connection *aconn)
 }
 
 int
-rxi_GetCallNumberVector(register struct rx_connection *aconn,
-                       register afs_int32 * aint32s)
+rxi_GetCallNumberVector(struct rx_connection *aconn,
+                       afs_int32 * aint32s)
 {
-    register int i;
-    register struct rx_call *tcall;
+    int i;
+    struct rx_call *tcall;
     SPLVAR;
 
     NETPRI;
@@ -1297,11 +1355,11 @@ rxi_GetCallNumberVector(register struct rx_connection *aconn,
 }
 
 int
-rxi_SetCallNumberVector(register struct rx_connection *aconn,
-                       register afs_int32 * aint32s)
+rxi_SetCallNumberVector(struct rx_connection *aconn,
+                       afs_int32 * aint32s)
 {
-    register int i;
-    register struct rx_call *tcall;
+    int i;
+    struct rx_call *tcall;
     SPLVAR;
 
     NETPRI;
@@ -1329,8 +1387,8 @@ rx_NewServiceHost(afs_uint32 host, u_short port, u_short serviceId,
                  afs_int32(*serviceProc) (struct rx_call * acall))
 {
     osi_socket socket = OSI_NULLSOCKET;
-    register struct rx_service *tservice;
-    register int i;
+    struct rx_service *tservice;
+    int i;
     SPLVAR;
 
     clock_NewTime();
@@ -1355,7 +1413,7 @@ rx_NewServiceHost(afs_uint32 host, u_short port, u_short serviceId,
     tservice = rxi_AllocService();
     NETPRI;
     for (i = 0; i < RX_MAX_SERVICES; i++) {
-       register struct rx_service *service = rx_services[i];
+       struct rx_service *service = rx_services[i];
        if (service) {
            if (port == service->servicePort && host == service->serviceHost) {
                if (service->serviceId == serviceId) {
@@ -1445,9 +1503,9 @@ rx_NewService(u_short port, u_short serviceId, char *serviceName,
 void
 rxi_ServerProc(int threadID, struct rx_call *newcall, osi_socket * socketp)
 {
-    register struct rx_call *call;
-    register afs_int32 code;
-    register struct rx_service *tservice = NULL;
+    struct rx_call *call;
+    afs_int32 code;
+    struct rx_service *tservice = NULL;
 
     for (;;) {
        if (newcall) {
@@ -1502,9 +1560,8 @@ rxi_ServerProc(int threadID, struct rx_call *newcall, osi_socket * socketp)
            (*tservice->afterProc) (call, code);
 
        rx_EndCall(call, code);
-       MUTEX_ENTER(&rx_stats_mutex);
-       rxi_nCalls++;
-       MUTEX_EXIT(&rx_stats_mutex);
+       if (rx_stats_active)
+            rx_MutexIncrement(rxi_nCalls, rx_stats_mutex);
     }
 }
 
@@ -1581,7 +1638,7 @@ struct rx_call *
 rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
 {
     struct rx_serverQueueEntry *sq;
-    register struct rx_call *call = (struct rx_call *)0;
+    struct rx_call *call = (struct rx_call *)0;
     struct rx_service *service = NULL;
     SPLVAR;
 
@@ -1604,7 +1661,7 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
     }
     while (1) {
        if (queue_IsNotEmpty(&rx_incomingCallQueue)) {
-           register struct rx_call *tcall, *ncall, *choice2 = NULL;
+           struct rx_call *tcall, *ncall, *choice2 = NULL;
 
            /* Scan for eligible incoming calls.  A call is not eligible
             * if the maximum number of calls for its service type are
@@ -1618,27 +1675,32 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
                if (!QuotaOK(service)) {
                    continue;
                }
+               MUTEX_ENTER(&rx_pthread_mutex);
                if (tno == rxi_fcfs_thread_num
                    || !tcall->queue_item_header.next) {
+                   MUTEX_EXIT(&rx_pthread_mutex);
                    /* If we're the fcfs thread , then  we'll just use 
                     * this call. If we haven't been able to find an optimal 
                     * choice, and we're at the end of the list, then use a 
                     * 2d choice if one has been identified.  Otherwise... */
                    call = (choice2 ? choice2 : tcall);
                    service = call->conn->service;
-               } else if (!queue_IsEmpty(&tcall->rq)) {
-                   struct rx_packet *rp;
-                   rp = queue_First(&tcall->rq, rx_packet);
-                   if (rp->header.seq == 1) {
-                       if (!meltdown_1pkt
-                           || (rp->header.flags & RX_LAST_PACKET)) {
-                           call = tcall;
-                       } else if (rxi_2dchoice && !choice2
-                                  && !(tcall->flags & RX_CALL_CLEARED)
-                                  && (tcall->rprev > rxi_HardAckRate)) {
-                           choice2 = tcall;
-                       } else
-                           rxi_md2cnt++;
+               } else {
+                   MUTEX_EXIT(&rx_pthread_mutex);
+                   if (!queue_IsEmpty(&tcall->rq)) {
+                       struct rx_packet *rp;
+                       rp = queue_First(&tcall->rq, rx_packet);
+                       if (rp->header.seq == 1) {
+                           if (!meltdown_1pkt
+                               || (rp->header.flags & RX_LAST_PACKET)) {
+                               call = tcall;
+                           } else if (rxi_2dchoice && !choice2
+                                      && !(tcall->flags & RX_CALL_CLEARED)
+                                      && (tcall->rprev > rxi_HardAckRate)) {
+                               choice2 = tcall;
+                           } else
+                               rxi_md2cnt++;
+                       }
                    }
                }
                if (call) {
@@ -1656,9 +1718,7 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
 
            if (call->flags & RX_CALL_WAIT_PROC) {
                call->flags &= ~RX_CALL_WAIT_PROC;
-               MUTEX_ENTER(&rx_stats_mutex);
-               rx_nWaiting--;
-               MUTEX_EXIT(&rx_stats_mutex);
+               rx_MutexDecrement(rx_nWaiting, rx_waiting_mutex);
            }
 
            if (call->state != RX_STATE_PRECALL || call->error) {
@@ -1748,7 +1808,7 @@ struct rx_call *
 rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
 {
     struct rx_serverQueueEntry *sq;
-    register struct rx_call *call = (struct rx_call *)0, *choice2;
+    struct rx_call *call = (struct rx_call *)0, *choice2;
     struct rx_service *service = NULL;
     SPLVAR;
 
@@ -1774,7 +1834,7 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
        rxi_availProcs++;
     }
     if (queue_IsNotEmpty(&rx_incomingCallQueue)) {
-       register struct rx_call *tcall, *ncall;
+       struct rx_call *tcall, *ncall;
        /* Scan for eligible incoming calls.  A call is not eligible
         * if the maximum number of calls for its service type are
         * already executing */
@@ -1786,27 +1846,32 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
        for (queue_Scan(&rx_incomingCallQueue, tcall, ncall, rx_call)) {
            service = tcall->conn->service;
            if (QuotaOK(service)) {
+               MUTEX_ENTER(&rx_pthread_mutex);
                if (tno == rxi_fcfs_thread_num
                    || !tcall->queue_item_header.next) {
+                   MUTEX_EXIT(&rx_pthread_mutex);
                    /* If we're the fcfs thread, then  we'll just use 
                     * this call. If we haven't been able to find an optimal 
                     * choice, and we're at the end of the list, then use a 
                     * 2d choice if one has been identified.  Otherwise... */
                    call = (choice2 ? choice2 : tcall);
                    service = call->conn->service;
-               } else if (!queue_IsEmpty(&tcall->rq)) {
-                   struct rx_packet *rp;
-                   rp = queue_First(&tcall->rq, rx_packet);
-                   if (rp->header.seq == 1
-                       && (!meltdown_1pkt
-                           || (rp->header.flags & RX_LAST_PACKET))) {
-                       call = tcall;
-                   } else if (rxi_2dchoice && !choice2
-                              && !(tcall->flags & RX_CALL_CLEARED)
-                              && (tcall->rprev > rxi_HardAckRate)) {
-                       choice2 = tcall;
-                   } else
-                       rxi_md2cnt++;
+               } else {
+                   MUTEX_EXIT(&rx_pthread_mutex);
+                   if (!queue_IsEmpty(&tcall->rq)) {
+                       struct rx_packet *rp;
+                       rp = queue_First(&tcall->rq, rx_packet);
+                       if (rp->header.seq == 1
+                           && (!meltdown_1pkt
+                               || (rp->header.flags & RX_LAST_PACKET))) {
+                           call = tcall;
+                       } else if (rxi_2dchoice && !choice2
+                                  && !(tcall->flags & RX_CALL_CLEARED)
+                                  && (tcall->rprev > rxi_HardAckRate)) {
+                           choice2 = tcall;
+                       } else
+                           rxi_md2cnt++;
+                   }
                }
            }
            if (call)
@@ -1906,11 +1971,11 @@ rx_GetCall(int tno, struct rx_service *cur_service, osi_socket * socketp)
  * and (2) only use it once.  Other uses currently void your warranty
  */
 void
-rx_SetArrivalProc(register struct rx_call *call,
-                 register void (*proc) (register struct rx_call * call,
-                                       register void * mh,
-                                       register int index),
-                 register void * handle, register int arg)
+rx_SetArrivalProc(struct rx_call *call,
+                 void (*proc) (struct rx_call * call,
+                                       void * mh,
+                                       int index),
+                 void * handle, int arg)
 {
     call->arrivalProc = proc;
     call->arrivalProcHandle = handle;
@@ -1922,10 +1987,10 @@ rx_SetArrivalProc(register struct rx_call *call,
  * to the caller */
 
 afs_int32
-rx_EndCall(register struct rx_call *call, afs_int32 rc)
+rx_EndCall(struct rx_call *call, afs_int32 rc)
 {
-    register struct rx_connection *conn = call->conn;
-    register struct rx_service *service;
+    struct rx_connection *conn = call->conn;
+    struct rx_service *service;
     afs_int32 error;
     SPLVAR;
 
@@ -2030,14 +2095,18 @@ rx_EndCall(register struct rx_call *call, afs_int32 rc)
      * kernel version, and may interrupt the macros rx_Read or
      * rx_Write, which run at normal priority for efficiency. */
     if (call->currentPacket) {
-       queue_Prepend(&call->iovq, call->currentPacket);
+        call->currentPacket->flags &= ~RX_PKTFLAG_CP;
+       rxi_FreePacket(call->currentPacket);
        call->currentPacket = (struct rx_packet *)0;
     }
        
     call->nLeft = call->nFree = call->curlen = 0;
 
     /* Free any packets from the last call to ReadvProc/WritevProc */
-    rxi_FreePackets(0, &call->iovq);
+#ifdef RXDEBUG_PACKET
+    call->iovqc -=
+#endif /* RXDEBUG_PACKET */
+        rxi_FreePackets(0, &call->iovq);
 
     CALL_RELE(call, RX_CALL_REFCOUNT_BEGIN);
     MUTEX_EXIT(&call->lock);
@@ -2064,7 +2133,7 @@ rx_EndCall(register struct rx_call *call, afs_int32 rc)
 void
 rx_Finalize(void)
 {
-    register struct rx_connection **conn_ptr, **conn_end;
+    struct rx_connection **conn_ptr, **conn_end;
 
     INIT_PTHREAD_LOCKS;
     LOCK_RX_INIT;
@@ -2083,7 +2152,7 @@ rx_Finalize(void)
                next = conn->next;
                if (conn->type == RX_CLIENT_CONNECTION) {
                    /* MUTEX_ENTER(&conn->conn_data_lock); when used in kernel */
-                   conn->refCount++;
+                   rx_AtomicIncrement(conn->refCount, conn->conn_data_lock);
                    /* MUTEX_EXIT(&conn->conn_data_lock); when used in kernel */
 #ifdef RX_ENABLE_LOCKS
                    rxi_DestroyConnectionNoLock(conn);
@@ -2144,9 +2213,9 @@ rxi_PacketsUnWait(void)
 /* Return this process's service structure for the
  * specified socket and service */
 struct rx_service *
-rxi_FindService(register osi_socket socket, register u_short serviceId)
+rxi_FindService(osi_socket socket, u_short serviceId)
 {
-    register struct rx_service **sp;
+    struct rx_service **sp;
     for (sp = &rx_services[0]; *sp; sp++) {
        if ((*sp)->serviceId == serviceId && (*sp)->socket == socket)
            return *sp;
@@ -2154,16 +2223,24 @@ rxi_FindService(register osi_socket socket, register u_short serviceId)
     return 0;
 }
 
+#ifdef DEBUG
+#ifdef KDUMP_RX_LOCK
+static struct rx_call_rx_lock *rx_allCallsp = 0;
+#else
+static struct rx_call *rx_allCallsp = 0;
+#endif
+#endif /* DEBUG */
+
 /* Allocate a call structure, for the indicated channel of the
  * supplied connection.  The mode and state of the call must be set by
  * the caller. Returns the call with mutex locked. */
 struct rx_call *
-rxi_NewCall(register struct rx_connection *conn, register int channel)
+rxi_NewCall(struct rx_connection *conn, int channel)
 {
-    register struct rx_call *call;
+    struct rx_call *call;
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
-    register struct rx_call *cp;       /* Call pointer temp */
-    register struct rx_call *nxp;      /* Next call pointer, for queue_Scan */
+    struct rx_call *cp;        /* Call pointer temp */
+    struct rx_call *nxp;       /* Next call pointer, for queue_Scan */
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
 
     dpf(("rxi_NewCall(conn %x, channel %d)\n", conn, channel));
@@ -2191,35 +2268,45 @@ rxi_NewCall(register struct rx_connection *conn, register int channel)
        call = queue_First(&rx_freeCallQueue, rx_call);
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
        queue_Remove(call);
-        rx_MutexDecrement(rx_stats.nFreeCallStructs, rx_stats_mutex);
+        if (rx_stats_active)
+            rx_AtomicDecrement(rx_stats.nFreeCallStructs, rx_stats_mutex);
        MUTEX_EXIT(&rx_freeCallQueue_lock);
        MUTEX_ENTER(&call->lock);
        CLEAR_CALL_QUEUE_LOCK(call);
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
        /* Now, if TQ wasn't cleared earlier, do it now. */
        if (call->flags & RX_CALL_TQ_CLEARME) {
-           rxi_ClearTransmitQueue(call, 0);
-           queue_Init(&call->tq);
+           rxi_ClearTransmitQueue(call, 1);
+           /*queue_Init(&call->tq);*/
        }
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
        /* Bind the call to its connection structure */
        call->conn = conn;
        rxi_ResetCall(call, 1);
     } else {
-       call = (struct rx_call *)rxi_Alloc(sizeof(struct rx_call));
 
-       MUTEX_EXIT(&rx_freeCallQueue_lock);
+       call = (struct rx_call *)rxi_Alloc(sizeof(struct rx_call));
+#ifdef RXDEBUG_PACKET
+        call->allNextp = rx_allCallsp;
+        rx_allCallsp = call;
+        call->call_id = 
+#endif /* RXDEBUG_PACKET */
+            rx_AtomicIncrement(rx_stats.nCallStructs, rx_stats_mutex);
+        
+        MUTEX_EXIT(&rx_freeCallQueue_lock);
        MUTEX_INIT(&call->lock, "call lock", MUTEX_DEFAULT, NULL);
        MUTEX_ENTER(&call->lock);
        CV_INIT(&call->cv_twind, "call twind", CV_DEFAULT, 0);
        CV_INIT(&call->cv_rq, "call rq", CV_DEFAULT, 0);
        CV_INIT(&call->cv_tq, "call tq", CV_DEFAULT, 0);
 
-        rx_MutexIncrement(rx_stats.nFreeCallStructs, rx_stats_mutex);
        /* Initialize once-only items */
        queue_Init(&call->tq);
        queue_Init(&call->rq);
        queue_Init(&call->iovq);
+#ifdef RXDEBUG_PACKET
+        call->rqc = call->tqc = call->iovqc = 0;
+#endif /* RXDEBUG_PACKET */
        /* Bind the call to its connection structure (prereq for reset) */
        call->conn = conn;
        rxi_ResetCall(call, 1);
@@ -2248,14 +2335,14 @@ rxi_NewCall(register struct rx_connection *conn, register int channel)
  */
 #ifdef RX_ENABLE_LOCKS
 void
-rxi_FreeCall(register struct rx_call *call, int haveCTLock)
+rxi_FreeCall(struct rx_call *call, int haveCTLock)
 #else /* RX_ENABLE_LOCKS */
 void
-rxi_FreeCall(register struct rx_call *call)
+rxi_FreeCall(struct rx_call *call)
 #endif                         /* RX_ENABLE_LOCKS */
 {
-    register int channel = call->channel;
-    register struct rx_connection *conn = call->conn;
+    int channel = call->channel;
+    struct rx_connection *conn = call->conn;
 
 
     if (call->state == RX_STATE_DALLY || call->state == RX_STATE_HOLD)
@@ -2277,7 +2364,8 @@ rxi_FreeCall(register struct rx_call *call)
 #else /* AFS_GLOBAL_RXLOCK_KERNEL */
     queue_Append(&rx_freeCallQueue, call);
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
-    rx_MutexIncrement(rx_stats.nFreeCallStructs, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_AtomicIncrement(rx_stats.nFreeCallStructs, rx_stats_mutex);
     MUTEX_EXIT(&rx_freeCallQueue_lock);
 
     /* Destroy the connection if it was previously slated for
@@ -2293,9 +2381,7 @@ rxi_FreeCall(register struct rx_call *call)
      * call lock held or are going through this section of code.
      */
     if (conn->flags & RX_CONN_DESTROY_ME && !(conn->flags & RX_CONN_MAKECALL_WAITING)) {
-       MUTEX_ENTER(&conn->conn_data_lock);
-       conn->refCount++;
-       MUTEX_EXIT(&conn->conn_data_lock);
+       rx_AtomicIncrement(conn->refCount, conn->conn_data_lock);
 #ifdef RX_ENABLE_LOCKS
        if (haveCTLock)
            rxi_DestroyConnectionNoLock(conn);
@@ -2309,13 +2395,19 @@ rxi_FreeCall(register struct rx_call *call)
 
 afs_int32 rxi_Alloccnt = 0, rxi_Allocsize = 0;
 char *
-rxi_Alloc(register size_t size)
+rxi_Alloc(size_t size)
 {
-    register char *p;
+    char *p;
 
-    rx_MutexAdd1Increment2(rxi_Allocsize, (afs_int32)size, rxi_Alloccnt, rx_stats_mutex);
-    p = (char *)osi_Alloc(size);
+    if (rx_stats_active)
+        rx_MutexAdd1Increment2(rxi_Allocsize, (afs_int32)size, rxi_Alloccnt, rx_stats_mutex);
 
+p = (char *)
+#if defined(KERNEL) && !defined(UKERNEL) && defined(AFS_FBSD80_ENV)
+  afs_osi_Alloc_NoSleep(size);
+#else
+  osi_Alloc(size);
+#endif
     if (!p)
        osi_Panic("rxi_Alloc error");
     memset(p, 0, size);
@@ -2323,14 +2415,15 @@ rxi_Alloc(register size_t size)
 }
 
 void
-rxi_Free(void *addr, register size_t size)
+rxi_Free(void *addr, size_t size)
 {
-    rx_MutexAdd1Decrement2(rxi_Allocsize, -(afs_int32)size, rxi_Alloccnt, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_MutexAdd1Decrement2(rxi_Allocsize, -(afs_int32)size, rxi_Alloccnt, rx_stats_mutex);
     osi_Free(addr, size);
 }
 
 void 
-rxi_SetPeerMtu(register afs_uint32 host, register afs_uint32 port, int mtu)
+rxi_SetPeerMtu(afs_uint32 host, afs_uint32 port, int mtu)
 {
     struct rx_peer **peer_ptr, **peer_end;
     int hashIndex;
@@ -2352,7 +2445,7 @@ rxi_SetPeerMtu(register afs_uint32 host, register afs_uint32 port, int mtu)
            }
        }
     } else {
-       struct rx_peer *peer, *next;
+       struct rx_peer *peer;
        hashIndex = PEER_HASH(host, port);
        for (peer = rx_peerHashTable[hashIndex]; peer; peer = peer->next) {
            if ((peer->host == host) && (peer->port == port)) {
@@ -2373,10 +2466,10 @@ rxi_SetPeerMtu(register afs_uint32 host, register afs_uint32 port, int mtu)
  * refcount will be be decremented. This is used to replace the peer
  * structure hanging off a connection structure */
 struct rx_peer *
-rxi_FindPeer(register afs_uint32 host, register u_short port,
+rxi_FindPeer(afs_uint32 host, u_short port,
              struct rx_peer *origPeer, int create)
 {
-    register struct rx_peer *pp;
+    struct rx_peer *pp;
     int hashIndex;
     hashIndex = PEER_HASH(host, port);
     MUTEX_ENTER(&rx_peerHashTable_lock);
@@ -2395,14 +2488,15 @@ rxi_FindPeer(register afs_uint32 host, register u_short port,
            pp->next = rx_peerHashTable[hashIndex];
            rx_peerHashTable[hashIndex] = pp;
            rxi_InitPeerParams(pp);
-           rx_MutexIncrement(rx_stats.nPeerStructs, rx_stats_mutex);
+           if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.nPeerStructs, rx_stats_mutex);
        }
     }
     if (pp && create) {
-       pp->refCount++;
+       rx_AtomicIncrement_NL(pp->refCount);
     }
     if (origPeer)
-       origPeer->refCount--;
+       rx_AtomicDecrement_NL(origPeer->refCount);
     MUTEX_EXIT(&rx_peerHashTable_lock);
     return pp;
 }
@@ -2421,12 +2515,12 @@ rxi_FindPeer(register afs_uint32 host, register u_short port,
  * server connection is created, it will be created using the supplied
  * index, if the index is valid for this service */
 struct rx_connection *
-rxi_FindConnection(osi_socket socket, register afs_int32 host,
-                  register u_short port, u_short serviceId, afs_uint32 cid,
+rxi_FindConnection(osi_socket socket, afs_int32 host,
+                  u_short port, u_short serviceId, afs_uint32 cid,
                   afs_uint32 epoch, int type, u_int securityIndex)
 {
     int hashindex, flag, i;
-    register struct rx_connection *conn;
+    struct rx_connection *conn;
     hashindex = CONN_HASH(host, port, cid, epoch, type);
     MUTEX_ENTER(&rx_connHashTable_lock);
     rxLastConn ? (conn = rxLastConn, flag = 0) : (conn =
@@ -2435,7 +2529,7 @@ rxi_FindConnection(osi_socket socket, register afs_int32 host,
     for (; conn;) {
        if ((conn->type == type) && ((cid & RX_CIDMASK) == conn->cid)
            && (epoch == conn->epoch)) {
-           register struct rx_peer *pp = conn->peer;
+           struct rx_peer *pp = conn->peer;
            if (securityIndex != conn->securityIndex) {
                /* this isn't supposed to happen, but someone could forge a packet
                 * like this, and there seems to be some CM bug that makes this
@@ -2505,12 +2599,11 @@ rxi_FindConnection(osi_socket socket, register afs_int32 host,
        /* XXXX Connection timeout? */
        if (service->newConnProc)
            (*service->newConnProc) (conn);
-        rx_MutexIncrement(rx_stats.nServerConns, rx_stats_mutex);
+        if (rx_stats_active)
+            rx_AtomicIncrement(rx_stats.nServerConns, rx_stats_mutex);
     }
 
-    MUTEX_ENTER(&conn->conn_data_lock);
-    conn->refCount++;
-    MUTEX_EXIT(&conn->conn_data_lock);
+    rx_AtomicIncrement(conn->refCount, conn->conn_data_lock);
 
     rxLastConn = conn;         /* store this connection as the last conn used */
     MUTEX_EXIT(&rx_connHashTable_lock);
@@ -2525,8 +2618,8 @@ rxi_FindConnection(osi_socket socket, register afs_int32 host,
  * containing the network address.  Both can be modified.  The return value, if
  * non-zero, indicates that the packet should be dropped.  */
 
-int (*rx_justReceived) () = 0;
-int (*rx_almostSent) () = 0;
+int (*rx_justReceived) (struct rx_packet *, struct sockaddr_in *) = 0;
+int (*rx_almostSent) (struct rx_packet *, struct sockaddr_in *) = 0;
 
 /* A packet has been received off the interface.  Np is the packet, socket is
  * the socket number it was received from (useful in determining which service
@@ -2535,12 +2628,12 @@ int (*rx_almostSent) () = 0;
  * it, rather than de-allocating it, just as a small performance hack */
 
 struct rx_packet *
-rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
+rxi_ReceivePacket(struct rx_packet *np, osi_socket socket,
                  afs_uint32 host, u_short port, int *tnop,
                  struct rx_call **newcallp)
 {
-    register struct rx_call *call;
-    register struct rx_connection *conn;
+    struct rx_call *call;
+    struct rx_connection *conn;
     int channel;
     afs_uint32 currentCallNumber;
     int type;
@@ -2616,12 +2709,12 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
 
     /* If the connection is in an error state, send an abort packet and ignore
      * the incoming packet */
-    if (conn->error) {
+    if (rx_ConnError(conn)) {
        /* Don't respond to an abort packet--we don't want loops! */
        MUTEX_ENTER(&conn->conn_data_lock);
        if (np->header.type != RX_PACKET_TYPE_ABORT)
            np = rxi_SendConnectionAbort(conn, np, 1, 0);
-       conn->refCount--;
+       rx_AtomicDecrement_NL(conn->refCount);
        MUTEX_EXIT(&conn->conn_data_lock);
        return np;
     }
@@ -2634,30 +2727,22 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
            afs_int32 errcode = ntohl(rx_GetInt32(np, 0));
            dpf(("rxi_ReceivePacket ABORT rx_GetInt32 = %d", errcode));
            rxi_ConnectionError(conn, errcode);
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
        case RX_PACKET_TYPE_CHALLENGE:
            tnp = rxi_ReceiveChallengePacket(conn, np, 1);
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return tnp;
        case RX_PACKET_TYPE_RESPONSE:
            tnp = rxi_ReceiveResponsePacket(conn, np, 1);
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return tnp;
        case RX_PACKET_TYPE_PARAMS:
        case RX_PACKET_TYPE_PARAMS + 1:
        case RX_PACKET_TYPE_PARAMS + 2:
            /* ignore these packet types for now */
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
 
 
@@ -2667,7 +2752,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
            rxi_ConnectionError(conn, RX_PROTOCOL_ERROR);
            MUTEX_ENTER(&conn->conn_data_lock);
            tnp = rxi_SendConnectionAbort(conn, np, 1, 0);
-           conn->refCount--;
+           rx_AtomicDecrement_NL(conn->refCount);
            MUTEX_EXIT(&conn->conn_data_lock);
            return tnp;
        }
@@ -2703,10 +2788,9 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
             * then, since this is a client connection we're getting data for
             * it must be for the previous call.
             */
-           rx_MutexIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
     }
@@ -2715,14 +2799,13 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
 
     if (type == RX_SERVER_CONNECTION) {        /* We're the server */
        if (np->header.callNumber < currentCallNumber) {
-           rx_MutexIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
+           if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
 #ifdef RX_ENABLE_LOCKS
            if (call)
                MUTEX_EXIT(&call->lock);
 #endif
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
        if (!call) {
@@ -2730,9 +2813,10 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
            call = rxi_NewCall(conn, channel);
            MUTEX_EXIT(&conn->conn_call_lock);
            *call->callNumber = np->header.callNumber;
+#ifdef RXDEBUG
            if (np->header.callNumber == 0) 
                dpf(("RecPacket call 0 %d %s: %x.%u.%u.%u.%u.%u.%u flags %d, packet %lx resend %d.%0.3d len %d", np->header.serial, rx_packetTypes[np->header.type - 1], ntohl(conn->peer->host), ntohs(conn->peer->port), np->header.serial, np->header.epoch, np->header.cid, np->header.callNumber, np->header.seq, np->header.flags, (unsigned long)np, np->retryTime.sec, np->retryTime.usec / 1000, np->length));
-
+#endif
            call->state = RX_STATE_PRECALL;
            clock_GetTime(&call->queueTime);
            hzero(call->bytesSent);
@@ -2747,10 +2831,9 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
                rxi_CallError(call, rx_BusyError);
                tp = rxi_SendCallAbort(call, np, 1, 0);
                MUTEX_EXIT(&call->lock);
-               MUTEX_ENTER(&conn->conn_data_lock);
-               conn->refCount--;
-               MUTEX_EXIT(&conn->conn_data_lock);
-                rx_MutexIncrement(rx_stats.nBusies, rx_stats_mutex);
+               rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
+                if (rx_stats_active)
+                    rx_AtomicIncrement(rx_stats.nBusies, rx_stats_mutex);
                return tp;
            }
            rxi_KeepAliveOn(call);
@@ -2786,16 +2869,15 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
                tp = rxi_SendSpecial(call, conn, np, RX_PACKET_TYPE_BUSY,
                                     NULL, 0, 1);
                MUTEX_EXIT(&call->lock);
-               MUTEX_ENTER(&conn->conn_data_lock);
-               conn->refCount--;
-               MUTEX_EXIT(&conn->conn_data_lock);
+               rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
                return tp;
            }
            rxi_ResetCall(call, 0);
            *call->callNumber = np->header.callNumber;
+#ifdef RXDEBUG
            if (np->header.callNumber == 0) 
                dpf(("RecPacket call 0 %d %s: %x.%u.%u.%u.%u.%u.%u flags %d, packet %lx resend %d.%0.3d len %d", np->header.serial, rx_packetTypes[np->header.type - 1], ntohl(conn->peer->host), ntohs(conn->peer->port), np->header.serial, np->header.epoch, np->header.cid, np->header.callNumber, np->header.seq, np->header.flags, (unsigned long)np, np->retryTime.sec, np->retryTime.usec / 1000, np->length));
-
+#endif
            call->state = RX_STATE_PRECALL;
            clock_GetTime(&call->queueTime);
            hzero(call->bytesSent);
@@ -2810,10 +2892,9 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
                rxi_CallError(call, rx_BusyError);
                tp = rxi_SendCallAbort(call, np, 1, 0);
                MUTEX_EXIT(&call->lock);
-               MUTEX_ENTER(&conn->conn_data_lock);
-               conn->refCount--;
-               MUTEX_EXIT(&conn->conn_data_lock);
-                rx_MutexIncrement(rx_stats.nBusies, rx_stats_mutex);
+               rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
+                if (rx_stats_active)
+                    rx_AtomicIncrement(rx_stats.nBusies, rx_stats_mutex);
                return tp;
            }
            rxi_KeepAliveOn(call);
@@ -2824,30 +2905,28 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
        /* Ignore all incoming acknowledgements for calls in DALLY state */
        if (call && (call->state == RX_STATE_DALLY)
            && (np->header.type == RX_PACKET_TYPE_ACK)) {
-           rx_MutexIncrement(rx_stats.ignorePacketDally, rx_stats_mutex);
+           if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.ignorePacketDally, rx_stats_mutex);
 #ifdef  RX_ENABLE_LOCKS
            if (call) {
                MUTEX_EXIT(&call->lock);
            }
 #endif
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
 
        /* Ignore anything that's not relevant to the current call.  If there
         * isn't a current call, then no packet is relevant. */
        if (!call || (np->header.callNumber != currentCallNumber)) {
-           rx_MutexIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
+           if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
 #ifdef RX_ENABLE_LOCKS
            if (call) {
                MUTEX_EXIT(&call->lock);
            }
 #endif
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
        /* If the service security object index stamped in the packet does not
@@ -2856,9 +2935,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
 #ifdef RX_ENABLE_LOCKS
            MUTEX_EXIT(&call->lock);
 #endif
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
            return np;
        }
 
@@ -2904,11 +2981,10 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
                 * XXX interact badly with the server-restart detection 
                 * XXX code in receiveackpacket.  */
                if (ntohl(rx_GetInt32(np, FIRSTACKOFFSET)) < call->tfirst) {
-                    rx_MutexIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
+                    if (rx_stats_active)
+                        rx_AtomicIncrement(rx_stats.spuriousPacketsRead, rx_stats_mutex);
                    MUTEX_EXIT(&call->lock);
-                   MUTEX_ENTER(&conn->conn_data_lock);
-                   conn->refCount--;
-                   MUTEX_EXIT(&conn->conn_data_lock);
+                   rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
                    return np;
                }
            }
@@ -2935,7 +3011,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
     conn->lastSerial = np->header.serial;
     MUTEX_EXIT(&conn->conn_data_lock);
     if (skew > 0) {
-       register struct rx_peer *peer;
+       struct rx_peer *peer;
        peer = conn->peer;
        if (skew > peer->inPacketSkew) {
            dpf(("*** In skew changed from %d to %d\n", peer->inPacketSkew,
@@ -2970,9 +3046,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
        dpf(("rxi_ReceivePacket ABORT rx_DataOf = %d", errdata));
        rxi_CallError(call, errdata);
        MUTEX_EXIT(&call->lock);
-       MUTEX_ENTER(&conn->conn_data_lock);
-       conn->refCount--;
-       MUTEX_EXIT(&conn->conn_data_lock);
+       rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
        return np;              /* xmitting; drop packet */
     }
     case RX_PACKET_TYPE_BUSY:
@@ -2997,9 +3071,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
            break;
 #else /* RX_ENABLE_LOCKS */
            MUTEX_EXIT(&call->lock);
-           MUTEX_ENTER(&conn->conn_data_lock);
-           conn->refCount--;
-           MUTEX_EXIT(&conn->conn_data_lock);
+           rx_MutexDecrement(conn->refCount, conn->conn_data_lock);
            return np;          /* xmitting; drop packet */
 #endif /* RX_ENABLE_LOCKS */
        }
@@ -3020,9 +3092,7 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
      * (if not, then the time won't actually be re-evaluated here). */
     call->lastReceiveTime = clock_Sec();
     MUTEX_EXIT(&call->lock);
-    MUTEX_ENTER(&conn->conn_data_lock);
-    conn->refCount--;
-    MUTEX_EXIT(&conn->conn_data_lock);
+    rx_AtomicDecrement(conn->refCount, conn->conn_data_lock);
     return np;
 }
 
@@ -3031,8 +3101,8 @@ rxi_ReceivePacket(register struct rx_packet *np, osi_socket socket,
 int
 rxi_IsConnInteresting(struct rx_connection *aconn)
 {
-    register int i;
-    register struct rx_call *tcall;
+    int i;
+    struct rx_call *tcall;
 
     if (aconn->flags & (RX_CONN_MAKECALL_WAITING | RX_CONN_DESTROY_ME))
        return 1;
@@ -3062,7 +3132,8 @@ static int
 TooLow(struct rx_packet *ap, struct rx_call *acall)
 {
     int rc = 0;
-    MUTEX_ENTER(&rx_stats_mutex);
+
+    MUTEX_ENTER(&rx_quota_mutex);
     if (((ap->header.seq != 1) && (acall->flags & RX_CALL_CLEARED)
         && (acall->state == RX_STATE_PRECALL))
        || ((rx_nFreePackets < rxi_dataQuota + 2)
@@ -3070,15 +3141,16 @@ TooLow(struct rx_packet *ap, struct rx_call *acall)
                 && (acall->flags & RX_CALL_READER_WAIT)))) {
        rc = 1;
     }
-    MUTEX_EXIT(&rx_stats_mutex);
+    MUTEX_EXIT(&rx_quota_mutex);
     return rc;
 }
 #endif /* KERNEL */
 
 static void
-rxi_CheckReachEvent(struct rxevent *event, struct rx_connection *conn,
-                   struct rx_call *acall)
+rxi_CheckReachEvent(struct rxevent *event, void *arg1, void *arg2)
 {
+    struct rx_connection *conn = arg1;
+    struct rx_call *acall = arg2;
     struct rx_call *call = acall;
     struct clock when, now;
     int i, waiting;
@@ -3087,7 +3159,7 @@ rxi_CheckReachEvent(struct rxevent *event, struct rx_connection *conn,
     conn->checkReachEvent = NULL;
     waiting = conn->flags & RX_CONN_ATTACHWAIT;
     if (event)
-       conn->refCount--;
+       rx_AtomicDecrement_NL(conn->refCount);
     MUTEX_EXIT(&conn->conn_data_lock);
 
     if (waiting) {
@@ -3124,7 +3196,7 @@ rxi_CheckReachEvent(struct rxevent *event, struct rx_connection *conn,
            when.sec += RX_CHECKREACH_TIMEOUT;
            MUTEX_ENTER(&conn->conn_data_lock);
            if (!conn->checkReachEvent) {
-               conn->refCount++;
+               rx_AtomicIncrement_NL(conn->refCount);
                conn->checkReachEvent =
                    rxevent_PostNow(&when, &now, rxi_CheckReachEvent, conn, 
                                    NULL);
@@ -3166,8 +3238,8 @@ rxi_CheckConnReach(struct rx_connection *conn, struct rx_call *call)
 
 /* try to attach call, if authentication is complete */
 static void
-TryAttach(register struct rx_call *acall, register osi_socket socket,
-         register int *tnop, register struct rx_call **newcallp,
+TryAttach(struct rx_call *acall, osi_socket socket,
+         int *tnop, struct rx_call **newcallp,
          int reachOverride)
 {
     struct rx_connection *conn = acall->conn;
@@ -3192,8 +3264,8 @@ TryAttach(register struct rx_call *acall, register osi_socket socket,
  * routine can return a packet to the caller, for re-use */
 
 struct rx_packet *
-rxi_ReceiveDataPacket(register struct rx_call *call,
-                     register struct rx_packet *np, int istack,
+rxi_ReceiveDataPacket(struct rx_call *call,
+                     struct rx_packet *np, int istack,
                      osi_socket socket, afs_uint32 host, u_short port,
                      int *tnop, struct rx_call **newcallp)
 {
@@ -3201,11 +3273,13 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
     int newPackets = 0;
     int didHardAck = 0;
     int haveLast = 0;
-    afs_uint32 seq, serial, flags;
+    afs_uint32 seq; 
+    afs_uint32 serial=0, flags=0;
     int isFirst;
     struct rx_packet *tnp;
     struct clock when, now;
-    rx_MutexIncrement(rx_stats.dataPacketsRead, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_AtomicIncrement(rx_stats.dataPacketsRead, rx_stats_mutex);
 
 #ifdef KERNEL
     /* If there are no packet buffers, drop this new packet, unless we can find
@@ -3215,7 +3289,8 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
        MUTEX_ENTER(&rx_freePktQ_lock);
        rxi_NeedMorePackets = TRUE;
        MUTEX_EXIT(&rx_freePktQ_lock);
-        rx_MutexIncrement(rx_stats.noPacketBuffersOnRead, rx_stats_mutex);
+        if (rx_stats_active)
+            rx_AtomicIncrement(rx_stats.noPacketBuffersOnRead, rx_stats_mutex);
        call->rprev = np->header.serial;
        rxi_calltrace(RX_TRACE_DROP, call);
        dpf(("packet %x dropped on receipt - quota problems", np));
@@ -3280,7 +3355,8 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
            /* Check to make sure it is not a duplicate of one already queued */
            if (queue_IsNotEmpty(&call->rq)
                && queue_First(&call->rq, rx_packet)->header.seq == seq) {
-                rx_MutexIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
+                if (rx_stats_active)
+                    rx_AtomicIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
                dpf(("packet %x dropped on receipt - duplicate", np));
                rxevent_Cancel(call->delayedAckEvent, call,
                               RX_CALL_REFCOUNT_DELAY);
@@ -3293,7 +3369,11 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
            /* It's the next packet. Stick it on the receive queue
             * for this call. Set newPackets to make sure we wake
             * the reader once all packets have been processed */
+           np->flags |= RX_PKTFLAG_RQ;
            queue_Prepend(&call->rq, np);
+#ifdef RXDEBUG_PACKET
+            call->rqc++;
+#endif /* RXDEBUG_PACKET */
            call->nSoftAcks++;
            np = NULL;          /* We can't use this anymore */
            newPackets = 1;
@@ -3364,7 +3444,8 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
            /* If the new packet's sequence number has been sent to the
             * application already, then this is a duplicate */
            if (seq < call->rnext) {
-                rx_MutexIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
+                if (rx_stats_active)
+                    rx_AtomicIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
                rxevent_Cancel(call->delayedAckEvent, call,
                               RX_CALL_REFCOUNT_DELAY);
                np = rxi_SendAck(call, np, serial, RX_ACK_DUPLICATE, istack);
@@ -3391,7 +3472,8 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
                 0, queue_Scan(&call->rq, tp, nxp, rx_packet)) {
                /*Check for duplicate packet */
                if (seq == tp->header.seq) {
-                    rx_MutexIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
+                    if (rx_stats_active)
+                        rx_AtomicIncrement(rx_stats.dupPacketsRead, rx_stats_mutex);
                    rxevent_Cancel(call->delayedAckEvent, call,
                                   RX_CALL_REFCOUNT_DELAY);
                    np = rxi_SendAck(call, np, serial, RX_ACK_DUPLICATE,
@@ -3422,6 +3504,10 @@ rxi_ReceiveDataPacket(register struct rx_call *call,
             * packet before which to insert the new packet, or at the
             * queue head if the queue is empty or the packet should be
             * appended. */
+            np->flags |= RX_PKTFLAG_RQ;
+#ifdef RXDEBUG_PACKET
+            call->rqc++;
+#endif /* RXDEBUG_PACKET */
            queue_InsertBefore(tp, np);
            call->nSoftAcks++;
            np = NULL;
@@ -3610,14 +3696,14 @@ rxi_ComputePeerNetStats(struct rx_call *call, struct rx_packet *p,
 
 /* The real smarts of the whole thing.  */
 struct rx_packet *
-rxi_ReceiveAckPacket(register struct rx_call *call, struct rx_packet *np,
+rxi_ReceiveAckPacket(struct rx_call *call, struct rx_packet *np,
                     int istack)
 {
     struct rx_ackPacket *ap;
     int nAcks;
-    register struct rx_packet *tp;
-    register struct rx_packet *nxp;    /* Next packet pointer for queue_Scan */
-    register struct rx_connection *conn = call->conn;
+    struct rx_packet *tp;
+    struct rx_packet *nxp;     /* Next packet pointer for queue_Scan */
+    struct rx_connection *conn = call->conn;
     struct rx_peer *peer = conn->peer;
     afs_uint32 first;
     afs_uint32 serial;
@@ -3631,7 +3717,8 @@ rxi_ReceiveAckPacket(register struct rx_call *call, struct rx_packet *np,
     u_short maxMTU = 0;                /* Set if peer supports AFS 3.4a jumbo datagrams */
     int maxDgramPackets = 0;   /* Set if peer supports AFS 3.5 jumbo datagrams */
 
-    rx_MutexIncrement(rx_stats.ackPacketsRead, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_AtomicIncrement(rx_stats.ackPacketsRead, rx_stats_mutex);
     ap = (struct rx_ackPacket *)rx_DataOf(np);
     nbytes = rx_Contiguous(np) - (int)((ap->acks) - (u_char *) ap);
     if (nbytes < 0)
@@ -3739,6 +3826,10 @@ rxi_ReceiveAckPacket(register struct rx_call *call, struct rx_packet *np,
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
        {
            queue_Remove(tp);
+           tp->flags &= ~RX_PKTFLAG_TQ;
+#ifdef RXDEBUG_PACKET
+            call->tqc--;
+#endif /* RXDEBUG_PACKET */
            rxi_FreePacket(tp); /* rxi_FreePacket mustn't wake up anyone, preemptively. */
        }
     }
@@ -4063,8 +4154,8 @@ rxi_ReceiveAckPacket(register struct rx_call *call, struct rx_packet *np,
 
 /* Received a response to a challenge packet */
 struct rx_packet *
-rxi_ReceiveResponsePacket(register struct rx_connection *conn,
-                         register struct rx_packet *np, int istack)
+rxi_ReceiveResponsePacket(struct rx_connection *conn,
+                         struct rx_packet *np, int istack)
 {
     int error;
 
@@ -4120,8 +4211,8 @@ rxi_ReceiveResponsePacket(register struct rx_connection *conn,
  * challenge if it fails to get a response. */
 
 struct rx_packet *
-rxi_ReceiveChallengePacket(register struct rx_connection *conn,
-                          register struct rx_packet *np, int istack)
+rxi_ReceiveChallengePacket(struct rx_connection *conn,
+                          struct rx_packet *np, int istack)
 {
     int error;
 
@@ -4158,13 +4249,13 @@ rxi_ReceiveChallengePacket(register struct rx_connection *conn,
  * the given call structure.  If one isn't available, queue up this
  * call so it eventually gets one */
 void
-rxi_AttachServerProc(register struct rx_call *call,
-                    register osi_socket socket, register int *tnop,
-                    register struct rx_call **newcallp)
+rxi_AttachServerProc(struct rx_call *call,
+                    osi_socket socket, int *tnop,
+                    struct rx_call **newcallp)
 {
-    register struct rx_serverQueueEntry *sq;
-    register struct rx_service *service = call->conn->service;
-    register int haveQuota = 0;
+    struct rx_serverQueueEntry *sq;
+    struct rx_service *service = call->conn->service;
+    int haveQuota = 0;
 
     /* May already be attached */
     if (call->state == RX_STATE_ACTIVE)
@@ -4185,10 +4276,10 @@ rxi_AttachServerProc(register struct rx_call *call,
 
        if (!(call->flags & RX_CALL_WAIT_PROC)) {
            call->flags |= RX_CALL_WAIT_PROC;
-           MUTEX_ENTER(&rx_stats_mutex);
-           rx_nWaiting++;
-           rx_nWaited++;
-           MUTEX_EXIT(&rx_stats_mutex);
+            MUTEX_ENTER(&rx_waiting_mutex);
+            rx_nWaiting++;
+            rx_nWaited++;
+            MUTEX_EXIT(&rx_waiting_mutex);
            rxi_calltrace(RX_CALL_ARRIVAL, call);
            SET_CALL_QUEUE_LOCK(call, &rx_serverPool_lock);
            queue_Append(&rx_incomingCallQueue, call);
@@ -4215,9 +4306,10 @@ rxi_AttachServerProc(register struct rx_call *call,
            call->flags &= ~RX_CALL_WAIT_PROC;
            if (queue_IsOnQueue(call)) {
                queue_Remove(call);
-               MUTEX_ENTER(&rx_stats_mutex);
-               rx_nWaiting--;
-               MUTEX_EXIT(&rx_stats_mutex);
+                
+                MUTEX_ENTER(&rx_waiting_mutex);
+                rx_nWaiting--;
+                MUTEX_EXIT(&rx_waiting_mutex);
            }
        }
        call->state = RX_STATE_ACTIVE;
@@ -4257,7 +4349,7 @@ rxi_AttachServerProc(register struct rx_call *call,
  * is being prepared (in the case of a server).  Rather than sending
  * an ack packet, an ACKALL packet is sent. */
 void
-rxi_AckAll(struct rxevent *event, register struct rx_call *call, char *dummy)
+rxi_AckAll(struct rxevent *event, struct rx_call *call, char *dummy)
 {
 #ifdef RX_ENABLE_LOCKS
     if (event) {
@@ -4278,9 +4370,9 @@ rxi_AckAll(struct rxevent *event, register struct rx_call *call, char *dummy)
 }
 
 void
-rxi_SendDelayedAck(struct rxevent *event, register struct rx_call *call,
-                  char *dummy)
+rxi_SendDelayedAck(struct rxevent *event, void *arg1, void *unused)
 {
+    struct rx_call *call = arg1;
 #ifdef RX_ENABLE_LOCKS
     if (event) {
        MUTEX_ENTER(&call->lock);
@@ -4304,9 +4396,9 @@ rxi_SendDelayedAck(struct rxevent *event, register struct rx_call *call,
  * clearing them out.
  */
 static void
-rxi_SetAcksInTransmitQueue(register struct rx_call *call)
+rxi_SetAcksInTransmitQueue(struct rx_call *call)
 {
-    register struct rx_packet *p, *tp;
+    struct rx_packet *p, *tp;
     int someAcked = 0;
 
     for (queue_Scan(&call->tq, p, tp, rx_packet)) {
@@ -4335,10 +4427,10 @@ rxi_SetAcksInTransmitQueue(register struct rx_call *call)
 /* Clear out the transmit queue for the current call (all packets have
  * been received by peer) */
 void
-rxi_ClearTransmitQueue(register struct rx_call *call, register int force)
+rxi_ClearTransmitQueue(struct rx_call *call, int force)
 {
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
-    register struct rx_packet *p, *tp;
+    struct rx_packet *p, *tp;
 
     if (!force && (call->flags & RX_CALL_TQ_BUSY)) {
        int someAcked = 0;
@@ -4352,7 +4444,10 @@ rxi_ClearTransmitQueue(register struct rx_call *call, register int force)
        }
     } else {
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
-       rxi_FreePackets(0, &call->tq);
+#ifdef RXDEBUG_PACKET
+        call->tqc -=
+#endif /* RXDEBUG_PACKET */
+            rxi_FreePackets(0, &call->tq);
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
        call->flags &= ~RX_CALL_TQ_CLEARME;
     }
@@ -4374,10 +4469,18 @@ rxi_ClearTransmitQueue(register struct rx_call *call, register int force)
 }
 
 void
-rxi_ClearReceiveQueue(register struct rx_call *call)
+rxi_ClearReceiveQueue(struct rx_call *call)
 {
     if (queue_IsNotEmpty(&call->rq)) {
-       rx_packetReclaims += rxi_FreePackets(0, &call->rq);
+        u_short count;
+        
+        count = rxi_FreePackets(0, &call->rq);
+       rx_packetReclaims += count;
+#ifdef RXDEBUG_PACKET
+        call->rqc -= count;
+        if ( call->rqc != 0 ) 
+            dpf(("rxi_ClearReceiveQueue call %x rqc %u != 0", call, call->rqc));
+#endif
        call->flags &= ~(RX_CALL_RECEIVE_DONE | RX_CALL_HAVE_LAST);
     }
     if (call->state == RX_STATE_PRECALL) {
@@ -4387,7 +4490,7 @@ rxi_ClearReceiveQueue(register struct rx_call *call)
 
 /* Send an abort packet for the specified call */
 struct rx_packet *
-rxi_SendCallAbort(register struct rx_call *call, struct rx_packet *packet,
+rxi_SendCallAbort(struct rx_call *call, struct rx_packet *packet,
                  int istack, int force)
 {
     afs_int32 error;
@@ -4437,13 +4540,13 @@ rxi_SendCallAbort(register struct rx_call *call, struct rx_packet *packet,
  *       to send the abort packet.
  */
 struct rx_packet *
-rxi_SendConnectionAbort(register struct rx_connection *conn,
+rxi_SendConnectionAbort(struct rx_connection *conn,
                        struct rx_packet *packet, int istack, int force)
 {
     afs_int32 error;
     struct clock when, now;
 
-    if (!conn->error)
+    if (!rx_ConnError(conn))
        return packet;
 
     /* Clients should never delay abort messages */
@@ -4455,7 +4558,7 @@ rxi_SendConnectionAbort(register struct rx_connection *conn,
        if (conn->delayedAbortEvent) {
            rxevent_Cancel(conn->delayedAbortEvent, (struct rx_call *)0, 0);
        }
-       error = htonl(conn->error);
+       error = htonl(rx_ConnError(conn));
        conn->abortCount++;
        MUTEX_EXIT(&conn->conn_data_lock);
        packet =
@@ -4473,17 +4576,20 @@ rxi_SendConnectionAbort(register struct rx_connection *conn,
     return packet;
 }
 
-/* Associate an error all of the calls owned by a connection.  Called
+/* 
+ * Associate an error all of the calls owned by a connection.  Called
  * with error non-zero.  This is only for really fatal things, like
  * bad authentication responses.  The connection itself is set in
  * error at this point, so that future packets received will be
- * rejected. */
+ * rejected. 
+ */
 void
-rxi_ConnectionError(register struct rx_connection *conn,
-                   register afs_int32 error)
+rxi_ConnectionError(struct rx_connection *conn,
+                   afs_int32 error)
 {
     if (error) {
-       register int i;
+       int i;
+        struct rx_connection *tconn;
 
        dpf(("rxi_ConnectionError conn %x error %d", conn, error));
 
@@ -4494,30 +4600,39 @@ rxi_ConnectionError(register struct rx_connection *conn,
            rxevent_Cancel(conn->checkReachEvent, (struct rx_call *)0, 0);
            conn->checkReachEvent = 0;
            conn->flags &= ~RX_CONN_ATTACHWAIT;
-           conn->refCount--;
+           rx_AtomicDecrement_NL(conn->refCount);
        }
        MUTEX_EXIT(&conn->conn_data_lock);
-       for (i = 0; i < RX_MAXCALLS; i++) {
-           struct rx_call *call = conn->call[i];
-           if (call) {
-               MUTEX_ENTER(&call->lock);
-               rxi_CallError(call, error);
-               MUTEX_EXIT(&call->lock);
-           }
+
+        for ( tconn = rx_IsClonedConn(conn) ? conn->parent : conn;
+              tconn; 
+              tconn = tconn->next_clone) {
+            for (i = 0; i < RX_MAXCALLS; i++) {
+                struct rx_call *call = tconn->call[i];
+                if (call) {
+                    MUTEX_ENTER(&call->lock);
+                    rxi_CallError(call, error);
+                    MUTEX_EXIT(&call->lock);
+                }
+            }
        }
-       conn->error = error;
-        rx_MutexIncrement(rx_stats.fatalErrors, rx_stats_mutex);
+        rx_SetConnError(conn, error);
+        if (rx_stats_active)
+            rx_AtomicIncrement(rx_stats.fatalErrors, rx_stats_mutex);
     }
 }
 
 void
-rxi_CallError(register struct rx_call *call, afs_int32 error)
+rxi_CallError(struct rx_call *call, afs_int32 error)
 {
+#ifdef DEBUG
+    osirx_AssertMine(&call->lock, "rxi_CallError");
+#endif
     dpf(("rxi_CallError call %x error %d call->error %d", call, error, call->error));
     if (call->error)
        error = call->error;
 
-#ifdef RX_GLOBAL_RXLOCK_KERNEL
+#ifdef AFS_GLOBAL_RXLOCK_KERNEL
     if (!((call->flags & RX_CALL_TQ_BUSY) || (call->tqWaiters > 0))) {
        rxi_ResetCall(call, 0);
     }
@@ -4539,12 +4654,14 @@ rxi_CallError(register struct rx_call *call, afs_int32 error)
 #endif /* ADAPT_WINDOW */
 
 void
-rxi_ResetCall(register struct rx_call *call, register int newcall)
+rxi_ResetCall(struct rx_call *call, int newcall)
 {
-    register int flags;
-    register struct rx_peer *peer;
+    int flags;
+    struct rx_peer *peer;
     struct rx_packet *packet;
-
+#ifdef DEBUG
+    osirx_AssertMine(&call->lock, "rxi_ResetCall");
+#endif
     dpf(("rxi_ResetCall(call %x, newcall %d)\n", call, newcall));
 
     /* Notify anyone who is waiting for asynchronous packet arrival */
@@ -4594,7 +4711,6 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
     MUTEX_EXIT(&peer->peer_lock);
 
     flags = call->flags;
-    rxi_ClearReceiveQueue(call);
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
     if (flags & RX_CALL_TQ_BUSY) {
        call->flags = RX_CALL_TQ_CLEARME | RX_CALL_TQ_BUSY;
@@ -4602,8 +4718,8 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
     } else
 #endif /* AFS_GLOBAL_RXLOCK_KERNEL */
     {
-       rxi_ClearTransmitQueue(call, 0);
-       queue_Init(&call->tq);
+       rxi_ClearTransmitQueue(call, 1);
+       /* why init the queue if you just emptied it? queue_Init(&call->tq); */
        if (call->tqWaiters || (flags & RX_CALL_TQ_WAIT)) {
            dpf(("rcall %x has %d waiters and flags %d\n", call, call->tqWaiters, call->flags));
        }
@@ -4617,7 +4733,26 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
            call->tqWaiters--;
        }
     }
-    queue_Init(&call->rq);
+
+    rxi_ClearReceiveQueue(call);
+    /* why init the queue if you just emptied it? queue_Init(&call->rq); */
+    
+    if (call->currentPacket) {
+        call->currentPacket->flags &= ~RX_PKTFLAG_CP;
+        call->currentPacket->flags |= RX_PKTFLAG_IOVQ;
+        queue_Prepend(&call->iovq, call->currentPacket);
+#ifdef RXDEBUG_PACKET
+        call->iovqc++;
+#endif /* RXDEBUG_PACKET */
+        call->currentPacket = (struct rx_packet *)0;
+    }
+    call->curlen = call->nLeft = call->nFree = 0;
+
+#ifdef RXDEBUG_PACKET
+    call->iovqc -= 
+#endif
+        rxi_FreePackets(0, &call->iovq);
+
     call->error = 0;
     call->twind = call->conn->twind[call->channel];
     call->rwind = call->conn->rwind[call->channel];
@@ -4668,9 +4803,10 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
        if (queue_IsOnQueue(call)) {
            queue_Remove(call);
            if (flags & RX_CALL_WAIT_PROC) {
-               MUTEX_ENTER(&rx_stats_mutex);
-               rx_nWaiting--;
-               MUTEX_EXIT(&rx_stats_mutex);
+                
+                MUTEX_ENTER(&rx_waiting_mutex);
+                rx_nWaiting--;
+                MUTEX_EXIT(&rx_waiting_mutex);
            }
        }
        MUTEX_EXIT(call->call_queue_lock);
@@ -4705,7 +4841,7 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
  * ignored by mundanes, which indicates the maximum size packet this 
  * host can swallow.  */
 /*
-    register struct rx_packet *optionalPacket;  use to send ack (or null) 
+    struct rx_packet *optionalPacket;  use to send ack (or null) 
     int        seq;                     Sequence number of the packet we are acking 
     int        serial;                  Serial number of the packet 
     int        pflags;                  Flags field from packet header 
@@ -4713,14 +4849,14 @@ rxi_ResetCall(register struct rx_call *call, register int newcall)
 */
 
 struct rx_packet *
-rxi_SendAck(register struct rx_call *call,
-           register struct rx_packet *optionalPacket, int serial, int reason,
+rxi_SendAck(struct rx_call *call,
+           struct rx_packet *optionalPacket, int serial, int reason,
            int istack)
 {
     struct rx_ackPacket *ap;
-    register struct rx_packet *rqp;
-    register struct rx_packet *nxp;    /* For queue_Scan */
-    register struct rx_packet *p;
+    struct rx_packet *rqp;
+    struct rx_packet *nxp;     /* For queue_Scan */
+    struct rx_packet *p;
     u_char offset;
     afs_int32 templ;
 #ifdef RX_ENABLE_TSFPQ
@@ -4902,11 +5038,11 @@ rxi_SendAck(register struct rx_call *call,
 #endif /* AFS_NT40_ENV */
 #endif
     {
-       register int i, nbytes = p->length;
+       int i, nbytes = p->length;
 
        for (i = 1; i < p->niovecs; i++) {      /* vec 0 is ALWAYS header */
            if (nbytes <= p->wirevec[i].iov_len) {
-               register int savelen, saven;
+               int savelen, saven;
 
                savelen = p->wirevec[i].iov_len;
                saven = p->niovecs;
@@ -4920,7 +5056,8 @@ rxi_SendAck(register struct rx_call *call,
                nbytes -= p->wirevec[i].iov_len;
        }
     }
-    rx_MutexIncrement(rx_stats.ackPacketsSent, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_AtomicIncrement(rx_stats.ackPacketsSent, rx_stats_mutex);
 #ifndef RX_ENABLE_TSFPQ
     if (!optionalPacket)
        rxi_FreePacket(p);
@@ -4944,7 +5081,8 @@ rxi_SendList(struct rx_call *call, struct rx_packet **list, int len,
     peer->nSent += len;
     if (resending)
        peer->reSends += len;
-    rx_MutexIncrement(rx_stats.dataPacketsSent, rx_stats_mutex);
+    if (rx_stats_active)
+        rx_AtomicIncrement(rx_stats.dataPacketsSent, rx_stats_mutex);
     MUTEX_EXIT(&peer->peer_lock);
 
     if (list[len - 1]->header.flags & RX_LAST_PACKET) {
@@ -4979,7 +5117,8 @@ rxi_SendList(struct rx_call *call, struct rx_packet **list, int len,
         * packet until the congestion window reaches the ack rate. */
        if (list[i]->header.serial) {
            requestAck = 1;
-           rx_MutexIncrement(rx_stats.dataPacketsReSent, rx_stats_mutex);
+            if (rx_stats_active)
+                rx_AtomicIncrement(rx_stats.dataPacketsReSent, rx_stats_mutex);
        } else {
            /* improved RTO calculation- not Karn */
            list[i]->firstSent = *now;
@@ -4994,7 +5133,8 @@ rxi_SendList(struct rx_call *call, struct rx_packet **list, int len,
        peer->nSent++;
        if (resending)
            peer->reSends++;
-        rx_MutexIncrement(rx_stats.dataPacketsSent, rx_stats_mutex);
+        if (rx_stats_active)
+            rx_AtomicIncrement(rx_stats.dataPacketsSent, rx_stats_mutex);
        MUTEX_EXIT(&peer->peer_lock);
 
        /* Tag this packet as not being the last in this group,
@@ -5133,9 +5273,11 @@ rxi_SendXmitList(struct rx_call *call, struct rx_packet **list, int len,
 #ifdef RX_ENABLE_LOCKS
 /* Call rxi_Start, below, but with the call lock held. */
 void
-rxi_StartUnlocked(struct rxevent *event, register struct rx_call *call,
-                 void *arg1, int istack)
+rxi_StartUnlocked(struct rxevent *event, 
+                 void *arg0, void *arg1, int istack)
 {
+    struct rx_call *call = arg0;
+    
     MUTEX_ENTER(&call->lock);
     rxi_Start(event, call, arg1, istack);
     MUTEX_EXIT(&call->lock);
@@ -5148,11 +5290,13 @@ rxi_StartUnlocked(struct rxevent *event, register struct rx_call *call,
  * better optimized for new packets, the usual case, now that we've
  * got rid of queues of send packets. XXXXXXXXXXX */
 void
-rxi_Start(struct rxevent *event, register struct rx_call *call,
-         void *arg1, int istack)
+rxi_Start(struct rxevent *event, 
+          void *arg0, void *arg1, int istack)
 {
+    struct rx_call *call = arg0;
+    
     struct rx_packet *p;
-    register struct rx_packet *nxp;    /* Next pointer for queue_Scan */
+    struct rx_packet *nxp;     /* Next pointer for queue_Scan */
     struct rx_peer *peer = call->conn->peer;
     struct clock now, usenow, retryTime;
     int haveEvent;
@@ -5214,7 +5358,8 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
     }
     if (call->error) {
 #ifdef AFS_GLOBAL_RXLOCK_KERNEL
-        rx_MutexIncrement(rx_tq_debug.rxi_start_in_error, rx_stats_mutex);
+        if (rx_stats_active)
+            rx_MutexIncrement(rx_tq_debug.rxi_start_in_error, rx_stats_mutex);
 #endif
        return;
     }
@@ -5260,7 +5405,12 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
                nXmitPackets = 0;
                maxXmitPackets = MIN(call->twind, call->cwind);
                xmitList = (struct rx_packet **)
-                   osi_Alloc(maxXmitPackets * sizeof(struct rx_packet *));
+#if defined(KERNEL) && !defined(UKERNEL) && defined(AFS_FBSD80_ENV)
+                   /* XXXX else we must drop any mtx we hold */
+                   afs_osi_Alloc_NoSleep(maxXmitPackets * sizeof(struct rx_packet *));
+#else
+               osi_Alloc(maxXmitPackets * sizeof(struct rx_packet *));
+#endif
                if (xmitList == NULL)
                    osi_Panic("rxi_Start, failed to allocate xmit list");
                for (queue_Scan(&call->tq, p, nxp, rx_packet)) {
@@ -5284,7 +5434,8 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
                    if (p->flags & RX_PKTFLAG_ACKED) {
                        /* Since we may block, don't trust this */
                        usenow.sec = usenow.usec = 0;
-                        rx_MutexIncrement(rx_stats.ignoreAckedPacket, rx_stats_mutex);
+                        if (rx_stats_active)
+                            rx_AtomicIncrement(rx_stats.ignoreAckedPacket, rx_stats_mutex);
                        continue;       /* Ignore this packet if it has been acknowledged */
                    }
 
@@ -5351,7 +5502,8 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
                     * the time to reset the call. This will also inform the using
                     * process that the call is in an error state.
                     */
-                    rx_MutexIncrement(rx_tq_debug.rxi_start_aborted, rx_stats_mutex);
+                    if (rx_stats_active)
+                        rx_MutexIncrement(rx_tq_debug.rxi_start_aborted, rx_stats_mutex);
                    call->flags &= ~RX_CALL_TQ_BUSY;
                    if (call->tqWaiters || (call->flags & RX_CALL_TQ_WAIT)) {
                        dpf(("call %x has %d waiters and flags %d\n", call, call->tqWaiters, call->flags));
@@ -5367,7 +5519,7 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
                }
 #ifdef RX_ENABLE_LOCKS
                if (call->flags & RX_CALL_TQ_SOME_ACKED) {
-                   register int missing;
+                   int missing;
                    call->flags &= ~RX_CALL_TQ_SOME_ACKED;
                    /* Some packets have received acks. If they all have, we can clear
                     * the transmit queue.
@@ -5377,6 +5529,10 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
                        if (p->header.seq < call->tfirst
                            && (p->flags & RX_PKTFLAG_ACKED)) {
                            queue_Remove(p);
+                           p->flags &= ~RX_PKTFLAG_TQ;
+#ifdef RXDEBUG_PACKET
+                            call->tqc--;
+#endif
                            rxi_FreePacket(p);
                        } else
                            missing = 1;
@@ -5466,10 +5622,10 @@ rxi_Start(struct rxevent *event, register struct rx_call *call,
  * that we have just sent a packet (so keep alives aren't sent
  * immediately) */
 void
-rxi_Send(register struct rx_call *call, register struct rx_packet *p,
+rxi_Send(struct rx_call *call, struct rx_packet *p,
         int istack)
 {
-    register struct rx_connection *conn = call->conn;
+    struct rx_connection *conn = call->conn;
 
     /* Stamp each packet with the user supplied status */
     p->header.userStatus = call->localStatus;
@@ -5494,7 +5650,7 @@ rxi_Send(register struct rx_call *call, register struct rx_packet *p,
      * idle connections) */
     conn->lastSendTime = call->lastSendTime = clock_Sec();
     /* Don't count keepalives here, so idleness can be tracked. */
-    if (p->header.type != RX_PACKET_TYPE_ACK)
+    if ((p->header.type != RX_PACKET_TYPE_ACK) || (((struct rx_ackPacket *)rx_DataOf(p))->reason != RX_ACK_PING))
        call->lastSendData = call->lastSendTime;
 }
 
@@ -5508,17 +5664,17 @@ rxi_Send(register struct rx_call *call, register struct rx_packet *p,
  */
 #ifdef RX_ENABLE_LOCKS
 int
-rxi_CheckCall(register struct rx_call *call, int haveCTLock)
+rxi_CheckCall(struct rx_call *call, int haveCTLock)
 #else /* RX_ENABLE_LOCKS */
 int
-rxi_CheckCall(register struct rx_call *call)
+rxi_CheckCall(struct rx_call *call)
 #endif                         /* RX_ENABLE_LOCKS */
 {
-    register struct rx_connection *conn = call->conn;
+    struct rx_connection *conn = call->conn;
     afs_uint32 now;
     afs_uint32 deadTime;
 
-#ifdef RX_GLOBAL_RXLOCK_KERNEL
+#ifdef AFS_GLOBAL_RXLOCK_KERNEL
     if (call->flags & RX_CALL_TQ_BUSY) {
        /* Call is active and will be reset by rxi_Start if it's
         * in an error state.
@@ -5528,7 +5684,7 @@ rxi_CheckCall(register struct rx_call *call)
 #endif
     /* dead time + RTT + 8*MDEV, rounded up to next second. */
     deadTime =
-       (((afs_uint32) conn->secondsUntilDead << 10) +
+       (((afs_uint32) rx_ConnSecondsUntilDead(conn) << 10) +
         ((afs_uint32) conn->peer->rtt >> 3) +
         ((afs_uint32) conn->peer->rtt_dev << 1) + 1023) >> 10;
     now = clock_Sec();
@@ -5588,23 +5744,24 @@ rxi_CheckCall(register struct rx_call *call)
         * attached process can die reasonably gracefully. */
     }
     /* see if we have a non-activity timeout */
-    if (call->startWait && conn->idleDeadTime
-       && ((call->startWait + conn->idleDeadTime) < now)) {
+    if (call->startWait && rx_ConnIdleDeadTime(conn)
+       && ((call->startWait + rx_ConnIdleDeadTime(conn)) < now)) {
        if (call->state == RX_STATE_ACTIVE) {
            rxi_CallError(call, RX_CALL_TIMEOUT);
            return -1;
        }
     }
-    if (call->lastSendData && conn->idleDeadTime && (conn->idleDeadErr != 0)
-        && ((call->lastSendData + conn->idleDeadTime) < now)) {
+    if (call->lastSendData && rx_ConnIdleDeadTime(conn) 
+        && (rx_ConnIdleDeadErr(conn) != 0)
+        && ((call->lastSendData + rx_ConnIdleDeadTime(conn)) < now)) {
        if (call->state == RX_STATE_ACTIVE) {
            rxi_CallError(call, conn->idleDeadErr);
            return -1;
        }
     }
     /* see if we have a hard timeout */
-    if (conn->hardDeadTime
-       && (now > (conn->hardDeadTime + call->startTime.sec))) {
+    if (rx_ConnHardDeadTime(conn)
+       && (now > (rx_ConnHardDeadTime(conn) + call->startTime.sec))) {
        if (call->state == RX_STATE_ACTIVE)
            rxi_CallError(call, RX_CALL_TIMEOUT);
        return -1;
@@ -5620,9 +5777,9 @@ rxi_CheckCall(register struct rx_call *call)
  * keep-alive packet (if we're actually trying to keep the call alive)
  */
 void
-rxi_KeepAliveEvent(struct rxevent *event, register struct rx_call *call,
-                  char *dummy)
+rxi_KeepAliveEvent(struct rxevent *event, void *arg1, void *dummy)
 {
+    struct rx_call *call = arg1;
     struct rx_connection *conn;
     afs_uint32 now;
 
@@ -5649,7 +5806,7 @@ rxi_KeepAliveEvent(struct rxevent *event, register struct rx_call *call,
     }
 
     conn = call->conn;
-    if ((now - call->lastSendTime) > conn->secondsUntilPing) {
+    if ((now - call->lastSendTime) > rx_ConnSecondsUntilPing(conn)) {
        /* Don't try to send keepalives if there is unacknowledged data */
        /* the rexmit code should be good enough, this little hack 
         * doesn't quite work XXX */
@@ -5661,13 +5818,13 @@ rxi_KeepAliveEvent(struct rxevent *event, register struct rx_call *call,
 
 
 void
-rxi_ScheduleKeepAliveEvent(register struct rx_call *call)
+rxi_ScheduleKeepAliveEvent(struct rx_call *call)
 {
     if (!call->keepAliveEvent) {
        struct clock when, now;
        clock_GetTime(&now);
        when = now;
-       when.sec += call->conn->secondsUntilPing;
+       when.sec += rx_ConnSecondsUntilPing(call->conn);
        CALL_HOLD(call, RX_CALL_REFCOUNT_ALIVE);
        call->keepAliveEvent =
            rxevent_PostNow(&when, &now, rxi_KeepAliveEvent, call, 0);
@@ -5676,7 +5833,7 @@ rxi_ScheduleKeepAliveEvent(register struct rx_call *call)
 
 /* N.B. rxi_KeepAliveOff:  is defined earlier as a macro */
 void
-rxi_KeepAliveOn(register struct rx_call *call)
+rxi_KeepAliveOn(struct rx_call *call)
 {
     /* Pretend last packet received was received now--i.e. if another
      * packet isn't received within the keep alive time, then the call
@@ -5691,14 +5848,16 @@ rxi_KeepAliveOn(register struct rx_call *call)
  * that have been delayed to throttle looping clients. */
 void
 rxi_SendDelayedConnAbort(struct rxevent *event,
-                        register struct rx_connection *conn, char *dummy)
+                        void *arg1, void *unused)
 {
+    struct rx_connection *conn = arg1;
+    
     afs_int32 error;
     struct rx_packet *packet;
 
     MUTEX_ENTER(&conn->conn_data_lock);
     conn->delayedAbortEvent = NULL;
-    error = htonl(conn->error);
+    error = htonl(rx_ConnError(conn));
     conn->abortCount++;
     MUTEX_EXIT(&conn->conn_data_lock);
     packet = rxi_AllocPacket(RX_PACKET_CLASS_SPECIAL);
@@ -5714,9 +5873,11 @@ rxi_SendDelayedConnAbort(struct rxevent *event,
 /* This routine is called to send call abort messages
  * that have been delayed to throttle looping clients. */
 void
-rxi_SendDelayedCallAbort(struct rxevent *event, register struct rx_call *call,
-                        char *dummy)
+rxi_SendDelayedCallAbort(struct rxevent *event, 
+                        void *arg1, void *dummy)
 {
+    struct rx_call *call = arg1;
+    
     afs_int32 error;
     struct rx_packet *packet;
 
@@ -5740,12 +5901,14 @@ rxi_SendDelayedCallAbort(struct rxevent *event, register struct rx_call *call,
  * issues a challenge to the client, which is obtained from the
  * security object associated with the connection */
 void
-rxi_ChallengeEvent(struct rxevent *event, register struct rx_connection *conn,
-                  void *arg1, int tries)
+rxi_ChallengeEvent(struct rxevent *event, 
+                  void *arg0, void *arg1, int tries)
 {
+    struct rx_connection *conn = arg0;
+    
     conn->challengeEvent = NULL;
     if (RXS_CheckAuthentication(conn->securityObject, conn) != 0) {
-       register struct rx_packet *packet;
+       struct rx_packet *packet;
        struct clock when, now;
 
        if (tries <= 0) {
@@ -5795,7 +5958,7 @@ rxi_ChallengeEvent(struct rxevent *event, register struct rx_connection *conn,
  * the challenge at this time.  N.B.  rxi_ChallengeOff is a macro,
  * defined earlier. */
 void
-rxi_ChallengeOn(register struct rx_connection *conn)
+rxi_ChallengeOn(struct rx_connection *conn)
 {
     if (!conn->challengeEvent) {
        RXS_CreateChallenge(conn->securityObject, conn);
@@ -5810,13 +5973,13 @@ rxi_ChallengeOn(register struct rx_connection *conn)
 /* rxi_ComputeRoundTripTime is called with peer locked. */
 /* sentp and/or peer may be null */
 void
-rxi_ComputeRoundTripTime(register struct rx_packet *p,
-                        register struct clock *sentp,
-                        register struct rx_peer *peer)
+rxi_ComputeRoundTripTime(struct rx_packet *p,
+                        struct clock *sentp,
+                        struct rx_peer *peer)
 {
     struct clock thisRtt, *rttp = &thisRtt;
 
-    register int rtt_timeout;
+    int rtt_timeout;
 
     clock_GetTime(rttp);
 
@@ -5825,25 +5988,27 @@ rxi_ComputeRoundTripTime(register struct rx_packet *p,
        return;                 /* somebody set the clock back, don't count this time. */
     }
     clock_Sub(rttp, sentp);
-    MUTEX_ENTER(&rx_stats_mutex);
-    if (clock_Lt(rttp, &rx_stats.minRtt))
-       rx_stats.minRtt = *rttp;
-    if (clock_Gt(rttp, &rx_stats.maxRtt)) {
-       if (rttp->sec > 60) {
-           MUTEX_EXIT(&rx_stats_mutex);
-           return;             /* somebody set the clock ahead */
-       }
-       rx_stats.maxRtt = *rttp;
+    if (rx_stats_active) {
+        MUTEX_ENTER(&rx_stats_mutex);
+        if (clock_Lt(rttp, &rx_stats.minRtt))
+            rx_stats.minRtt = *rttp;
+        if (clock_Gt(rttp, &rx_stats.maxRtt)) {
+            if (rttp->sec > 60) {
+                MUTEX_EXIT(&rx_stats_mutex);
+                return;                /* somebody set the clock ahead */
+            }
+            rx_stats.maxRtt = *rttp;
+        }
+        clock_Add(&rx_stats.totalRtt, rttp);
+        rx_AtomicIncrement_NL(rx_stats.nRttSamples);
+        MUTEX_EXIT(&rx_stats_mutex);
     }
-    clock_Add(&rx_stats.totalRtt, rttp);
-    rx_stats.nRttSamples++;
-    MUTEX_EXIT(&rx_stats_mutex);
 
     /* better rtt calculation courtesy of UMich crew (dave,larry,peter,?) */
 
     /* Apply VanJacobson round-trip estimations */
     if (peer->rtt) {
-       register int delta;
+       int delta;
 
        /*
         * srtt (peer->rtt) is in units of one-eighth-milliseconds.
@@ -5903,7 +6068,7 @@ rxi_ComputeRoundTripTime(register struct rx_packet *p,
 /* Find all server connections that have not been active for a long time, and
  * toss them */
 void
-rxi_ReapConnections(void)
+rxi_ReapConnections(struct rxevent *unused, void *unused1, void *unused2)
 {
     struct clock now, when;
     clock_GetTime(&now);
@@ -5929,8 +6094,11 @@ rxi_ReapConnections(void)
                for (i = 0; i < RX_MAXCALLS; i++) {
                    call = conn->call[i];
                    if (call) {
+                       int code;
                        havecalls = 1;
-                       MUTEX_ENTER(&call->lock);
+                       code = MUTEX_TRYENTER(&call->lock);
+                       if (!code)
+                           continue;
 #ifdef RX_ENABLE_LOCKS
                        result = rxi_CheckCall(call, 1);
 #else /* RX_ENABLE_LOCKS */
@@ -5950,10 +6118,10 @@ rxi_ReapConnections(void)
                    /* This only actually destroys the connection if
                     * there are no outstanding calls */
                    MUTEX_ENTER(&conn->conn_data_lock);
-                   if (!havecalls && !conn->refCount
+                   if (!havecalls && (rx_AtomicPeek_NL(conn->refCount) == 0)
                        && ((conn->lastSendTime + rx_idleConnectionTime) <
                            now.sec)) {
-                       conn->refCount++;       /* it will be decr in rx_DestroyConn */
+                       rx_AtomicIncrement_NL(conn->refCount);  /* it will be decr in rx_DestroyConn */
                        MUTEX_EXIT(&conn->conn_data_lock);
 #ifdef RX_ENABLE_LOCKS
                        rxi_DestroyConnectionNoLock(conn);
@@ -5996,7 +6164,7 @@ rxi_ReapConnections(void)
            for (prev = peer = *peer_ptr; peer; peer = next) {
                next = peer->next;
                code = MUTEX_TRYENTER(&peer->peer_lock);
-               if ((code) && (peer->refCount == 0)
+               if ((code) && (rx_AtomicPeek_NL(peer->refCount) == 0)
                    && ((peer->idleWhen + rx_idlePeerTime) < now.sec)) {
                    rx_interface_stat_p rpc_stat, nrpc_stat;
                    size_t space;
@@ -6020,7 +6188,8 @@ rxi_ReapConnections(void)
                        rxi_rpc_peer_stat_cnt -= num_funcs;
                    }
                    rxi_FreePeer(peer);
-                    rx_MutexDecrement(rx_stats.nPeerStructs, rx_stats_mutex);
+                    if (rx_stats_active)
+                        rx_AtomicDecrement(rx_stats.nPeerStructs, rx_stats_mutex);
                    if (peer == *peer_ptr) {
                        *peer_ptr = next;
                        prev = next;
@@ -6089,11 +6258,11 @@ rxs_Release(struct rx_securityClass *aobj)
  */
 
 static void
-rxi_ComputeRate(register struct rx_peer *peer, register struct rx_call *call,
+rxi_ComputeRate(struct rx_peer *peer, struct rx_call *call,
                struct rx_packet *p, struct rx_packet *ackp, u_char ackReason)
 {
     afs_int32 xferSize, xferMs;
-    register afs_int32 minTime;
+    afs_int32 minTime;
     struct clock newTO;
 
     /* Count down packets */
@@ -6225,12 +6394,12 @@ rxi_ComputeRate(register struct rx_peer *peer, register struct rx_call *call,
 #endif /* ADAPT_WINDOW */
 
 
-#ifdef RXDEBUG
 void
 rxi_DebugInit(void)
 {
+#ifdef RXDEBUG
 #ifdef AFS_NT40_ENV
-#define TRACE_OPTION_DEBUGLOG 4
+#define TRACE_OPTION_RX_DEBUG 16
     HKEY parmKey;
     DWORD dummyLen;
     DWORD TraceOption;
@@ -6247,38 +6416,49 @@ rxi_DebugInit(void)
     code = RegQueryValueEx(parmKey, "TraceOption", NULL, NULL,
                           (BYTE *) &TraceOption, &dummyLen);
     if (code == ERROR_SUCCESS) {
-       rxdebug_active = (TraceOption & TRACE_OPTION_DEBUGLOG) ? 1 : 0;
+       rxdebug_active = (TraceOption & TRACE_OPTION_RX_DEBUG) ? 1 : 0;
     }
     RegCloseKey (parmKey);
 #endif /* AFS_NT40_ENV */
+#endif
 }
 
-#ifdef AFS_NT40_ENV
 void
 rx_DebugOnOff(int on)
 {
+#ifdef RXDEBUG
+#ifdef AFS_NT40_ENV
     rxdebug_active = on;
+#endif
+#endif
+}
+
+void
+rx_StatsOnOff(int on)
+{
+#ifdef RXDEBUG
+    rx_stats_active = on;
+#endif
 }
-#endif /* AFS_NT40_ENV */
 
 
 /* Don't call this debugging routine directly; use dpf */
 void
-rxi_DebugPrint(char *format, int a1, int a2, int a3, int a4, int a5, int a6,
-              int a7, int a8, int a9, int a10, int a11, int a12, int a13,
-              int a14, int a15)
+rxi_DebugPrint(char *format, ...)
 {
+#ifdef RXDEBUG
+    va_list ap;
 #ifdef AFS_NT40_ENV
     char msg[512];
     char tformat[256];
     size_t len;
 
+    va_start(ap, format);
+
     len = _snprintf(tformat, sizeof(tformat), "tid[%d] %s", GetCurrentThreadId(), format);
 
     if (len > 0) {
-       len = _snprintf(msg, sizeof(msg)-2, 
-                       tformat, a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, 
-                       a11, a12, a13, a14, a15);
+       len = _vsnprintf(msg, sizeof(msg)-2, tformat, ap);
        if (len > 0) {
            if (msg[len-1] != '\n') {
                msg[len] = '\n';
@@ -6287,17 +6467,23 @@ rxi_DebugPrint(char *format, int a1, int a2, int a3, int a4, int a5, int a6,
            OutputDebugString(msg);
        }
     }
+    va_end(ap);
 #else
     struct clock now;
+    
+    va_start(ap, format);
+
     clock_GetTime(&now);
     fprintf(rx_Log, " %u.%.3u:", (unsigned int)now.sec,
            (unsigned int)now.usec / 1000);
-    fprintf(rx_Log, format, a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, a11, a12,
-           a13, a14, a15);
+    vfprintf(rx_Log, format, ap);
     putc('\n', rx_Log);
+    va_end(ap);
+#endif
 #endif
 }
 
+#ifndef KERNEL
 /*
  * This function is used to process the rx_stats structure that is local
  * to a process as well as an rx_stats structure received from a remote
@@ -6305,69 +6491,83 @@ rxi_DebugPrint(char *format, int a1, int a2, int a3, int a4, int a5, int a6,
  * checking.
  */
 void
-rx_PrintTheseStats(FILE * file, struct rx_stats *s, int size,
+rx_PrintTheseStats(FILE * file, struct rx_statistics *s, int size,
                   afs_int32 freePackets, char version)
 {
+#ifdef RXDEBUG
     int i;
 
-    if (size != sizeof(struct rx_stats)) {
+    if (size != sizeof(struct rx_statistics)) {
        fprintf(file,
-               "Unexpected size of stats structure: was %d, expected %d\n",
-               size, sizeof(struct rx_stats));
+               "Unexpected size of stats structure: was %d, expected %lud\n",
+               size, sizeof(struct rx_statistics));
     }
 
     fprintf(file, "rx stats: free packets %d, allocs %d, ", (int)freePackets,
-           s->packetRequests);
+           rx_AtomicPeek_NL(s->packetRequests));
 
     if (version >= RX_DEBUGI_VERSION_W_NEWPACKETTYPES) {
        fprintf(file, "alloc-failures(rcv %d/%d,send %d/%d,ack %d)\n",
-               s->receivePktAllocFailures, s->receiveCbufPktAllocFailures,
-               s->sendPktAllocFailures, s->sendCbufPktAllocFailures,
-               s->specialPktAllocFailures);
+               rx_AtomicPeek_NL(s->receivePktAllocFailures),
+               rx_AtomicPeek_NL(s->receiveCbufPktAllocFailures),
+               rx_AtomicPeek_NL(s->sendPktAllocFailures),
+               rx_AtomicPeek_NL(s->sendCbufPktAllocFailures),
+               rx_AtomicPeek_NL(s->specialPktAllocFailures));
     } else {
        fprintf(file, "alloc-failures(rcv %d,send %d,ack %d)\n",
-               s->receivePktAllocFailures, s->sendPktAllocFailures,
-               s->specialPktAllocFailures);
+               rx_AtomicPeek_NL(s->receivePktAllocFailures),
+               rx_AtomicPeek_NL(s->sendPktAllocFailures),
+               rx_AtomicPeek_NL(s->specialPktAllocFailures));
     }
 
     fprintf(file,
            "   greedy %d, " "bogusReads %d (last from host %x), "
            "noPackets %d, " "noBuffers %d, " "selects %d, "
-           "sendSelects %d\n", s->socketGreedy, s->bogusPacketOnRead,
-           s->bogusHost, s->noPacketOnRead, s->noPacketBuffersOnRead,
-           s->selects, s->sendSelects);
+           "sendSelects %d\n", 
+           rx_AtomicPeek_NL(s->socketGreedy), 
+           rx_AtomicPeek_NL(s->bogusPacketOnRead),
+           rx_AtomicPeek_NL(s->bogusHost), 
+           rx_AtomicPeek_NL(s->noPacketOnRead), 
+           rx_AtomicPeek_NL(s->noPacketBuffersOnRead),
+           rx_AtomicPeek_NL(s->selects),
+           rx_AtomicPeek_NL(s->sendSelects));
 
     fprintf(file, "   packets read: ");
     for (i = 0; i < RX_N_PACKET_TYPES; i++) {
-       fprintf(file, "%s %d ", rx_packetTypes[i], s->packetsRead[i]);
+      fprintf(file, "%s %d ", rx_packetTypes[i], rx_AtomicPeek_NL(s->packetsRead[i]));
     }
     fprintf(file, "\n");
 
     fprintf(file,
            "   other read counters: data %d, " "ack %d, " "dup %d "
-           "spurious %d " "dally %d\n", s->dataPacketsRead,
-           s->ackPacketsRead, s->dupPacketsRead, s->spuriousPacketsRead,
-           s->ignorePacketDally);
+           "spurious %d " "dally %d\n", rx_AtomicPeek_NL(s->dataPacketsRead),
+           rx_AtomicPeek_NL(s->ackPacketsRead), 
+           rx_AtomicPeek_NL(s->dupPacketsRead), 
+           rx_AtomicPeek_NL(s->spuriousPacketsRead),
+           rx_AtomicPeek_NL(s->ignorePacketDally));
 
     fprintf(file, "   packets sent: ");
     for (i = 0; i < RX_N_PACKET_TYPES; i++) {
-       fprintf(file, "%s %d ", rx_packetTypes[i], s->packetsSent[i]);
+      fprintf(file, "%s %d ", rx_packetTypes[i], rx_AtomicPeek_NL(s->packetsSent[i]));
     }
     fprintf(file, "\n");
 
     fprintf(file,
            "   other send counters: ack %d, " "data %d (not resends), "
            "resends %d, " "pushed %d, " "acked&ignored %d\n",
-           s->ackPacketsSent, s->dataPacketsSent, s->dataPacketsReSent,
-           s->dataPacketsPushed, s->ignoreAckedPacket);
+           rx_AtomicPeek_NL(s->ackPacketsSent), 
+           rx_AtomicPeek_NL(s->dataPacketsSent), 
+           rx_AtomicPeek_NL(s->dataPacketsReSent),
+           rx_AtomicPeek_NL(s->dataPacketsPushed), 
+           rx_AtomicPeek_NL(s->ignoreAckedPacket));
 
     fprintf(file,
            "   \t(these should be small) sendFailed %d, " "fatalErrors %d\n",
-           s->netSendFailures, (int)s->fatalErrors);
+           rx_AtomicPeek_NL(s->netSendFailures), rx_AtomicPeek_NL(s->fatalErrors));
 
-    if (s->nRttSamples) {
+    if (rx_AtomicPeek_NL(s->nRttSamples)) {
        fprintf(file, "   Average rtt is %0.3f, with %d samples\n",
-               clock_Float(&s->totalRtt) / s->nRttSamples, s->nRttSamples);
+               clock_Float(&s->totalRtt) / rx_AtomicPeek_NL(s->nRttSamples), rx_AtomicPeek_NL(s->nRttSamples));
 
        fprintf(file, "   Minimum rtt is %0.3f, maximum is %0.3f\n",
                clock_Float(&s->minRtt), clock_Float(&s->maxRtt));
@@ -6376,13 +6576,18 @@ rx_PrintTheseStats(FILE * file, struct rx_stats *s, int size,
     fprintf(file,
            "   %d server connections, " "%d client connections, "
            "%d peer structs, " "%d call structs, " "%d free call structs\n",
-           s->nServerConns, s->nClientConns, s->nPeerStructs,
-           s->nCallStructs, s->nFreeCallStructs);
+           rx_AtomicPeek_NL(s->nServerConns),
+           rx_AtomicPeek_NL(s->nClientConns),
+           rx_AtomicPeek_NL(s->nPeerStructs),
+           rx_AtomicPeek_NL(s->nCallStructs),
+           rx_AtomicPeek_NL(s->nFreeCallStructs));
 
 #if    !defined(AFS_PTHREAD_ENV) && !defined(AFS_USE_GETTIMEOFDAY)
     fprintf(file, "   %d clock updates\n", clock_nUpdates);
 #endif
-
+#else
+    fprintf(file, "ERROR: compiled without RXDEBUG\n");
+#endif
 }
 
 /* for backward compatibility */
@@ -6412,20 +6617,22 @@ rx_PrintPeerStats(FILE * file, struct rx_peer *peer)
            "max out packet skew %d\n", peer->ifMTU, (int)peer->inPacketSkew,
            (int)peer->outPacketSkew);
 }
+#endif
 
-#ifdef AFS_PTHREAD_ENV
+#if defined(AFS_PTHREAD_ENV) && defined(RXDEBUG)
 /*
  * This mutex protects the following static variables:
  * counter
  */
 
-#define LOCK_RX_DEBUG assert(pthread_mutex_lock(&rx_debug_mutex)==0)
-#define UNLOCK_RX_DEBUG assert(pthread_mutex_unlock(&rx_debug_mutex)==0)
+#define LOCK_RX_DEBUG MUTEX_ENTER(&rx_debug_mutex)
+#define UNLOCK_RX_DEBUG MUTEX_EXIT(&rx_debug_mutex)
 #else
 #define LOCK_RX_DEBUG
 #define UNLOCK_RX_DEBUG
 #endif /* AFS_PTHREAD_ENV */
 
+#ifdef RXDEBUG
 static int
 MakeDebugCall(osi_socket socket, afs_uint32 remoteAddr, afs_uint16 remotePort,
              u_char type, void *inputData, size_t inputLength,
@@ -6435,12 +6642,16 @@ MakeDebugCall(osi_socket socket, afs_uint32 remoteAddr, afs_uint16 remotePort,
     time_t waitTime, waitCount, startTime;
     struct rx_header theader;
     char tbuffer[1500];
-    register afs_int32 code;
+    afs_int32 code;
     struct timeval tv_now, tv_wake, tv_delta;
     struct sockaddr_in taddr, faddr;
+#ifdef AFS_NT40_ENV
     int faddrLen;
+#else
+    socklen_t faddrLen;
+#endif
     fd_set imask;
-    register char *tp;
+    char *tp;
 
     startTime = time(0);
     waitTime = 1;
@@ -6527,14 +6738,18 @@ MakeDebugCall(osi_socket socket, afs_uint32 remoteAddr, afs_uint16 remotePort,
     memcpy(outputData, tp, code);
     return code;
 }
+#endif /* RXDEBUG */
 
 afs_int32
 rx_GetServerDebug(osi_socket socket, afs_uint32 remoteAddr,
                  afs_uint16 remotePort, struct rx_debugStats * stat,
                  afs_uint32 * supportedValues)
 {
-    struct rx_debugIn in;
+#ifndef RXDEBUG
+    afs_int32 rc = -1;
+#else
     afs_int32 rc = 0;
+    struct rx_debugIn in;
 
     *supportedValues = 0;
     in.type = htonl(RX_DEBUGI_GETSTATS);
@@ -6574,26 +6789,33 @@ rx_GetServerDebug(osi_socket socket, afs_uint32 remoteAddr,
        if (stat->version >= RX_DEBUGI_VERSION_W_WAITED) {
            *supportedValues |= RX_SERVER_DEBUG_WAITED_CNT;
        }
-
+       if (stat->version >= RX_DEBUGI_VERSION_W_PACKETS) {
+           *supportedValues |= RX_SERVER_DEBUG_PACKETS_CNT;
+       }
        stat->nFreePackets = ntohl(stat->nFreePackets);
        stat->packetReclaims = ntohl(stat->packetReclaims);
        stat->callsExecuted = ntohl(stat->callsExecuted);
        stat->nWaiting = ntohl(stat->nWaiting);
        stat->idleThreads = ntohl(stat->idleThreads);
+        stat->nWaited = ntohl(stat->nWaited);
+        stat->nPackets = ntohl(stat->nPackets);
     }
-
+#endif
     return rc;
 }
 
 afs_int32
 rx_GetServerStats(osi_socket socket, afs_uint32 remoteAddr,
-                 afs_uint16 remotePort, struct rx_stats * stat,
+                 afs_uint16 remotePort, struct rx_statistics * stat,
                  afs_uint32 * supportedValues)
 {
+#ifndef RXDEBUG
+    afs_int32 rc = -1;
+#else
+    afs_int32 rc = 0;
     struct rx_debugIn in;
-    afs_int32 *lp = (afs_int32 *) stat;
     int i;
-    afs_int32 rc = 0;
+    afs_int32 *lp = (afs_int32 *) stat;
 
     /*
      * supportedValues is currently unused, but added to allow future
@@ -6618,7 +6840,7 @@ rx_GetServerStats(osi_socket socket, afs_uint32 remoteAddr,
            *lp = ntohl(*lp);
        }
     }
-
+#endif
     return rc;
 }
 
@@ -6627,10 +6849,14 @@ rx_GetServerVersion(osi_socket socket, afs_uint32 remoteAddr,
                    afs_uint16 remotePort, size_t version_length,
                    char *version)
 {
+#ifdef RXDEBUG
     char a[1] = { 0 };
     return MakeDebugCall(socket, remoteAddr, remotePort,
                         RX_PACKET_TYPE_VERSION, a, 1, version,
                         version_length);
+#else
+    return -1;
+#endif
 }
 
 afs_int32
@@ -6640,8 +6866,11 @@ rx_GetServerConnections(osi_socket socket, afs_uint32 remoteAddr,
                        struct rx_debugConn * conn,
                        afs_uint32 * supportedValues)
 {
-    struct rx_debugIn in;
+#ifndef RXDEBUG
+    afs_int32 rc = -1;
+#else
     afs_int32 rc = 0;
+    struct rx_debugIn in;
     int i;
 
     /*
@@ -6702,7 +6931,7 @@ rx_GetServerConnections(osi_socket socket, afs_uint32 remoteAddr,
        for (i = 0; i < RX_MAXCALLS; i++) {
            conn->callNumber[i] = ntohl(conn->callNumber[i]);
        }
-       conn->error = ntohl(conn->error);
+        rx_SetConnError(conn, ntohl(rx_ConnError(conn)));
        conn->secStats.flags = ntohl(conn->secStats.flags);
        conn->secStats.expires = ntohl(conn->secStats.expires);
        conn->secStats.packetsReceived =
@@ -6713,7 +6942,7 @@ rx_GetServerConnections(osi_socket socket, afs_uint32 remoteAddr,
        conn->epoch = ntohl(conn->epoch);
        conn->natMTU = ntohl(conn->natMTU);
     }
-
+#endif
     return rc;
 }
 
@@ -6723,8 +6952,11 @@ rx_GetServerPeers(osi_socket socket, afs_uint32 remoteAddr,
                  afs_uint32 debugSupportedValues, struct rx_debugPeer * peer,
                  afs_uint32 * supportedValues)
 {
-    struct rx_debugIn in;
+#ifndef RXDEBUG
+    afs_int32 rc = -1;
+#else
     afs_int32 rc = 0;
+    struct rx_debugIn in;
 
     /*
      * supportedValues is currently unused, but added to allow future
@@ -6775,19 +7007,18 @@ rx_GetServerPeers(osi_socket socket, afs_uint32 remoteAddr,
        peer->bytesReceived.high = ntohl(peer->bytesReceived.high);
        peer->bytesReceived.low = ntohl(peer->bytesReceived.low);
     }
-
+#endif
     return rc;
 }
-#endif /* RXDEBUG */
 
 void
 shutdown_rx(void)
 {
     struct rx_serverQueueEntry *np;
-    register int i, j;
+    int i, j;
 #ifndef KERNEL
-    register struct rx_call *call;
-    register struct rx_serverQueueEntry *sq;
+    struct rx_call *call;
+    struct rx_serverQueueEntry *sq;
 #endif /* KERNEL */
 
     LOCK_RX_INIT;
@@ -6848,13 +7079,12 @@ shutdown_rx(void)
                        sizeof(rx_function_entry_v1_t);
 
                    rxi_Free(rpc_stat, space);
-                   MUTEX_ENTER(&rx_rpc_stats);
-                   rxi_rpc_peer_stat_cnt -= num_funcs;
-                   MUTEX_EXIT(&rx_rpc_stats);
+                   rx_MutexAdd(rxi_rpc_peer_stat_cnt, -num_funcs, rx_rpc_stats);
                }
                next = peer->next;
                rxi_FreePeer(peer);
-                rx_MutexDecrement(rx_stats.nPeerStructs, rx_stats_mutex);
+                if (rx_stats_active)
+                    rx_AtomicDecrement(rx_stats.nPeerStructs, rx_stats_mutex);
            }
        }
     }
@@ -6863,7 +7093,7 @@ shutdown_rx(void)
            rxi_Free(rx_services[i], sizeof(*rx_services[i]));
     }
     for (i = 0; i < rx_hashTableSize; i++) {
-       register struct rx_connection *tc, *ntc;
+       struct rx_connection *tc, *ntc;
        MUTEX_ENTER(&rx_connHashTable_lock);
        for (tc = rx_connHashTable[i]; tc; tc = ntc) {
            ntc = tc->next;
@@ -6902,11 +7132,10 @@ shutdown_rx(void)
 
     rxi_FreeAllPackets();
 
-    MUTEX_ENTER(&rx_stats_mutex);
+    MUTEX_ENTER(&rx_quota_mutex);
     rxi_dataQuota = RX_MAX_QUOTA;
     rxi_availProcs = rxi_totalMin = rxi_minDeficit = 0;
-    MUTEX_EXIT(&rx_stats_mutex);
-
+    MUTEX_EXIT(&rx_quota_mutex);
     rxinit_status = 1;
     UNLOCK_RX_INIT;
 }
@@ -6944,38 +7173,44 @@ void
 rx_SetSpecific(struct rx_connection *conn, int key, void *ptr)
 {
     int i;
-    MUTEX_ENTER(&conn->conn_data_lock);
-    if (!conn->specific) {
-       conn->specific = (void **)malloc((key + 1) * sizeof(void *));
+    struct rx_connection *tconn =
+       (rx_IsClonedConn(conn)) ? conn->parent : conn;
+
+    MUTEX_ENTER(&tconn->conn_data_lock);
+    if (!tconn->specific) {
+       tconn->specific = (void **)malloc((key + 1) * sizeof(void *));
        for (i = 0; i < key; i++)
-           conn->specific[i] = NULL;
-       conn->nSpecific = key + 1;
-       conn->specific[key] = ptr;
-    } else if (key >= conn->nSpecific) {
-       conn->specific = (void **)
-           realloc(conn->specific, (key + 1) * sizeof(void *));
-       for (i = conn->nSpecific; i < key; i++)
-           conn->specific[i] = NULL;
-       conn->nSpecific = key + 1;
-       conn->specific[key] = ptr;
+           tconn->specific[i] = NULL;
+       tconn->nSpecific = key + 1;
+       tconn->specific[key] = ptr;
+    } else if (key >= tconn->nSpecific) {
+       tconn->specific = (void **)
+           realloc(tconn->specific, (key + 1) * sizeof(void *));
+       for (i = tconn->nSpecific; i < key; i++)
+           tconn->specific[i] = NULL;
+       tconn->nSpecific = key + 1;
+       tconn->specific[key] = ptr;
     } else {
-       if (conn->specific[key] && rxi_keyCreate_destructor[key])
+       if (tconn->specific[key] && rxi_keyCreate_destructor[key])
            (*rxi_keyCreate_destructor[key]) (conn->specific[key]);
-       conn->specific[key] = ptr;
+       tconn->specific[key] = ptr;
     }
-    MUTEX_EXIT(&conn->conn_data_lock);
+    MUTEX_EXIT(&tconn->conn_data_lock);
 }
 
 void *
 rx_GetSpecific(struct rx_connection *conn, int key)
 {
     void *ptr;
-    MUTEX_ENTER(&conn->conn_data_lock);
-    if (key >= conn->nSpecific)
+    struct rx_connection *tconn =
+       (rx_IsClonedConn(conn)) ? conn->parent : conn;
+
+    MUTEX_ENTER(&tconn->conn_data_lock);
+    if (key >= tconn->nSpecific)
        ptr = NULL;
     else
-       ptr = conn->specific[key];
-    MUTEX_EXIT(&conn->conn_data_lock);
+       ptr = tconn->specific[key];
+    MUTEX_EXIT(&tconn->conn_data_lock);
     return ptr;
 }
 
@@ -7904,5 +8139,66 @@ DllMain(HINSTANCE dllInstHandle, /* instance handle for this DLL module */
        return FALSE;
     }
 }
+
+#ifdef AFS_NT40_ENV
+int rx_DumpCalls(FILE *outputFile, char *cookie)
+{
+#ifdef RXDEBUG_PACKET
+    int zilch;
+#ifdef KDUMP_RX_LOCK
+    struct rx_call_rx_lock *c;
+#else
+    struct rx_call *c;
+#endif
+    char output[2048];
+
+    sprintf(output, "%s - Start dumping all Rx Calls - count=%u\r\n", cookie, rx_stats.nCallStructs);
+    WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
+
+    for (c = rx_allCallsp; c; c = c->allNextp) {
+        u_short rqc, tqc, iovqc;
+        struct rx_packet *p, *np;
+
+        MUTEX_ENTER(&c->lock);
+        queue_Count(&c->rq, p, np, rx_packet, rqc);
+        queue_Count(&c->tq, p, np, rx_packet, tqc);
+        queue_Count(&c->iovq, p, np, rx_packet, iovqc);
+
+        sprintf(output, "%s - call=0x%p, id=%u, state=%u, mode=%u, conn=%p, epoch=%u, cid=%u, callNum=%u, connFlags=0x%x, flags=0x%x, "
+                "rqc=%u,%u, tqc=%u,%u, iovqc=%u,%u, "
+                "lstatus=%u, rstatus=%u, error=%d, timeout=%u, "
+                "resendEvent=%d, timeoutEvt=%d, keepAliveEvt=%d, delayedAckEvt=%d, delayedAbortEvt=%d, abortCode=%d, abortCount=%d, "
+                "lastSendTime=%u, lastRecvTime=%u, lastSendData=%u"
+#ifdef RX_ENABLE_LOCKS
+                ", refCount=%u"
+#endif
+#ifdef RX_REFCOUNT_CHECK
+                ", refCountBegin=%u, refCountResend=%u, refCountDelay=%u, "
+                "refCountAlive=%u, refCountPacket=%u, refCountSend=%u, refCountAckAll=%u, refCountAbort=%u"
+#endif
+                "\r\n",
+                cookie, c, c->call_id, (afs_uint32)c->state, (afs_uint32)c->mode, c->conn, c->conn?c->conn->epoch:0, c->conn?c->conn->cid:0,
+                c->callNumber?*c->callNumber:0, c->conn?c->conn->flags:0, c->flags,
+                (afs_uint32)c->rqc, (afs_uint32)rqc, (afs_uint32)c->tqc, (afs_uint32)tqc, (afs_uint32)c->iovqc, (afs_uint32)iovqc, 
+                (afs_uint32)c->localStatus, (afs_uint32)c->remoteStatus, c->error, c->timeout, 
+                c->resendEvent?1:0, c->timeoutEvent?1:0, c->keepAliveEvent?1:0, c->delayedAckEvent?1:0, c->delayedAbortEvent?1:0,
+                c->abortCode, c->abortCount, c->lastSendTime, c->lastReceiveTime, c->lastSendData
+#ifdef RX_ENABLE_LOCKS
+                , (afs_uint32)c->refCount
+#endif
+#ifdef RX_REFCOUNT_CHECK
+                , c->refCDebug[0],c->refCDebug[1],c->refCDebug[2],c->refCDebug[3],c->refCDebug[4],c->refCDebug[5],c->refCDebug[6],c->refCDebug[7]
+#endif
+                );
+        MUTEX_EXIT(&c->lock);
+
+        WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
+    }
+    sprintf(output, "%s - End dumping all Rx Calls\r\n", cookie);
+    WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
+#endif /* RXDEBUG_PACKET */
+    return 0;
+}
+#endif /* AFS_NT40_ENV */
 #endif