netrestrict-netinfo-20081129
[openafs.git] / src / viced / viced.c
index 3cbe1fb..c8fee20 100644 (file)
@@ -5,6 +5,8 @@
  * This software has been released under the terms of the IBM Public
  * License.  For details, see the LICENSE file in the top-level source
  * directory or online at http://www.openafs.org/dl/license10.html
+ *
+ * Portions Copyright (c) 2006 Sine Nomine Associates
  */
 
 /*  viced.c    - File Server main loop                                  */
@@ -25,11 +27,12 @@ RCSID
 #include <stdio.h>
 #include <stdlib.h>
 #include <errno.h>
+#include <string.h>
 #include <sys/types.h>
 #include <afs/procmgmt.h>      /* signal(), kill(), wait(), etc. */
 #include <sys/stat.h>
-#ifdef AFS_NT40_ENV
 #include <fcntl.h>
+#ifdef AFS_NT40_ENV
 #include <io.h>
 #include <windows.h>
 #include <WINNT/afsevent.h>
@@ -39,14 +42,6 @@ RCSID
 #include <netdb.h>
 #include <unistd.h>            /* sysconf() */
 
-#ifdef HAVE_STRING_H
-#include <string.h>
-#else
-#ifdef HAVE_STRINGS_H
-#include <strings.h>
-#endif
-#endif
-
 #ifndef ITIMER_REAL
 #include <sys/time.h>
 #endif /* ITIMER_REAL */
@@ -75,20 +70,22 @@ RCSID
 #include <afs/acl.h>
 #include <afs/prs_fs.h>
 #include <rx/rx.h>
-#include <rx/rxkad.h>
 #include <afs/keys.h>
 #include <afs/afs_args.h>
 #include <afs/vlserver.h>
 #include <afs/afsutil.h>
 #include <afs/fileutil.h>
+#include <afs/ptuser.h>
+#include <afs/audit.h>
+#include <afs/partition.h>
 #ifndef AFS_NT40_ENV
 #include <afs/netutils.h>
 #endif
+#include "viced_prototypes.h"
 #include "viced.h"
 #include "host.h"
 #ifdef AFS_PTHREAD_ENV
 #include "softsig.h"
-char *(*threadNameProgram) ();
 #endif
 #if defined(AFS_SGI_ENV)
 #include "sys/schedctl.h"
@@ -114,10 +111,10 @@ extern int BreakVolumeCallBacksLater();
 extern int LogLevel, etext;
 extern afs_int32 BlocksSpare, PctSpare;
 
-void ShutDown(void);
+void *ShutDown(void *);
 static void ClearXStatValues(), NewParms(), PrintCounters();
 static void ResetCheckDescriptors(void), ResetCheckSignal(void);
-static void CheckSignal(void);
+static void *CheckSignal(void *);
 extern int GetKeysFromToken();
 extern int RXAFS_ExecuteRequest();
 extern int RXSTATS_ExecuteRequest();
@@ -151,8 +148,6 @@ struct afsconf_dir *confDir;        /* Configuration dir object */
 
 int restartMode = RESTART_ORDINARY;
 
-int Testing = 0;               /* for ListViceInodes */
-
 /*
  * Home for the performance statistics.
  */
@@ -167,7 +162,10 @@ int SawSpare;
 int SawPctSpare;
 int debuglevel = 0;
 int printBanner = 0;
-int rxJumbograms = 1;          /* default is to send and receive jumbograms. */
+int rxJumbograms = 0;          /* default is to not send and receive jumbograms. */
+int rxBind = 0;                /* don't bind */
+int rxkadDisableDotCheck = 0;      /* disable check for dot in principal name */ 
+int rxMaxMTU = -1;
 afs_int32 implicitAdminRights = PRSFS_LOOKUP;  /* The ADMINISTER right is 
                                                 * already implied */
 afs_int32 readonlyServer = 0;
@@ -194,9 +192,18 @@ int busy_threshold = 600;
 int abort_threshold = 10;
 int udpBufSize = 0;            /* UDP buffer size for receive */
 int sendBufSize = 16384;       /* send buffer size */
+int saneacls = 0;              /* Sane ACLs Flag */
 
 struct timeval tp;
 
+#ifdef AFS_PTHREAD_ENV
+pthread_key_t viced_uclient_key;
+#endif
+
+#ifdef AFS_PTHREAD_ENV
+pthread_key_t viced_uclient_key;
+#endif
+
 /*
  * FileServer's name and IP address, both network byte order and
  * host byte order.
@@ -212,13 +219,39 @@ afsUUID FS_HostUUID;
 
 static void FlagMsg();
 
+#ifdef AFS_DEMAND_ATTACH_FS
+/*
+ * demand attach fs
+ * fileserver mode support
+ *
+ * during fileserver shutdown, we have to track the graceful shutdown of
+ * certain background threads before we are allowed to dump state to
+ * disk
+ */
+
+#if !defined(PTHREAD_RWLOCK_INITIALIZER) && defined(AFS_DARWIN80_ENV)
+#define PTHREAD_RWLOCK_INITIALIZER {0x2DA8B3B4, {0}}
+#endif
+
+struct fs_state fs_state = 
+    { FS_MODE_NORMAL, 
+      0, 
+      0, 
+      0, 
+      0,
+      { 1,1,1,1 },
+      PTHREAD_COND_INITIALIZER,
+      PTHREAD_RWLOCK_INITIALIZER
+    };
+#endif /* AFS_DEMAND_ATTACH_FS */
+
 /*
  * Home for the performance statistics.
  */
 
 /* DEBUG HACK */
-static void
-CheckDescriptors()
+static void *
+CheckDescriptors(void *unused)
 {
 #ifndef AFS_NT40_ENV
     struct afs_stat status;
@@ -227,13 +260,15 @@ CheckDescriptors()
     for (i = 0; i < tsize; i++) {
        if (afs_fstat(i, &status) != -1) {
            printf("%d: dev %x, inode %u, length %u, type/mode %x\n", i,
-                  status.st_dev, status.st_ino, status.st_size,
+                  status.st_dev, status.st_ino, 
+                  (unsigned int) status.st_size,
                   status.st_mode);
        }
     }
     fflush(stdout);
     ResetCheckDescriptors();
 #endif
+    return 0;
 }                              /*CheckDescriptors */
 
 
@@ -241,19 +276,19 @@ CheckDescriptors()
 void
 CheckSignal_Signal(x)
 {
-    CheckSignal();
+    CheckSignal(NULL);
 }
 
 void
 ShutDown_Signal(x)
 {
-    ShutDown();
+    ShutDown(NULL);
 }
 
 void
 CheckDescriptors_Signal(x)
 {
-    CheckDescriptors();
+    CheckDescriptors(NULL);
 }
 #else /* AFS_PTHREAD_ENV */
 void
@@ -318,14 +353,9 @@ ResetCheckDescriptors(void)
 
 #if defined(AFS_PTHREAD_ENV)
 char *
-threadName(void)
+threadNum(void)
 {
-    char threadid[16];
-    if (LogLevel > 999) {
-       afs_snprintf(threadid, 16, "%d", pthread_getspecific(rx_thread_id_key));
-       return threadid;
-    } else 
-       return NULL;
+    return pthread_getspecific(rx_thread_id_key);
 }
 #endif
 
@@ -342,8 +372,10 @@ get_key(char *arock, register afs_int32 akvno, char *akey)
        return 1;
     }
     code = afsconf_GetKey(confDir, akvno, tkey.key);
-    if (code)
+    if (code) {
+       ViceLog(0, ("afsconf_GetKey failure: kvno %d code %d\n", akvno, code));
        return code;
+    }
     memcpy(akey, tkey.key, sizeof(tkey.key));
     return 0;
 
@@ -411,21 +443,39 @@ setThreadId(char *s)
 }
 
 /* This LWP does things roughly every 5 minutes */
-static void
-FiveMinuteCheckLWP()
+static void *
+FiveMinuteCheckLWP(void *unused)
 {
     static int msg = 0;
     char tbuffer[32];
 
     ViceLog(1, ("Starting five minute check process\n"));
     setThreadId("FiveMinuteCheckLWP");
+
+#ifdef AFS_DEMAND_ATTACH_FS
+    FS_STATE_WRLOCK;
+    while (fs_state.mode == FS_MODE_NORMAL) {
+       fs_state.FiveMinuteLWP_tranquil = 1;
+       FS_STATE_UNLOCK;
+#else
     while (1) {
+#endif
+
 #ifdef AFS_PTHREAD_ENV
        sleep(fiveminutes);
 #else /* AFS_PTHREAD_ENV */
        IOMGR_Sleep(fiveminutes);
 #endif /* AFS_PTHREAD_ENV */
 
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+       if (fs_state.mode != FS_MODE_NORMAL) {
+           break;
+       }
+       fs_state.FiveMinuteLWP_tranquil = 0;
+       FS_STATE_UNLOCK;
+#endif
+
        /* close the log so it can be removed */
        ReOpenLog(AFSDIR_SERVER_FILELOG_FILEPATH);      /* don't trunc, just append */
        ViceLog(2, ("Cleaning up timed out callbacks\n"));
@@ -451,7 +501,18 @@ FiveMinuteCheckLWP()
                         afs_ctime(&now, tbuffer, sizeof(tbuffer))));
            }
        }
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+#endif
     }
+#ifdef AFS_DEMAND_ATTACH_FS
+    fs_state.FiveMinuteLWP_tranquil = 1;
+    FS_LOCK;
+    assert(pthread_cond_broadcast(&fs_state.worker_done_cv)==0);
+    FS_UNLOCK;
+    FS_STATE_UNLOCK;
+#endif
+    return NULL;
 }                              /*FiveMinuteCheckLWP */
 
 
@@ -459,28 +520,59 @@ FiveMinuteCheckLWP()
  * other 5 minute activities because it may be delayed by timeouts when
  * it probes the workstations
  */
-static void
-HostCheckLWP()
+
+static void *
+HostCheckLWP(void *unused)
 {
     ViceLog(1, ("Starting Host check process\n"));
     setThreadId("HostCheckLWP");
-    while (1) {
+#ifdef AFS_DEMAND_ATTACH_FS
+    FS_STATE_WRLOCK;
+    while (fs_state.mode == FS_MODE_NORMAL) {
+       fs_state.HostCheckLWP_tranquil = 1;
+       FS_STATE_UNLOCK;
+#else
+    while(1) {
+#endif
+
 #ifdef AFS_PTHREAD_ENV
        sleep(fiveminutes);
 #else /* AFS_PTHREAD_ENV */
        IOMGR_Sleep(fiveminutes);
 #endif /* AFS_PTHREAD_ENV */
+
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+       if (fs_state.mode != FS_MODE_NORMAL) {
+           break;
+       }
+       fs_state.HostCheckLWP_tranquil = 0;
+       FS_STATE_UNLOCK;
+#endif
+
        ViceLog(2, ("Checking for dead venii & clients\n"));
        h_CheckHosts();
+
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+#endif
     }
+#ifdef AFS_DEMAND_ATTACH_FS
+    fs_state.HostCheckLWP_tranquil = 1;
+    FS_LOCK;
+    assert(pthread_cond_broadcast(&fs_state.worker_done_cv)==0);
+    FS_UNLOCK;
+    FS_STATE_UNLOCK;
+#endif
+    return NULL;
 }                              /*HostCheckLWP */
 
 /* This LWP does fsync checks every 5 minutes:  it should not be used for
  * other 5 minute activities because it may be delayed by timeouts when
  * it probes the workstations
  */
-static
-FsyncCheckLWP()
+static void *
+FsyncCheckLWP(void *unused)
 {
     afs_int32 code;
 #ifdef AFS_PTHREAD_ENV
@@ -490,12 +582,14 @@ FsyncCheckLWP()
 
     setThreadId("FsyncCheckLWP");
 
-#ifdef AFS_PTHREAD_ENV
-    assert(pthread_cond_init(&fsync_cond, NULL) == 0);
-    assert(pthread_mutex_init(&fsync_glock_mutex, NULL) == 0);
+#ifdef AFS_DEMAND_ATTACH_FS
+    FS_STATE_WRLOCK;
+    while (fs_state.mode == FS_MODE_NORMAL) {
+       fs_state.FsyncCheckLWP_tranquil = 1;
+       FS_STATE_UNLOCK;
+#else
+    while(1) {
 #endif
-
-    while (1) {
        FSYNC_LOCK;
 #ifdef AFS_PTHREAD_ENV
        /* rounding is fine */
@@ -512,11 +606,32 @@ FsyncCheckLWP()
            ViceLog(0, ("LWP_WaitProcess returned %d\n", code));
 #endif /* AFS_PTHREAD_ENV */
        FSYNC_UNLOCK;
+
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+       if (fs_state.mode != FS_MODE_NORMAL) {
+           break;
+       }
+       fs_state.FsyncCheckLWP_tranquil = 0;
+       FS_STATE_UNLOCK;
+#endif /* AFS_DEMAND_ATTACH_FS */
+
        ViceLog(2, ("Checking for fsync events\n"));
        do {
            code = BreakLaterCallBacks();
        } while (code != 0);
+#ifdef AFS_DEMAND_ATTACH_FS
+       FS_STATE_WRLOCK;
+#endif
     }
+#ifdef AFS_DEMAND_ATTACH_FS
+    fs_state.FsyncCheckLWP_tranquil = 1;
+    FS_LOCK;
+    assert(pthread_cond_broadcast(&fs_state.worker_done_cv)==0);
+    FS_UNLOCK;
+    FS_STATE_UNLOCK;
+#endif /* AFS_DEMAND_ATTACH_FS */
+    return NULL;
 }
 
 /*------------------------------------------------------------------------
@@ -603,6 +718,11 @@ PrintCounters()
            ("Vice was last started at %s\n",
             afs_ctime(&StartTime, tbuffer, sizeof(tbuffer))));
 
+#ifdef AFS_DEMAND_ATTACH_FS
+    /* XXX perhaps set extended stats verbosity flags
+     * based upon LogLevel ?? */
+    VPrintExtendedCacheStats(VOL_STATS_PER_CHAIN2);
+#endif
     VPrintCacheStats();
     VPrintDiskStats();
     DStat(&dirbuff, &dircall, &dirio);
@@ -631,8 +751,8 @@ PrintCounters()
 
 
 
-static void
-CheckSignal()
+static void *
+CheckSignal(void *unused)
 {
     if (FS_registered > 0) {
        /*
@@ -646,7 +766,7 @@ CheckSignal()
     DumpCallBackState();
     PrintCounters();
     ResetCheckSignal();
-
+    return 0;
 }                              /*CheckSignal */
 
 void
@@ -655,6 +775,16 @@ ShutDownAndCore(int dopanic)
     time_t now = time(0);
     char tbuffer[32];
 
+    /* do not allows new reqests to be served from now on, all new requests
+     * are returned with an error code of RX_RESTARTING ( transient failure ) */
+    rx_SetRxTranquil();                /* dhruba */
+
+#ifdef AFS_DEMAND_ATTACH_FS
+    FS_STATE_WRLOCK;
+    fs_state.mode = FS_MODE_SHUTDOWN;
+    FS_STATE_UNLOCK;
+#endif
+
     ViceLog(0,
            ("Shutting down file server at %s",
             afs_ctime(&now, tbuffer, sizeof(tbuffer))));
@@ -670,11 +800,34 @@ ShutDownAndCore(int dopanic)
     if (!dopanic)
        PrintCounters();
 
-    /* do not allows new reqests to be served from now on, all new requests
-     * are returned with an error code of RX_RESTARTING ( transient failure ) */
-    rx_SetRxTranquil();                /* dhruba */
+    /* shut down volume package */
     VShutdown();
 
+#ifdef AFS_DEMAND_ATTACH_FS
+    if (fs_state.options.fs_state_save) {
+       /* 
+        * demand attach fs
+        * save fileserver state to disk */
+
+       /* make sure background threads have finished all of their asynchronous 
+        * work on host and callback structures */
+       FS_STATE_RDLOCK;
+       while (!fs_state.FiveMinuteLWP_tranquil ||
+              !fs_state.HostCheckLWP_tranquil ||
+              !fs_state.FsyncCheckLWP_tranquil) {
+           FS_LOCK;
+           FS_STATE_UNLOCK;
+           ViceLog(0, ("waiting for background host/callback threads to quiesce before saving fileserver state...\n"));
+           assert(pthread_cond_wait(&fs_state.worker_done_cv, &fileproc_glock_mutex) == 0);
+           FS_UNLOCK;
+           FS_STATE_RDLOCK;
+       }
+
+       /* ok. it should now be fairly safe. let's do the state dump */
+       fs_stateSave();
+    }
+#endif /* AFS_DEMAND_ATTACH_FS */
+
     if (debugFile) {
        rx_PrintStats(debugFile);
        fflush(debugFile);
@@ -700,66 +853,85 @@ ShutDownAndCore(int dopanic)
        }
     }
 
-    exit(0);
+    if (dopanic)
+       assert(0);
 
-}                              /*ShutDown */
+    exit(0);
+}
 
-void
-ShutDown(void)
+void *
+ShutDown(void *unused)
 {                              /* backward compatibility */
     ShutDownAndCore(DONTPANIC);
+    return 0;
 }
 
 
 static void
 FlagMsg()
 {
-    char buffer[1024];
-
     /* default supports help flag */
 
-    strcpy(buffer, "Usage: fileserver ");
-    strcat(buffer, "[-d <debug level>] ");
-    strcat(buffer, "[-p <number of processes>] ");
-    strcat(buffer, "[-spare <number of spare blocks>] ");
-    strcat(buffer, "[-pctspare <percentage spare>] ");
-    strcat(buffer, "[-b <buffers>] ");
-    strcat(buffer, "[-l <large vnodes>] ");
-    strcat(buffer, "[-s <small vnodes>] ");
-    strcat(buffer, "[-vc <volume cachesize>] ");
-    strcat(buffer, "[-w <call back wait interval>] ");
-    strcat(buffer, "[-cb <number of call backs>] ");
-    strcat(buffer, "[-banner (print banner every 10 minutes)] ");
-    strcat(buffer, "[-novbc (whole volume cbs disabled)] ");
-    strcat(buffer, "[-implicit <admin mode bits: rlidwka>] ");
-    strcat(buffer, "[-readonly (read-only file server)] ");
-    strcat(buffer,
-          "[-hr <number of hours between refreshing the host cps>] ");
-    strcat(buffer, "[-busyat <redirect clients when queue > n>] ");
-    strcat(buffer, "[-nobusy <no VBUSY before a volume is attached>] ");
-    strcat(buffer, "[-rxpck <number of rx extra packets>] ");
-    strcat(buffer, "[-rxdbg (enable rx debugging)] ");
-    strcat(buffer, "[-rxdbge (enable rxevent debugging)] ");
+    fputs("Usage: fileserver ", stdout);
+    fputs("[-auditlog <log path>] ", stdout);
+    fputs("[-d <debug level>] ", stdout);
+    fputs("[-p <number of processes>] ", stdout);
+    fputs("[-spare <number of spare blocks>] ", stdout);
+    fputs("[-pctspare <percentage spare>] ", stdout);
+    fputs("[-b <buffers>] ", stdout);
+    fputs("[-l <large vnodes>] ", stdout);
+    fputs("[-s <small vnodes>] ", stdout);
+    fputs("[-vc <volume cachesize>] ", stdout);
+    fputs("[-w <call back wait interval>] ", stdout);
+    fputs("[-cb <number of call backs>] ", stdout);
+    fputs("[-banner (print banner every 10 minutes)] ", stdout);
+    fputs("[-novbc (whole volume cbs disabled)] ", stdout);
+    fputs("[-implicit <admin mode bits: rlidwka>] ", stdout);
+    fputs("[-readonly (read-only file server)] ", stdout);
+    fputs("[-hr <number of hours between refreshing the host cps>] ", stdout);
+    fputs("[-busyat <redirect clients when queue > n>] ", stdout);
+    fputs("[-nobusy <no VBUSY before a volume is attached>] ", stdout);
+    fputs("[-rxpck <number of rx extra packets>] ", stdout);
+    fputs("[-rxdbg (enable rx debugging)] ", stdout);
+    fputs("[-rxdbge (enable rxevent debugging)] ", stdout);
+    fputs("[-rxmaxmtu <bytes>] ", stdout);
+    fputs("[-rxbind (bind the Rx socket to one address)] ", stdout);
+    fputs("[-allow-dotted-principals (disable the rxkad principal name dot check)] ", stdout);
+#ifdef AFS_DEMAND_ATTACH_FS
+    fputs("[-fs-state-dont-save (disable state save during shutdown)] ", stdout);
+    fputs("[-fs-state-dont-restore (disable state restore during startup)] ", stdout);
+    fputs("[-fs-state-verify <none|save|restore|both> (default is both)] ", stdout);
+    fputs("[-vattachpar <max number of volume attach/shutdown threads> (default is 1)] ", stdout);
+    fputs("[-vhashsize <log(2) of number of volume hash buckets> (default is 8)] ", stdout);
+    fputs("[-vlrudisable (disable VLRU functionality)] ", stdout);
+    fputs("[-vlruthresh <minutes before unused volumes become eligible for soft detach> (default is 2 hours)] ", stdout);
+    fputs("[-vlruinterval <seconds between VLRU scans> (default is 2 minutes)] ", stdout);
+    fputs("[-vlrumax <max volumes to soft detach in one VLRU scan> (default is 8)] ", stdout);
+#elif AFS_PTHREAD_ENV
+    fputs("[-vattachpar <number of volume attach threads> (default is 1)] ", stdout);
+#endif
 #ifdef AFS_AIX32_ENV
-    strcat(buffer, "[-m <min percentage spare in partition>] ");
+    fputs("[-m <min percentage spare in partition>] ", stdout);
 #endif
 #if defined(AFS_SGI_ENV)
-    strcat(buffer, "[-lock (keep fileserver from swapping)] ");
-#endif
-    strcat(buffer, "[-L (large server conf)] ");
-    strcat(buffer, "[-S (small server conf)] ");
-    strcat(buffer, "[-k <stack size>] ");
-    strcat(buffer, "[-realm <Kerberos realm name>] ");
-    strcat(buffer, "[-udpsize <size of socket buffer in bytes>] ");
-    strcat(buffer, "[-sendsize <size of send buffer in bytes>] ");
-/*   strcat(buffer, "[-enable_peer_stats] "); */
-/*   strcat(buffer, "[-enable_process_stats] "); */
-    strcat(buffer, "[-help]\n");
+    fputs("[-lock (keep fileserver from swapping)] ", stdout);
+#endif
+    fputs("[-L (large server conf)] ", stdout);
+    fputs("[-S (small server conf)] ", stdout);
+    fputs("[-k <stack size>] ", stdout);
+    fputs("[-realm <Kerberos realm name>] ", stdout);
+    fputs("[-udpsize <size of socket buffer in bytes>] ", stdout);
+    fputs("[-sendsize <size of send buffer in bytes>] ", stdout);
+    fputs("[-abortthreshold <abort threshold>] ", stdout);
+    fputs("[-nojumbo (disable jumbogram network packets - deprecated)] ", stdout);
+    fputs("[-jumbo (enable jumbogram network packets)] ", stdout);
+/*   fputs("[-enable_peer_stats] ", stdout); */
+/*   fputs("[-enable_process_stats] ", stdout); */
+    fputs("[-help]\n", stdout);
 /*
     ViceLog(0, ("%s", buffer));
 */
 
-    printf("%s", buffer);
     fflush(stdout);
 
 }                              /*FlagMsg */
@@ -935,6 +1107,65 @@ ParseArgs(int argc, char *argv[])
                return -1; 
            }
            rxpackets = atoi(argv[++i]);
+#ifdef AFS_PTHREAD_ENV
+       } else if (!strcmp(argv[i], "-vattachpar")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           vol_attach_threads = atoi(argv[++i]);
+#endif /* AFS_PTHREAD_ENV */
+#ifdef AFS_DEMAND_ATTACH_FS
+       } else if (!strcmp(argv[i], "-fs-state-dont-save")) {
+           fs_state.options.fs_state_save = 0;
+       } else if (!strcmp(argv[i], "-fs-state-dont-restore")) {
+           fs_state.options.fs_state_restore = 0;
+       } else if (!strcmp(argv[i], "-fs-state-verify")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           i++;
+           if (!strcmp(argv[i], "none")) {
+               fs_state.options.fs_state_verify_before_save = 0;
+               fs_state.options.fs_state_verify_after_restore = 0;
+           } else if (!strcmp(argv[i], "save")) {
+               fs_state.options.fs_state_verify_after_restore = 0;
+           } else if (!strcmp(argv[i], "restore")) {
+               fs_state.options.fs_state_verify_before_save = 0;
+           } else if (!strcmp(argv[i], "both")) {
+               /* default */
+           } else {
+               fprintf(stderr, "invalid argument for %s\n", argv[i-1]);
+               return -1;
+           }
+       } else if (!strcmp(argv[i], "-vhashsize")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           VSetVolHashSize(atoi(argv[++i]));
+       } else if (!strcmp(argv[i], "-vlrudisable")) {
+           VLRU_SetOptions(VLRU_SET_ENABLED, 0);
+       } else if (!strcmp(argv[i], "-vlruthresh")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           VLRU_SetOptions(VLRU_SET_THRESH, 60*atoi(argv[++i]));
+       } else if (!strcmp(argv[i], "-vlruinterval")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           VLRU_SetOptions(VLRU_SET_INTERVAL, atoi(argv[++i]));
+       } else if (!strcmp(argv[i], "-vlrumax")) {
+            if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for %s\n", argv[i]); 
+               return -1; 
+           }
+           VLRU_SetOptions(VLRU_SET_MAX, atoi(argv[++i]));
+#endif /* AFS_DEMAND_ATTACH_FS */
        } else if (!strcmp(argv[i], "-s")) {
            Sawsmall = 1;
             if ((i + 1) >= argc) {
@@ -1044,8 +1275,28 @@ ParseArgs(int argc, char *argv[])
 #endif
        else if (!strcmp(argv[i], "-nojumbo")) {
            rxJumbograms = 0;
+       } else if (!strcmp(argv[i], "-jumbo")) {
+           rxJumbograms = 1;
+       } else if (!strcmp(argv[i], "-rxbind")) {
+           rxBind = 1;
+       } else if (!strcmp(argv[i], "-allow-dotted-principals")) {
+           rxkadDisableDotCheck = 1;
+       } else if (!strcmp(argv[i], "-rxmaxmtu")) {
+           if ((i + 1) >= argc) {
+               fprintf(stderr, "missing argument for -rxmaxmtu\n"); 
+               return -1; 
+           }
+           rxMaxMTU = atoi(argv[++i]);
+           if ((rxMaxMTU < RX_MIN_PACKET_SIZE) || 
+               (rxMaxMTU > RX_MAX_PACKET_DATA_SIZE)) {
+               printf("rxMaxMTU %d%% invalid; must be between %d-%d\n",
+                      rxMaxMTU, RX_MIN_PACKET_SIZE, 
+                      RX_MAX_PACKET_DATA_SIZE);
+               return -1;
+           }
        } else if (!strcmp(argv[i], "-realm")) {
-           extern char local_realm[AFS_REALM_SZ];
+           extern char local_realms[AFS_NUM_LREALMS][AFS_REALM_SZ];
+           extern int  num_lrealms;
            if ((i + 1) >= argc) {
                fprintf(stderr, "missing argument for -realm\n"); 
                return -1; 
@@ -1056,7 +1307,15 @@ ParseArgs(int argc, char *argv[])
                     AFS_REALM_SZ);
                return -1;
            }
-           strncpy(local_realm, argv[i], AFS_REALM_SZ);
+           if (num_lrealms == -1) 
+               num_lrealms = 0;
+           if (num_lrealms >= AFS_NUM_LREALMS) {
+               printf
+                   ("a maximum of %d -realm arguments can be specified.\n",
+                    AFS_NUM_LREALMS);
+               return -1;
+           }
+           strncpy(local_realms[num_lrealms++], argv[i], AFS_REALM_SZ);
        } else if (!strcmp(argv[i], "-udpsize")) {
            if ((i + 1) >= argc) {
                printf("You have to specify -udpsize <integer value>\n");
@@ -1086,6 +1345,36 @@ ParseArgs(int argc, char *argv[])
        } else if (!strcmp(argv[i], "-enable_process_stats")) {
            rx_enableProcessRPCStats();
        }
+       else if (strcmp(argv[i], "-auditlog") == 0) {
+           int tempfd, flags;
+           FILE *auditout;
+           char oldName[MAXPATHLEN];
+           char *fileName = argv[++i];
+           
+#ifndef AFS_NT40_ENV
+           struct stat statbuf;
+           
+           if ((lstat(fileName, &statbuf) == 0) 
+               && (S_ISFIFO(statbuf.st_mode))) {
+               flags = O_WRONLY | O_NONBLOCK;
+           } else 
+#endif
+           {
+               strcpy(oldName, fileName);
+               strcat(oldName, ".old");
+               renamefile(fileName, oldName);
+               flags = O_WRONLY | O_TRUNC | O_CREAT;
+           }
+           tempfd = open(fileName, flags, 0666);
+           if (tempfd > -1) {
+               auditout = fdopen(tempfd, "a");
+               if (auditout) {
+                   osi_audit_file(auditout);
+               } else
+                   printf("Warning: auditlog %s not writable, ignored.\n", fileName);
+           } else
+               printf("Warning: auditlog %s not writable, ignored.\n", fileName);
+       }
 #ifndef AFS_NT40_ENV
        else if (strcmp(argv[i], "-syslog") == 0) {
            /* set syslog logging flag */
@@ -1095,6 +1384,13 @@ ParseArgs(int argc, char *argv[])
            serverLogSyslogFacility = atoi(argv[i] + 8);
        }
 #endif
+       else if (strcmp(argv[i], "-mrafslogs") == 0) {
+           /* set syslog logging flag */
+           mrafsStyleLogs = 1;
+       } 
+       else if (strcmp(argv[i], "-saneacls") == 0) {
+           saneacls = 1;
+       }
        else {
            return (-1);
        }
@@ -1129,7 +1425,7 @@ ParseArgs(int argc, char *argv[])
        if (!Sawcbs)
            numberofcbs = 64000;
        if (!Sawlwps)
-           lwps = 12;
+           lwps = 128;
        if (!Sawbufs)
            buffs = 120;
        if (!SawVC)
@@ -1225,7 +1521,7 @@ Die(char *msg)
 afs_int32
 InitPR()
 {
-    register code;
+    int code;
 
     /*
      * If this fails, it's because something major is wrong, and is not
@@ -1237,6 +1533,11 @@ InitPR()
                ("Couldn't initialize protection library; code=%d.\n", code));
        return code;
     }
+
+#ifdef AFS_PTHREAD_ENV
+    assert(pthread_key_create(&viced_uclient_key, NULL) == 0);
+#endif
+
     SystemId = SYSADMINID;
     SystemAnyUser = ANYUSERID;
     SystemAnyUserCPS.prlist_len = 0;
@@ -1273,7 +1574,7 @@ struct rx_connection *serverconns[MAXSERVERS];
 struct ubik_client *cstruct;
 
 afs_int32
-vl_Initialize(char *confDir)
+vl_Initialize(const char *confDir)
 {
     afs_int32 code, scIndex = 0, i;
     struct afsconf_dir *tdir;
@@ -1304,6 +1605,7 @@ vl_Initialize(char *confDir)
                             info.hostAddr[i].sin_port, USER_SERVICE_ID, sc,
                             scIndex);
     code = ubik_ClientInit(serverconns, &cstruct);
+    afsconf_Close(tdir);
     if (code) {
        ViceLog(0, ("vl_Initialize: ubik client init failed.\n"));
        return code;
@@ -1375,16 +1677,22 @@ ReadSysIdFile()
                 AFSDIR_SERVER_SYSID_FILEPATH, nentries));
        return EIO;
     }
-    FS_HostAddr_cnt = nentries;
-    for (i = 0; i < nentries; i++) {
-       if (read(fd, (char *)&FS_HostAddrs[i], sizeof(afs_int32)) !=
-           sizeof(afs_int32)) {
-           ViceLog(0,
-                   ("%s: Read of addresses failed (%d)\n",
-                    AFSDIR_SERVER_SYSID_FILEPATH, errno));
-           FS_HostAddr_cnt = 0;        /* reset it */
-           return EIO;
+    if (FS_HostAddr_cnt == 0) {
+       FS_HostAddr_cnt = nentries;
+       for (i = 0; i < nentries; i++) {
+           if (read(fd, (char *)&FS_HostAddrs[i], sizeof(afs_int32)) !=
+               sizeof(afs_int32)) {
+               ViceLog(0,
+                       ("%s: Read of addresses failed (%d)\n",
+                        AFSDIR_SERVER_SYSID_FILEPATH, errno));
+               FS_HostAddr_cnt = 0;    /* reset it */
+               return EIO;
+           }
        }
+    } else {
+       ViceLog(1,
+               ("%s: address list ignored (NetInfo/NetRestrict override)\n",
+                AFSDIR_SERVER_SYSID_FILEPATH));
     }
     close(fd);
     return 0;
@@ -1472,11 +1780,11 @@ Do_VLRegisterRPC()
        FS_HostAddrs_HBO[i] = ntohl(FS_HostAddrs[i]);
     addrs.bulkaddrs_len = FS_HostAddr_cnt;
     addrs.bulkaddrs_val = (afs_uint32 *) FS_HostAddrs_HBO;
-    code = ubik_Call(VL_RegisterAddrs, cstruct, 0, &FS_HostUUID, 0, &addrs);
+    code = ubik_VL_RegisterAddrs(cstruct, 0, &FS_HostUUID, 0, &addrs);
     if (code) {
        if (code == VL_MULTIPADDR) {
            ViceLog(0,
-                   ("VL_RegisterAddrs rpc failed; The ethernet address exist on a different server; repair it\n"));
+                   ("VL_RegisterAddrs rpc failed; The IP address exists on a different server; repair it\n"));
            ViceLog(0,
                    ("VL_RegisterAddrs rpc failed; See VLLog for details\n"));
            return code;
@@ -1498,12 +1806,45 @@ Do_VLRegisterRPC()
 }
 
 afs_int32
-InitVL()
+SetupVL()
 {
     afs_int32 code;
     extern int rxi_numNetAddrs;
     extern afs_uint32 rxi_NetAddrs[];
 
+    if (AFSDIR_SERVER_NETRESTRICT_FILEPATH || AFSDIR_SERVER_NETINFO_FILEPATH) {
+       /*
+        * Find addresses we are supposed to register as per the netrestrict 
+        * and netinfo files (/usr/afs/local/NetInfo and 
+        * /usr/afs/local/NetRestict)
+        */
+       char reason[1024];
+       afs_int32 code = parseNetFiles(FS_HostAddrs, NULL, NULL,
+                                      ADDRSPERSITE, reason,
+                                      AFSDIR_SERVER_NETINFO_FILEPATH,
+                                      AFSDIR_SERVER_NETRESTRICT_FILEPATH);
+       if (code < 0) {
+           ViceLog(0, ("Can't register any valid addresses: %s\n", reason));
+           exit(1);
+       }
+       FS_HostAddr_cnt = (afs_uint32) code;
+    } else
+    {
+       FS_HostAddr_cnt = rx_getAllAddr(FS_HostAddrs, ADDRSPERSITE);
+    }
+
+    if (FS_HostAddr_cnt == 1 && rxBind == 1)
+       code = FS_HostAddrs[0];
+    else 
+       code = htonl(INADDR_ANY);
+    return code;
+}
+
+afs_int32
+InitVL()
+{
+    afs_int32 code;
+
     /*
      * If this fails, it's because something major is wrong, and is not
      * likely to be time dependent.
@@ -1530,30 +1871,7 @@ InitVL()
     /* A good sysid file exists; inform the vlserver. If any conflicts,
      * we always use the latest interface available as the real truth.
      */
-#ifndef AFS_NT40_ENV
-    if (AFSDIR_SERVER_NETRESTRICT_FILEPATH || AFSDIR_SERVER_NETINFO_FILEPATH) {
-       /*
-        * Find addresses we are supposed to register as per the netrestrict 
-        * and netinfo files (/usr/afs/local/NetInfo and 
-        * /usr/afs/local/NetRestict)
-        */
-       char reason[1024];
-       afs_int32 code = parseNetFiles(FS_HostAddrs, NULL, NULL,
-                                      ADDRSPERSITE, reason,
-                                      AFSDIR_SERVER_NETINFO_FILEPATH,
-                                      AFSDIR_SERVER_NETRESTRICT_FILEPATH);
-       if (code < 0) {
-           ViceLog(0, ("Can't register any valid addresses: %s\n", reason));
-           exit(1);
-       }
-       FS_HostAddr_cnt = (afs_uint32) code;
-    } else
-#endif
-    {
-       FS_HostAddr_cnt = rx_getAllAddr(FS_HostAddrs, ADDRSPERSITE);
-    }
 
-    FS_registered = 1;
     code = Do_VLRegisterRPC();
     return code;
 }
@@ -1578,6 +1896,7 @@ main(int argc, char *argv[])
 #endif
     int curLimit;
     time_t t;
+    afs_uint32 rx_bindhost;
 
 #ifdef AFS_AIX32_ENV
     struct sigaction nsa;
@@ -1588,6 +1907,7 @@ main(int argc, char *argv[])
     sigaction(SIGABRT, &nsa, NULL);
     sigaction(SIGSEGV, &nsa, NULL);
 #endif
+    osi_audit_init();
 
     /* Initialize dirpaths */
     if (!(initAFSDirPath() & AFSDIR_SERVER_PATHS_OK)) {
@@ -1716,8 +2036,8 @@ main(int argc, char *argv[])
        V_BreakVolumeCallbacks = BreakVolumeCallBacksLater;
     }
 
-#if defined(AFS_PTHREAD_ENV)
-    threadNameProgram = threadName;
+#ifdef AFS_PTHREAD_ENV
+    SetLogThreadNumProgram( threadNum );
 #endif
 
     /* initialize libacl routines */
@@ -1732,17 +2052,23 @@ main(int argc, char *argv[])
     rx_SetBusyThreshold(busy_threshold, VBUSY);
     rx_SetCallAbortThreshold(abort_threshold);
     rx_SetConnAbortThreshold(abort_threshold);
+#ifdef AFS_XBSD_ENV
+    stackSize = 128 * 1024;
+#else
     stackSize = lwps * 4000;
     if (stackSize < 32000)
        stackSize = 32000;
     else if (stackSize > 44000)
        stackSize = 44000;
-#if    defined(AFS_HPUX_ENV) || defined(AFS_SUN_ENV) || defined(AFS_SGI51_ENV)
+#endif
+#if defined(AFS_HPUX_ENV) || defined(AFS_SUN_ENV) || defined(AFS_SGI51_ENV) || defined(AFS_XBSD_ENV)
     rx_SetStackSize(1, stackSize);
 #endif
     if (udpBufSize)
        rx_SetUdpBufSize(udpBufSize);   /* set the UDP buffer size for receive */
-    if (rx_Init((int)htons(7000)) < 0) {
+    rx_bindhost = SetupVL();
+
+    if (rx_InitHost(rx_bindhost, (int)htons(7000)) < 0) {
        ViceLog(0, ("Cannot initialize RX\n"));
        exit(1);
     }
@@ -1750,26 +2076,34 @@ main(int argc, char *argv[])
        /* Don't send and don't allow 3.4 clients to send jumbograms. */
        rx_SetNoJumbo();
     }
+    if (rxMaxMTU != -1) {
+       rx_SetMaxMTU(rxMaxMTU);
+    }
     rx_GetIFInfo();
     rx_SetRxDeadTime(30);
     sc[0] = rxnull_NewServerSecurityObject();
     sc[1] = 0;                 /* rxvab_NewServerSecurityObject(key1, 0) */
     sc[2] = rxkad_NewServerSecurityObject(rxkad_clear, NULL, get_key, NULL);
     sc[3] = rxkad_NewServerSecurityObject(rxkad_crypt, NULL, get_key, NULL);
-    tservice = rx_NewService( /* port */ 0, /* service id */ 1,        /*service name */
-                            "AFS",
-                                                       /* security classes */ sc,
-                                                       /* numb sec classes */
-                            4, RXAFS_ExecuteRequest);
+    tservice = rx_NewServiceHost(rx_bindhost,  /* port */ 0, /* service id */ 
+                                1,     /*service name */
+                                "AFS",
+                                /* security classes */ sc,
+                                /* numb sec classes */
+                                4, RXAFS_ExecuteRequest);
     if (!tservice) {
        ViceLog(0,
                ("Failed to initialize RX, probably two servers running.\n"));
        exit(-1);
     }
-    rx_SetDestroyConnProc(tservice, (void (*)())h_FreeConnection);
+    if (rxkadDisableDotCheck) {
+        rx_SetSecurityConfiguration(tservice, RXS_CONFIG_FLAGS,
+                                    (void *)RXS_CONFIG_FLAGS_DISABLE_DOTCHECK);
+    }
     rx_SetMinProcs(tservice, 3);
     rx_SetMaxProcs(tservice, lwps);
     rx_SetCheckReach(tservice, 1);
+    rx_SetServerIdleDeadErr(tservice, VNOSERVICE);
 
     tservice =
        rx_NewService(0, RX_STATS_SERVICE_ID, "rpcstats", sc, 4,
@@ -1817,7 +2151,23 @@ main(int argc, char *argv[])
     /* allow super users to manage RX statistics */
     rx_SetRxStatUserOk(fs_rxstat_userok);
 
+#ifdef AFS_PTHREAD_ENV
+    assert(pthread_cond_init(&fsync_cond, NULL) == 0);
+    assert(pthread_mutex_init(&fsync_glock_mutex, NULL) == 0);
+#endif
+
+#if !defined(AFS_DEMAND_ATTACH_FS)
+    /* 
+     * For DAFS, we do not start the Rx server threads until after
+     * the volume package is initialized, and fileserver state is
+     * restored.  This is necessary in order to keep host and callback
+     * package state pristine until we have a chance to restore state.
+     *
+     * Furthermore, startup latency is much lower with dafs, so this
+     * shouldn't pose a serious problem.
+     */
     rx_StartServer(0);         /* now start handling requests */
+#endif
 
     /* we ensure that there is enough space in the vnode buffer to satisfy
      ** requests from all concurrent threads. 
@@ -1850,6 +2200,16 @@ main(int argc, char *argv[])
        exit(1);
     }
 
+#ifdef AFS_DEMAND_ATTACH_FS
+    if (fs_state.options.fs_state_restore) {
+       /*
+        * demand attach fs
+        * restore fileserver state */
+       fs_stateRestore();
+    }
+    rx_StartServer(0);  /* now start handling requests */
+#endif /* AFS_DEMAND_ATTACH_FS */
+
     /*
      * We are done calling fopen/fdopen. It is safe to use a large
      * of the file descriptor cache.
@@ -1858,16 +2218,19 @@ main(int argc, char *argv[])
 
 #ifdef AFS_PTHREAD_ENV
     ViceLog(5, ("Starting pthreads\n"));
+#ifdef AFS_DEMAND_ATTACH_FS
+    FS_STATE_INIT;
+#endif
     assert(pthread_attr_init(&tattr) == 0);
     assert(pthread_attr_setdetachstate(&tattr, PTHREAD_CREATE_DETACHED) == 0);
 
     assert(pthread_create
-          (&serverPid, &tattr, (void *)FiveMinuteCheckLWP,
+          (&serverPid, &tattr, FiveMinuteCheckLWP,
            &fiveminutes) == 0);
     assert(pthread_create
-          (&serverPid, &tattr, (void *)HostCheckLWP, &fiveminutes) == 0);
+          (&serverPid, &tattr, HostCheckLWP, &fiveminutes) == 0);
     assert(pthread_create
-          (&serverPid, &tattr, (void *)FsyncCheckLWP, &fiveminutes) == 0);
+          (&serverPid, &tattr, FsyncCheckLWP, &fiveminutes) == 0);
 #else /* AFS_PTHREAD_ENV */
     ViceLog(5, ("Starting LWP\n"));
     assert(LWP_CreateProcess
@@ -1940,4 +2303,5 @@ main(int argc, char *argv[])
 #else /* AFS_PTHREAD_ENV */
     assert(LWP_WaitProcess(&parentPid) == LWP_SUCCESS);
 #endif /* AFS_PTHREAD_ENV */
+    return 0;
 }