Change the meaning of the -fakestat switch to only enable fakestat
[openafs.git] / src / afs / VNOPS / afs_vnop_lookup.c
index 0346dc0..74960ee 100644 (file)
@@ -19,8 +19,8 @@
  * afs_index
  */
 
-#include "../afs/param.h"      /* Should be always first */
 #include <afsconfig.h>
+#include "../afs/param.h"
 
 RCSID("$Header$");
 
@@ -54,6 +54,7 @@ extern struct inode_operations afs_symlink_iops, afs_dir_iops;
 
 afs_int32 afs_bulkStatsDone;
 static int bulkStatCounter = 0;        /* counter for bulk stat seq. numbers */
+int afs_fakestat_enable = 0;
 
 
 /* this would be faster if it did comparison as int32word, but would be 
@@ -61,9 +62,7 @@ static int bulkStatCounter = 0;       /* counter for bulk stat seq. numbers */
  * what "@sys" is in binary... */
 #define AFS_EQ_ATSYS(name) (((name)[0]=='@')&&((name)[1]=='s')&&((name)[2]=='y')&&((name)[3]=='s')&&(!(name)[4]))
 
-char *
-afs_strcat(s1, s2)
-       register char *s1, *s2;
+char *afs_strcat(register char *s1, register char *s2)
 {
        register char *os1;
 
@@ -72,43 +71,41 @@ afs_strcat(s1, s2)
        while (*s1++)
                ;
        --s1;
-       while (*s1++ = *s2++)
+       while ((*s1++ = *s2++))
                ;
        return (os1);
 }
 
 
-char *afs_index(a, c)
-    register char *a, c; {
+char *afs_index(register char *a, register char c)
+{
     register char tc;
     AFS_STATCNT(afs_index);
-    while (tc = *a) {
+    while ((tc = *a)) {
        if (tc == c) return a;
        else a++;
     }
-    return (char *) 0;
+    return NULL;
 }
 
 /* call under write lock, evaluate mvid field from a mt pt.
- * avc is the vnode of the mount point object.
- * advc is the vnode of the containing directory
+ * avc is the vnode of the mount point object; must be write-locked.
+ * advc is the vnode of the containing directory (optional; if NULL and
+ *   EvalMountPoint succeeds, caller must initialize *avolpp->dotdot)
  * avolpp is where we return a pointer to the volume named by the mount pt, if success
  * areq is the identity of the caller.
  *
  * NOTE: this function returns a held volume structure in *volpp if it returns 0!
  */
-EvalMountPoint(avc, advc, avolpp, areq)
-    register struct vcache *avc;
-    struct volume **avolpp;
-    struct vcache *advc;           /* the containing dir */
-    register struct vrequest *areq;
+int EvalMountPoint(register struct vcache *avc, struct vcache *advc, 
+       struct volume **avolpp, register struct vrequest *areq)
 {
     afs_int32  code;
     struct volume *tvp = 0;
     struct VenusFid tfid;
     struct cell *tcell;
     char   *cpos, *volnamep;
-    char   type, buf[128];
+    char   type, *buf;
     afs_int32  prefetchRO;          /* 1=>No  2=>Yes */
     afs_int32  mtptCell, assocCell, hac=0;
     afs_int32  samecell, roname, len;
@@ -117,7 +114,7 @@ EvalMountPoint(avc, advc, avolpp, areq)
 #ifdef notdef
     if (avc->mvid && (avc->states & CMValid)) return 0;        /* done while racing */
 #endif
-    *avolpp = (struct volume *)0;
+    *avolpp = NULL;
     code = afs_HandleLink(avc, areq);
     if (code) return code;
 
@@ -133,12 +130,12 @@ EvalMountPoint(avc, advc, avolpp, areq)
        volnamep = &avc->linkData[1];
        tcell = afs_GetCell(avc->fid.Cell, READ_LOCK);
     }
-    if (!tcell) return ENOENT;
+    if (!tcell) return ENODEV;
 
-    mtptCell = tcell->cell;               /* The cell for the mountpoint */
+    mtptCell = tcell->cellNum;             /* The cell for the mountpoint */
     if (tcell->lcellp) {
-       hac = 1;                           /* has associated cell */
-       assocCell = tcell->lcellp->cell;   /* The associated cell */
+       hac = 1;                             /* has associated cell */
+       assocCell = tcell->lcellp->cellNum;  /* The associated cell */
     }
     afs_PutCell(tcell, READ_LOCK);         
 
@@ -177,15 +174,18 @@ EvalMountPoint(avc, advc, avolpp, areq)
      * Don't know why we do this. Would have still found it in above call - jpm.
      */
     if (!tvp && (prefetchRO == 2)) {
-       strcpy(buf, volnamep);
-       afs_strcat(buf, ".readonly");
+       buf = (char *)osi_AllocSmallSpace(strlen(volnamep)+10);
 
-       tvp = afs_GetVolumeByName(buf, mtptCell, 1, areq, WRITE_LOCK);
+       strcpy(buf, volnamep);
+       afs_strcat(buf, ".readonly");
 
-       /* Try the associated linked cell if failed */
-       if (!tvp && hac && areq->volumeError) {
-         tvp = afs_GetVolumeByName(buf, assocCell, 1, areq, WRITE_LOCK);
-       }
+       tvp = afs_GetVolumeByName(buf, mtptCell, 1, areq, WRITE_LOCK);
+       
+       /* Try the associated linked cell if failed */
+       if (!tvp && hac && areq->volumeError) {
+           tvp = afs_GetVolumeByName(buf, assocCell, 1, areq, WRITE_LOCK);
+       }
+       osi_FreeSmallSpace(buf);
     }
   
     if (!tvp) return ENODEV;       /* Couldn't find the volume */
@@ -193,7 +193,7 @@ EvalMountPoint(avc, advc, avolpp, areq)
     /* Don't cross mountpoint from a BK to a BK volume */
     if ((avc->states & CBackup) && (tvp->states & VBackup)) {
        afs_PutVolume(tvp, WRITE_LOCK);
-       return ELOOP;
+       return ENODEV;
     }
 
     /* If we want (prefetched) the RO and it exists, then drop the
@@ -231,14 +231,189 @@ EvalMountPoint(avc, advc, avolpp, areq)
      * to the new path.
      */
     tvp->mtpoint = avc->fid;   /* setup back pointer to mtpoint */
-    tvp->dotdot  = advc->fid;
+    if (advc) tvp->dotdot  = advc->fid;
 
     *avolpp = tvp;
     return 0;
 }
+
+/*
+ * afs_InitFakeStat
+ *
+ * Must be called on an afs_fakestat_state object before calling
+ * afs_EvalFakeStat or afs_PutFakeStat.  Calling afs_PutFakeStat
+ * without calling afs_EvalFakeStat is legal, as long as this
+ * function is called.
+ */
+void afs_InitFakeStat(struct afs_fakestat_state *state)
+{
+    if (!afs_fakestat_enable)
+       return;
+
+    state->valid = 1;
+    state->did_eval = 0;
+    state->need_release = 0;
+}
+
+/*
+ * afs_EvalFakeStat_int
+ *
+ * The actual implementation of afs_EvalFakeStat and afs_TryEvalFakeStat,
+ * which is called by those wrapper functions.
+ */
+static int afs_EvalFakeStat_int(struct vcache **avcp,
+       struct afs_fakestat_state *state, struct vrequest *areq, int canblock)
+{
+    struct vcache *tvc, *root_vp;
+    struct volume *tvolp = NULL;
+    int code = 0;
+
+    if (!afs_fakestat_enable)
+       return 0;
+
+    osi_Assert(state->valid == 1);
+    osi_Assert(state->did_eval == 0);
+    state->did_eval = 1;
+
+    tvc = *avcp;
+    if (tvc->mvstat != 1)
+       return 0;
+
+    code = afs_VerifyVCache(tvc, areq);
+    if (code)
+       goto done;
+
+    if (afs_fakestat_enable == 2 && !canblock) {
+       ObtainSharedLock(&tvc->lock, 680);
+       if (!tvc->linkData) {
+           UpgradeSToWLock(&tvc->lock, 681);
+           code = afs_HandleLink(tvc, areq);
+           if (code) {
+               ReleaseWriteLock(&tvc->lock);
+               goto done;
+           }
+           ConvertWToRLock(&tvc->lock);
+       } else {
+           ConvertSToRLock(&tvc->lock);
+       }
+
+       if (!afs_strchr(tvc->linkData, ':'))
+           canblock = 1;
+       ReleaseReadLock(&tvc->lock);
+    }
+
+    if (canblock) {
+       ObtainWriteLock(&tvc->lock, 599);
+       code = EvalMountPoint(tvc, NULL, &tvolp, areq);
+       ReleaseWriteLock(&tvc->lock);
+       if (code)
+           goto done;
+       if (tvolp) {
+           tvolp->dotdot = tvc->fid;
+           tvolp->dotdot.Fid.Vnode = tvc->parentVnode;
+           tvolp->dotdot.Fid.Unique = tvc->parentUnique;
+       }
+    }
+    if (tvc->mvid && (tvc->states & CMValid)) {
+       if (!canblock) {
+           afs_int32 retry;
+
+           do {
+               retry = 0;
+               ObtainWriteLock(&afs_xvcache, 597);
+               root_vp = afs_FindVCache(tvc->mvid, &retry, 0);
+               if (root_vp && retry) {
+                   ReleaseWriteLock(&afs_xvcache);
+                   afs_PutVCache(root_vp);
+               }
+           } while (root_vp && retry);
+           ReleaseWriteLock(&afs_xvcache);
+       } else {
+           root_vp = afs_GetVCache(tvc->mvid, areq, NULL, NULL);
+       }
+       if (!root_vp) {
+           code = canblock ? ENOENT : 0;
+           goto done;
+       }
+       if (tvolp) {
+           /* Is this always kosher?  Perhaps we should instead use
+            * NBObtainWriteLock to avoid potential deadlock.
+            */
+           ObtainWriteLock(&root_vp->lock, 598);
+           if (!root_vp->mvid)
+               root_vp->mvid = osi_AllocSmallSpace(sizeof(struct VenusFid));
+           *root_vp->mvid = tvolp->dotdot;
+           ReleaseWriteLock(&root_vp->lock);
+       }
+       state->need_release = 1;
+       state->root_vp = root_vp;
+       *avcp = root_vp;
+       code = 0;
+    } else {
+       code = canblock ? ENOENT : 0;
+    }
+
+done:
+    if (tvolp)
+       afs_PutVolume(tvolp, WRITE_LOCK);
+    return code;
+}
+
+/*
+ * afs_EvalFakeStat
+ *
+ * Automatically does the equivalent of EvalMountPoint for vcache entries
+ * which are mount points.  Remembers enough state to properly release
+ * the volume root vcache when afs_PutFakeStat() is called.
+ *
+ * State variable must be initialized by afs_InitFakeState() beforehand.
+ *
+ * Returns 0 when everything succeeds and *avcp points to the vcache entry
+ * that should be used for the real vnode operation.  Returns non-zero if
+ * something goes wrong and the error code should be returned to the user.
+ */
+int
+afs_EvalFakeStat(struct vcache **avcp, struct afs_fakestat_state *state,
+       struct vrequest *areq)
+{
+    return afs_EvalFakeStat_int(avcp, state, areq, 1);
+}
+
+/*
+ * afs_TryEvalFakeStat
+ *
+ * Same as afs_EvalFakeStat, but tries not to talk to remote servers
+ * and only evaluate the mount point if all the data is already in
+ * local caches.
+ *
+ * Returns 0 if everything succeeds and *avcp points to a valid
+ * vcache entry (possibly evaluated).
+ */
+int afs_TryEvalFakeStat(struct vcache **avcp, struct afs_fakestat_state *state, 
+       struct vrequest *areq)
+{
+    return afs_EvalFakeStat_int(avcp, state, areq, 0);
+}
+
+/*
+ * afs_PutFakeStat
+ *
+ * Perform any necessary cleanup at the end of a vnode op, given that
+ * afs_InitFakeStat was previously called with this state.
+ */
+void afs_PutFakeStat(struct afs_fakestat_state *state)
+{
+    if (!afs_fakestat_enable)
+       return;
+
+    osi_Assert(state->valid == 1);
+    if (state->need_release)
+       afs_PutVCache(state->root_vp);
+    state->valid = 0;
+}
     
-afs_ENameOK(aname)
-    register char *aname; {
+int afs_ENameOK(register char *aname)
+{
     register char tc;
     register int tlen;
 
@@ -248,10 +423,8 @@ afs_ENameOK(aname)
     return 1;
 }
 
-afs_getsysname(areq, adp, bufp)
-    register struct vrequest *areq;
-    register struct vcache *adp;
-    register char *bufp;
+int afs_getsysname(register struct vrequest *areq, register struct vcache *adp, 
+       register char *bufp)
 {
     static char sysname[MAXSYSNAME];
     register struct unixuser *au;
@@ -265,7 +438,7 @@ afs_getsysname(areq, adp, bufp)
     au = afs_GetUser(areq->uid, adp->fid.Cell, 0);
     afs_PutUser(au, 0);        
     if (au->exporter) {
-      error = EXP_SYSNAME(au->exporter, (char *)0, bufp);
+      error = EXP_SYSNAME(au->exporter, NULL, bufp);
       if (error) 
        strcpy(bufp, "@sys");
       return -1;
@@ -275,11 +448,8 @@ afs_getsysname(areq, adp, bufp)
     }
 }
 
-Check_AtSys(avc, aname, state, areq)
-    register struct vcache *avc;
-    char *aname;
-    struct sysname_info *state;
-    struct vrequest *areq;
+int Check_AtSys(register struct vcache *avc, const char *aname, 
+       struct sysname_info *state, struct vrequest *areq)
 {
     if (AFS_EQ_ATSYS(aname)) {
       state->offset = 0;
@@ -294,10 +464,8 @@ Check_AtSys(avc, aname, state, areq)
     }
 }
 
-Next_AtSys(avc, areq, state)
-     register struct vcache *avc;
-     struct vrequest *areq;
-     struct sysname_info *state;
+int Next_AtSys(register struct vcache *avc, struct vrequest *areq, 
+       struct sysname_info *state)
 {
   if (state->index == -1)
     return 0;  /* No list */
@@ -352,11 +520,9 @@ extern int BlobScan(afs_int32 *afile, afs_int32 ablob);
  * ensure that vcaches created for failed RPC's to older servers have the
  * CForeign bit set.
  */
-struct vcache * BStvc = (struct vcache *) 0;
-void afs_DoBulkStat(adp, dirCookie, areqp)
-  struct vcache *adp;
-  long dirCookie;
-  struct vrequest *areqp;
+static struct vcache *BStvc = NULL;
+
+int afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
 {
     int nentries;              /* # of entries to prefetch */
     int nskip;                 /* # of slots in the LRU queue to skip */
@@ -364,7 +530,7 @@ void afs_DoBulkStat(adp, dirCookie, areqp)
     struct dcache *dcp;                /* chunk containing the dir block */
     char *statMemp;            /* status memory block */
     char *cbfMemp;             /* callback and fid memory block */
-    long temp;                 /* temp for holding chunk length, &c. */
+    afs_size_t temp;           /* temp for holding chunk length, &c. */
     struct AFSFid *fidsp;      /* file IDs were collecting */
     struct AFSCallBack *cbsp;  /* call back pointers */
     struct AFSCallBack *tcbp;  /* temp callback ptr */
@@ -385,7 +551,7 @@ void afs_DoBulkStat(adp, dirCookie, areqp)
     long startTime;            /* time we started the call,
                                 * for callback expiration base
                                 */
-    int statSeqNo;             /* Valued of file size to detect races */
+    afs_size_t statSeqNo;      /* Valued of file size to detect races */
     int code;                  /* error code */
     long newIndex;             /* new index in the dir */
     struct DirEntry *dirEntryp;        /* dir entry we are examining */
@@ -397,6 +563,7 @@ void afs_DoBulkStat(adp, dirCookie, areqp)
     struct volume *volp=0;     /* volume ptr */
     struct VenusFid dotdot;
     int        flagIndex;              /* First file with bulk fetch flag set */
+    int inlinebulk=0;           /* Did we use InlineBulk RPC or not? */
     XSTATS_DECLS
 
     /* first compute some basic parameters.  We dont want to prefetch more
@@ -436,7 +603,7 @@ tagain:
     code = afs_VerifyVCache(adp, areqp);
     if (code) goto done;
 
-    dcp = afs_GetDCache(adp, 0, areqp, &temp, &temp, 1);
+    dcp = afs_GetDCache(adp, (afs_size_t) 0, areqp, &temp, &temp, 1);
     if (!dcp) {
        code = ENOENT;
        goto done;
@@ -444,6 +611,7 @@ tagain:
 
     /* lock the directory cache entry */
     ObtainReadLock(&adp->lock);
+    ObtainReadLock(&dcp->lock);
 
     /*
      * Make sure that the data in the cache is current. There are two
@@ -452,15 +620,22 @@ tagain:
      * 2. The cache data is no longer valid
      */
     while ((adp->states & CStatd)
-          && (dcp->flags & DFFetching)
+          && (dcp->dflags & DFFetching)
           && hsame(adp->m.DataVersion, dcp->f.versionNo)) {
-       dcp->flags |= DFWaiting;
+       afs_Trace4(afs_iclSetp, CM_TRACE_DCACHEWAIT,
+                       ICL_TYPE_STRING, __FILE__,
+                       ICL_TYPE_INT32, __LINE__,
+                       ICL_TYPE_POINTER, dcp,
+                       ICL_TYPE_INT32, dcp->dflags);
+       ReleaseReadLock(&dcp->lock);
        ReleaseReadLock(&adp->lock);
        afs_osi_Sleep(&dcp->validPos);
        ObtainReadLock(&adp->lock);
+       ObtainReadLock(&dcp->lock);
     }
     if (!(adp->states & CStatd)
        || !hsame(adp->m.DataVersion, dcp->f.versionNo)) {
+       ReleaseReadLock(&dcp->lock);
        ReleaseReadLock(&adp->lock);
        afs_PutDCache(dcp);
        goto tagain;
@@ -513,14 +688,14 @@ tagain:
            do {
              retry = 0;
              ObtainWriteLock(&afs_xvcache, 130);
-             tvcp = afs_FindVCache(&tfid, 0, 0, &retry, 0 /* no stats | LRU */);
+             tvcp = afs_FindVCache(&tfid, &retry, 0 /* no stats | LRU */);
              if (tvcp && retry) {
                ReleaseWriteLock(&afs_xvcache);
                afs_PutVCache(tvcp);
              }
            } while (tvcp && retry);
            if (!tvcp) {          /* otherwise, create manually */
-             tvcp = afs_NewVCache(&tfid, hostp, 0, 0);
+             tvcp = afs_NewVCache(&tfid, hostp);
              ObtainWriteLock(&tvcp->lock, 505);
              ReleaseWriteLock(&afs_xvcache);
              afs_RemoveVCB(&tfid);
@@ -562,8 +737,7 @@ tagain:
                 * preserve the value of the file size. We could
                 * flush the pages, but it wouldn't be worthwhile.
                 */
-               bcopy((char *) &tfid.Fid, (char *)(fidsp+fidIndex),
-                     sizeof(*fidsp));
+               memcpy((char *)(fidsp+fidIndex), (char *) &tfid.Fid, sizeof(*fidsp));
                tvcp->states |= CBulkFetching;
                tvcp->m.Length = statSeqNo;
                fidIndex++;
@@ -581,6 +755,7 @@ tagain:
     }  /* while loop over all dir entries */
 
     /* now release the dir lock and prepare to make the bulk RPC */
+    ReleaseReadLock(&dcp->lock);
     ReleaseReadLock(&adp->lock);
 
     /* release the chunk */
@@ -605,19 +780,29 @@ tagain:
        if (tcp) {
            hostp = tcp->srvr->server;
            XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_BULKSTATUS);
-#ifdef RX_ENABLE_LOCKS
-           AFS_GUNLOCK();
-#endif /* RX_ENABLE_LOCKS */
-           code = RXAFS_BulkStatus(tcp->id, &fidParm, &statParm, &cbParm,
-                                   &volSync);
-#ifdef RX_ENABLE_LOCKS
-           AFS_GLOCK();
-#endif /* RX_ENABLE_LOCKS */
+           RX_AFS_GUNLOCK();
+
+           if (!(tcp->srvr->server->flags & SNO_INLINEBULK)) {
+               code = RXAFS_InlineBulkStatus(tcp->id, &fidParm, &statParm,
+                                             &cbParm, &volSync);
+               if (code == RXGEN_OPCODE) {
+                   tcp->srvr->server->flags |= SNO_INLINEBULK;
+                   inlinebulk = 0;
+                   code = RXAFS_BulkStatus(tcp->id, &fidParm, &statParm, 
+                                           &cbParm, &volSync);
+               } else
+                   inlinebulk=1;
+           } else {
+               inlinebulk=0;
+               code = RXAFS_BulkStatus(tcp->id, &fidParm, &statParm, &cbParm,
+                                       &volSync);
+           }
+           RX_AFS_GLOCK();
            XSTATS_END_TIME;
        }
        else code = -1;
     } while (afs_Analyze(tcp, code, &adp->fid, areqp, 
-                        AFS_STATS_FS_RPCIDX_BULKSTATUS, SHARED_LOCK, (struct cell *)0));
+                        AFS_STATS_FS_RPCIDX_BULKSTATUS, SHARED_LOCK, NULL));
 
     /* now, if we didnt get the info, bail out. */
     if (code) goto done;
@@ -681,6 +866,8 @@ tagain:
      * We also have to take into account racing token revocations.
      */
     for(i=0; i<fidIndex; i++) {
+       if ((&statsp[i])->errorCode) 
+           continue;
        afid.Cell = adp->fid.Cell;
        afid.Fid.Volume = adp->fid.Fid.Volume;
        afid.Fid.Vnode = fidsp[i].Vnode;
@@ -688,7 +875,7 @@ tagain:
        do {
           retry = 0;
           ObtainReadLock(&afs_xvcache);
-          tvcp = afs_FindVCache(&afid, 1, 0, &retry, 0/* !stats&!lru*/);
+          tvcp = afs_FindVCache(&afid, &retry, 0/* !stats&!lru*/);
           ReleaseReadLock(&afs_xvcache);
        } while (tvcp && retry);
 
@@ -726,10 +913,10 @@ tagain:
        }
        if ((QNext(QPrev(&tvcp->vlruq)) != &tvcp->vlruq) 
            || (QPrev(QNext(&tvcp->vlruq)) != &tvcp->vlruq))
-          refpanic ("Bulkstat VLRU inconsistent4");
+       {   refpanic ("Bulkstat VLRU inconsistent4"); }
        if ((QNext(QPrev(&lruvcp->vlruq)) != &lruvcp->vlruq) 
            || (QPrev(QNext(&lruvcp->vlruq)) != &lruvcp->vlruq)) 
-          refpanic ("Bulkstat VLRU inconsistent5");
+       {   refpanic ("Bulkstat VLRU inconsistent5"); }
 
        if (tvcp != lruvcp) {  /* if they are == don't move it, don't corrupt vlru */
           QRemove(&tvcp->vlruq);
@@ -741,10 +928,10 @@ tagain:
        }
        if ((QNext(QPrev(&tvcp->vlruq)) != &tvcp->vlruq) 
            || (QPrev(QNext(&tvcp->vlruq)) != &tvcp->vlruq))
-          refpanic ("Bulkstat VLRU inconsistent5");
+       {   refpanic ("Bulkstat VLRU inconsistent5"); }
        if ((QNext(QPrev(&lruvcp->vlruq)) != &lruvcp->vlruq) 
            || (QPrev(QNext(&lruvcp->vlruq)) != &lruvcp->vlruq))
-          refpanic ("Bulkstat VLRU inconsistent6");
+       {   refpanic ("Bulkstat VLRU inconsistent6"); }
        ReleaseWriteLock(&afs_xvcache);
 
        ObtainWriteLock(&afs_xcbhash, 494);
@@ -832,7 +1019,7 @@ tagain:
        do {
           retry = 0;
           ObtainReadLock(&afs_xvcache);
-          tvcp = afs_FindVCache(&afid, 1, 0, &retry, 0/* !stats&!lru*/);
+          tvcp = afs_FindVCache(&afid, &retry, 0/* !stats&!lru*/);
           ReleaseReadLock(&afs_xvcache);
        } while (tvcp && retry);
        if (tvcp != NULL
@@ -847,12 +1034,24 @@ tagain:
     if ( volp )
        afs_PutVolume(volp, READ_LOCK);
     
+    /* If we did the InlineBulk RPC pull out the return code */
+    if (inlinebulk) {
+       if ((&statsp[0])->errorCode) {
+           afs_Analyze(tcp, (&statsp[0])->errorCode, &adp->fid, areqp, 
+                       AFS_STATS_FS_RPCIDX_BULKSTATUS, SHARED_LOCK, 
+                       NULL);
+           code = (&statsp[0])->errorCode;
+       }
+    } else {
+       code = 0;
+    }
     osi_FreeLargeSpace(statMemp);
     osi_FreeLargeSpace(cbfMemp);
+    return code;
 }
 
 /* was: (AFS_DEC_ENV) || defined(AFS_OSF30_ENV) || defined(AFS_NCR_ENV) */
-int AFSDOBULK = 1;
+static int AFSDOBULK = 1;
 
 #ifdef AFS_OSF_ENV
 afs_lookup(adp, ndp)
@@ -883,9 +1082,10 @@ afs_lookup(adp, aname, avcp, acred)
     struct AFS_UCRED *acred; {
 #endif
     struct vrequest treq;
-    char *tname = (char *)0;
+    char *tname = NULL;
     register struct vcache *tvc=0;
     register afs_int32 code;
+    register afs_int32 bulkcode = 0;
     int pass = 0, hit = 0;
     long dirCookie;
     extern afs_int32 afs_mariner;                      /*Writing activity to log?*/
@@ -893,29 +1093,56 @@ afs_lookup(adp, aname, avcp, acred)
     afs_hyper_t versionNo;
     int no_read_access = 0;
     struct sysname_info sysState;   /* used only for @sys checking */
+    int dynrootRetry = 1;
+    struct afs_fakestat_state fakestate;
+    int tryEvalOnly = 0;
 
     AFS_STATCNT(afs_lookup);
+    afs_InitFakeStat(&fakestate);
+
+    if ((code = afs_InitReq(&treq, acred)))
+       goto done;
+
 #ifdef AFS_OSF_ENV
-    ndp->ni_dvp = (struct vnode *)adp;
-    bcopy(ndp->ni_ptr, aname, ndp->ni_namelen);
+    ndp->ni_dvp = AFSTOV(adp);
+    memcpy(aname, ndp->ni_ptr, ndp->ni_namelen);
     aname[ndp->ni_namelen] = '\0';
 #endif /* AFS_OSF_ENV */
 
-    *avcp = (struct vcache *) 0;   /* Since some callers don't initialize it */
-
-    if (code = afs_InitReq(&treq, acred)) { 
-      goto done;
+#if defined(AFS_DARWIN_ENV)
+    /* Workaround for MacOSX Finder, which tries to look for
+     * .DS_Store and Contents under every directory.
+     */
+    if (afs_fakestat_enable && adp->mvstat == 1) {
+       if (strcmp(aname, ".DS_Store") == 0)
+           tryEvalOnly = 1;
+       if (strcmp(aname, "Contents") == 0)
+           tryEvalOnly = 1;
     }
+#endif
+
+    if (tryEvalOnly)
+       code = afs_TryEvalFakeStat(&adp, &fakestate, &treq);
+    else
+       code = afs_EvalFakeStat(&adp, &fakestate, &treq);
+    if (tryEvalOnly && adp->mvstat == 1)
+       code = ENOENT;
+    if (code)
+       goto done;
+
+    *avcp = NULL;   /* Since some callers don't initialize it */
 
     /* come back to here if we encounter a non-existent object in a read-only
        volume's directory */
 
   redo:
-    *avcp = (struct vcache *) 0;   /* Since some callers don't initialize it */
+    *avcp = NULL;   /* Since some callers don't initialize it */
+    bulkcode = 0;
 
     if (!(adp->states & CStatd)) {
-       if (code = afs_VerifyVCache2(adp, &treq))
-         goto done;
+       if ((code = afs_VerifyVCache2(adp, &treq))) {
+           goto done;
+       }
     }
     else code = 0;
 
@@ -926,7 +1153,7 @@ afs_lookup(adp, aname, avcp, acred)
 #ifdef AFS_OSF_ENV
            extern struct vcache *afs_globalVp;
            if (adp == afs_globalVp) {
-               struct vnode *rvp = (struct vnode *)adp;
+               struct vnode *rvp = AFSTOV(adp);
 /*
                ndp->ni_vp = rvp->v_vfsp->vfs_vnodecovered;
                ndp->ni_dvp = ndp->ni_vp;
@@ -940,15 +1167,14 @@ afs_lookup(adp, aname, avcp, acred)
            goto done;
        }
        /* otherwise we have the fid here, so we use it */
-       tvc = afs_GetVCache(adp->mvid, &treq, (afs_int32 *)0,
-                           (struct vcache*)0, 0);
+       tvc = afs_GetVCache(adp->mvid, &treq, NULL, NULL);
        afs_Trace3(afs_iclSetp, CM_TRACE_GETVCDOTDOT,
                   ICL_TYPE_FID, adp->mvid, ICL_TYPE_POINTER, tvc, 
                   ICL_TYPE_INT32,  code);
        *avcp = tvc;
        code = (tvc ? 0 : ENOENT);
        hit = 1;
-       if (tvc && !tvc->vrefCount) {
+       if (tvc && !VREFCOUNT(tvc)) {
            osi_Panic("TT1");
        }
        if (code) {
@@ -960,7 +1186,7 @@ afs_lookup(adp, aname, avcp, acred)
     /* now check the access */
     if (treq.uid != adp->last_looker) {  
        if (!afs_AccessOK(adp, PRSFS_LOOKUP, &treq, CHECK_MODE_BITS)) {
-        *avcp = (struct vcache *)0;
+        *avcp = NULL;
         code = EACCES;
         goto done;
        }
@@ -969,7 +1195,7 @@ afs_lookup(adp, aname, avcp, acred)
 
     /* Check for read access as well.  We need read access in order to
        stat files, but not to stat subdirectories. */
-    if (!afs_AccessOK(adp, PRSFS_READ, &treq, CHECK_MODE_BITS))
+    if (!afs_AccessOK(adp, PRSFS_LOOKUP, &treq, CHECK_MODE_BITS))
        no_read_access = 1;
 
     /* special case lookup of ".".  Can we check for it sooner in this code,
@@ -981,13 +1207,13 @@ afs_lookup(adp, aname, avcp, acred)
        ObtainReadLock(&afs_xvcache);   
        osi_vnhold(adp, 0);
        ReleaseReadLock(&afs_xvcache);  
-      code = 0;
-      *avcp = tvc = adp;
-      hit = 1;
-       if (adp && !adp->vrefCount) {
+       code = 0;
+       *avcp = tvc = adp;
+       hit = 1;
+       if (adp && !VREFCOUNT(adp)) {
            osi_Panic("TT2");
        }
-      goto done;
+       goto done;
     }
 
     Check_AtSys(adp, aname, &sysState, &treq);
@@ -1003,10 +1229,10 @@ afs_lookup(adp, aname, avcp, acred)
     tvc = osi_dnlc_lookup (adp, tname, WRITE_LOCK);
     *avcp = tvc;  /* maybe wasn't initialized, but it is now */
     if (tvc) {
-       if (no_read_access && vType(tvc) != VDIR) {
-           /* need read access on dir to stat non-directory */
-           afs_PutVCache(tvc, WRITE_LOCK);
-           *avcp = (struct vcache *)0;
+       if (no_read_access && vType(tvc) != VDIR && vType(tvc) != VLNK) {
+           /* need read access on dir to stat non-directory / non-link */
+           afs_PutVCache(tvc);
+           *avcp = NULL;
            code = EACCES;
            goto done;
        }
@@ -1029,14 +1255,14 @@ afs_lookup(adp, aname, avcp, acred)
 
     {
     register struct dcache *tdc;
-    afs_int32 dirOffset, dirLen;
+    afs_size_t dirOffset, dirLen;
     ino_t theDir;
     struct VenusFid tfid;
 
     /* now we have to lookup the next fid */
-    tdc = afs_GetDCache(adp, 0, &treq, &dirOffset, &dirLen, 1);
+    tdc = afs_GetDCache(adp, (afs_size_t) 0, &treq, &dirOffset, &dirLen, 1);
     if (!tdc) {
-      *avcp = (struct vcache *)0;  /* redundant, but harmless */
+      *avcp = NULL;  /* redundant, but harmless */
       code = EIO;
       goto done;
     }
@@ -1044,6 +1270,7 @@ afs_lookup(adp, aname, avcp, acred)
     /* now we will just call dir package with appropriate inode.
       Dirs are always fetched in their entirety for now */
     ObtainReadLock(&adp->lock);
+    ObtainReadLock(&tdc->lock);
 
     /*
      * Make sure that the data in the cache is current. There are two
@@ -1052,15 +1279,17 @@ afs_lookup(adp, aname, avcp, acred)
      * 2. The cache data is no longer valid
      */
     while ((adp->states & CStatd)
-          && (tdc->flags & DFFetching)
+          && (tdc->dflags & DFFetching)
           && hsame(adp->m.DataVersion, tdc->f.versionNo)) {
-       tdc->flags |= DFWaiting;
+       ReleaseReadLock(&tdc->lock);
        ReleaseReadLock(&adp->lock);
        afs_osi_Sleep(&tdc->validPos);
        ObtainReadLock(&adp->lock);
+       ObtainReadLock(&tdc->lock);
     }
     if (!(adp->states & CStatd)
        || !hsame(adp->m.DataVersion, tdc->f.versionNo)) {
+       ReleaseReadLock(&tdc->lock);
        ReleaseReadLock(&adp->lock);
        afs_PutDCache(tdc);
        goto redo;
@@ -1091,9 +1320,22 @@ afs_lookup(adp, aname, avcp, acred)
     }
     tname = sysState.name;
 
-    ReleaseReadLock(&adp->lock);
+    ReleaseReadLock(&tdc->lock);
     afs_PutDCache(tdc);
 
+    if (code == ENOENT && afs_IsDynroot(adp) && dynrootRetry) {
+       ReleaseReadLock(&adp->lock);
+       dynrootRetry = 0;
+       if (tname[0] == '.')
+           afs_LookupAFSDB(tname + 1);
+       else
+           afs_LookupAFSDB(tname);
+       if (tname && tname != aname) osi_FreeLargeSpace(tname);
+       goto redo;
+    } else {
+       ReleaseReadLock(&adp->lock);
+    }
+
     /* new fid has same cell and volume */
     tfid.Cell = adp->fid.Cell;
     tfid.Fid.Volume = adp->fid.Fid.Volume;
@@ -1111,7 +1353,7 @@ afs_lookup(adp, aname, avcp, acred)
     /* prefetch some entries, if the dir is currently open.  The variable
      * dirCookie tells us where to start prefetching from.
      */
-    if (AFSDOBULK && adp->opens > 0 && !(adp->states & CForeign)) {
+    if (AFSDOBULK && adp->opens > 0 && !(adp->states & CForeign) && !afs_IsDynroot(adp)) {
         afs_int32 retry;
        /* if the entry is not in the cache, or is in the cache,
         * but hasn't been statd, then do a bulk stat operation.
@@ -1119,39 +1361,40 @@ afs_lookup(adp, aname, avcp, acred)
         do {
           retry = 0;
           ObtainReadLock(&afs_xvcache);        
-          tvc = afs_FindVCache(&tfid, 1, 0, &retry, 0/* !stats,!lru */);
+          tvc = afs_FindVCache(&tfid, &retry, 0/* !stats,!lru */);
           ReleaseReadLock(&afs_xvcache);       
         } while (tvc && retry);
 
-       if (!tvc || !(tvc->states & CStatd)) {
-           afs_DoBulkStat(adp, dirCookie, &treq);
-       }
+       if (!tvc || !(tvc->states & CStatd)) 
+           bulkcode = afs_DoBulkStat(adp, dirCookie, &treq);
+       else 
+           bulkcode = 0;
 
        /* if the vcache isn't usable, release it */
        if (tvc && !(tvc->states & CStatd)) {
            afs_PutVCache(tvc);
-           tvc = (struct vcache *) 0;
+           tvc = NULL;
        }
+    } else {
+       tvc = NULL;
+       bulkcode = 0;
     }
-    else tvc = (struct vcache *) 0;
-    
+
     /* now get the status info, if we don't already have it */
     /* This is kind of weird, but we might wind up accidentally calling
      * RXAFS_Lookup because we happened upon a file which legitimately
      * has a 0 uniquifier. That is the result of allowing unique to wrap
-     * to 0. This was fixed in AFS 3.4. For CForeigh, Unique == 0 means that
+     * to 0. This was fixed in AFS 3.4. For CForeign, Unique == 0 means that
      * the file has not yet been looked up.
      */
     if (!tvc) {
        afs_int32 cached = 0;
        if (!tfid.Fid.Unique && (adp->states & CForeign)) {
-           tvc = afs_LookupVCache(&tfid, &treq, &cached, WRITE_LOCK, 
-                                  adp, tname);
+           tvc = afs_LookupVCache(&tfid, &treq, &cached, adp, tname);
+       } 
+       if (!tvc && !bulkcode) {  /* lookup failed or wasn't called */
+          tvc = afs_GetVCache(&tfid, &treq, &cached, NULL);
        } 
-       if (!tvc) {  /* lookup failed or wasn't called */
-           tvc = afs_GetVCache(&tfid, &treq, &cached, (struct vcache*)0,
-                               WRITE_LOCK);
-       }
     } /* if !tvc */
     } /* sub-block just to reduce stack usage */
 
@@ -1166,15 +1409,16 @@ afs_lookup(adp, aname, avcp, acred)
         if (!(flags & AFS_LOOKUP_NOEVAL))
           /* don't eval mount points */
 #endif /* UKERNEL && AFS_WEB_ENHANCEMENTS */
-       if (tvc->mvstat == 1) {
-         /* a mt point, possibly unevaluated */
-         struct volume *tvolp;
+       if (!afs_fakestat_enable && tvc->mvstat == 1) {
+           /* a mt point, possibly unevaluated */
+           struct volume *tvolp;
 
            ObtainWriteLock(&tvc->lock,133);
            code = EvalMountPoint(tvc, adp, &tvolp, &treq);
            ReleaseWriteLock(&tvc->lock);
 
            if (code) {
+               afs_PutVCache(tvc);
                if (tvolp) afs_PutVolume(tvolp, WRITE_LOCK);
                goto done;
            }
@@ -1189,12 +1433,11 @@ afs_lookup(adp, aname, avcp, acred)
 
                if (tvolp && (tvolp->states & VForeign)) {
                    /* XXXX tvolp has ref cnt on but not locked! XXX */
-                   tvc = afs_GetRootVCache(tvc->mvid, &treq, (afs_int32 *)0, tvolp, WRITE_LOCK);
+                   tvc = afs_GetRootVCache(tvc->mvid, &treq, NULL, tvolp);
                } else {
-                   tvc = afs_GetVCache(tvc->mvid, &treq, (afs_int32 *)0,
-                                       (struct vcache*)0, WRITE_LOCK);
+                   tvc = afs_GetVCache(tvc->mvid, &treq, NULL, NULL);
                }
-               afs_PutVCache(uvc, WRITE_LOCK); /* we're done with it */
+               afs_PutVCache(uvc); /* we're done with it */
 
                if (!tvc) {
                    code = ENOENT;
@@ -1209,7 +1452,7 @@ afs_lookup(adp, aname, avcp, acred)
                 * ptr to point back to the appropriate place */
                if (tvolp) {
                    ObtainWriteLock(&tvc->lock,134);
-                   if (tvc->mvid == (struct VenusFid *) 0) {
+                   if (tvc->mvid == NULL) {
                        tvc->mvid = (struct VenusFid *) osi_AllocSmallSpace(sizeof(struct VenusFid));
                    }
                    /* setup backpointer */
@@ -1219,14 +1462,14 @@ afs_lookup(adp, aname, avcp, acred)
                }
            }
            else {
-               afs_PutVCache(tvc, WRITE_LOCK);
+               afs_PutVCache(tvc);
                code = ENOENT;
                if (tvolp) afs_PutVolume(tvolp, WRITE_LOCK);
                goto done;
            }
        }
        *avcp = tvc;
-       if (tvc && !tvc->vrefCount) {
+       if (tvc && !VREFCOUNT(tvc)) {
            osi_Panic("TT3");
        }
        code = 0;
@@ -1265,8 +1508,9 @@ done:
        /* Handle RENAME; only need to check rename "."  */
        if (opflag == RENAME && wantparent && *ndp->ni_next == 0) {
            if (!FidCmp(&(tvc->fid), &(adp->fid))) { 
-               afs_PutVCache(*avcp, WRITE_LOCK);
+               afs_PutVCache(*avcp);
                *avcp = NULL;
+               afs_PutFakeStat(&fakestate);
                return afs_CheckCode(EISDIR, &treq, 18);
            }
        }
@@ -1290,17 +1534,20 @@ done:
            /* So Linux inode cache is up to date. */
            code = afs_VerifyVCache(tvc, &treq);
 #else
+           afs_PutFakeStat(&fakestate);
            return 0;  /* can't have been any errors if hit and !code */
 #endif
        }
     }
+    if (bulkcode) code = bulkcode; else 
     code = afs_CheckCode(code, &treq, 19);
     if (code) {
        /* If there is an error, make sure *avcp is null.
        * Alphas panic otherwise - defect 10719.
        */
-       *avcp = (struct vcache *)0;
+       *avcp = NULL;
     }
 
+    afs_PutFakeStat(&fakestate);
     return code;
 }