macos: bulkstat sysctl
[openafs.git] / src / afs / VNOPS / afs_vnop_lookup.c
index e0db9ae..103a586 100644 (file)
@@ -50,14 +50,14 @@ int afs_fakestat_enable = 0;        /* 1: fakestat-all, 2: fakestat-crosscell */
  */
 static int
 EvalMountData(char type, char *data, afs_uint32 states, afs_uint32 cellnum,
-              struct volume **avolpp, register struct vrequest *areq,
+              struct volume **avolpp, struct vrequest *areq,
              afs_uint32 *acellidxp, afs_uint32 *avolnump,
              afs_uint32 *avnoidp, afs_uint32 *auniqp)
 {
     struct volume *tvp = 0;
     struct VenusFid tfid;
     struct cell *tcell;
-    char *cpos, *volnamep;
+    char *cpos, *volnamep = NULL;
     char *buf, *endptr;
     afs_int32 prefetch;                /* 1=>None  2=>RO  3=>BK */
     afs_int32 mtptCell, assocCell = 0, hac = 0;
@@ -137,7 +137,7 @@ EvalMountData(char type, char *data, afs_uint32 states, afs_uint32 cellnum,
      * in the dynamic mount directory.
      */
     if (volid && !avolpp) {
-       if (*cpos)
+       if (cpos)
            *cpos = ':';
        goto done;
     }
@@ -271,8 +271,8 @@ done:
 }
 
 int
-EvalMountPoint(register struct vcache *avc, struct vcache *advc,
-              struct volume **avolpp, register struct vrequest *areq)
+EvalMountPoint(struct vcache *avc, struct vcache *advc,
+              struct volume **avolpp, struct vrequest *areq)
 {
     afs_int32 code;
     afs_uint32 avnoid, auniq;
@@ -503,9 +503,9 @@ afs_PutFakeStat(struct afs_fakestat_state *state)
 }
 
 int
-afs_ENameOK(register char *aname)
+afs_ENameOK(char *aname)
 {
-    register int tlen;
+    int tlen;
 
     AFS_STATCNT(ENameOK);
     tlen = strlen(aname);
@@ -515,11 +515,11 @@ afs_ENameOK(register char *aname)
 }
 
 static int
-afs_getsysname(register struct vrequest *areq, register struct vcache *adp,
-              register char *bufp, int *num, char **sysnamelist[])
+afs_getsysname(struct vrequest *areq, struct vcache *adp,
+              char *bufp, int *num, char **sysnamelist[])
 {
-    register struct unixuser *au;
-    register afs_int32 error;
+    struct unixuser *au;
+    afs_int32 error;
 
     AFS_STATCNT(getsysname);
 
@@ -528,25 +528,25 @@ afs_getsysname(register struct vrequest *areq, register struct vcache *adp,
     if (!afs_nfsexporter)
        strcpy(bufp, (*sysnamelist)[0]);
     else {
-       au = afs_GetUser(areq->uid, adp->f.fid.Cell, 0);
+       au = afs_GetUser(areq->uid, adp->f.fid.Cell, READ_LOCK);
        if (au->exporter) {
            error = EXP_SYSNAME(au->exporter, (char *)0, sysnamelist, num, 0);
            if (error) {
                strcpy(bufp, "@sys");
-               afs_PutUser(au, 0);
+               afs_PutUser(au, READ_LOCK);
                return -1;
            } else {
                strcpy(bufp, (*sysnamelist)[0]);
            }
        } else
            strcpy(bufp, afs_sysname);
-       afs_PutUser(au, 0);
+       afs_PutUser(au, READ_LOCK);
     }
     return 0;
 }
 
 void
-Check_AtSys(register struct vcache *avc, const char *aname,
+Check_AtSys(struct vcache *avc, const char *aname,
            struct sysname_info *state, struct vrequest *areq)
 {
     int num = 0;
@@ -567,7 +567,7 @@ Check_AtSys(register struct vcache *avc, const char *aname,
 }
 
 int
-Next_AtSys(register struct vcache *avc, struct vrequest *areq,
+Next_AtSys(struct vcache *avc, struct vrequest *areq,
           struct sysname_info *state)
 {
     int num = afs_sysnamecount;
@@ -578,7 +578,7 @@ Next_AtSys(register struct vcache *avc, struct vrequest *areq,
 
     /* Check for the initial state of aname != "@sys" in Check_AtSys */
     if (state->offset == -1 && state->allocked == 0) {
-       register char *tname;
+       char *tname;
 
        /* Check for .*@sys */
        for (tname = state->name; *tname; tname++)
@@ -598,22 +598,22 @@ Next_AtSys(register struct vcache *avc, struct vrequest *areq,
        } else
            return 0;           /* .*@sys doesn't match either */
     } else {
-       register struct unixuser *au;
-       register afs_int32 error;
+       struct unixuser *au;
+       afs_int32 error;
 
        *sysnamelist = afs_sysnamelist;
 
        if (afs_nfsexporter) {
-           au = afs_GetUser(areq->uid, avc->f.fid.Cell, 0);
+           au = afs_GetUser(areq->uid, avc->f.fid.Cell, READ_LOCK);
            if (au->exporter) {
                error =
                    EXP_SYSNAME(au->exporter, (char *)0, sysnamelist, &num, 0);
                if (error) {
-                   afs_PutUser(au, 0);
+                   afs_PutUser(au, READ_LOCK);
                    return 0;
                }
            }
-           afs_PutUser(au, 0);
+           afs_PutUser(au, READ_LOCK);
        }
        if (++(state->index) >= num || !(*sysnamelist)[(unsigned int)state->index])
            return 0;           /* end of list */
@@ -670,6 +670,7 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
     long startTime;            /* time we started the call,
                                 * for callback expiration base
                                 */
+    int ftype[4] = {VNON, VREG, VDIR, VLNK}; /* verify type is as expected */
     afs_size_t statSeqNo = 0;  /* Valued of file size to detect races */
     int code;                  /* error code */
     long newIndex;             /* new index in the dir */
@@ -683,6 +684,7 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
     struct VenusFid dotdot = {0, {0, 0, 0}};
     int flagIndex = 0;         /* First file with bulk fetch flag set */
     int inlinebulk = 0;                /* Did we use InlineBulk RPC or not? */
+    struct rx_connection *rxconn;
     XSTATS_DECLS;
     dotdot.Cell = 0;
     dotdot.Fid.Unique = 0;
@@ -826,12 +828,24 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
                tvcp = afs_NewBulkVCache(&tfid, hostp, statSeqNo);
                if (tvcp)
                {
-                       ObtainWriteLock(&tvcp->lock, 505);
-                       ReleaseWriteLock(&afs_xvcache);
-                       afs_RemoveVCB(&tfid);
-                       ReleaseWriteLock(&tvcp->lock);
+                   ObtainWriteLock(&tvcp->lock, 505);
+#ifdef AFS_DARWIN80_ENV
+                   /* use even/odd hack to guess file versus dir.
+                      let links be reaped. oh well. */
+                   if (dirEntryp->fid.vnode & 1)
+                       tvcp->f.m.Type = VDIR;
+                   else
+                       tvcp->f.m.Type = VREG;
+                   /* finalize to a best guess */
+                   afs_darwin_finalizevnode(tvcp, VTOAFS(adp), NULL, 0, 1);
+                   /* re-acquire usecount that finalizevnode disposed of */
+                   vnode_ref(AFSTOV(tvcp));
+#endif
+                   ReleaseWriteLock(&afs_xvcache);
+                   afs_RemoveVCB(&tfid);
+                   ReleaseWriteLock(&tvcp->lock);
                } else {
-                       ReleaseWriteLock(&afs_xvcache);
+                   ReleaseWriteLock(&afs_xvcache);
                }
            } else {
                ReleaseWriteLock(&afs_xvcache);
@@ -874,12 +888,17 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
                 * CBulkFetching state bit and the value in the file size.
                 * It is safe to set the status only if the CBulkFetching
                 * flag is still set and the value in the file size does
-                * not change. NewBulkVCache sets us up.
+                * not change. NewBulkVCache sets us up for the new ones.
+                * Set up the rest here.
                 *
                 * Don't fetch status for dirty files. We need to
                 * preserve the value of the file size. We could
                 * flush the pages, but it wouldn't be worthwhile.
                 */
+               if (!(tvcp->f.states & CBulkFetching)) {
+                   tvcp->f.states |= CBulkFetching;
+                   tvcp->f.m.Length = statSeqNo;
+               }
                memcpy((char *)(fidsp + fidIndex), (char *)&tfid.Fid,
                       sizeof(*fidsp));
                fidIndex++;
@@ -921,36 +940,84 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
        /* start the timer; callback expirations are relative to this */
        startTime = osi_Time();
 
-       tcp = afs_Conn(&adp->f.fid, areqp, SHARED_LOCK);
+       tcp = afs_Conn(&adp->f.fid, areqp, SHARED_LOCK, &rxconn);
        if (tcp) {
-           hostp = tcp->srvr->server;
+           hostp = tcp->parent->srvr->server;
+
+           for (i = 0; i < fidIndex; i++) {
+               /* we must set tvcp->callback before the BulkStatus call, so
+                * we can detect concurrent InitCallBackState's */
+
+               afid.Cell = adp->f.fid.Cell;
+               afid.Fid.Volume = adp->f.fid.Fid.Volume;
+               afid.Fid.Vnode = fidsp[i].Vnode;
+               afid.Fid.Unique = fidsp[i].Unique;
+
+               do {
+                   retry = 0;
+                   ObtainReadLock(&afs_xvcache);
+                   tvcp = afs_FindVCache(&afid, &retry, 0 /* !stats&!lru */);
+                   ReleaseReadLock(&afs_xvcache);
+               } while (tvcp && retry);
+
+               if (!tvcp) {
+                   continue;
+               }
+
+               if ((tvcp->f.states & CBulkFetching) &&
+                    (tvcp->f.m.Length == statSeqNo)) {
+                   tvcp->callback = hostp;
+               }
+
+               afs_PutVCache(tvcp);
+               tvcp = NULL;
+           }
+
            XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_BULKSTATUS);
-           RX_AFS_GUNLOCK();
 
-           if (!(tcp->srvr->server->flags & SNO_INLINEBULK)) {
+           if (!(tcp->parent->srvr->server->flags & SNO_INLINEBULK)) {
+           retryonce:
+               RX_AFS_GUNLOCK();
                code =
-                   RXAFS_InlineBulkStatus(tcp->id, &fidParm, &statParm,
+                   RXAFS_InlineBulkStatus(rxconn, &fidParm, &statParm,
                                           &cbParm, &volSync);
+               RX_AFS_GLOCK();
                if (code == RXGEN_OPCODE) {
-                   tcp->srvr->server->flags |= SNO_INLINEBULK;
+                   tcp->parent->srvr->server->flags |= SNO_INLINEBULK;
                    inlinebulk = 0;
+                   RX_AFS_GUNLOCK();
                    code =
-                       RXAFS_BulkStatus(tcp->id, &fidParm, &statParm,
+                       RXAFS_BulkStatus(rxconn, &fidParm, &statParm,
                                         &cbParm, &volSync);
-               } else
+                   RX_AFS_GLOCK();
+               } else {
                    inlinebulk = 1;
+                   if (!code && ((&statsp[0])->errorCode)) {
+                       /*
+                        * If this is an error needing retry, do so.
+                        * Retryable errors are all whole-volume or
+                        * whole-server.
+                        */
+                       if (afs_Analyze(tcp, rxconn, (&statsp[0])->errorCode,
+                                       &adp->f.fid, areqp,
+                                       AFS_STATS_FS_RPCIDX_BULKSTATUS,
+                                       SHARED_LOCK, NULL) != 0)
+                           goto retryonce;
+                   }
+               }
            } else {
                inlinebulk = 0;
+               RX_AFS_GUNLOCK();
                code =
-                   RXAFS_BulkStatus(tcp->id, &fidParm, &statParm, &cbParm,
+                   RXAFS_BulkStatus(rxconn, &fidParm, &statParm, &cbParm,
                                     &volSync);
+               RX_AFS_GLOCK();
            }
-           RX_AFS_GLOCK();
            XSTATS_END_TIME;
        } else
            code = -1;
     } while (afs_Analyze
-            (tcp, code, &adp->f.fid, areqp, AFS_STATS_FS_RPCIDX_BULKSTATUS,
+            (tcp, rxconn, code, &adp->f.fid, areqp, AFS_STATS_FS_RPCIDX_BULKSTATUS,
              SHARED_LOCK, NULL));
 
     /* now, if we didnt get the info, bail out. */
@@ -1056,7 +1123,7 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
        do {
            retry = 0;
            ObtainReadLock(&afs_xvcache);
-           tvcp = afs_FindVCache(&afid, &retry, 0 /* !stats&!lru */ );
+           tvcp = afs_FindVCache(&afid, &retry, 0/* !stats&!lru */);
            ReleaseReadLock(&afs_xvcache);
        } while (tvcp && retry);
 
@@ -1072,20 +1139,14 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
         * matches the value we placed there when we set the CBulkFetching
         * flag, then someone else has done something with this node,
         * and we may not have the latest status information for this
-        * file.  Leave the entry alone.
+        * file.  Leave the entry alone. There's also a file type
+        * change here, for OSX bulkstat support.
         */
-       if (!(tvcp->f.states & CBulkFetching) || (tvcp->f.m.Length != statSeqNo)) {
-#ifdef AFS_DARWIN80_ENV            
-           int isdead = ((tvcp->f.states & CDeadVnode) ||
-                         (tvcp->f.states & CVInit));
-#endif
+       if (!(tvcp->f.states & CBulkFetching)
+           || (tvcp->f.m.Length != statSeqNo)
+           || (ftype[(&statsp[i])->FileType] != vType(tvcp))) {
            flagIndex++;
            ReleaseWriteLock(&tvcp->lock);
-#ifdef AFS_DARWIN80_ENV            
-           if (!isdead)
-               /* re-acquire the usecount that the other finalizevnode disposed of */
-               vnode_ref(AFSTOV(tvcp));
-#endif
            afs_PutVCache(tvcp);
            continue;
        }
@@ -1141,11 +1202,6 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
         */
        if (!(tvcp->f.states & CBulkFetching) || (tvcp->f.m.Length != statSeqNo)) {
            flagIndex++;
-#ifdef AFS_DARWIN80_ENV            
-           if ((!(tvcp->f.states & CDeadVnode)&&!(tvcp->f.states & CVInit)))
-               /* re-acquire the usecount that the other finalizevnode disposed of */
-               vnode_ref(AFSTOV(tvcp));
-#endif
            ReleaseWriteLock(&tvcp->lock);
            ReleaseWriteLock(&afs_xcbhash);
            afs_PutVCache(tvcp);
@@ -1201,10 +1257,10 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
            if ((tvcp->f.states & CForeign) || (vType(tvcp) == VDIR))
                osi_dnlc_purgedp(tvcp); /* if it (could be) a directory */
        }
-       ReleaseWriteLock(&afs_xcbhash);
 #ifdef AFS_DARWIN80_ENV
        /* reclaim->FlushVCache will need xcbhash */
        if (((tvcp->f.states & CDeadVnode)||(tvcp->f.states & CVInit))) {
+           ReleaseWriteLock(&afs_xcbhash);
            /* passing in a parent hangs getting the vnode lock */
            code = afs_darwin_finalizevnode(tvcp, NULL, NULL, 0, 1);
            if (code) {
@@ -1217,8 +1273,9 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
            } else
                /* re-acquire the usecount that finalizevnode disposed of */
                vnode_ref(AFSTOV(tvcp));
-       }
+       } else
 #endif
+       ReleaseWriteLock(&afs_xcbhash);
 
        ReleaseWriteLock(&tvcp->lock);
        /* finally, we're done with the entry */
@@ -1247,19 +1304,14 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
        do {
            retry = 0;
            ObtainReadLock(&afs_xvcache);
-           tvcp = afs_FindVCache(&afid, &retry, 0 /* !stats&!lru */ );
+           tvcp = afs_FindVCache(&afid, &retry, 0 /* !stats&!lru */);
            ReleaseReadLock(&afs_xvcache);
        } while (tvcp && retry);
-       if (tvcp != NULL && (tvcp->f.states & CBulkFetching)
-           && (tvcp->f.m.Length == statSeqNo)) {
-           tvcp->f.states &= ~CBulkFetching;
-       }
        if (tvcp != NULL) {
-#ifdef AFS_DARWIN80_ENV            
-           if ((!(tvcp->f.states & CDeadVnode)&&!(tvcp->f.states & CVInit)))
-               /* re-acquire the usecount that the other finalizevnode disposed of */
-               vnode_ref(AFSTOV(tvcp));
-#endif
+           if ((tvcp->f.states & CBulkFetching)
+               && (tvcp->f.m.Length == statSeqNo)) {
+               tvcp->f.states &= ~CBulkFetching;
+           }
            afs_PutVCache(tvcp);
        }
     }
@@ -1269,7 +1321,7 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
     /* If we did the InlineBulk RPC pull out the return code */
     if (inlinebulk && code == 0) {
        if ((&statsp[0])->errorCode) {
-           afs_Analyze(tcp, (&statsp[0])->errorCode, &adp->f.fid, areqp,
+           afs_Analyze(tcp, rxconn, (&statsp[0])->errorCode, &adp->f.fid, areqp,
                        AFS_STATS_FS_RPCIDX_BULKSTATUS, SHARED_LOCK, NULL);
            code = (&statsp[0])->errorCode;
        }
@@ -1284,7 +1336,28 @@ afs_DoBulkStat(struct vcache *adp, long dirCookie, struct vrequest *areqp)
 }
 
 /* was: (AFS_DEC_ENV) || defined(AFS_OSF30_ENV) || defined(AFS_NCR_ENV) */
+#ifdef AFS_DARWIN80_ENV
+int AFSDOBULK = 1;
+#else
 static int AFSDOBULK = 1;
+#endif
+
+static_inline int
+osi_lookup_isdot(const char *aname)
+{
+#ifdef AFS_SUN5_ENV
+    if (!aname[0]) {
+       /* in Solaris, we can get passed "" as a path component if we are the
+        * root directory, e.g. after a call to chroot. It is equivalent to
+        * looking up "." */
+       return 1;
+    }
+#endif /* AFS_SUN5_ENV */
+    if (aname[0] == '.' && !aname[1]) {
+       return 1;
+    }
+    return 0;
+}
 
 int
 #if defined(AFS_SUN5_ENV) || defined(AFS_SGI_ENV)
@@ -1297,9 +1370,9 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
 {
     struct vrequest treq;
     char *tname = NULL;
-    register struct vcache *tvc = 0;
-    register afs_int32 code;
-    register afs_int32 bulkcode = 0;
+    struct vcache *tvc = 0;
+    afs_int32 code;
+    afs_int32 bulkcode = 0;
     int pass = 0, hit = 0;
     int force_eval = afs_fakestat_enable ? 0 : 1;
     long dirCookie;
@@ -1413,7 +1486,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
      * I'm not fiddling with the LRUQ here, either, perhaps I should, or else 
      * invent a lightweight version of GetVCache.
      */
-    if (aname[0] == '.' && !aname[1]) {        /* special case */
+    if (osi_lookup_isdot(aname)) {     /* special case */
        ObtainReadLock(&afs_xvcache);
        osi_vnhold(adp, 0);
        ReleaseReadLock(&afs_xvcache);
@@ -1512,9 +1585,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
     if (tvc) {
        if (no_read_access && vType(tvc) != VDIR && vType(tvc) != VLNK) {
            /* need read access on dir to stat non-directory / non-link */
-#ifndef AFS_FBSD80_ENV
            afs_PutVCache(tvc);
-#endif
            *avcp = NULL;
            code = EACCES;
            goto done;
@@ -1536,7 +1607,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
     }
 
     {                          /* sub-block just to reduce stack usage */
-       register struct dcache *tdc;
+       struct dcache *tdc;
        afs_size_t dirOffset, dirLen;
        struct VenusFid tfid;
 
@@ -1619,7 +1690,21 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
        if (!afs_InReadDir(adp))
            afs_PutDCache(tdc);
        if (code == ENOENT && afs_IsDynroot(adp) && dynrootRetry && !tryEvalOnly) {
+           struct cell *tc;
+           char *cn = (tname[0] == '.') ? tname + 1 : tname;
            ReleaseReadLock(&adp->lock);
+           /* confirm it's not just hushed */
+           tc = afs_GetCellByName(cn, WRITE_LOCK);
+           if (tc) {
+               if (tc->states & CHush) {
+                   tc->states &= ~CHush;
+                   ReleaseWriteLock(&tc->lock);
+                   afs_DynrootInvalidate();
+                   goto redo;
+               }
+               ReleaseWriteLock(&tc->lock);
+           }
+           /* Allow a second dynroot retry if the cell was hushed before */
            dynrootRetry = 0;
            if (tname[0] == '.')
                afs_LookupAFSDB(tname + 1);
@@ -1670,9 +1755,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
 
            /* if the vcache isn't usable, release it */
            if (tvc && !(tvc->f.states & CStatd)) {
-#ifndef  AFS_FBSD80_ENV
                afs_PutVCache(tvc);
-#endif
                tvc = NULL;
            }
        } else {
@@ -1735,9 +1818,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
                ReleaseWriteLock(&tvc->lock);
 
                if (code) {
-#ifndef AFS_FBSD80_ENV
                    afs_PutVCache(tvc);
-#endif
                    if (tvolp)
                        afs_PutVolume(tvolp, WRITE_LOCK);
                    goto done;
@@ -1759,9 +1840,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
                    } else {
                        tvc = afs_GetVCache(tvc->mvid, &treq, NULL, NULL);
                    }
-#ifndef AFS_FBSD80_ENV
                    afs_PutVCache(uvc); /* we're done with it */
-#endif
 
                    if (!tvc) {
                        code = ENOENT;
@@ -1786,9 +1865,7 @@ afs_lookup(OSI_VC_DECL(adp), char *aname, struct vcache **avcp, afs_ucred_t *acr
                        afs_PutVolume(tvolp, WRITE_LOCK);
                    }
                } else {
-#ifndef AFS_FBSD80_ENV
                    afs_PutVCache(tvc);
-#endif
                    code = ENOENT;
                    if (tvolp)
                        afs_PutVolume(tvolp, WRITE_LOCK);