freebsd60-20050422
[openafs.git] / src / afs / afs_vcache.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * Implements:
12  * afs_FlushVCache
13  * afs_AllocCBR
14  * afs_FreeCBR
15  * afs_FlushVCBs
16  * afs_QueueVCB
17  * afs_RemoveVCB
18  * afs_NewVCache
19  * afs_FlushActiveVcaches
20  * afs_VerifyVCache2
21  * afs_WriteVCache
22  * afs_SimpleVStat
23  * afs_ProcessFS
24  * TellALittleWhiteLie
25  * afs_RemoteLookup
26  * afs_GetVCache
27  * afs_LookupVCache
28  * afs_GetRootVCache
29  * afs_FetchStatus
30  * afs_StuffVcache
31  * afs_PutVCache
32  * afs_FindVCache
33  * afs_NFSFindVCache
34  * afs_vcacheInit
35  * shutdown_vcache
36  *
37  */
38 #include <afsconfig.h>
39 #include "afs/param.h"
40
41 RCSID
42     ("$Header$");
43
44 #include "afs/sysincludes.h"    /*Standard vendor system headers */
45 #include "afsincludes.h"        /*AFS-based standard headers */
46 #include "afs/afs_stats.h"
47 #include "afs/afs_cbqueue.h"
48 #include "afs/afs_osidnlc.h"
49
50 #ifdef AFS_OSF_ENV
51 afs_int32 afs_maxvcount = 0;    /* max number of vcache entries */
52 afs_int32 afs_vcount = 0;       /* number of vcache in use now */
53 #endif /* AFS_OSF_ENV */
54
55 #ifdef AFS_SGI_ENV
56 int afsvnumbers = 0;
57 #endif
58
59 #ifdef AFS_SGI64_ENV
60 char *makesname();
61 #endif /* AFS_SGI64_ENV */
62
63 /* Exported variables */
64 afs_rwlock_t afs_xvcache;       /*Lock: alloc new stat cache entries */
65 afs_lock_t afs_xvcb;            /*Lock: fids on which there are callbacks */
66 struct vcache *freeVCList;      /*Free list for stat cache entries */
67 struct vcache *Initial_freeVCList;      /*Initial list for above */
68 struct afs_q VLRU;              /*vcache LRU */
69 afs_int32 vcachegen = 0;
70 unsigned int afs_paniconwarn = 0;
71 struct vcache *afs_vhashT[VCSIZE];
72 static struct afs_cbr *afs_cbrHashT[CBRSIZE];
73 afs_int32 afs_bulkStatsLost;
74 int afs_norefpanic = 0;
75
76 /* Forward declarations */
77 static afs_int32 afs_QueueVCB(struct vcache *avc);
78
79 /*
80  * afs_HashCBRFid
81  *
82  * Generate an index into the hash table for a given Fid.
83  */
84 static int
85 afs_HashCBRFid(struct AFSFid *fid)
86 {
87     return (fid->Volume + fid->Vnode + fid->Unique) % CBRSIZE;
88 }
89
90 /*
91  * afs_InsertHashCBR
92  *
93  * Insert a CBR entry into the hash table.
94  * Must be called with afs_xvcb held.
95  */
96 static void
97 afs_InsertHashCBR(struct afs_cbr *cbr)
98 {
99     int slot = afs_HashCBRFid(&cbr->fid);
100
101     cbr->hash_next = afs_cbrHashT[slot];
102     if (afs_cbrHashT[slot])
103         afs_cbrHashT[slot]->hash_pprev = &cbr->hash_next;
104
105     cbr->hash_pprev = &afs_cbrHashT[slot];
106     afs_cbrHashT[slot] = cbr;
107 }
108
109 /*
110  * afs_FlushVCache
111  *
112  * Description:
113  *      Flush the given vcache entry.
114  *
115  * Parameters:
116  *      avc : Pointer to vcache entry to flush.
117  *      slept : Pointer to int to set 1 if we sleep/drop locks, 0 if we don't.
118  *
119  * Environment:
120  *      afs_xvcache lock must be held for writing upon entry to
121  *      prevent people from changing the vrefCount field, and to
122  *      protect the lruq and hnext fields.
123  * LOCK: afs_FlushVCache afs_xvcache W
124  * REFCNT: vcache ref count must be zero on entry except for osf1
125  * RACE: lock is dropped and reobtained, permitting race in caller
126  */
127
128 int
129 afs_FlushVCache(struct vcache *avc, int *slept)
130 {                               /*afs_FlushVCache */
131
132     register afs_int32 i, code;
133     register struct vcache **uvc, *wvc;
134
135     *slept = 0;
136     AFS_STATCNT(afs_FlushVCache);
137     afs_Trace2(afs_iclSetp, CM_TRACE_FLUSHV, ICL_TYPE_POINTER, avc,
138                ICL_TYPE_INT32, avc->states);
139 #ifdef  AFS_OSF_ENV
140     AFS_GUNLOCK();
141     VN_LOCK(AFSTOV(avc));
142     AFS_GLOCK();
143 #endif
144
145     code = osi_VM_FlushVCache(avc, slept);
146     if (code)
147         goto bad;
148
149     if (avc->states & CVFlushed) {
150         code = EBUSY;
151         goto bad;
152     }
153     if (avc->nextfree || !avc->vlruq.prev || !avc->vlruq.next) {        /* qv afs.h */
154         refpanic("LRU vs. Free inconsistency");
155     }
156     avc->states |= CVFlushed;
157     /* pull the entry out of the lruq and put it on the free list */
158     QRemove(&avc->vlruq);
159     avc->vlruq.prev = avc->vlruq.next = (struct afs_q *)0;
160
161     /* keep track of # of files that we bulk stat'd, but never used
162      * before they got recycled.
163      */
164     if (avc->states & CBulkStat)
165         afs_bulkStatsLost++;
166     vcachegen++;
167     /* remove entry from the hash chain */
168     i = VCHash(&avc->fid);
169     uvc = &afs_vhashT[i];
170     for (wvc = *uvc; wvc; uvc = &wvc->hnext, wvc = *uvc) {
171         if (avc == wvc) {
172             *uvc = avc->hnext;
173             avc->hnext = (struct vcache *)NULL;
174             break;
175         }
176     }
177     if (!wvc)
178         osi_Panic("flushvcache");       /* not in correct hash bucket */
179     if (avc->mvid)
180         osi_FreeSmallSpace(avc->mvid);
181     avc->mvid = (struct VenusFid *)0;
182     if (avc->linkData) {
183         afs_osi_Free(avc->linkData, strlen(avc->linkData) + 1);
184         avc->linkData = NULL;
185     }
186 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
187     /* OK, there are no internal vrefCounts, so there shouldn't
188      * be any more refs here. */
189     if (avc->v) {
190         avc->v->v_data = NULL;  /* remove from vnode */
191         avc->v = NULL;          /* also drop the ptr to vnode */
192     }
193 #endif
194     afs_FreeAllAxs(&(avc->Access));
195
196     /* we can't really give back callbacks on RO files, since the
197      * server only tracks them on a per-volume basis, and we don't
198      * know whether we still have some other files from the same
199      * volume. */
200     if ((avc->states & CRO) == 0 && avc->callback) {
201         afs_QueueVCB(avc);
202     }
203     ObtainWriteLock(&afs_xcbhash, 460);
204     afs_DequeueCallback(avc);   /* remove it from queued callbacks list */
205     avc->states &= ~(CStatd | CUnique);
206     ReleaseWriteLock(&afs_xcbhash);
207     afs_symhint_inval(avc);
208     if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1))
209         osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
210     else
211         osi_dnlc_purgevp(avc);
212
213     /*
214      * Next, keep track of which vnodes we've deleted for create's
215      * optimistic synchronization algorithm
216      */
217     afs_allZaps++;
218     if (avc->fid.Fid.Vnode & 1)
219         afs_oddZaps++;
220     else
221         afs_evenZaps++;
222
223 #if     !defined(AFS_OSF_ENV)
224     /* put the entry in the free list */
225     avc->nextfree = freeVCList;
226     freeVCList = avc;
227     if (avc->vlruq.prev || avc->vlruq.next) {
228         refpanic("LRU vs. Free inconsistency");
229     }
230 #else
231     /* This should put it back on the vnode free list since usecount is 1 */
232     afs_vcount--;
233     vSetType(avc, VREG);
234     if (VREFCOUNT(avc) > 0) {
235         VN_UNLOCK(AFSTOV(avc));
236         AFS_RELE(AFSTOV(avc));
237     } else {
238         if (afs_norefpanic) {
239             printf("flush vc refcnt < 1");
240             afs_norefpanic++;
241             (void)vgone(avc, VX_NOSLEEP, NULL);
242             AFS_GLOCK();
243             VN_UNLOCK(AFSTOV(avc));
244         } else
245             osi_Panic("flush vc refcnt < 1");
246     }
247 #endif /* AFS_OSF_ENV */
248     avc->states |= CVFlushed;
249     return 0;
250
251   bad:
252 #ifdef  AFS_OSF_ENV
253     VN_UNLOCK(AFSTOV(avc));
254 #endif
255     return code;
256
257 }                               /*afs_FlushVCache */
258
259 #ifndef AFS_SGI_ENV
260 /*
261  * afs_InactiveVCache
262  *
263  * The core of the inactive vnode op for all but IRIX.
264  */
265 void
266 afs_InactiveVCache(struct vcache *avc, struct AFS_UCRED *acred)
267 {
268     AFS_STATCNT(afs_inactive);
269     if (avc->states & CDirty) {
270         /* we can't keep trying to push back dirty data forever.  Give up. */
271         afs_InvalidateAllSegments(avc); /* turns off dirty bit */
272     }
273     avc->states &= ~CMAPPED;    /* mainly used by SunOS 4.0.x */
274     avc->states &= ~CDirty;     /* Turn it off */
275     if (avc->states & CUnlinked) {
276         if (CheckLock(&afs_xvcache) || CheckLock(&afs_xdcache)) {
277             avc->states |= CUnlinkedDel;
278             return;
279         }
280         afs_remunlink(avc, 1);  /* ignore any return code */
281     }
282
283 }
284 #endif
285
286 /*
287  * afs_AllocCBR
288  *
289  * Description: allocate a callback return structure from the
290  * free list and return it.
291  *
292  * Env: The alloc and free routines are both called with the afs_xvcb lock
293  * held, so we don't have to worry about blocking in osi_Alloc.
294  */
295 static struct afs_cbr *afs_cbrSpace = 0;
296 struct afs_cbr *
297 afs_AllocCBR(void)
298 {
299     register struct afs_cbr *tsp;
300     int i;
301
302     while (!afs_cbrSpace) {
303         if (afs_stats_cmperf.CallBackAlloced >= 2) {
304             /* don't allocate more than 2 * AFS_NCBRS for now */
305             afs_FlushVCBs(0);
306             afs_stats_cmperf.CallBackFlushes++;
307         } else {
308             /* try allocating */
309             tsp =
310                 (struct afs_cbr *)afs_osi_Alloc(AFS_NCBRS *
311                                                 sizeof(struct afs_cbr));
312             for (i = 0; i < AFS_NCBRS - 1; i++) {
313                 tsp[i].next = &tsp[i + 1];
314             }
315             tsp[AFS_NCBRS - 1].next = 0;
316             afs_cbrSpace = tsp;
317             afs_stats_cmperf.CallBackAlloced++;
318         }
319     }
320     tsp = afs_cbrSpace;
321     afs_cbrSpace = tsp->next;
322     return tsp;
323 }
324
325 /*
326  * afs_FreeCBR
327  *
328  * Description: free a callback return structure, removing it from all lists.
329  *
330  * Parameters:
331  *      asp -- the address of the structure to free.
332  *
333  * Environment: the xvcb lock is held over these calls.
334  */
335 int
336 afs_FreeCBR(register struct afs_cbr *asp)
337 {
338     *(asp->pprev) = asp->next;
339     if (asp->next)
340         asp->next->pprev = asp->pprev;
341
342     *(asp->hash_pprev) = asp->hash_next;
343     if (asp->hash_next)
344         asp->hash_next->hash_pprev = asp->hash_pprev;
345
346     asp->next = afs_cbrSpace;
347     afs_cbrSpace = asp;
348     return 0;
349 }
350
351 /*
352  * afs_FlushVCBs
353  *
354  * Description: flush all queued callbacks to all servers.
355  *
356  * Parameters: none.
357  *
358  * Environment: holds xvcb lock over RPC to guard against race conditions
359  *      when a new callback is granted for the same file later on.
360  */
361 afs_int32
362 afs_FlushVCBs(afs_int32 lockit)
363 {
364     struct AFSFid *tfids;
365     struct AFSCallBack callBacks[1];
366     struct AFSCBFids fidArray;
367     struct AFSCBs cbArray;
368     afs_int32 code;
369     struct afs_cbr *tcbrp;
370     int tcount;
371     struct server *tsp;
372     int i;
373     struct vrequest treq;
374     struct conn *tc;
375     int safety1, safety2, safety3;
376     XSTATS_DECLS;
377     if ((code = afs_InitReq(&treq, afs_osi_credp)))
378         return code;
379     treq.flags |= O_NONBLOCK;
380     tfids = afs_osi_Alloc(sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
381
382     if (lockit)
383         MObtainWriteLock(&afs_xvcb, 273);
384     ObtainReadLock(&afs_xserver);
385     for (i = 0; i < NSERVERS; i++) {
386         for (safety1 = 0, tsp = afs_servers[i];
387              tsp && safety1 < afs_totalServers + 10;
388              tsp = tsp->next, safety1++) {
389             /* don't have any */
390             if (tsp->cbrs == (struct afs_cbr *)0)
391                 continue;
392
393             /* otherwise, grab a block of AFS_MAXCBRSCALL from the list
394              * and make an RPC, over and over again.
395              */
396             tcount = 0;         /* number found so far */
397             for (safety2 = 0; safety2 < afs_cacheStats; safety2++) {
398                 if (tcount >= AFS_MAXCBRSCALL || !tsp->cbrs) {
399                     /* if buffer is full, or we've queued all we're going
400                      * to from this server, we should flush out the
401                      * callbacks.
402                      */
403                     fidArray.AFSCBFids_len = tcount;
404                     fidArray.AFSCBFids_val = (struct AFSFid *)tfids;
405                     cbArray.AFSCBs_len = 1;
406                     cbArray.AFSCBs_val = callBacks;
407                     memset(&callBacks[0], 0, sizeof(callBacks[0]));
408                     callBacks[0].CallBackType = CB_EXCLUSIVE;
409                     for (safety3 = 0; safety3 < MAXHOSTS * 2; safety3++) {
410                         tc = afs_ConnByHost(tsp, tsp->cell->fsport,
411                                             tsp->cell->cellNum, &treq, 0,
412                                             SHARED_LOCK);
413                         if (tc) {
414                             XSTATS_START_TIME
415                                 (AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS);
416                             RX_AFS_GUNLOCK();
417                             code =
418                                 RXAFS_GiveUpCallBacks(tc->id, &fidArray,
419                                                       &cbArray);
420                             RX_AFS_GLOCK();
421                             XSTATS_END_TIME;
422                         } else
423                             code = -1;
424                         if (!afs_Analyze
425                             (tc, code, 0, &treq,
426                              AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS, SHARED_LOCK,
427                              tsp->cell)) {
428                             break;
429                         }
430                     }
431                     /* ignore return code, since callbacks may have
432                      * been returned anyway, we shouldn't leave them
433                      * around to be returned again.
434                      *
435                      * Next, see if we are done with this server, and if so,
436                      * break to deal with the next one.
437                      */
438                     if (!tsp->cbrs)
439                         break;
440                     tcount = 0;
441                 }
442                 /* if to flush full buffer */
443                 /* if we make it here, we have an entry at the head of cbrs,
444                  * which we should copy to the file ID array and then free.
445                  */
446                 tcbrp = tsp->cbrs;
447                 tfids[tcount++] = tcbrp->fid;
448
449                 /* Freeing the CBR will unlink it from the server's CBR list */
450                 afs_FreeCBR(tcbrp);
451             }                   /* while loop for this one server */
452             if (safety2 > afs_cacheStats) {
453                 afs_warn("possible internal error afs_flushVCBs (%d)\n",
454                          safety2);
455             }
456         }                       /* for loop for this hash chain */
457     }                           /* loop through all hash chains */
458     if (safety1 > afs_totalServers + 2) {
459         afs_warn
460             ("AFS internal error (afs_flushVCBs) (%d > %d), continuing...\n",
461              safety1, afs_totalServers + 2);
462         if (afs_paniconwarn)
463             osi_Panic("afs_flushVCBS safety1");
464     }
465
466     ReleaseReadLock(&afs_xserver);
467     if (lockit)
468         MReleaseWriteLock(&afs_xvcb);
469     afs_osi_Free(tfids, sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
470     return 0;
471 }
472
473 /*
474  * afs_QueueVCB
475  *
476  * Description:
477  *      Queue a callback on the given fid.
478  *
479  * Parameters:
480  *      avc: vcache entry
481  *
482  * Environment:
483  *      Locks the xvcb lock.
484  *      Called when the xvcache lock is already held.
485  */
486
487 static afs_int32
488 afs_QueueVCB(struct vcache *avc)
489 {
490     struct server *tsp;
491     struct afs_cbr *tcbp;
492
493     AFS_STATCNT(afs_QueueVCB);
494     /* The callback is really just a struct server ptr. */
495     tsp = (struct server *)(avc->callback);
496
497     /* we now have a pointer to the server, so we just allocate
498      * a queue entry and queue it.
499      */
500     MObtainWriteLock(&afs_xvcb, 274);
501     tcbp = afs_AllocCBR();
502     tcbp->fid = avc->fid.Fid;
503
504     tcbp->next = tsp->cbrs;
505     if (tsp->cbrs)
506         tsp->cbrs->pprev = &tcbp->next;
507
508     tsp->cbrs = tcbp;
509     tcbp->pprev = &tsp->cbrs;
510
511     afs_InsertHashCBR(tcbp);
512
513     /* now release locks and return */
514     MReleaseWriteLock(&afs_xvcb);
515     return 0;
516 }
517
518
519 /*
520  * afs_RemoveVCB
521  *
522  * Description:
523  *      Remove a queued callback for a given Fid.
524  *
525  * Parameters:
526  *      afid: The fid we want cleansed of queued callbacks.
527  *
528  * Environment:
529  *      Locks xvcb and xserver locks.
530  *      Typically called with xdcache, xvcache and/or individual vcache
531  *      entries locked.
532  */
533
534 void
535 afs_RemoveVCB(struct VenusFid *afid)
536 {
537     int slot;
538     struct afs_cbr *cbr, *ncbr;
539
540     AFS_STATCNT(afs_RemoveVCB);
541     MObtainWriteLock(&afs_xvcb, 275);
542
543     slot = afs_HashCBRFid(&afid->Fid);
544     ncbr = afs_cbrHashT[slot];
545
546     while (ncbr) {
547         cbr = ncbr;
548         ncbr = cbr->hash_next;
549
550         if (afid->Fid.Volume == cbr->fid.Volume &&
551             afid->Fid.Vnode == cbr->fid.Vnode &&
552             afid->Fid.Unique == cbr->fid.Unique) {
553             afs_FreeCBR(cbr);
554         }
555     }
556
557     MReleaseWriteLock(&afs_xvcb);
558 }
559
560 /*
561  * afs_NewVCache
562  *
563  * Description:
564  *      This routine is responsible for allocating a new cache entry
565  *      from the free list.  It formats the cache entry and inserts it
566  *      into the appropriate hash tables.  It must be called with
567  *      afs_xvcache write-locked so as to prevent several processes from
568  *      trying to create a new cache entry simultaneously.
569  *
570  * Parameters:
571  *      afid  : The file id of the file whose cache entry is being
572  *              created.
573  */
574 /* LOCK: afs_NewVCache  afs_xvcache W */
575 struct vcache *
576 afs_NewVCache(struct VenusFid *afid, struct server *serverp)
577 {
578     struct vcache *tvc;
579     afs_int32 i;
580     afs_int32 anumber = VCACHE_FREE;
581 #ifdef  AFS_AIX_ENV
582     struct gnode *gnodepnt;
583 #endif
584 #ifdef  AFS_OSF_ENV
585     struct vcache *nvc;
586 #endif /* AFS_OSF_ENV */
587     struct afs_q *tq, *uq;
588     int code, fv_slept;
589
590     AFS_STATCNT(afs_NewVCache);
591 #ifdef  AFS_OSF_ENV
592 #ifdef  AFS_OSF30_ENV
593     if (afs_vcount >= afs_maxvcount) {
594 #else
595     /*
596      * If we are using > 33 % of the total system vnodes for AFS vcache
597      * entries or we are using the maximum number of vcache entries,
598      * then free some.  (if our usage is > 33% we should free some, if
599      * our usage is > afs_maxvcount, set elsewhere to 0.5*nvnode,
600      * we _must_ free some -- no choice).
601      */
602     if (((3 * afs_vcount) > nvnode) || (afs_vcount >= afs_maxvcount)) {
603 #endif
604         struct afs_q *tq, *uq;
605         int i;
606         char *panicstr;
607
608         i = 0;
609         for (tq = VLRU.prev; tq != &VLRU && anumber > 0; tq = uq) {
610             tvc = QTOV(tq);
611             uq = QPrev(tq);
612             if (tvc->states & CVFlushed)
613                 refpanic("CVFlushed on VLRU");
614             else if (i++ > afs_maxvcount)
615                 refpanic("Exceeded pool of AFS vnodes(VLRU cycle?)");
616             else if (QNext(uq) != tq)
617                 refpanic("VLRU inconsistent");
618             else if (VREFCOUNT(tvc) < 1)
619                 refpanic("refcnt 0 on VLRU");
620
621             if (VREFCOUNT(tvc) == 1 && tvc->opens == 0
622                 && (tvc->states & CUnlinkedDel) == 0) {
623                 code = afs_FlushVCache(tvc, &fv_slept);
624                 if (code == 0) {
625                     anumber--;
626                 }
627                 if (fv_slept) {
628                     uq = VLRU.prev;
629                     i = 0;
630                     continue;   /* start over - may have raced. */
631                 }
632             }
633             if (tq == uq)
634                 break;
635         }
636         if (anumber == VCACHE_FREE) {
637             printf("NewVCache: warning none freed, using %d of %d\n",
638                    afs_vcount, afs_maxvcount);
639             if (afs_vcount >= afs_maxvcount) {
640                 osi_Panic("NewVCache - none freed");
641                 /* XXX instead of panicing, should do afs_maxvcount++
642                  * and magic up another one */
643             }
644         }
645     }
646
647     AFS_GUNLOCK();
648     if (getnewvnode(MOUNT_AFS, &Afs_vnodeops, &nvc)) {
649         /* What should we do ???? */
650         osi_Panic("afs_NewVCache: no more vnodes");
651     }
652     AFS_GLOCK();
653
654     tvc = nvc;
655     tvc->nextfree = NULL;
656     afs_vcount++;
657 #else /* AFS_OSF_ENV */
658     /* pull out a free cache entry */
659     if (!freeVCList) {
660         i = 0;
661         for (tq = VLRU.prev; (anumber > 0) && (tq != &VLRU); tq = uq) {
662             tvc = QTOV(tq);
663             uq = QPrev(tq);
664
665             if (tvc->states & CVFlushed) {
666                 refpanic("CVFlushed on VLRU");
667 #if 0
668             } else if (i++ > 2 * afs_cacheStats) {      /* even allowing for a few xallocs... */
669                 refpanic("Increase -stat parameter of afsd(VLRU cycle?)");
670 #endif
671             } else if (QNext(uq) != tq) {
672                 refpanic("VLRU inconsistent");
673             }
674 #if defined(AFS_LINUX22_ENV)
675             if (tvc != afs_globalVp && VREFCOUNT(tvc) && tvc->opens == 0) {
676                 struct dentry *dentry;
677                 struct list_head *cur, *head = &(AFSTOI(tvc))->i_dentry;
678                 AFS_FAST_HOLD(tvc);
679                 AFS_GUNLOCK();
680
681 restart:
682 #if defined(AFS_LINUX24_ENV)
683                 spin_lock(&dcache_lock);
684 #endif
685                 cur = head;
686                 while ((cur = cur->next) != head) {
687                     dentry = list_entry(cur, struct dentry, d_alias);
688
689                     if (d_unhashed(dentry))
690                         continue;
691
692                     dget_locked(dentry);
693
694 #if defined(AFS_LINUX24_ENV)
695                     spin_unlock(&dcache_lock);
696 #endif
697                     if (d_invalidate(dentry) == -EBUSY) {
698                         dput(dentry);
699                         /* perhaps lock and try to continue? (use cur as head?) */
700                         goto inuse;
701                     }
702                     dput(dentry);
703                     goto restart;
704                 }                   
705 #if defined(AFS_LINUX24_ENV)
706                 spin_unlock(&dcache_lock);
707 #endif
708             inuse:
709                 AFS_GLOCK();
710                 AFS_FAST_RELE(tvc);
711             }
712 #endif
713
714             if (((VREFCOUNT(tvc) == 0) 
715 #if defined(AFS_DARWIN_ENV) && !defined(UKERNEL) 
716                  || ((VREFCOUNT(tvc) == 1) && 
717                      (UBCINFOEXISTS(AFSTOV(tvc))))
718 #endif
719                  ) && tvc->opens == 0 && (tvc->states & CUnlinkedDel) == 0) {
720 #if defined (AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV)
721                 /*
722                  * vgone() reclaims the vnode, which calls afs_FlushVCache(),
723                  * then it puts the vnode on the free list.
724                  * If we don't do this we end up with a cleaned vnode that's
725                  * not on the free list.
726                  * XXX assume FreeBSD is the same for now.
727                  */
728                 AFS_GUNLOCK();
729                 vgone(AFSTOV(tvc));
730                 AFS_GLOCK();
731                 code = fv_slept = 0;
732 #else
733                 code = afs_FlushVCache(tvc, &fv_slept);
734 #endif
735                 if (code == 0) {
736                     anumber--;
737                 }
738                 if (fv_slept) {
739                     uq = VLRU.prev;
740                     i = 0;
741                     continue;   /* start over - may have raced. */
742                 }
743             }
744             if (tq == uq)
745                 break;
746         }
747     }
748     if (!freeVCList) {
749         /* none free, making one is better than a panic */
750         afs_stats_cmperf.vcacheXAllocs++;       /* count in case we have a leak */
751         if (afs_cacheStats == afs_stats_cmperf.vcacheXAllocs) printf("would vlru cycle panic\n");
752         tvc = (struct vcache *)afs_osi_Alloc(sizeof(struct vcache));
753 #if defined(AFS_DARWIN_ENV) && !defined(UKERNEL)
754         tvc->v = NULL; /* important to clean this, or use memset 0 */
755 #endif
756 #ifdef  KERNEL_HAVE_PIN
757         pin((char *)tvc, sizeof(struct vcache));        /* XXX */
758 #endif
759 #if defined(AFS_SGI_ENV)
760         {
761             char name[METER_NAMSZ];
762             memset(tvc, 0, sizeof(struct vcache));
763             tvc->v.v_number = ++afsvnumbers;
764             tvc->vc_rwlockid = OSI_NO_LOCKID;
765             initnsema(&tvc->vc_rwlock, 1,
766                       makesname(name, "vrw", tvc->v.v_number));
767 #ifndef AFS_SGI53_ENV
768             initnsema(&tvc->v.v_sync, 0,
769                       makesname(name, "vsy", tvc->v.v_number));
770 #endif
771 #ifndef AFS_SGI62_ENV
772             initnlock(&tvc->v.v_lock,
773                       makesname(name, "vlk", tvc->v.v_number));
774 #endif
775         }
776 #endif /* AFS_SGI_ENV */
777     } else {
778         tvc = freeVCList;       /* take from free list */
779         freeVCList = tvc->nextfree;
780         tvc->nextfree = NULL;
781     }
782 #endif /* AFS_OSF_ENV */
783
784 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
785     if (tvc->v)
786         panic("afs_NewVCache(): free vcache with vnode attached");
787 #endif
788
789 #if !defined(AFS_SGI_ENV) && !defined(AFS_OSF_ENV)
790     memset((char *)tvc, 0, sizeof(struct vcache));
791 #else
792     tvc->uncred = 0;
793 #endif
794
795     RWLOCK_INIT(&tvc->lock, "vcache lock");
796 #if     defined(AFS_SUN5_ENV)
797     RWLOCK_INIT(&tvc->vlock, "vcache vlock");
798 #endif /* defined(AFS_SUN5_ENV) */
799
800 #ifdef AFS_OBSD_ENV
801     AFS_GUNLOCK();
802     afs_nbsd_getnewvnode(tvc);  /* includes one refcount */
803     AFS_GLOCK();
804     lockinit(&tvc->rwlock, PINOD, "vcache", 0, 0);
805 #endif
806 #ifdef AFS_DARWIN_ENV
807     AFS_GUNLOCK();
808     afs_darwin_getnewvnode(tvc);        /* includes one refcount */
809     AFS_GLOCK();
810     lockinit(&tvc->rwlock, PINOD, "vcache", 0, 0);
811 #endif
812 #ifdef AFS_FBSD_ENV
813     {
814         struct vnode *vp;
815
816         AFS_GUNLOCK();
817 #if defined(AFS_FBSD60_ENV)
818         if (getnewvnode(MOUNT_AFS, afs_globalVFS, &afs_vnodeops, &vp))
819 #elif defined(AFS_FBSD50_ENV)
820         if (getnewvnode(MOUNT_AFS, afs_globalVFS, afs_vnodeop_p, &vp))
821 #else
822         if (getnewvnode(VT_AFS, afs_globalVFS, afs_vnodeop_p, &vp))
823 #endif
824             panic("afs getnewvnode");   /* can't happen */
825         AFS_GLOCK();
826         if (tvc->v != NULL) {
827             /* I'd like to know if this ever happens...
828              * We don't drop global for the rest of this function,
829              * so if we do lose the race, the other thread should
830              * have found the same vnode and finished initializing
831              * the vcache entry.  Is it conceivable that this vcache
832              * entry could be recycled during this interval?  If so,
833              * then there probably needs to be some sort of additional
834              * mutual exclusion (an Embryonic flag would suffice).
835              * -GAW */
836             printf("afs_NewVCache: lost the race\n");
837             return (tvc);
838         }
839         tvc->v = vp;
840         tvc->v->v_data = tvc;
841         lockinit(&tvc->rwlock, PINOD, "vcache", 0, 0);
842     }
843 #endif
844     tvc->parentVnode = 0;
845     tvc->mvid = NULL;
846     tvc->linkData = NULL;
847     tvc->cbExpires = 0;
848     tvc->opens = 0;
849     tvc->execsOrWriters = 0;
850     tvc->flockCount = 0;
851     tvc->anyAccess = 0;
852     tvc->states = 0;
853     tvc->last_looker = 0;
854     tvc->fid = *afid;
855     tvc->asynchrony = -1;
856     tvc->vc_error = 0;
857     afs_symhint_inval(tvc);
858 #ifdef AFS_TEXT_ENV
859     tvc->flushDV.low = tvc->flushDV.high = AFS_MAXDV;
860 #endif
861     hzero(tvc->mapDV);
862     tvc->truncPos = AFS_NOTRUNC;        /* don't truncate until we need to */
863     hzero(tvc->m.DataVersion);  /* in case we copy it into flushDV */
864 #if defined(AFS_LINUX22_ENV)
865     {
866         struct inode *ip = AFSTOI(tvc);
867 #if defined(AFS_LINUX24_ENV)
868         struct address_space *mapping = &ip->i_data;
869 #endif
870
871 #if defined(AFS_LINUX26_ENV)
872         inode_init_once(ip);
873 #else
874         sema_init(&ip->i_sem, 1);
875         INIT_LIST_HEAD(&ip->i_hash);
876         INIT_LIST_HEAD(&ip->i_dentry);
877 #if defined(AFS_LINUX24_ENV)
878         sema_init(&ip->i_zombie, 1);
879         init_waitqueue_head(&ip->i_wait);
880         spin_lock_init(&ip->i_data.i_shared_lock);
881 #ifdef STRUCT_ADDRESS_SPACE_HAS_PAGE_LOCK
882         spin_lock_init(&ip->i_data.page_lock);
883 #endif
884         INIT_LIST_HEAD(&ip->i_data.clean_pages);
885         INIT_LIST_HEAD(&ip->i_data.dirty_pages);
886         INIT_LIST_HEAD(&ip->i_data.locked_pages);
887         INIT_LIST_HEAD(&ip->i_dirty_buffers);
888 #ifdef STRUCT_INODE_HAS_I_DIRTY_DATA_BUFFERS
889         INIT_LIST_HEAD(&ip->i_dirty_data_buffers);
890 #endif
891 #ifdef STRUCT_INODE_HAS_I_DEVICES
892         INIT_LIST_HEAD(&ip->i_devices);
893 #endif
894 #ifdef STRUCT_INODE_HAS_I_TRUNCATE_SEM
895         init_rwsem(&ip->i_truncate_sem);
896 #endif
897 #ifdef STRUCT_INODE_HAS_I_ALLOC_SEM
898         init_rwsem(&ip->i_alloc_sem);
899 #endif
900
901 #else /* AFS_LINUX22_ENV */
902         sema_init(&ip->i_atomic_write, 1);
903         init_waitqueue(&ip->i_wait);
904 #endif
905 #endif
906
907 #if defined(AFS_LINUX24_ENV)
908         mapping->host = ip;
909         ip->i_mapping = mapping;
910 #ifdef STRUCT_ADDRESS_SPACE_HAS_GFP_MASK
911         ip->i_data.gfp_mask = GFP_HIGHUSER;
912 #endif
913 #if defined(AFS_LINUX26_ENV)
914         mapping_set_gfp_mask(mapping, GFP_HIGHUSER);
915         {
916             extern struct backing_dev_info afs_backing_dev_info;
917
918             mapping->backing_dev_info = &afs_backing_dev_info;
919         }
920 #endif
921 #endif
922
923 #if !defined(AFS_LINUX26_ENV)
924         if (afs_globalVFS)
925             ip->i_dev = afs_globalVFS->s_dev;
926 #else
927 #ifdef STRUCT_INODE_HAS_I_SECURITY
928         ip->i_security = NULL;
929         if (security_inode_alloc(ip))
930             panic("Cannot allocate inode security");
931 #endif
932 #endif
933         ip->i_sb = afs_globalVFS;
934         put_inode_on_dummy_list(ip);
935 #ifdef STRUCT_INODE_HAS_I_SB_LIST
936         list_add(&ip->i_sb_list, &ip->i_sb->s_inodes);
937 #endif
938 #if defined(STRUCT_INODE_HAS_INOTIFY_LOCK) || defined(STRUCT_INODE_HAS_INOTIFY_SEM)
939         INIT_LIST_HEAD(&ip->inotify_watches); 
940 #if defined(STRUCT_INODE_HAS_INOTIFY_SEM) 
941         sema_init(&ip->inotify_sem, 1); 
942 #else
943         spin_lock_init(&ip->inotify_lock); 
944 #endif 
945 #endif 
946     }
947 #endif
948
949 #ifdef  AFS_OSF_ENV
950     /* Hold it for the LRU (should make count 2) */
951     VN_HOLD(AFSTOV(tvc));
952 #else /* AFS_OSF_ENV */
953 #if !(defined (AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV))
954     VREFCOUNT_SET(tvc, 1);      /* us */
955 #endif /* AFS_XBSD_ENV */
956 #endif /* AFS_OSF_ENV */
957 #ifdef  AFS_AIX32_ENV
958     LOCK_INIT(&tvc->pvmlock, "vcache pvmlock");
959     tvc->vmh = tvc->segid = NULL;
960     tvc->credp = NULL;
961 #endif
962 #ifdef AFS_BOZONLOCK_ENV
963 #if     defined(AFS_SUN5_ENV)
964     rw_init(&tvc->rwlock, "vcache rwlock", RW_DEFAULT, NULL);
965
966 #if     defined(AFS_SUN55_ENV)
967     /* This is required if the kaio (kernel aynchronous io)
968      ** module is installed. Inside the kernel, the function
969      ** check_vp( common/os/aio.c) checks to see if the kernel has
970      ** to provide asynchronous io for this vnode. This
971      ** function extracts the device number by following the
972      ** v_data field of the vnode. If we do not set this field
973      ** then the system panics. The  value of the v_data field
974      ** is not really important for AFS vnodes because the kernel
975      ** does not do asynchronous io for regular files. Hence,
976      ** for the time being, we fill up the v_data field with the
977      ** vnode pointer itself. */
978     tvc->v.v_data = (char *)tvc;
979 #endif /* AFS_SUN55_ENV */
980 #endif
981     afs_BozonInit(&tvc->pvnLock, tvc);
982 #endif
983
984     tvc->Access = NULL;
985     tvc->callback = serverp;    /* to minimize chance that clear
986                                  * request is lost */
987     /* initialize vnode data, note vrefCount is v.v_count */
988 #ifdef  AFS_AIX_ENV
989     /* Don't forget to free the gnode space */
990     tvc->v.v_gnode = gnodepnt =
991         (struct gnode *)osi_AllocSmallSpace(sizeof(struct gnode));
992     memset((char *)gnodepnt, 0, sizeof(struct gnode));
993 #endif
994 #ifdef AFS_SGI64_ENV
995     memset((void *)&(tvc->vc_bhv_desc), 0, sizeof(tvc->vc_bhv_desc));
996     bhv_desc_init(&(tvc->vc_bhv_desc), tvc, tvc, &Afs_vnodeops);
997 #ifdef AFS_SGI65_ENV
998     vn_bhv_head_init(&(tvc->v.v_bh), "afsvp");
999     vn_bhv_insert_initial(&(tvc->v.v_bh), &(tvc->vc_bhv_desc));
1000 #else
1001     bhv_head_init(&(tvc->v.v_bh));
1002     bhv_insert_initial(&(tvc->v.v_bh), &(tvc->vc_bhv_desc));
1003 #endif
1004 #ifdef AFS_SGI65_ENV
1005     tvc->v.v_mreg = tvc->v.v_mregb = (struct pregion *)tvc;
1006 #ifdef VNODE_TRACING
1007     tvc->v.v_trace = ktrace_alloc(VNODE_TRACE_SIZE, 0);
1008 #endif
1009     init_bitlock(&tvc->v.v_pcacheflag, VNODE_PCACHE_LOCKBIT, "afs_pcache",
1010                  tvc->v.v_number);
1011     init_mutex(&tvc->v.v_filocksem, MUTEX_DEFAULT, "afsvfl", (long)tvc);
1012     init_mutex(&tvc->v.v_buf_lock, MUTEX_DEFAULT, "afsvnbuf", (long)tvc);
1013 #endif
1014     vnode_pcache_init(&tvc->v);
1015 #if defined(DEBUG) && defined(VNODE_INIT_BITLOCK)
1016     /* Above define is never true execpt in SGI test kernels. */
1017     init_bitlock(&(tvc->v.v_flag, VLOCK, "vnode", tvc->v.v_number);
1018 #endif
1019 #ifdef INTR_KTHREADS
1020                  AFS_VN_INIT_BUF_LOCK(&(tvc->v));
1021 #endif
1022 #else
1023     SetAfsVnode(AFSTOV(tvc));
1024 #endif /* AFS_SGI64_ENV */
1025     /*
1026      * The proper value for mvstat (for root fids) is setup by the caller.
1027      */
1028     tvc->mvstat = 0;
1029     if (afid->Fid.Vnode == 1 && afid->Fid.Unique == 1)
1030         tvc->mvstat = 2;
1031     if (afs_globalVFS == 0)
1032         osi_Panic("afs globalvfs");
1033     vSetVfsp(tvc, afs_globalVFS);
1034     vSetType(tvc, VREG);
1035 #ifdef  AFS_AIX_ENV
1036     tvc->v.v_vfsnext = afs_globalVFS->vfs_vnodes;       /* link off vfs */
1037     tvc->v.v_vfsprev = NULL;
1038     afs_globalVFS->vfs_vnodes = &tvc->v;
1039     if (tvc->v.v_vfsnext != NULL)
1040         tvc->v.v_vfsnext->v_vfsprev = &tvc->v;
1041     tvc->v.v_next = gnodepnt->gn_vnode; /*Single vnode per gnode for us! */
1042     gnodepnt->gn_vnode = &tvc->v;
1043 #endif
1044 #if     defined(AFS_DUX40_ENV)
1045     insmntque(tvc, afs_globalVFS, &afs_ubcops);
1046 #else
1047 #ifdef  AFS_OSF_ENV
1048     /* Is this needed??? */
1049     insmntque(tvc, afs_globalVFS);
1050 #endif /* AFS_OSF_ENV */
1051 #endif /* AFS_DUX40_ENV */
1052 #if defined(AFS_SGI_ENV)
1053     VN_SET_DPAGES(&(tvc->v), (struct pfdat *)NULL);
1054     osi_Assert((tvc->v.v_flag & VINACT) == 0);
1055     tvc->v.v_flag = 0;
1056     osi_Assert(VN_GET_PGCNT(&(tvc->v)) == 0);
1057     osi_Assert(tvc->mapcnt == 0 && tvc->vc_locktrips == 0);
1058     osi_Assert(tvc->vc_rwlockid == OSI_NO_LOCKID);
1059     osi_Assert(tvc->v.v_filocks == NULL);
1060 #if !defined(AFS_SGI65_ENV)
1061     osi_Assert(tvc->v.v_filocksem == NULL);
1062 #endif
1063     osi_Assert(tvc->cred == NULL);
1064 #ifdef AFS_SGI64_ENV
1065     vnode_pcache_reinit(&tvc->v);
1066     tvc->v.v_rdev = NODEV;
1067 #endif
1068     vn_initlist((struct vnlist *)&tvc->v);
1069     tvc->lastr = 0;
1070 #endif /* AFS_SGI_ENV */
1071     tvc->h1.dchint = 0;
1072     osi_dnlc_purgedp(tvc);      /* this may be overkill */
1073     memset((char *)&(tvc->quick), 0, sizeof(struct vtodc));
1074     memset((char *)&(tvc->callsort), 0, sizeof(struct afs_q));
1075     tvc->slocks = NULL;
1076     i = VCHash(afid);
1077
1078     tvc->hnext = afs_vhashT[i];
1079     afs_vhashT[i] = tvc;
1080     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
1081         refpanic("NewVCache VLRU inconsistent");
1082     }
1083     QAdd(&VLRU, &tvc->vlruq);   /* put in lruq */
1084     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
1085         refpanic("NewVCache VLRU inconsistent2");
1086     }
1087     if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
1088         refpanic("NewVCache VLRU inconsistent3");
1089     }
1090     if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
1091         refpanic("NewVCache VLRU inconsistent4");
1092     }
1093     vcachegen++;
1094
1095     return tvc;
1096
1097 }                               /*afs_NewVCache */
1098
1099
1100 /*
1101  * afs_FlushActiveVcaches
1102  *
1103  * Description:
1104  *      ???
1105  *
1106  * Parameters:
1107  *      doflocks : Do we handle flocks?
1108  */
1109 /* LOCK: afs_FlushActiveVcaches afs_xvcache N */
1110 void
1111 afs_FlushActiveVcaches(register afs_int32 doflocks)
1112 {
1113     register struct vcache *tvc;
1114     register int i;
1115     register struct conn *tc;
1116     register afs_int32 code;
1117     register struct AFS_UCRED *cred = NULL;
1118     struct vrequest treq, ureq;
1119     struct AFSVolSync tsync;
1120     int didCore;
1121     XSTATS_DECLS;
1122     AFS_STATCNT(afs_FlushActiveVcaches);
1123     ObtainReadLock(&afs_xvcache);
1124     for (i = 0; i < VCSIZE; i++) {
1125         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
1126             if (doflocks && tvc->flockCount != 0) {
1127                 /* if this entry has an flock, send a keep-alive call out */
1128                 osi_vnhold(tvc, 0);
1129                 ReleaseReadLock(&afs_xvcache);
1130                 ObtainWriteLock(&tvc->lock, 51);
1131                 do {
1132                     afs_InitReq(&treq, afs_osi_credp);
1133                     treq.flags |= O_NONBLOCK;
1134
1135                     tc = afs_Conn(&tvc->fid, &treq, SHARED_LOCK);
1136                     if (tc) {
1137                         XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_EXTENDLOCK);
1138                         RX_AFS_GUNLOCK();
1139                         code =
1140                             RXAFS_ExtendLock(tc->id,
1141                                              (struct AFSFid *)&tvc->fid.Fid,
1142                                              &tsync);
1143                         RX_AFS_GLOCK();
1144                         XSTATS_END_TIME;
1145                     } else
1146                         code = -1;
1147                 } while (afs_Analyze
1148                          (tc, code, &tvc->fid, &treq,
1149                           AFS_STATS_FS_RPCIDX_EXTENDLOCK, SHARED_LOCK, NULL));
1150
1151                 ReleaseWriteLock(&tvc->lock);
1152                 ObtainReadLock(&afs_xvcache);
1153                 AFS_FAST_RELE(tvc);
1154             }
1155             didCore = 0;
1156             if ((tvc->states & CCore) || (tvc->states & CUnlinkedDel)) {
1157                 /*
1158                  * Don't let it evaporate in case someone else is in
1159                  * this code.  Also, drop the afs_xvcache lock while
1160                  * getting vcache locks.
1161                  */
1162                 osi_vnhold(tvc, 0);
1163                 ReleaseReadLock(&afs_xvcache);
1164 #ifdef AFS_BOZONLOCK_ENV
1165                 afs_BozonLock(&tvc->pvnLock, tvc);
1166 #endif
1167 #if defined(AFS_SGI_ENV)
1168                 /*
1169                  * That's because if we come in via the CUnlinkedDel bit state path we'll be have 0 refcnt
1170                  */
1171                 osi_Assert(VREFCOUNT(tvc) > 0);
1172                 AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1173 #endif
1174                 ObtainWriteLock(&tvc->lock, 52);
1175                 if (tvc->states & CCore) {
1176                     tvc->states &= ~CCore;
1177                     /* XXXX Find better place-holder for cred XXXX */
1178                     cred = (struct AFS_UCRED *)tvc->linkData;
1179                     tvc->linkData = NULL;       /* XXX */
1180                     afs_InitReq(&ureq, cred);
1181                     afs_Trace2(afs_iclSetp, CM_TRACE_ACTCCORE,
1182                                ICL_TYPE_POINTER, tvc, ICL_TYPE_INT32,
1183                                tvc->execsOrWriters);
1184                     code = afs_StoreOnLastReference(tvc, &ureq);
1185                     ReleaseWriteLock(&tvc->lock);
1186 #ifdef AFS_BOZONLOCK_ENV
1187                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1188 #endif
1189                     hzero(tvc->flushDV);
1190                     osi_FlushText(tvc);
1191                     didCore = 1;
1192                     if (code && code != VNOVNODE) {
1193                         afs_StoreWarn(code, tvc->fid.Fid.Volume,
1194                                       /* /dev/console */ 1);
1195                     }
1196                 } else if (tvc->states & CUnlinkedDel) {
1197                     /*
1198                      * Ignore errors
1199                      */
1200                     ReleaseWriteLock(&tvc->lock);
1201 #ifdef AFS_BOZONLOCK_ENV
1202                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1203 #endif
1204 #if defined(AFS_SGI_ENV)
1205                     AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1206 #endif
1207                     afs_remunlink(tvc, 0);
1208 #if defined(AFS_SGI_ENV)
1209                     AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1210 #endif
1211                 } else {
1212                     /* lost (or won, perhaps) the race condition */
1213                     ReleaseWriteLock(&tvc->lock);
1214 #ifdef AFS_BOZONLOCK_ENV
1215                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1216 #endif
1217                 }
1218 #if defined(AFS_SGI_ENV)
1219                 AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1220 #endif
1221                 ObtainReadLock(&afs_xvcache);
1222                 AFS_FAST_RELE(tvc);
1223                 if (didCore) {
1224                     AFS_RELE(AFSTOV(tvc));
1225                     /* Matches write code setting CCore flag */
1226                     crfree(cred);
1227                 }
1228             }
1229         }
1230     }
1231     ReleaseReadLock(&afs_xvcache);
1232 }
1233
1234
1235 /*
1236  * afs_VerifyVCache
1237  *
1238  * Description:
1239  *      Make sure a cache entry is up-to-date status-wise.
1240  *
1241  * NOTE: everywhere that calls this can potentially be sped up
1242  *       by checking CStatd first, and avoiding doing the InitReq
1243  *       if this is up-to-date.
1244  *
1245  *  Anymore, the only places that call this KNOW already that the
1246  *  vcache is not up-to-date, so we don't screw around.
1247  *
1248  * Parameters:
1249  *      avc  : Ptr to vcache entry to verify.
1250  *      areq : ???
1251  */
1252
1253 int
1254 afs_VerifyVCache2(struct vcache *avc, struct vrequest *areq)
1255 {
1256     register struct vcache *tvc;
1257
1258     AFS_STATCNT(afs_VerifyVCache);
1259
1260 #if defined(AFS_OSF_ENV)
1261     ObtainReadLock(&avc->lock);
1262     if (afs_IsWired(avc)) {
1263         ReleaseReadLock(&avc->lock);
1264         return 0;
1265     }
1266     ReleaseReadLock(&avc->lock);
1267 #endif /* AFS_OSF_ENV */
1268     /* otherwise we must fetch the status info */
1269
1270     ObtainWriteLock(&avc->lock, 53);
1271     if (avc->states & CStatd) {
1272         ReleaseWriteLock(&avc->lock);
1273         return 0;
1274     }
1275     ObtainWriteLock(&afs_xcbhash, 461);
1276     avc->states &= ~(CStatd | CUnique);
1277     avc->callback = NULL;
1278     afs_DequeueCallback(avc);
1279     ReleaseWriteLock(&afs_xcbhash);
1280     ReleaseWriteLock(&avc->lock);
1281
1282     /* since we've been called back, or the callback has expired,
1283      * it's possible that the contents of this directory, or this
1284      * file's name have changed, thus invalidating the dnlc contents.
1285      */
1286     if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1))
1287         osi_dnlc_purgedp(avc);
1288     else
1289         osi_dnlc_purgevp(avc);
1290
1291     /* fetch the status info */
1292     tvc = afs_GetVCache(&avc->fid, areq, NULL, avc);
1293     if (!tvc)
1294         return ENOENT;
1295     /* Put it back; caller has already incremented vrefCount */
1296     afs_PutVCache(tvc);
1297     return 0;
1298
1299 }                               /*afs_VerifyVCache */
1300
1301
1302 /*
1303  * afs_SimpleVStat
1304  *
1305  * Description:
1306  *      Simple copy of stat info into cache.
1307  *
1308  * Parameters:
1309  *      avc   : Ptr to vcache entry involved.
1310  *      astat : Ptr to stat info to copy.
1311  *
1312  * Environment:
1313  *      Nothing interesting.
1314  *
1315  * Callers:  as of 1992-04-29, only called by WriteVCache
1316  */
1317 static void
1318 afs_SimpleVStat(register struct vcache *avc,
1319                 register struct AFSFetchStatus *astat, struct vrequest *areq)
1320 {
1321     afs_size_t length;
1322     AFS_STATCNT(afs_SimpleVStat);
1323
1324 #ifdef AFS_SGI_ENV
1325     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1326         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1327 #else
1328     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)) {
1329 #endif
1330 #ifdef AFS_64BIT_CLIENT
1331         FillInt64(length, astat->Length_hi, astat->Length);
1332 #else /* AFS_64BIT_CLIENT */
1333         length = astat->Length;
1334 #endif /* AFS_64BIT_CLIENT */
1335 #if defined(AFS_SGI_ENV)
1336         osi_Assert((valusema(&avc->vc_rwlock) <= 0)
1337                    && (OSI_GET_LOCKID() == avc->vc_rwlockid));
1338         if (length < avc->m.Length) {
1339             vnode_t *vp = (vnode_t *) avc;
1340
1341             osi_Assert(WriteLocked(&avc->lock));
1342             ReleaseWriteLock(&avc->lock);
1343             AFS_GUNLOCK();
1344             PTOSSVP(vp, (off_t) length, (off_t) MAXLONG);
1345             AFS_GLOCK();
1346             ObtainWriteLock(&avc->lock, 67);
1347         }
1348 #endif
1349         /* if writing the file, don't fetch over this value */
1350         afs_Trace3(afs_iclSetp, CM_TRACE_SIMPLEVSTAT, ICL_TYPE_POINTER, avc,
1351                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length),
1352                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1353         avc->m.Length = length;
1354         avc->m.Date = astat->ClientModTime;
1355     }
1356     avc->m.Owner = astat->Owner;
1357     avc->m.Group = astat->Group;
1358     avc->m.Mode = astat->UnixModeBits;
1359     if (vType(avc) == VREG) {
1360         avc->m.Mode |= S_IFREG;
1361     } else if (vType(avc) == VDIR) {
1362         avc->m.Mode |= S_IFDIR;
1363     } else if (vType(avc) == VLNK) {
1364         avc->m.Mode |= S_IFLNK;
1365         if ((avc->m.Mode & 0111) == 0)
1366             avc->mvstat = 1;
1367     }
1368     if (avc->states & CForeign) {
1369         struct axscache *ac;
1370         avc->anyAccess = astat->AnonymousAccess;
1371 #ifdef badidea
1372         if ((astat->CallerAccess & ~astat->AnonymousAccess))
1373             /*   USED TO SAY :
1374              * Caller has at least one bit not covered by anonymous, and
1375              * thus may have interesting rights.
1376              *
1377              * HOWEVER, this is a really bad idea, because any access query
1378              * for bits which aren't covered by anonymous, on behalf of a user
1379              * who doesn't have any special rights, will result in an answer of
1380              * the form "I don't know, lets make a FetchStatus RPC and find out!"
1381              * It's an especially bad idea under Ultrix, since (due to the lack of
1382              * a proper access() call) it must perform several afs_access() calls
1383              * in order to create magic mode bits that vary according to who makes
1384              * the call.  In other words, _every_ stat() generates a test for
1385              * writeability...
1386              */
1387 #endif /* badidea */
1388             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1389                 ac->axess = astat->CallerAccess;
1390             else                /* not found, add a new one if possible */
1391                 afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1392     }
1393
1394
1395 }                               /*afs_SimpleVStat */
1396
1397
1398 /*
1399  * afs_WriteVCache
1400  *
1401  * Description:
1402  *      Store the status info *only* back to the server for a
1403  *      fid/vrequest.
1404  *
1405  * Parameters:
1406  *      avc     : Ptr to the vcache entry.
1407  *      astatus : Ptr to the status info to store.
1408  *      areq    : Ptr to the associated vrequest.
1409  *
1410  * Environment:
1411  *      Must be called with a shared lock held on the vnode.
1412  */
1413
1414 int
1415 afs_WriteVCache(register struct vcache *avc,
1416                 register struct AFSStoreStatus *astatus,
1417                 struct vrequest *areq)
1418 {
1419     afs_int32 code;
1420     struct conn *tc;
1421     struct AFSFetchStatus OutStatus;
1422     struct AFSVolSync tsync;
1423     XSTATS_DECLS;
1424     AFS_STATCNT(afs_WriteVCache);
1425     afs_Trace2(afs_iclSetp, CM_TRACE_WVCACHE, ICL_TYPE_POINTER, avc,
1426                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length));
1427
1428     do {
1429         tc = afs_Conn(&avc->fid, areq, SHARED_LOCK);
1430         if (tc) {
1431             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STORESTATUS);
1432             RX_AFS_GUNLOCK();
1433             code =
1434                 RXAFS_StoreStatus(tc->id, (struct AFSFid *)&avc->fid.Fid,
1435                                   astatus, &OutStatus, &tsync);
1436             RX_AFS_GLOCK();
1437             XSTATS_END_TIME;
1438         } else
1439             code = -1;
1440     } while (afs_Analyze
1441              (tc, code, &avc->fid, areq, AFS_STATS_FS_RPCIDX_STORESTATUS,
1442               SHARED_LOCK, NULL));
1443
1444     UpgradeSToWLock(&avc->lock, 20);
1445     if (code == 0) {
1446         /* success, do the changes locally */
1447         afs_SimpleVStat(avc, &OutStatus, areq);
1448         /*
1449          * Update the date, too.  SimpleVStat didn't do this, since
1450          * it thought we were doing this after fetching new status
1451          * over a file being written.
1452          */
1453         avc->m.Date = OutStatus.ClientModTime;
1454     } else {
1455         /* failure, set up to check with server next time */
1456         ObtainWriteLock(&afs_xcbhash, 462);
1457         afs_DequeueCallback(avc);
1458         avc->states &= ~(CStatd | CUnique);     /* turn off stat valid flag */
1459         ReleaseWriteLock(&afs_xcbhash);
1460         if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1))
1461             osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
1462     }
1463     ConvertWToSLock(&avc->lock);
1464     return code;
1465
1466 }                               /*afs_WriteVCache */
1467
1468 /*
1469  * afs_ProcessFS
1470  *
1471  * Description:
1472  *      Copy astat block into vcache info
1473  *
1474  * Parameters:
1475  *      avc   : Ptr to vcache entry.
1476  *      astat : Ptr to stat block to copy in.
1477  *      areq  : Ptr to associated request.
1478  *
1479  * Environment:
1480  *      Must be called under a write lock
1481  *
1482  * Note: this code may get dataversion and length out of sync if the file has
1483  *       been modified.  This is less than ideal.  I haven't thought about
1484  *       it sufficiently to be certain that it is adequate.
1485  */
1486 void
1487 afs_ProcessFS(register struct vcache *avc,
1488               register struct AFSFetchStatus *astat, struct vrequest *areq)
1489 {
1490     afs_size_t length;
1491     AFS_STATCNT(afs_ProcessFS);
1492
1493 #ifdef AFS_64BIT_CLIENT
1494     FillInt64(length, astat->Length_hi, astat->Length);
1495 #else /* AFS_64BIT_CLIENT */
1496     length = astat->Length;
1497 #endif /* AFS_64BIT_CLIENT */
1498     /* WARNING: afs_DoBulkStat uses the Length field to store a sequence
1499      * number for each bulk status request. Under no circumstances
1500      * should afs_DoBulkStat store a sequence number if the new
1501      * length will be ignored when afs_ProcessFS is called with
1502      * new stats. If you change the following conditional then you
1503      * also need to change the conditional in afs_DoBulkStat.  */
1504 #ifdef AFS_SGI_ENV
1505     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1506         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1507 #else
1508     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)) {
1509 #endif
1510         /* if we're writing or mapping this file, don't fetch over these
1511          *  values.
1512          */
1513         afs_Trace3(afs_iclSetp, CM_TRACE_PROCESSFS, ICL_TYPE_POINTER, avc,
1514                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length),
1515                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1516         avc->m.Length = length;
1517         avc->m.Date = astat->ClientModTime;
1518     }
1519     hset64(avc->m.DataVersion, astat->dataVersionHigh, astat->DataVersion);
1520     avc->m.Owner = astat->Owner;
1521     avc->m.Mode = astat->UnixModeBits;
1522     avc->m.Group = astat->Group;
1523     avc->m.LinkCount = astat->LinkCount;
1524     if (astat->FileType == File) {
1525         vSetType(avc, VREG);
1526         avc->m.Mode |= S_IFREG;
1527     } else if (astat->FileType == Directory) {
1528         vSetType(avc, VDIR);
1529         avc->m.Mode |= S_IFDIR;
1530     } else if (astat->FileType == SymbolicLink) {
1531         if (afs_fakestat_enable && (avc->m.Mode & 0111) == 0) {
1532             vSetType(avc, VDIR);
1533             avc->m.Mode |= S_IFDIR;
1534         } else {
1535             vSetType(avc, VLNK);
1536             avc->m.Mode |= S_IFLNK;
1537         }
1538         if ((avc->m.Mode & 0111) == 0) {
1539             avc->mvstat = 1;
1540         }
1541     }
1542     avc->anyAccess = astat->AnonymousAccess;
1543 #ifdef badidea
1544     if ((astat->CallerAccess & ~astat->AnonymousAccess))
1545         /*   USED TO SAY :
1546          * Caller has at least one bit not covered by anonymous, and
1547          * thus may have interesting rights.
1548          *
1549          * HOWEVER, this is a really bad idea, because any access query
1550          * for bits which aren't covered by anonymous, on behalf of a user
1551          * who doesn't have any special rights, will result in an answer of
1552          * the form "I don't know, lets make a FetchStatus RPC and find out!"
1553          * It's an especially bad idea under Ultrix, since (due to the lack of
1554          * a proper access() call) it must perform several afs_access() calls
1555          * in order to create magic mode bits that vary according to who makes
1556          * the call.  In other words, _every_ stat() generates a test for
1557          * writeability...
1558          */
1559 #endif /* badidea */
1560     {
1561         struct axscache *ac;
1562         if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1563             ac->axess = astat->CallerAccess;
1564         else                    /* not found, add a new one if possible */
1565             afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1566     }
1567 #ifdef AFS_LINUX22_ENV
1568     vcache2inode(avc);          /* Set the inode attr cache */
1569 #endif
1570
1571 }                               /*afs_ProcessFS */
1572
1573
1574 int
1575 afs_RemoteLookup(register struct VenusFid *afid, struct vrequest *areq,
1576                  char *name, struct VenusFid *nfid,
1577                  struct AFSFetchStatus *OutStatusp,
1578                  struct AFSCallBack *CallBackp, struct server **serverp,
1579                  struct AFSVolSync *tsyncp)
1580 {
1581     afs_int32 code;
1582     afs_uint32 start;
1583     register struct conn *tc;
1584     struct AFSFetchStatus OutDirStatus;
1585     XSTATS_DECLS;
1586     if (!name)
1587         name = "";              /* XXX */
1588     do {
1589         tc = afs_Conn(afid, areq, SHARED_LOCK);
1590         if (tc) {
1591             if (serverp)
1592                 *serverp = tc->srvr->server;
1593             start = osi_Time();
1594             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_XLOOKUP);
1595             RX_AFS_GUNLOCK();
1596             code =
1597                 RXAFS_Lookup(tc->id, (struct AFSFid *)&afid->Fid, name,
1598                              (struct AFSFid *)&nfid->Fid, OutStatusp,
1599                              &OutDirStatus, CallBackp, tsyncp);
1600             RX_AFS_GLOCK();
1601             XSTATS_END_TIME;
1602         } else
1603             code = -1;
1604     } while (afs_Analyze
1605              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_XLOOKUP, SHARED_LOCK,
1606               NULL));
1607
1608     return code;
1609 }
1610
1611
1612 /*
1613  * afs_GetVCache
1614  *
1615  * Description:
1616  *      Given a file id and a vrequest structure, fetch the status
1617  *      information associated with the file.
1618  *
1619  * Parameters:
1620  *      afid : File ID.
1621  *      areq : Ptr to associated vrequest structure, specifying the
1622  *              user whose authentication tokens will be used.
1623  *      avc  : caller may already have a vcache for this file, which is
1624  *             already held.
1625  *
1626  * Environment:
1627  *      The cache entry is returned with an increased vrefCount field.
1628  *      The entry must be discarded by calling afs_PutVCache when you
1629  *      are through using the pointer to the cache entry.
1630  *
1631  *      You should not hold any locks when calling this function, except
1632  *      locks on other vcache entries.  If you lock more than one vcache
1633  *      entry simultaneously, you should lock them in this order:
1634  *
1635  *          1. Lock all files first, then directories.
1636  *          2.  Within a particular type, lock entries in Fid.Vnode order.
1637  *
1638  *      This locking hierarchy is convenient because it allows locking
1639  *      of a parent dir cache entry, given a file (to check its access
1640  *      control list).  It also allows renames to be handled easily by
1641  *      locking directories in a constant order.
1642  * NB.  NewVCache -> FlushVCache presently (4/10/95) drops the xvcache lock.
1643  */
1644    /* might have a vcache structure already, which must
1645     * already be held by the caller */
1646
1647 struct vcache *
1648 afs_GetVCache(register struct VenusFid *afid, struct vrequest *areq,
1649               afs_int32 * cached, struct vcache *avc)
1650 {
1651
1652     afs_int32 code, newvcache = 0;
1653     register struct vcache *tvc;
1654     struct volume *tvp;
1655     afs_int32 retry;
1656
1657     AFS_STATCNT(afs_GetVCache);
1658
1659     if (cached)
1660         *cached = 0;            /* Init just in case */
1661
1662 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1663   loop:
1664 #endif
1665
1666     ObtainSharedLock(&afs_xvcache, 5);
1667
1668     tvc = afs_FindVCache(afid, &retry, DO_STATS | DO_VLRU);
1669     if (tvc && retry) {
1670 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1671         ReleaseSharedLock(&afs_xvcache);
1672         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1673         goto loop;
1674 #endif
1675     }
1676
1677     if (tvc) {
1678         if (cached)
1679             *cached = 1;
1680         if (tvc->states & CStatd) {
1681             ReleaseSharedLock(&afs_xvcache);
1682             return tvc;
1683         }
1684     } else {
1685         UpgradeSToWLock(&afs_xvcache, 21);
1686
1687         /* no cache entry, better grab one */
1688         tvc = afs_NewVCache(afid, NULL);
1689         newvcache = 1;
1690
1691         ConvertWToSLock(&afs_xvcache);
1692         afs_stats_cmperf.vcacheMisses++;
1693     }
1694
1695     ReleaseSharedLock(&afs_xvcache);
1696
1697     ObtainWriteLock(&tvc->lock, 54);
1698
1699     if (tvc->states & CStatd) {
1700 #ifdef AFS_LINUX22_ENV
1701         vcache2inode(tvc);
1702 #endif
1703         ReleaseWriteLock(&tvc->lock);
1704         return tvc;
1705     }
1706 #if defined(AFS_OSF_ENV)
1707     if (afs_IsWired(tvc)) {
1708         ReleaseWriteLock(&tvc->lock);
1709         return tvc;
1710     }
1711 #endif /* AFS_OSF_ENV */
1712 #if defined(AFS_DARWIN_ENV) || defined(AFS_FBSD_ENV)
1713     /*
1714      * XXX - I really don't like this.  Should try to understand better.
1715      * It seems that sometimes, when we get called, we already hold the
1716      * lock on the vnode (e.g., from afs_getattr via afs_VerifyVCache).
1717      * We can't drop the vnode lock, because that could result in a race.
1718      * Sometimes, though, we get here and don't hold the vnode lock.
1719      * I hate code paths that sometimes hold locks and sometimes don't.
1720      * In any event, the dodge we use here is to check whether the vnode
1721      * is locked, and if it isn't, then we gain and drop it around the call
1722      * to vinvalbuf; otherwise, we leave it alone.
1723      */
1724     {
1725         struct vnode *vp = AFSTOV(tvc);
1726         int iheldthelock;
1727
1728 #if defined(AFS_DARWIN_ENV)
1729         iheldthelock = VOP_ISLOCKED(vp);
1730         if (!iheldthelock)
1731             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, current_proc());
1732         /* this is messy. we can call fsync which will try to reobtain this */
1733         if (VTOAFS(vp) == tvc) 
1734           ReleaseWriteLock(&tvc->lock);
1735         if (UBCINFOEXISTS(vp)) {
1736           vinvalbuf(vp, V_SAVE, &afs_osi_cred, current_proc(), PINOD, 0);
1737         }
1738         if (VTOAFS(vp) == tvc) 
1739           ObtainWriteLock(&tvc->lock, 954);
1740         if (!iheldthelock)
1741             VOP_UNLOCK(vp, LK_EXCLUSIVE, current_proc());
1742 #elif defined(AFS_FBSD60_ENV)
1743         iheldthelock = VOP_ISLOCKED(vp, curthread);
1744         if (!iheldthelock)
1745             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1746         vinvalbuf(vp, V_SAVE, curthread, PINOD, 0);
1747         if (!iheldthelock)
1748             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1749 #elif defined(AFS_FBSD50_ENV)
1750         iheldthelock = VOP_ISLOCKED(vp, curthread);
1751         if (!iheldthelock)
1752             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1753         vinvalbuf(vp, V_SAVE, osi_curcred(), curthread, PINOD, 0);
1754         if (!iheldthelock)
1755             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1756 #elif defined(AFS_FBSD40_ENV)
1757         iheldthelock = VOP_ISLOCKED(vp, curproc);
1758         if (!iheldthelock)
1759             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curproc);
1760         vinvalbuf(vp, V_SAVE, osi_curcred(), curproc, PINOD, 0);
1761         if (!iheldthelock)
1762             VOP_UNLOCK(vp, LK_EXCLUSIVE, curproc);
1763 #elif defined(AFS_OBSD_ENV)
1764         iheldthelock = VOP_ISLOCKED(vp, curproc);
1765         if (!iheldthelock)
1766             VOP_LOCK(vp, LK_EXCLUSIVE | LK_RETRY, curproc);
1767         uvm_vnp_uncache(vp);
1768         if (!iheldthelock)
1769             VOP_UNLOCK(vp, 0, curproc);
1770 #endif
1771     }
1772 #endif
1773
1774     ObtainWriteLock(&afs_xcbhash, 464);
1775     tvc->states &= ~CUnique;
1776     tvc->callback = 0;
1777     afs_DequeueCallback(tvc);
1778     ReleaseWriteLock(&afs_xcbhash);
1779
1780     /* It is always appropriate to throw away all the access rights? */
1781     afs_FreeAllAxs(&(tvc->Access));
1782     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-volume info */
1783     if (tvp) {
1784         if ((tvp->states & VForeign)) {
1785             if (newvcache)
1786                 tvc->states |= CForeign;
1787             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1788                 && (tvp->rootUnique == afid->Fid.Unique)) {
1789                 tvc->mvstat = 2;
1790             }
1791         }
1792         if (tvp->states & VRO)
1793             tvc->states |= CRO;
1794         if (tvp->states & VBackup)
1795             tvc->states |= CBackup;
1796         /* now copy ".." entry back out of volume structure, if necessary */
1797         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1798             if (!tvc->mvid)
1799                 tvc->mvid = (struct VenusFid *)
1800                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1801             *tvc->mvid = tvp->dotdot;
1802         }
1803         afs_PutVolume(tvp, READ_LOCK);
1804     }
1805
1806     /* stat the file */
1807     afs_RemoveVCB(afid);
1808     {
1809         struct AFSFetchStatus OutStatus;
1810
1811         if (afs_DynrootNewVnode(tvc, &OutStatus)) {
1812             afs_ProcessFS(tvc, &OutStatus, areq);
1813             tvc->states |= CStatd | CUnique;
1814             code = 0;
1815         } else {
1816             code = afs_FetchStatus(tvc, afid, areq, &OutStatus);
1817         }
1818     }
1819
1820     if (code) {
1821         ReleaseWriteLock(&tvc->lock);
1822
1823         ObtainReadLock(&afs_xvcache);
1824         AFS_FAST_RELE(tvc);
1825         ReleaseReadLock(&afs_xvcache);
1826         return NULL;
1827     }
1828
1829     ReleaseWriteLock(&tvc->lock);
1830     return tvc;
1831
1832 }                               /*afs_GetVCache */
1833
1834
1835
1836 struct vcache *
1837 afs_LookupVCache(struct VenusFid *afid, struct vrequest *areq,
1838                  afs_int32 * cached, struct vcache *adp, char *aname)
1839 {
1840     afs_int32 code, now, newvcache = 0;
1841     struct VenusFid nfid;
1842     register struct vcache *tvc;
1843     struct volume *tvp;
1844     struct AFSFetchStatus OutStatus;
1845     struct AFSCallBack CallBack;
1846     struct AFSVolSync tsync;
1847     struct server *serverp = 0;
1848     afs_int32 origCBs;
1849     afs_int32 retry;
1850
1851     AFS_STATCNT(afs_GetVCache);
1852     if (cached)
1853         *cached = 0;            /* Init just in case */
1854
1855 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1856   loop1:
1857 #endif
1858
1859     ObtainReadLock(&afs_xvcache);
1860     tvc = afs_FindVCache(afid, &retry, DO_STATS /* no vlru */ );
1861
1862     if (tvc) {
1863         ReleaseReadLock(&afs_xvcache);
1864         if (retry) {
1865 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1866             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1867             goto loop1;
1868 #endif
1869         }
1870         ObtainReadLock(&tvc->lock);
1871
1872         if (tvc->states & CStatd) {
1873             if (cached) {
1874                 *cached = 1;
1875             }
1876             ReleaseReadLock(&tvc->lock);
1877             return tvc;
1878         }
1879         tvc->states &= ~CUnique;
1880
1881         ReleaseReadLock(&tvc->lock);
1882         ObtainReadLock(&afs_xvcache);
1883         AFS_FAST_RELE(tvc);
1884     }
1885     /* if (tvc) */
1886     ReleaseReadLock(&afs_xvcache);
1887
1888     /* lookup the file */
1889     nfid = *afid;
1890     now = osi_Time();
1891     origCBs = afs_allCBs;       /* if anything changes, we don't have a cb */
1892     code =
1893         afs_RemoteLookup(&adp->fid, areq, aname, &nfid, &OutStatus, &CallBack,
1894                          &serverp, &tsync);
1895
1896 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1897   loop2:
1898 #endif
1899
1900     ObtainSharedLock(&afs_xvcache, 6);
1901     tvc = afs_FindVCache(&nfid, &retry, DO_VLRU /* no xstats now */ );
1902     if (tvc && retry) {
1903 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1904         ReleaseSharedLock(&afs_xvcache);
1905         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1906         goto loop2;
1907 #endif
1908     }
1909
1910     if (!tvc) {
1911         /* no cache entry, better grab one */
1912         UpgradeSToWLock(&afs_xvcache, 22);
1913         tvc = afs_NewVCache(&nfid, serverp);
1914         newvcache = 1;
1915         ConvertWToSLock(&afs_xvcache);
1916     }
1917
1918     ReleaseSharedLock(&afs_xvcache);
1919     ObtainWriteLock(&tvc->lock, 55);
1920
1921     /* It is always appropriate to throw away all the access rights? */
1922     afs_FreeAllAxs(&(tvc->Access));
1923     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-vol info */
1924     if (tvp) {
1925         if ((tvp->states & VForeign)) {
1926             if (newvcache)
1927                 tvc->states |= CForeign;
1928             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1929                 && (tvp->rootUnique == afid->Fid.Unique))
1930                 tvc->mvstat = 2;
1931         }
1932         if (tvp->states & VRO)
1933             tvc->states |= CRO;
1934         if (tvp->states & VBackup)
1935             tvc->states |= CBackup;
1936         /* now copy ".." entry back out of volume structure, if necessary */
1937         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1938             if (!tvc->mvid)
1939                 tvc->mvid = (struct VenusFid *)
1940                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1941             *tvc->mvid = tvp->dotdot;
1942         }
1943     }
1944
1945     if (code) {
1946         ObtainWriteLock(&afs_xcbhash, 465);
1947         afs_DequeueCallback(tvc);
1948         tvc->states &= ~(CStatd | CUnique);
1949         ReleaseWriteLock(&afs_xcbhash);
1950         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
1951             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1952         if (tvp)
1953             afs_PutVolume(tvp, READ_LOCK);
1954         ReleaseWriteLock(&tvc->lock);
1955         ObtainReadLock(&afs_xvcache);
1956         AFS_FAST_RELE(tvc);
1957         ReleaseReadLock(&afs_xvcache);
1958         return NULL;
1959     }
1960
1961     ObtainWriteLock(&afs_xcbhash, 466);
1962     if (origCBs == afs_allCBs) {
1963         if (CallBack.ExpirationTime) {
1964             tvc->callback = serverp;
1965             tvc->cbExpires = CallBack.ExpirationTime + now;
1966             tvc->states |= CStatd | CUnique;
1967             tvc->states &= ~CBulkFetching;
1968             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvp);
1969         } else if (tvc->states & CRO) {
1970             /* adapt gives us an hour. */
1971             tvc->cbExpires = 3600 + osi_Time();
1972              /*XXX*/ tvc->states |= CStatd | CUnique;
1973             tvc->states &= ~CBulkFetching;
1974             afs_QueueCallback(tvc, CBHash(3600), tvp);
1975         } else {
1976             tvc->callback = NULL;
1977             afs_DequeueCallback(tvc);
1978             tvc->states &= ~(CStatd | CUnique);
1979             if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
1980                 osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
1981         }
1982     } else {
1983         afs_DequeueCallback(tvc);
1984         tvc->states &= ~CStatd;
1985         tvc->states &= ~CUnique;
1986         tvc->callback = NULL;
1987         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
1988             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1989     }
1990     ReleaseWriteLock(&afs_xcbhash);
1991     if (tvp)
1992         afs_PutVolume(tvp, READ_LOCK);
1993     afs_ProcessFS(tvc, &OutStatus, areq);
1994
1995     ReleaseWriteLock(&tvc->lock);
1996     return tvc;
1997
1998 }
1999
2000 struct vcache *
2001 afs_GetRootVCache(struct VenusFid *afid, struct vrequest *areq,
2002                   afs_int32 * cached, struct volume *tvolp)
2003 {
2004     afs_int32 code = 0, i, newvcache = 0, haveStatus = 0;
2005     afs_int32 getNewFid = 0;
2006     afs_uint32 start;
2007     struct VenusFid nfid;
2008     register struct vcache *tvc;
2009     struct server *serverp = 0;
2010     struct AFSFetchStatus OutStatus;
2011     struct AFSCallBack CallBack;
2012     struct AFSVolSync tsync;
2013     int origCBs = 0;
2014
2015     start = osi_Time();
2016
2017   newmtpt:
2018     if (!tvolp->rootVnode || getNewFid) {
2019         struct VenusFid tfid;
2020
2021         tfid = *afid;
2022         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
2023         origCBs = afs_allCBs;   /* ignore InitCallBackState */
2024         code =
2025             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
2026                              &serverp, &tsync);
2027         if (code) {
2028             return NULL;
2029         }
2030 /*      ReleaseReadLock(&tvolp->lock);           */
2031         ObtainWriteLock(&tvolp->lock, 56);
2032         tvolp->rootVnode = afid->Fid.Vnode = nfid.Fid.Vnode;
2033         tvolp->rootUnique = afid->Fid.Unique = nfid.Fid.Unique;
2034         ReleaseWriteLock(&tvolp->lock);
2035 /*      ObtainReadLock(&tvolp->lock);*/
2036         haveStatus = 1;
2037     } else {
2038         afid->Fid.Vnode = tvolp->rootVnode;
2039         afid->Fid.Unique = tvolp->rootUnique;
2040     }
2041
2042     ObtainSharedLock(&afs_xvcache, 7);
2043     i = VCHash(afid);
2044     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2045         if (!FidCmp(&(tvc->fid), afid)) {
2046 #ifdef  AFS_OSF_ENV
2047             /* Grab this vnode, possibly reactivating from the free list */
2048             /* for the present (95.05.25) everything on the hash table is
2049              * definitively NOT in the free list -- at least until afs_reclaim
2050              * can be safely implemented */
2051             int vg;
2052             AFS_GUNLOCK();
2053             vg = vget(AFSTOV(tvc));     /* this bumps ref count */
2054             AFS_GLOCK();
2055             if (vg)
2056                 continue;
2057 #endif /* AFS_OSF_ENV */
2058             break;
2059         }
2060     }
2061
2062     if (!haveStatus && (!tvc || !(tvc->states & CStatd))) {
2063         /* Mount point no longer stat'd or unknown. FID may have changed. */
2064 #ifdef AFS_OSF_ENV
2065         if (tvc)
2066             AFS_RELE(AFSTOV(tvc));
2067 #endif
2068         tvc = NULL;
2069         getNewFid = 1;
2070         ReleaseSharedLock(&afs_xvcache);
2071         goto newmtpt;
2072     }
2073
2074     if (!tvc) {
2075         UpgradeSToWLock(&afs_xvcache, 23);
2076         /* no cache entry, better grab one */
2077         tvc = afs_NewVCache(afid, NULL);
2078         newvcache = 1;
2079         afs_stats_cmperf.vcacheMisses++;
2080     } else {
2081         if (cached)
2082             *cached = 1;
2083         afs_stats_cmperf.vcacheHits++;
2084 #ifdef  AFS_OSF_ENV
2085         /* we already bumped the ref count in the for loop above */
2086 #else /* AFS_OSF_ENV */
2087         osi_vnhold(tvc, 0);
2088 #endif
2089         UpgradeSToWLock(&afs_xvcache, 24);
2090         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2091             refpanic("GRVC VLRU inconsistent0");
2092         }
2093         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2094             refpanic("GRVC VLRU inconsistent1");
2095         }
2096         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2097             refpanic("GRVC VLRU inconsistent2");
2098         }
2099         QRemove(&tvc->vlruq);   /* move to lruq head */
2100         QAdd(&VLRU, &tvc->vlruq);
2101         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2102             refpanic("GRVC VLRU inconsistent3");
2103         }
2104         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2105             refpanic("GRVC VLRU inconsistent4");
2106         }
2107         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2108             refpanic("GRVC VLRU inconsistent5");
2109         }
2110         vcachegen++;
2111     }
2112
2113     ReleaseWriteLock(&afs_xvcache);
2114
2115     if (tvc->states & CStatd) {
2116         return tvc;
2117     } else {
2118
2119         ObtainReadLock(&tvc->lock);
2120         tvc->states &= ~CUnique;
2121         tvc->callback = NULL;   /* redundant, perhaps */
2122         ReleaseReadLock(&tvc->lock);
2123     }
2124
2125     ObtainWriteLock(&tvc->lock, 57);
2126
2127     /* It is always appropriate to throw away all the access rights? */
2128     afs_FreeAllAxs(&(tvc->Access));
2129
2130     if (newvcache)
2131         tvc->states |= CForeign;
2132     if (tvolp->states & VRO)
2133         tvc->states |= CRO;
2134     if (tvolp->states & VBackup)
2135         tvc->states |= CBackup;
2136     /* now copy ".." entry back out of volume structure, if necessary */
2137     if (newvcache && (tvolp->rootVnode == afid->Fid.Vnode)
2138         && (tvolp->rootUnique == afid->Fid.Unique)) {
2139         tvc->mvstat = 2;
2140     }
2141     if (tvc->mvstat == 2 && tvolp->dotdot.Fid.Volume != 0) {
2142         if (!tvc->mvid)
2143             tvc->mvid = (struct VenusFid *)
2144                 osi_AllocSmallSpace(sizeof(struct VenusFid));
2145         *tvc->mvid = tvolp->dotdot;
2146     }
2147
2148     /* stat the file */
2149     afs_RemoveVCB(afid);
2150
2151     if (!haveStatus) {
2152         struct VenusFid tfid;
2153
2154         tfid = *afid;
2155         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
2156         origCBs = afs_allCBs;   /* ignore InitCallBackState */
2157         code =
2158             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
2159                              &serverp, &tsync);
2160     }
2161
2162     if (code) {
2163         ObtainWriteLock(&afs_xcbhash, 467);
2164         afs_DequeueCallback(tvc);
2165         tvc->callback = NULL;
2166         tvc->states &= ~(CStatd | CUnique);
2167         ReleaseWriteLock(&afs_xcbhash);
2168         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
2169             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2170         ReleaseWriteLock(&tvc->lock);
2171         ObtainReadLock(&afs_xvcache);
2172         AFS_FAST_RELE(tvc);
2173         ReleaseReadLock(&afs_xvcache);
2174         return NULL;
2175     }
2176
2177     ObtainWriteLock(&afs_xcbhash, 468);
2178     if (origCBs == afs_allCBs) {
2179         tvc->states |= CTruth;
2180         tvc->callback = serverp;
2181         if (CallBack.ExpirationTime != 0) {
2182             tvc->cbExpires = CallBack.ExpirationTime + start;
2183             tvc->states |= CStatd;
2184             tvc->states &= ~CBulkFetching;
2185             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvolp);
2186         } else if (tvc->states & CRO) {
2187             /* adapt gives us an hour. */
2188             tvc->cbExpires = 3600 + osi_Time();
2189              /*XXX*/ tvc->states |= CStatd;
2190             tvc->states &= ~CBulkFetching;
2191             afs_QueueCallback(tvc, CBHash(3600), tvolp);
2192         }
2193     } else {
2194         afs_DequeueCallback(tvc);
2195         tvc->callback = NULL;
2196         tvc->states &= ~(CStatd | CUnique);
2197         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
2198             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2199     }
2200     ReleaseWriteLock(&afs_xcbhash);
2201     afs_ProcessFS(tvc, &OutStatus, areq);
2202
2203     ReleaseWriteLock(&tvc->lock);
2204     return tvc;
2205 }
2206
2207
2208
2209 /*
2210  * must be called with avc write-locked
2211  * don't absolutely have to invalidate the hint unless the dv has
2212  * changed, but be sure to get it right else there will be consistency bugs.
2213  */
2214 afs_int32
2215 afs_FetchStatus(struct vcache * avc, struct VenusFid * afid,
2216                 struct vrequest * areq, struct AFSFetchStatus * Outsp)
2217 {
2218     int code;
2219     afs_uint32 start = 0;
2220     register struct conn *tc;
2221     struct AFSCallBack CallBack;
2222     struct AFSVolSync tsync;
2223     struct volume *volp;
2224     XSTATS_DECLS;
2225     do {
2226         tc = afs_Conn(afid, areq, SHARED_LOCK);
2227         avc->quick.stamp = 0;
2228         avc->h1.dchint = NULL;  /* invalidate hints */
2229         if (tc) {
2230             avc->callback = tc->srvr->server;
2231             start = osi_Time();
2232             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_FETCHSTATUS);
2233             RX_AFS_GUNLOCK();
2234             code =
2235                 RXAFS_FetchStatus(tc->id, (struct AFSFid *)&afid->Fid, Outsp,
2236                                   &CallBack, &tsync);
2237             RX_AFS_GLOCK();
2238
2239             XSTATS_END_TIME;
2240
2241         } else
2242             code = -1;
2243     } while (afs_Analyze
2244              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_FETCHSTATUS,
2245               SHARED_LOCK, NULL));
2246
2247     if (!code) {
2248         afs_ProcessFS(avc, Outsp, areq);
2249         volp = afs_GetVolume(afid, areq, READ_LOCK);
2250         ObtainWriteLock(&afs_xcbhash, 469);
2251         avc->states |= CTruth;
2252         if (avc->callback /* check for race */ ) {
2253             if (CallBack.ExpirationTime != 0) {
2254                 avc->cbExpires = CallBack.ExpirationTime + start;
2255                 avc->states |= CStatd;
2256                 avc->states &= ~CBulkFetching;
2257                 afs_QueueCallback(avc, CBHash(CallBack.ExpirationTime), volp);
2258             } else if (avc->states & CRO) {     /* ordinary callback on a read-only volume -- AFS 3.2 style */
2259                 avc->cbExpires = 3600 + start;
2260                 avc->states |= CStatd;
2261                 avc->states &= ~CBulkFetching;
2262                 afs_QueueCallback(avc, CBHash(3600), volp);
2263             } else {
2264                 afs_DequeueCallback(avc);
2265                 avc->callback = NULL;
2266                 avc->states &= ~(CStatd | CUnique);
2267                 if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1))
2268                     osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
2269             }
2270         } else {
2271             afs_DequeueCallback(avc);
2272             avc->callback = NULL;
2273             avc->states &= ~(CStatd | CUnique);
2274             if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1))
2275                 osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
2276         }
2277         ReleaseWriteLock(&afs_xcbhash);
2278         if (volp)
2279             afs_PutVolume(volp, READ_LOCK);
2280     } else {
2281         /* used to undo the local callback, but that's too extreme.
2282          * There are plenty of good reasons that fetchstatus might return
2283          * an error, such as EPERM.  If we have the vnode cached, statd,
2284          * with callback, might as well keep track of the fact that we
2285          * don't have access...
2286          */
2287         if (code == EPERM || code == EACCES) {
2288             struct axscache *ac;
2289             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
2290                 ac->axess = 0;
2291             else                /* not found, add a new one if possible */
2292                 afs_AddAxs(avc->Access, areq->uid, 0);
2293         }
2294     }
2295     return code;
2296 }
2297
2298 #if 0
2299 /*
2300  * afs_StuffVcache
2301  *
2302  * Description:
2303  *      Stuff some information into the vcache for the given file.
2304  *
2305  * Parameters:
2306  *      afid      : File in question.
2307  *      OutStatus : Fetch status on the file.
2308  *      CallBack  : Callback info.
2309  *      tc        : RPC connection involved.
2310  *      areq      : vrequest involved.
2311  *
2312  * Environment:
2313  *      Nothing interesting.
2314  */
2315 void
2316 afs_StuffVcache(register struct VenusFid *afid,
2317                 struct AFSFetchStatus *OutStatus,
2318                 struct AFSCallBack *CallBack, register struct conn *tc,
2319                 struct vrequest *areq)
2320 {
2321     register afs_int32 code, i, newvcache = 0;
2322     register struct vcache *tvc;
2323     struct AFSVolSync tsync;
2324     struct volume *tvp;
2325     struct axscache *ac;
2326     afs_int32 retry;
2327
2328     AFS_STATCNT(afs_StuffVcache);
2329 #ifdef IFS_VCACHECOUNT
2330     ifs_gvcachecall++;
2331 #endif
2332
2333   loop:
2334     ObtainSharedLock(&afs_xvcache, 8);
2335
2336     tvc = afs_FindVCache(afid, &retry, DO_VLRU /* no stats */ );
2337     if (tvc && retry) {
2338 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2339         ReleaseSharedLock(&afs_xvcache);
2340         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2341         goto loop;
2342 #endif
2343     }
2344
2345     if (!tvc) {
2346         /* no cache entry, better grab one */
2347         UpgradeSToWLock(&afs_xvcache, 25);
2348         tvc = afs_NewVCache(afid, NULL);
2349         newvcache = 1;
2350         ConvertWToSLock(&afs_xvcache);
2351     }
2352
2353     ReleaseSharedLock(&afs_xvcache);
2354     ObtainWriteLock(&tvc->lock, 58);
2355
2356     tvc->states &= ~CStatd;
2357     if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
2358         osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
2359
2360     /* Is it always appropriate to throw away all the access rights? */
2361     afs_FreeAllAxs(&(tvc->Access));
2362
2363     /*Copy useful per-volume info */
2364     tvp = afs_GetVolume(afid, areq, READ_LOCK);
2365     if (tvp) {
2366         if (newvcache && (tvp->states & VForeign))
2367             tvc->states |= CForeign;
2368         if (tvp->states & VRO)
2369             tvc->states |= CRO;
2370         if (tvp->states & VBackup)
2371             tvc->states |= CBackup;
2372         /*
2373          * Now, copy ".." entry back out of volume structure, if
2374          * necessary
2375          */
2376         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
2377             if (!tvc->mvid)
2378                 tvc->mvid = (struct VenusFid *)
2379                     osi_AllocSmallSpace(sizeof(struct VenusFid));
2380             *tvc->mvid = tvp->dotdot;
2381         }
2382     }
2383     /* store the stat on the file */
2384     afs_RemoveVCB(afid);
2385     afs_ProcessFS(tvc, OutStatus, areq);
2386     tvc->callback = tc->srvr->server;
2387
2388     /* we use osi_Time twice below.  Ideally, we would use the time at which
2389      * the FetchStatus call began, instead, but we don't have it here.  So we
2390      * make do with "now".  In the CRO case, it doesn't really matter. In
2391      * the other case, we hope that the difference between "now" and when the
2392      * call actually began execution on the server won't be larger than the
2393      * padding which the server keeps.  Subtract 1 second anyway, to be on
2394      * the safe side.  Can't subtract more because we don't know how big
2395      * ExpirationTime is.  Possible consistency problems may arise if the call
2396      * timeout period becomes longer than the server's expiration padding.  */
2397     ObtainWriteLock(&afs_xcbhash, 470);
2398     if (CallBack->ExpirationTime != 0) {
2399         tvc->cbExpires = CallBack->ExpirationTime + osi_Time() - 1;
2400         tvc->states |= CStatd;
2401         tvc->states &= ~CBulkFetching;
2402         afs_QueueCallback(tvc, CBHash(CallBack->ExpirationTime), tvp);
2403     } else if (tvc->states & CRO) {
2404         /* old-fashioned AFS 3.2 style */
2405         tvc->cbExpires = 3600 + osi_Time();
2406          /*XXX*/ tvc->states |= CStatd;
2407         tvc->states &= ~CBulkFetching;
2408         afs_QueueCallback(tvc, CBHash(3600), tvp);
2409     } else {
2410         afs_DequeueCallback(tvc);
2411         tvc->callback = NULL;
2412         tvc->states &= ~(CStatd | CUnique);
2413         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1))
2414             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2415     }
2416     ReleaseWriteLock(&afs_xcbhash);
2417     if (tvp)
2418         afs_PutVolume(tvp, READ_LOCK);
2419
2420     /* look in per-pag cache */
2421     if (tvc->Access && (ac = afs_FindAxs(tvc->Access, areq->uid)))
2422         ac->axess = OutStatus->CallerAccess;    /* substitute pags */
2423     else                        /* not found, add a new one if possible */
2424         afs_AddAxs(tvc->Access, areq->uid, OutStatus->CallerAccess);
2425
2426     ReleaseWriteLock(&tvc->lock);
2427     afs_Trace4(afs_iclSetp, CM_TRACE_STUFFVCACHE, ICL_TYPE_POINTER, tvc,
2428                ICL_TYPE_POINTER, tvc->callback, ICL_TYPE_INT32,
2429                tvc->cbExpires, ICL_TYPE_INT32, tvc->cbExpires - osi_Time());
2430     /*
2431      * Release ref count... hope this guy stays around...
2432      */
2433     afs_PutVCache(tvc);
2434 }                               /*afs_StuffVcache */
2435 #endif
2436
2437 /*
2438  * afs_PutVCache
2439  *
2440  * Description:
2441  *      Decrements the reference count on a cache entry.
2442  *
2443  * Parameters:
2444  *      avc : Pointer to the cache entry to decrement.
2445  *
2446  * Environment:
2447  *      Nothing interesting.
2448  */
2449 void
2450 afs_PutVCache(register struct vcache *avc)
2451 {
2452     AFS_STATCNT(afs_PutVCache);
2453     /*
2454      * Can we use a read lock here?
2455      */
2456     ObtainReadLock(&afs_xvcache);
2457     AFS_FAST_RELE(avc);
2458     ReleaseReadLock(&afs_xvcache);
2459 }                               /*afs_PutVCache */
2460
2461 /*
2462  * afs_FindVCache
2463  *
2464  * Description:
2465  *      Find a vcache entry given a fid.
2466  *
2467  * Parameters:
2468  *      afid : Pointer to the fid whose cache entry we desire.
2469  *      retry: (SGI-specific) tell the caller to drop the lock on xvcache,
2470  *             unlock the vnode, and try again.
2471  *      flags: bit 1 to specify whether to compute hit statistics.  Not
2472  *             set if FindVCache is called as part of internal bookkeeping.
2473  *
2474  * Environment:
2475  *      Must be called with the afs_xvcache lock at least held at
2476  *      the read level.  In order to do the VLRU adjustment, the xvcache lock
2477  *      must be shared-- we upgrade it here.
2478  */
2479
2480 struct vcache *
2481 afs_FindVCache(struct VenusFid *afid, afs_int32 * retry, afs_int32 flag)
2482 {
2483
2484     register struct vcache *tvc;
2485     afs_int32 i;
2486
2487     AFS_STATCNT(afs_FindVCache);
2488
2489     i = VCHash(afid);
2490     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2491         if (FidMatches(afid, tvc)) {
2492 #ifdef  AFS_OSF_ENV
2493             /* Grab this vnode, possibly reactivating from the free list */
2494             int vg;
2495             AFS_GUNLOCK();
2496             vg = vget(AFSTOV(tvc));
2497             AFS_GLOCK();
2498             if (vg)
2499                 continue;
2500 #endif /* AFS_OSF_ENV */
2501             break;
2502         }
2503     }
2504
2505     /* should I have a read lock on the vnode here? */
2506     if (tvc) {
2507         if (retry)
2508             *retry = 0;
2509 #if !defined(AFS_OSF_ENV)
2510         osi_vnhold(tvc, retry); /* already held, above */
2511         if (retry && *retry)
2512             return 0;
2513 #endif
2514 #ifdef AFS_DARWIN_ENV
2515         tvc->states |= CUBCinit;
2516         AFS_GUNLOCK();
2517         if (UBCINFOMISSING(AFSTOV(tvc)) ||
2518             UBCINFORECLAIMED(AFSTOV(tvc))) {
2519           ubc_info_init(AFSTOV(tvc));
2520         }
2521         AFS_GLOCK();
2522         tvc->states &= ~CUBCinit;
2523 #endif
2524         /*
2525          * only move to front of vlru if we have proper vcache locking)
2526          */
2527         if (flag & DO_VLRU) {
2528             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2529                 refpanic("FindVC VLRU inconsistent1");
2530             }
2531             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2532                 refpanic("FindVC VLRU inconsistent1");
2533             }
2534             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2535                 refpanic("FindVC VLRU inconsistent2");
2536             }
2537             UpgradeSToWLock(&afs_xvcache, 26);
2538             QRemove(&tvc->vlruq);
2539             QAdd(&VLRU, &tvc->vlruq);
2540             ConvertWToSLock(&afs_xvcache);
2541             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2542                 refpanic("FindVC VLRU inconsistent1");
2543             }
2544             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2545                 refpanic("FindVC VLRU inconsistent2");
2546             }
2547             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2548                 refpanic("FindVC VLRU inconsistent3");
2549             }
2550         }
2551         vcachegen++;
2552     }
2553
2554     if (flag & DO_STATS) {
2555         if (tvc)
2556             afs_stats_cmperf.vcacheHits++;
2557         else
2558             afs_stats_cmperf.vcacheMisses++;
2559         if (afs_IsPrimaryCellNum(afid->Cell))
2560             afs_stats_cmperf.vlocalAccesses++;
2561         else
2562             afs_stats_cmperf.vremoteAccesses++;
2563     }
2564 #ifdef AFS_LINUX22_ENV
2565     if (tvc && (tvc->states & CStatd))
2566         vcache2inode(tvc);      /* mainly to reset i_nlink */
2567 #endif
2568     return tvc;
2569 }                               /*afs_FindVCache */
2570
2571 /*
2572  * afs_NFSFindVCache
2573  *
2574  * Description:
2575  *      Find a vcache entry given a fid. Does a wildcard match on what we
2576  *      have for the fid. If more than one entry, don't return anything.
2577  *
2578  * Parameters:
2579  *      avcp : Fill in pointer if we found one and only one.
2580  *      afid : Pointer to the fid whose cache entry we desire.
2581  *      retry: (SGI-specific) tell the caller to drop the lock on xvcache,
2582  *             unlock the vnode, and try again.
2583  *      flags: bit 1 to specify whether to compute hit statistics.  Not
2584  *             set if FindVCache is called as part of internal bookkeeping.
2585  *
2586  * Environment:
2587  *      Must be called with the afs_xvcache lock at least held at
2588  *      the read level.  In order to do the VLRU adjustment, the xvcache lock
2589  *      must be shared-- we upgrade it here.
2590  *
2591  * Return value:
2592  *      number of matches found.
2593  */
2594
2595 int afs_duplicate_nfs_fids = 0;
2596
2597 afs_int32
2598 afs_NFSFindVCache(struct vcache **avcp, struct VenusFid *afid)
2599 {
2600     register struct vcache *tvc;
2601     afs_int32 i;
2602     afs_int32 count = 0;
2603     struct vcache *found_tvc = NULL;
2604
2605     AFS_STATCNT(afs_FindVCache);
2606
2607 #if defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2608   loop:
2609 #endif
2610
2611     ObtainSharedLock(&afs_xvcache, 331);
2612
2613     i = VCHash(afid);
2614     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2615         /* Match only on what we have.... */
2616         if (((tvc->fid.Fid.Vnode & 0xffff) == afid->Fid.Vnode)
2617             && (tvc->fid.Fid.Volume == afid->Fid.Volume)
2618             && ((tvc->fid.Fid.Unique & 0xffffff) == afid->Fid.Unique)
2619             && (tvc->fid.Cell == afid->Cell)) {
2620 #ifdef  AFS_OSF_ENV
2621             /* Grab this vnode, possibly reactivating from the free list */
2622             int vg;
2623             AFS_GUNLOCK();
2624             vg = vget(AFSTOV(tvc));
2625             AFS_GLOCK();
2626             if (vg) {
2627                 /* This vnode no longer exists. */
2628                 continue;
2629             }
2630 #endif /* AFS_OSF_ENV */
2631             count++;
2632             if (found_tvc) {
2633                 /* Duplicates */
2634 #ifdef AFS_OSF_ENV
2635                 /* Drop our reference counts. */
2636                 vrele(AFSTOV(tvc));
2637                 vrele(AFSTOV(found_tvc));
2638 #endif
2639                 afs_duplicate_nfs_fids++;
2640                 ReleaseSharedLock(&afs_xvcache);
2641                 return count;
2642             }
2643             found_tvc = tvc;
2644         }
2645     }
2646
2647     tvc = found_tvc;
2648     /* should I have a read lock on the vnode here? */
2649     if (tvc) {
2650 #if defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2651         afs_int32 retry = 0;
2652         osi_vnhold(tvc, &retry);
2653         if (retry) {
2654             count = 0;
2655             found_tvc = (struct vcache *)0;
2656             ReleaseSharedLock(&afs_xvcache);
2657             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2658             goto loop;
2659         }
2660 #else
2661 #if !defined(AFS_OSF_ENV)
2662         osi_vnhold(tvc, (int *)0);      /* already held, above */
2663 #endif
2664 #endif
2665         /*
2666          * We obtained the xvcache lock above.
2667          */
2668         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2669             refpanic("FindVC VLRU inconsistent1");
2670         }
2671         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2672             refpanic("FindVC VLRU inconsistent1");
2673         }
2674         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2675             refpanic("FindVC VLRU inconsistent2");
2676         }
2677         UpgradeSToWLock(&afs_xvcache, 568);
2678         QRemove(&tvc->vlruq);
2679         QAdd(&VLRU, &tvc->vlruq);
2680         ConvertWToSLock(&afs_xvcache);
2681         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2682             refpanic("FindVC VLRU inconsistent1");
2683         }
2684         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2685             refpanic("FindVC VLRU inconsistent2");
2686         }
2687         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2688             refpanic("FindVC VLRU inconsistent3");
2689         }
2690     }
2691     vcachegen++;
2692
2693     if (tvc)
2694         afs_stats_cmperf.vcacheHits++;
2695     else
2696         afs_stats_cmperf.vcacheMisses++;
2697     if (afs_IsPrimaryCellNum(afid->Cell))
2698         afs_stats_cmperf.vlocalAccesses++;
2699     else
2700         afs_stats_cmperf.vremoteAccesses++;
2701
2702     *avcp = tvc;                /* May be null */
2703
2704     ReleaseSharedLock(&afs_xvcache);
2705     return (tvc ? 1 : 0);
2706
2707 }                               /*afs_NFSFindVCache */
2708
2709
2710
2711
2712 /*
2713  * afs_vcacheInit
2714  *
2715  * Initialize vcache related variables
2716  */
2717 void
2718 afs_vcacheInit(int astatSize)
2719 {
2720     register struct vcache *tvp;
2721     int i;
2722 #if     defined(AFS_OSF_ENV)
2723     if (!afs_maxvcount) {
2724 #if     defined(AFS_OSF30_ENV)
2725         afs_maxvcount = max_vnodes / 2; /* limit ourselves to half the total */
2726 #else
2727         afs_maxvcount = nvnode / 2;     /* limit ourselves to half the total */
2728 #endif
2729         if (astatSize < afs_maxvcount) {
2730             afs_maxvcount = astatSize;
2731         }
2732     }
2733 #else /* AFS_OSF_ENV */
2734     freeVCList = NULL;
2735 #endif
2736
2737     RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2738     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2739
2740 #if     !defined(AFS_OSF_ENV)
2741 #ifdef AFS_LINUX26_ENV
2742     printf("old style would have needed %d contiguous bytes\n", astatSize *
2743            sizeof(struct vcache));
2744     Initial_freeVCList = freeVCList = tvp = (struct vcache *)
2745         afs_osi_Alloc(sizeof(struct vcache));
2746     for (i = 0; i < astatSize; i++) {
2747         tvp->nextfree = (struct vcache *) afs_osi_Alloc(sizeof(struct vcache));
2748         tvp = tvp->nextfree;
2749     }
2750     tvp->nextfree = NULL;
2751 #else
2752     /* Allocate and thread the struct vcache entries */
2753     tvp = (struct vcache *)afs_osi_Alloc(astatSize * sizeof(struct vcache));
2754     memset((char *)tvp, 0, sizeof(struct vcache) * astatSize);
2755
2756     Initial_freeVCList = tvp;
2757     freeVCList = &(tvp[0]);
2758     for (i = 0; i < astatSize - 1; i++) {
2759         tvp[i].nextfree = &(tvp[i + 1]);
2760     }
2761     tvp[astatSize - 1].nextfree = NULL;
2762 #ifdef  KERNEL_HAVE_PIN
2763     pin((char *)tvp, astatSize * sizeof(struct vcache));        /* XXX */
2764 #endif
2765 #endif
2766 #endif
2767
2768 #if defined(AFS_SGI_ENV)
2769     for (i = 0; i < astatSize; i++) {
2770         char name[METER_NAMSZ];
2771         struct vcache *tvc = &tvp[i];
2772
2773         tvc->v.v_number = ++afsvnumbers;
2774         tvc->vc_rwlockid = OSI_NO_LOCKID;
2775         initnsema(&tvc->vc_rwlock, 1,
2776                   makesname(name, "vrw", tvc->v.v_number));
2777 #ifndef AFS_SGI53_ENV
2778         initnsema(&tvc->v.v_sync, 0, makesname(name, "vsy", tvc->v.v_number));
2779 #endif
2780 #ifndef AFS_SGI62_ENV
2781         initnlock(&tvc->v.v_lock, makesname(name, "vlk", tvc->v.v_number));
2782 #endif /* AFS_SGI62_ENV */
2783     }
2784 #endif
2785
2786     QInit(&VLRU);
2787
2788
2789 }
2790
2791 /*
2792  * shutdown_vcache
2793  *
2794  */
2795 void
2796 shutdown_vcache(void)
2797 {
2798     int i;
2799     struct afs_cbr *tsp, *nsp;
2800     /*
2801      * XXX We may potentially miss some of the vcaches because if when there're no
2802      * free vcache entries and all the vcache entries are active ones then we allocate
2803      * an additional one - admittedly we almost never had that occur.
2804      */
2805
2806     {
2807         register struct afs_q *tq, *uq;
2808         register struct vcache *tvc;
2809         for (tq = VLRU.prev; tq != &VLRU; tq = uq) {
2810             tvc = QTOV(tq);
2811             uq = QPrev(tq);
2812             if (tvc->mvid) {
2813                 osi_FreeSmallSpace(tvc->mvid);
2814                 tvc->mvid = (struct VenusFid *)0;
2815             }
2816 #ifdef  AFS_AIX_ENV
2817             aix_gnode_rele(AFSTOV(tvc));
2818 #endif
2819             if (tvc->linkData) {
2820                 afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2821                 tvc->linkData = 0;
2822             }
2823         }
2824         /*
2825          * Also free the remaining ones in the Cache
2826          */
2827         for (i = 0; i < VCSIZE; i++) {
2828             for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2829                 if (tvc->mvid) {
2830                     osi_FreeSmallSpace(tvc->mvid);
2831                     tvc->mvid = (struct VenusFid *)0;
2832                 }
2833 #ifdef  AFS_AIX_ENV
2834                 if (tvc->v.v_gnode)
2835                     afs_osi_Free(tvc->v.v_gnode, sizeof(struct gnode));
2836 #ifdef  AFS_AIX32_ENV
2837                 if (tvc->segid) {
2838                     AFS_GUNLOCK();
2839                     vms_delete(tvc->segid);
2840                     AFS_GLOCK();
2841                     tvc->segid = tvc->vmh = NULL;
2842                     if (VREFCOUNT(tvc))
2843                         osi_Panic("flushVcache: vm race");
2844                 }
2845                 if (tvc->credp) {
2846                     crfree(tvc->credp);
2847                     tvc->credp = NULL;
2848                 }
2849 #endif
2850 #endif
2851 #if     defined(AFS_SUN5_ENV)
2852                 if (tvc->credp) {
2853                     crfree(tvc->credp);
2854                     tvc->credp = NULL;
2855                 }
2856 #endif
2857                 if (tvc->linkData) {
2858                     afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2859                     tvc->linkData = 0;
2860                 }
2861
2862                 afs_FreeAllAxs(&(tvc->Access));
2863             }
2864             afs_vhashT[i] = 0;
2865         }
2866     }
2867     /*
2868      * Free any leftover callback queue
2869      */
2870     for (tsp = afs_cbrSpace; tsp; tsp = nsp) {
2871         nsp = tsp->next;
2872         afs_osi_Free((char *)tsp, AFS_NCBRS * sizeof(struct afs_cbr));
2873     }
2874     afs_cbrSpace = 0;
2875
2876 #ifdef AFS_LINUX26_ENV
2877     {
2878         struct vcache *tvp = Initial_freeVCList;
2879         while (tvp) {
2880             struct vcache *next = tvp->nextfree;
2881             
2882             afs_osi_Free(tvp, sizeof(struct vcache));
2883             tvp = next;
2884         }
2885     }
2886 #else
2887 #ifdef  KERNEL_HAVE_PIN
2888     unpin(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2889 #endif
2890 #if     !defined(AFS_OSF_ENV)
2891     afs_osi_Free(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2892 #endif
2893 #endif
2894
2895 #if     !defined(AFS_OSF_ENV)
2896     freeVCList = Initial_freeVCList = 0;
2897 #endif
2898     RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2899     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2900     QInit(&VLRU);
2901
2902 }