linux-dcache-cleanup-aggressively-to-avoid-having-too-many-vcache-entries-locked...
[openafs.git] / src / afs / afs_vcache.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * Implements:
12  * afs_FlushVCache
13  * afs_AllocCBR
14  * afs_FreeCBR
15  * afs_FlushVCBs
16  * afs_QueueVCB
17  * afs_RemoveVCB
18  * afs_NewVCache
19  * afs_FlushActiveVcaches
20  * afs_VerifyVCache2
21  * afs_WriteVCache
22  * afs_SimpleVStat
23  * afs_ProcessFS
24  * TellALittleWhiteLie
25  * afs_RemoteLookup
26  * afs_GetVCache
27  * afs_LookupVCache
28  * afs_GetRootVCache
29  * afs_FetchStatus
30  * afs_StuffVcache
31  * afs_PutVCache
32  * afs_FindVCache
33  * afs_NFSFindVCache
34  * afs_vcacheInit
35  * shutdown_vcache
36  *
37  */
38 #include <afsconfig.h>
39 #include "../afs/param.h"
40
41 RCSID("$Header$");
42
43 #include "../afs/sysincludes.h" /*Standard vendor system headers*/
44 #include "../afs/afsincludes.h" /*AFS-based standard headers*/
45 #include "../afs/afs_stats.h"
46 #include "../afs/afs_cbqueue.h"
47 #include "../afs/afs_osidnlc.h"
48
49 #ifdef AFS_OSF_ENV
50 afs_int32 afs_maxvcount = 0;            /* max number of vcache entries */
51 afs_int32 afs_vcount = 0;                       /* number of vcache in use now */
52 #if     defined(AFS_OSF30_ENV)
53 extern int max_vnodes;                  /* number of total system vnodes */
54 #else
55 extern int nvnode;                      /* number of total system vnodes */
56 #endif 
57 #ifndef AFS_OSF30_ENV
58 extern int numvnodes;                   /* number vnodes in use now */ 
59 #endif
60 #endif /* AFS_OSF_ENV */
61 #ifdef AFS_SGI_ENV
62 int afsvnumbers = 0;
63 #endif
64
65 /* Imported variables */
66 extern struct server *afs_servers[NSERVERS];
67 extern afs_rwlock_t afs_xserver;
68 extern afs_rwlock_t afs_xcbhash;
69 extern struct vcache *afs_globalVp;
70 #ifdef AFS_OSF_ENV
71 extern struct mount *afs_globalVFS;
72 extern struct vnodeops Afs_vnodeops;
73 #elif defined(AFS_DARWIN_ENV)
74 extern struct mount *afs_globalVFS;
75 #else
76 extern struct vfs *afs_globalVFS;
77 #endif /* AFS_OSF_ENV */
78 #if     defined(AFS_DUX40_ENV)
79 extern struct vfs_ubcops afs_ubcops;
80 #endif
81 #ifdef AFS_SGI62_ENV
82 extern struct vnodeops Afs_vnodeops;
83 #endif
84 #ifdef AFS_SGI64_ENV
85 char *makesname();
86 #endif /* AFS_SGI64_ENV */
87  
88 /* Exported variables */
89 afs_rwlock_t afs_xvcache;               /*Lock: alloc new stat cache entries*/
90 afs_lock_t afs_xvcb;                    /*Lock: fids on which there are callbacks*/
91 struct vcache *freeVCList;              /*Free list for stat cache entries*/
92 struct vcache *Initial_freeVCList;      /*Initial list for above*/
93 struct afs_q VLRU;                      /*vcache LRU*/
94 afs_int32 vcachegen = 0;
95 unsigned int afs_paniconwarn = 0;
96 struct vcache *afs_vhashT[VCSIZE];
97 afs_int32 afs_bulkStatsLost;
98 int afs_norefpanic = 0;
99
100 /* Forward declarations */
101 static afs_int32 afs_QueueVCB(struct vcache *avc);
102
103
104 /*
105  * afs_FlushVCache
106  *
107  * Description:
108  *      Flush the given vcache entry.
109  *
110  * Parameters:
111  *      avc : Pointer to vcache entry to flush.
112  *      slept : Pointer to int to set 1 if we sleep/drop locks, 0 if we don't.
113  *
114  * Environment:
115  *      afs_xvcache lock must be held for writing upon entry to
116  *      prevent people from changing the vrefCount field, and to
117  *      protect the lruq and hnext fields.
118  * LOCK: afs_FlushVCache afs_xvcache W 
119  * REFCNT: vcache ref count must be zero on entry except for osf1
120  * RACE: lock is dropped and reobtained, permitting race in caller
121  */
122
123 int afs_FlushVCache(struct vcache *avc, int *slept)
124 { /*afs_FlushVCache*/
125
126     register afs_int32 i, code;
127     register struct vcache **uvc, *wvc, *tvc;
128
129     *slept = 0;
130     AFS_STATCNT(afs_FlushVCache);
131     afs_Trace2(afs_iclSetp, CM_TRACE_FLUSHV, ICL_TYPE_POINTER, avc,
132                ICL_TYPE_INT32, avc->states);
133 #ifdef  AFS_OSF_ENV
134     AFS_GUNLOCK();
135     VN_LOCK((struct vnode *)avc);
136     AFS_GLOCK();
137 #endif
138
139     code = osi_VM_FlushVCache(avc, slept);
140     if (code)
141         goto bad;
142
143     if (avc->states & CVFlushed) {
144         code = EBUSY;
145         goto bad;
146     }
147     if (avc->nextfree || !avc->vlruq.prev || !avc->vlruq.next) { /* qv afs.h */
148       refpanic ("LRU vs. Free inconsistency");
149     }
150     avc->states |= CVFlushed;
151     /* pull the entry out of the lruq and put it on the free list */
152     QRemove(&avc->vlruq);
153     avc->vlruq.prev = avc->vlruq.next = (struct afs_q *) 0;
154
155     /* keep track of # of files that we bulk stat'd, but never used
156      * before they got recycled.
157      */
158     if (avc->states & CBulkStat)
159         afs_bulkStatsLost++;
160     vcachegen++;
161     /* remove entry from the hash chain */
162     i = VCHash(&avc->fid);
163     uvc = &afs_vhashT[i];
164     for(wvc = *uvc; wvc; uvc = &wvc->hnext, wvc = *uvc) {
165         if (avc == wvc) {
166             *uvc = avc->hnext;
167             avc->hnext = (struct vcache *) NULL;
168             break;
169         }
170     }
171     if (!wvc) osi_Panic("flushvcache"); /* not in correct hash bucket */
172     if (avc->mvid) osi_FreeSmallSpace(avc->mvid);
173     avc->mvid = (struct VenusFid*)0;
174     if (avc->linkData) {
175       afs_osi_Free(avc->linkData, strlen(avc->linkData)+1);
176       avc->linkData = NULL;
177     }
178     afs_FreeAllAxs(&(avc->Access));
179
180     /* we can't really give back callbacks on RO files, since the 
181      * server only tracks them on a per-volume basis, and we don't
182      * know whether we still have some other files from the same
183      * volume. */
184     if ((avc->states & CRO) == 0 && avc->callback) {
185         afs_QueueVCB(avc);
186     }
187     ObtainWriteLock(&afs_xcbhash, 460);
188     afs_DequeueCallback(avc);  /* remove it from queued callbacks list */
189     avc->states &= ~(CStatd | CUnique);
190     ReleaseWriteLock(&afs_xcbhash);
191     afs_symhint_inval(avc);
192     if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1)) 
193       osi_dnlc_purgedp (avc);  /* if it (could be) a directory */
194     else 
195       osi_dnlc_purgevp (avc);
196
197     /*
198      * Next, keep track of which vnodes we've deleted for create's
199      * optimistic synchronization algorithm
200      */
201     afs_allZaps++;
202     if (avc->fid.Fid.Vnode & 1) afs_oddZaps++;
203     else afs_evenZaps++;
204
205 #if     !defined(AFS_OSF_ENV)
206     /* put the entry in the free list */
207     avc->nextfree = freeVCList;
208     freeVCList = avc;
209     if (avc->vlruq.prev || avc->vlruq.next) {
210        refpanic ("LRU vs. Free inconsistency");
211     }
212 #else 
213     /* This should put it back on the vnode free list since usecount is 1 */
214     afs_vcount--;
215     vSetType(avc, VREG);
216     if (VREFCOUNT(avc) > 0) {
217         VN_UNLOCK((struct vnode *)avc);
218         AFS_RELE((struct vnode *)avc);
219     } else {
220        if (afs_norefpanic) {
221           printf ("flush vc refcnt < 1");
222           afs_norefpanic++;
223           (void) vgone(avc, VX_NOSLEEP, (struct vnodeops *) 0);
224           AFS_GLOCK();
225           VN_UNLOCK((struct vnode *)avc);
226        }
227        else osi_Panic ("flush vc refcnt < 1");
228     }
229 #endif  /* AFS_OSF_ENV */
230     avc->states |= CVFlushed;
231     return 0;
232
233 bad:
234 #ifdef  AFS_OSF_ENV
235     VN_UNLOCK((struct vnode *)avc);
236 #endif
237     return code;
238
239 } /*afs_FlushVCache*/
240
241 #ifndef AFS_SGI_ENV
242 /*
243  * afs_InactiveVCache
244  *
245  * The core of the inactive vnode op for all but IRIX.
246  */
247 void afs_InactiveVCache(struct vcache *avc, struct AFS_UCRED *acred)
248 {
249     extern afs_rwlock_t afs_xdcache, afs_xvcache;
250     
251     AFS_STATCNT(afs_inactive);
252     if (avc->states & CDirty) {
253       /* we can't keep trying to push back dirty data forever.  Give up. */
254       afs_InvalidateAllSegments(avc, 1/*set lock*/);  /* turns off dirty bit */
255     }
256     avc->states &= ~CMAPPED;    /* mainly used by SunOS 4.0.x */
257     avc->states &= ~CDirty;     /* Turn it off */
258     if (avc->states & CUnlinked) {
259         if (CheckLock(&afs_xvcache) || CheckLock(&afs_xdcache)) { 
260             avc->states |= CUnlinkedDel;
261             return; 
262         }
263         afs_remunlink(avc, 1);  /* ignore any return code */
264     }
265
266 }
267 #endif
268
269 /*
270  * afs_AllocCBR
271  *
272  * Description: allocate a callback return structure from the
273  * free list and return it.
274  *
275  * Env: The alloc and free routines are both called with the afs_xvcb lock
276  * held, so we don't have to worry about blocking in osi_Alloc.
277  */
278 static struct afs_cbr *afs_cbrSpace = 0;
279 struct afs_cbr *afs_AllocCBR() {
280     register struct afs_cbr *tsp;
281     int i;
282
283     while (!afs_cbrSpace) {
284         if (afs_stats_cmperf.CallBackAlloced >= 2) {
285             /* don't allocate more than 2 * AFS_NCBRS for now */
286             afs_FlushVCBs(0);
287             afs_stats_cmperf.CallBackFlushes++;
288         }
289         else {
290             /* try allocating */
291             tsp = (struct afs_cbr *) afs_osi_Alloc(AFS_NCBRS * sizeof(struct afs_cbr));
292             for(i=0; i < AFS_NCBRS-1; i++) {
293                 tsp[i].next = &tsp[i+1];
294             }
295             tsp[AFS_NCBRS-1].next = 0;
296             afs_cbrSpace = tsp;
297             afs_stats_cmperf.CallBackAlloced++;
298         }
299     }
300     tsp = afs_cbrSpace;
301     afs_cbrSpace = tsp->next;
302     return tsp;
303 }
304
305 /*
306  * afs_FreeCBR
307  *
308  * Description: free a callback return structure.
309  *
310  * Parameters:
311  *      asp -- the address of the structure to free.
312  *
313  * Environment: the xvcb lock is held over these calls.
314  */
315 afs_FreeCBR(asp)
316 register struct afs_cbr *asp; {
317     asp->next = afs_cbrSpace;
318     afs_cbrSpace = asp;
319     return 0;
320 }
321
322 /*
323  * afs_FlushVCBs
324  *
325  * Description: flush all queued callbacks to all servers.
326  *
327  * Parameters: none.
328  *
329  * Environment: holds xvcb lock over RPC to guard against race conditions
330  *      when a new callback is granted for the same file later on.
331  */
332 afs_int32 afs_FlushVCBs (afs_int32 lockit) 
333 {
334     struct AFSFid tfids[AFS_MAXCBRSCALL];
335     struct AFSCallBack callBacks[1];
336     struct AFSCBFids fidArray;
337     struct AFSCBs cbArray;
338     afs_int32 code;
339     struct afs_cbr *tcbrp;
340     int tcount;
341     struct server *tsp;
342     int i;
343     struct vrequest treq;
344     struct conn *tc;
345     int safety1, safety2, safety3;
346     extern int afs_totalServers;
347     XSTATS_DECLS
348
349     if (code = afs_InitReq(&treq, &afs_osi_cred)) return code;
350     treq.flags |= O_NONBLOCK;
351
352     if (lockit) MObtainWriteLock(&afs_xvcb,273);
353     ObtainReadLock(&afs_xserver);
354     for(i=0; i<NSERVERS; i++) {
355         for(safety1 = 0, tsp = afs_servers[i];
356             tsp && safety1 < afs_totalServers+10; tsp=tsp->next, safety1++) { 
357             /* don't have any */
358             if (tsp->cbrs == (struct afs_cbr *) 0) continue;
359
360             /* otherwise, grab a block of AFS_MAXCBRSCALL from the list
361              * and make an RPC, over and over again.
362              */
363             tcount = 0; /* number found so far */
364             for (safety2 = 0; safety2 < afs_cacheStats ; safety2++) {
365                 if (tcount >= AFS_MAXCBRSCALL || !tsp->cbrs) {
366                     /* if buffer is full, or we've queued all we're going
367                      * to from this server, we should flush out the
368                      * callbacks.
369                      */
370                     fidArray.AFSCBFids_len = tcount;
371                     fidArray.AFSCBFids_val = (struct AFSFid *) tfids;
372                     cbArray.AFSCBs_len = 1;
373                     cbArray.AFSCBs_val = callBacks;
374                     callBacks[0].CallBackType = CB_EXCLUSIVE;
375                     for (safety3 = 0; safety3 < MAXHOSTS*2; safety3++) {
376                         tc = afs_ConnByHost(tsp, tsp->cell->fsport,
377                                             tsp->cell->cell, &treq, 0,
378                                             SHARED_LOCK);
379                         if (tc) {
380                           XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS);
381 #ifdef RX_ENABLE_LOCKS
382                           AFS_GUNLOCK();
383 #endif /* RX_ENABLE_LOCKS */
384                           code = RXAFS_GiveUpCallBacks(tc->id, &fidArray,
385                                                        &cbArray);
386 #ifdef RX_ENABLE_LOCKS
387                           AFS_GLOCK();
388 #endif /* RX_ENABLE_LOCKS */
389                           XSTATS_END_TIME;
390                         }
391                         else code = -1;
392                         if (!afs_Analyze(tc, code, 0, &treq,
393                                      AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS,
394                                      SHARED_LOCK, tsp->cell)) {
395                            break;
396                         }
397                     }
398                     /* ignore return code, since callbacks may have
399                      * been returned anyway, we shouldn't leave them
400                      * around to be returned again.
401                      *
402                      * Next, see if we are done with this server, and if so,
403                      * break to deal with the next one.
404                      */
405                     if (!tsp->cbrs) break;
406                     tcount = 0;
407                 }       /* if to flush full buffer */
408                 /* if we make it here, we have an entry at the head of cbrs,
409                  * which we should copy to the file ID array and then free.
410                  */
411                 tcbrp = tsp->cbrs;
412                 tfids[tcount++] = tcbrp->fid;
413                 tsp->cbrs = tcbrp->next;
414                 afs_FreeCBR(tcbrp);
415             }           /* while loop for this one server */
416             if (safety2 > afs_cacheStats) {
417               afs_warn("possible internal error afs_flushVCBs (%d)\n", safety2);
418             }
419         }               /* for loop for this hash chain */
420     }                   /* loop through all hash chains */
421     if (safety1 > afs_totalServers+2)  {
422        afs_warn("AFS internal error (afs_flushVCBs) (%d > %d), continuing...\n", safety1, afs_totalServers+2);
423        if (afs_paniconwarn)
424          osi_Panic("afs_flushVCBS safety1");
425     }
426
427     ReleaseReadLock(&afs_xserver);
428     if (lockit) MReleaseWriteLock(&afs_xvcb);
429     return 0;
430 }
431
432 /*
433  * afs_QueueVCB
434  *
435  * Description:
436  *      Queue a callback on the given fid.
437  *
438  * Parameters:
439  *      avc: vcache entry
440  *
441  * Environment:
442  *      Locks the xvcb lock.
443  *      Called when the xvcache lock is already held.
444  */
445
446 static afs_int32 afs_QueueVCB(struct vcache *avc)
447 {
448     register struct server *tsp;
449     register struct afs_cbr *tcbp;
450
451     AFS_STATCNT(afs_QueueVCB);
452     /* The callback is really just a struct server ptr. */
453     tsp = (struct server *)(avc->callback);
454
455     /* we now have a pointer to the server, so we just allocate
456      * a queue entry and queue it.
457      */
458     MObtainWriteLock(&afs_xvcb,274);
459     tcbp = afs_AllocCBR();
460     tcbp->fid = avc->fid.Fid;
461     tcbp->next = tsp->cbrs;
462     tsp->cbrs = tcbp;
463
464     /* now release locks and return */
465     MReleaseWriteLock(&afs_xvcb);
466     return 0;
467 }
468
469
470 /*
471  * afs_RemoveVCB
472  *
473  * Description:
474  *      Remove a queued callback by looking through all the servers
475  *      to see if any have this callback queued.
476  *
477  * Parameters:
478  *      afid: The fid we want cleansed of queued callbacks.
479  *
480  * Environment:
481  *      Locks xvcb and xserver locks.
482  *      Typically called with xdcache, xvcache and/or individual vcache
483  *      entries locked.
484  */
485
486 afs_RemoveVCB(afid)
487     register struct VenusFid *afid;
488
489 { /*afs_RemoveVCB*/
490
491     register int i, j;
492     register struct server *tsp;
493     register struct afs_cbr *tcbrp;
494     struct afs_cbr **lcbrpp;
495
496     AFS_STATCNT(afs_RemoveVCB);
497     MObtainWriteLock(&afs_xvcb,275);
498     ObtainReadLock(&afs_xserver);
499     for(i=0;i<NSERVERS;i++) {
500         for(tsp=afs_servers[i]; tsp; tsp=tsp->next) {
501             /* if cell is known, and is wrong, then skip this server */
502             if (tsp->cell && tsp->cell->cell != afid->Cell) continue;
503
504             /*
505              * Otherwise, iterate through file IDs we're sending to the
506              * server.
507              */
508             lcbrpp = &tsp->cbrs;        /* first queued return callback */
509             for(tcbrp = *lcbrpp; tcbrp; lcbrpp = &tcbrp->next, tcbrp = *lcbrpp) {
510                 if (afid->Fid.Volume == tcbrp->fid.Volume &&
511                     afid->Fid.Unique == tcbrp->fid.Unique &&
512                     afid->Fid.Vnode == tcbrp->fid.Vnode) {
513                     *lcbrpp = tcbrp->next;      /* unthread from list */
514                     afs_FreeCBR(tcbrp);
515                     goto done;
516                 }
517             }
518         }
519     }
520   done:
521     ReleaseReadLock(&afs_xserver);
522     MReleaseWriteLock(&afs_xvcb);
523     return 0;
524
525 } /*afs_RemoveVCB*/
526
527
528
529 /*
530  * afs_NewVCache
531  *
532  * Description:
533  *      This routine is responsible for allocating a new cache entry
534  *      from the free list.  It formats the cache entry and inserts it
535  *      into the appropriate hash tables.  It must be called with
536  *      afs_xvcache write-locked so as to prevent several processes from
537  *      trying to create a new cache entry simultaneously.
538  *
539  * Parameters:
540  *      afid  : The file id of the file whose cache entry is being
541  *              created.
542  */
543 /* LOCK: afs_NewVCache  afs_xvcache W */ 
544 struct vcache *afs_NewVCache(struct VenusFid *afid, struct server *serverp,
545                              afs_int32 lockit, afs_int32 locktype)
546 {
547     struct vcache *tvc;
548     afs_int32 i;
549     afs_int32 anumber = VCACHE_FREE;
550 #ifdef  AFS_AIX_ENV
551     struct gnode *gnodepnt;
552 #endif
553 #ifdef  AFS_MACH_ENV
554     struct vm_info * vm_info_ptr;
555 #endif /* AFS_MACH_ENV */
556 #ifdef  AFS_OSF_ENV
557     struct vcache *nvc;
558 #endif  /* AFS_OSF_ENV */
559     struct afs_q *tq, *uq;
560     int code, fv_slept;
561
562     AFS_STATCNT(afs_NewVCache);
563 #ifdef AFS_LINUX22_ENV
564     if (!freeVCList) {
565         /* Free some if possible. */
566          struct afs_q *tq, *uq;
567          int i; char *panicstr;
568          int vmax = 2 * afs_cacheStats;
569          int vn = VCACHE_FREE;
570
571          AFS_GUNLOCK();
572          shrink_dcache_sb(afs_globalVFS);
573          AFS_GLOCK();
574
575          i = 0;
576          for(tq = VLRU.prev; tq != &VLRU && vn > 0; tq = uq) {
577             tvc = QTOV(tq);
578             uq = QPrev(tq);
579             if (tvc->states & CVFlushed) 
580                  refpanic ("CVFlushed on VLRU");
581             else if (i++ > vmax)
582                  refpanic ("Exceeded pool of AFS vnodes(VLRU cycle?)");
583             else if (QNext(uq) != tq)
584                  refpanic ("VLRU inconsistent");
585
586             if (tvc == afs_globalVp)
587                 continue;
588
589             if ( VREFCOUNT(tvc) && tvc->opens == 0 ) {
590                 struct inode *ip = (struct inode*)tvc;
591                 if (list_empty(&ip->i_dentry)) {
592                     vn --;
593                 }
594                 else {
595                     struct list_head *cur;
596                     struct list_head *head = &ip->i_dentry;
597                     int all = 1;
598                 restart:
599 #if defined(AFS_LINUX24_ENV)
600                     spin_lock(&dcache_lock);
601 #endif
602                     cur = head;
603                     while ((cur = cur->next) != head) {
604                         struct dentry *dentry = list_entry(cur, struct dentry, d_alias);
605 #if defined(AFS_LINUX24_ENV)
606                         if (!atomic_read(&dentry->d_count)) {
607 #else
608                         if (!dentry->d_count) {
609 #endif
610                             AFS_GUNLOCK();
611 #if defined(AFS_LINUX24_ENV)
612                             dget_locked(dentry);
613                             spin_unlock(&dcache_lock);
614 #else
615                             dget(dentry);
616 #endif
617                             d_drop(dentry);
618                             dput(dentry);
619                             AFS_GLOCK();
620                             goto restart;
621                         }
622                         else {
623                             all = 0;
624                         }
625                     }
626 #if defined(AFS_LINUX24_ENV)
627                     spin_unlock(&dcache_lock);
628 #endif
629                     if (all) vn --;
630                 }
631             }
632             if (tq == uq) break;
633          }
634     }
635 #endif /* AFS_LINUX22_ENV */
636 #ifdef  AFS_OSF_ENV
637 #ifdef  AFS_OSF30_ENV
638     if (afs_vcount >= afs_maxvcount) 
639 #else
640     /*
641      * If we are using > 33 % of the total system vnodes for AFS vcache
642      * entries or we are using the maximum number of vcache entries,
643      * then free some.  (if our usage is > 33% we should free some, if
644      * our usage is > afs_maxvcount, set elsewhere to 0.5*nvnode, 
645      * we _must_ free some -- no choice).
646      */
647     if ( (( 3 * afs_vcount ) > nvnode) || ( afs_vcount >= afs_maxvcount ))
648 #endif
649        {
650          struct afs_q *tq, *uq;
651          int i; char *panicstr;
652
653          i = 0;
654          for(tq = VLRU.prev; tq != &VLRU && anumber > 0; tq = uq) {
655             tvc = QTOV(tq);
656             uq = QPrev(tq);
657             if (tvc->states & CVFlushed) 
658                  refpanic ("CVFlushed on VLRU");
659             else if (i++ > afs_maxvcount)
660                  refpanic ("Exceeded pool of AFS vnodes(VLRU cycle?)");
661             else if (QNext(uq) != tq)
662                  refpanic ("VLRU inconsistent");
663             else if (VREFCOUNT(tvc) < 1) 
664                  refpanic ("refcnt 0 on VLRU");
665
666             if ( VREFCOUNT(tvc) == 1   &&   tvc->opens == 0 
667                 && (tvc->states & CUnlinkedDel) == 0) {
668                 code = afs_FlushVCache(tvc, &fv_slept);
669                 if (code == 0) {
670                   anumber--;
671                 }
672                 if (fv_slept) {
673                   uq = VLRU.prev;
674                   i = 0;
675                   continue;  /* start over - may have raced. */
676                 }
677             }
678             if (tq == uq) break;
679          }
680          if (anumber == VCACHE_FREE) {
681             printf("NewVCache: warning none freed, using %d of %d\n", 
682                    afs_vcount, afs_maxvcount);
683             if (afs_vcount >= afs_maxvcount) {
684                 osi_Panic("NewVCache - none freed");
685                 /* XXX instead of panicing, should do afs_maxvcount++ 
686                    and magic up another one */
687             }
688          }
689       }
690
691     AFS_GUNLOCK();
692     if (getnewvnode(MOUNT_AFS, &Afs_vnodeops, &nvc)) {
693         /* What should we do ???? */
694         osi_Panic("afs_NewVCache: no more vnodes");
695     }
696     AFS_GLOCK();
697
698     tvc = nvc;
699     tvc->nextfree = (struct vcache *)0; 
700     afs_vcount++;
701 #else   /* AFS_OSF_ENV */
702     /* pull out a free cache entry */
703     if (!freeVCList) {
704         i = 0;
705         for(tq = VLRU.prev; (anumber > 0) && (tq != &VLRU); tq = uq) {
706            tvc = QTOV(tq);
707            uq = QPrev(tq);
708
709            if (tvc->states & CVFlushed)
710                 refpanic("CVFlushed on VLRU");
711            else if (i++ > 2*afs_cacheStats) /* even allowing for a few xallocs...*/
712                 refpanic("Increase -stat parameter of afsd(VLRU cycle?)");
713            else if (QNext(uq) != tq)
714                 refpanic("VLRU inconsistent");
715
716 #ifdef AFS_DARWIN_ENV
717            if (tvc->opens == 0 && ((tvc->states & CUnlinkedDel) == 0) &&
718                 VREFCOUNT(tvc) == 1 && UBCINFOEXISTS(&tvc->v)) {
719                osi_VM_TryReclaim(tvc, &fv_slept);
720                if (fv_slept) {
721                   uq = VLRU.prev;
722                   i = 0;
723                   continue;  /* start over - may have raced. */
724                }
725             }
726 #endif
727            if (VREFCOUNT(tvc) == 0 && tvc->opens == 0
728                && (tvc->states & CUnlinkedDel) == 0) {
729                 code = afs_FlushVCache(tvc, &fv_slept);
730                 if (code == 0) {
731                   anumber--;
732                 }
733                 if (fv_slept) {
734                   uq = VLRU.prev;
735                   i = 0;
736                   continue;  /* start over - may have raced. */
737                 }
738            } 
739            if (tq == uq ) break;
740         }
741     }
742     if (!freeVCList) {
743         /* none free, making one is better than a panic */
744         afs_stats_cmperf.vcacheXAllocs++;       /* count in case we have a leak */
745         tvc = (struct vcache *) afs_osi_Alloc(sizeof (struct vcache));
746 #ifdef  AFS_AIX32_ENV
747         pin((char *)tvc, sizeof(struct vcache));        /* XXX */
748 #endif
749 #ifdef  AFS_MACH_ENV
750         /* In case it still comes here we need to fill this */
751         tvc->v.v_vm_info = VM_INFO_NULL;
752         vm_info_init(tvc->v.v_vm_info);
753         /* perhaps we should also do close_flush on non-NeXT mach systems;
754          * who knows; we don't currently have the sources.
755          */
756 #endif /* AFS_MACH_ENV */
757 #if defined(AFS_SGI_ENV)
758         { char name[METER_NAMSZ];
759         memset(tvc, 0, sizeof(struct vcache));
760         tvc->v.v_number = ++afsvnumbers;
761         tvc->vc_rwlockid = OSI_NO_LOCKID;
762         initnsema(&tvc->vc_rwlock, 1, makesname(name, "vrw", tvc->v.v_number));
763 #ifndef AFS_SGI53_ENV
764         initnsema(&tvc->v.v_sync, 0, makesname(name, "vsy", tvc->v.v_number));
765 #endif
766 #ifndef AFS_SGI62_ENV
767         initnlock(&tvc->v.v_lock, makesname(name, "vlk", tvc->v.v_number));
768 #endif
769         }
770 #endif /* AFS_SGI_ENV */
771     }
772     else {
773         tvc = freeVCList;   /* take from free list */
774         freeVCList = tvc->nextfree;
775         tvc->nextfree = (struct vcache *)0;
776     }
777 #endif  /* AFS_OSF_ENV */
778
779 #ifdef  AFS_MACH_ENV
780     vm_info_ptr = tvc->v.v_vm_info;
781 #endif /* AFS_MACH_ENV */
782
783 #if !defined(AFS_SGI_ENV) && !defined(AFS_OSF_ENV)
784     memset((char *)tvc, 0, sizeof(struct vcache));
785 #else
786     tvc->uncred = 0;
787 #endif
788
789     RWLOCK_INIT(&tvc->lock, "vcache lock");
790 #if     defined(AFS_SUN5_ENV)
791     RWLOCK_INIT(&tvc->vlock, "vcache vlock");
792 #endif /* defined(AFS_SUN5_ENV) */
793
794 #ifdef  AFS_MACH_ENV
795     tvc->v.v_vm_info = vm_info_ptr;
796     tvc->v.v_vm_info->pager = MEMORY_OBJECT_NULL;
797 #endif /* AFS_MACH_ENV */
798     tvc->parentVnode = 0;
799     tvc->mvid = (struct VenusFid *) 0;
800     tvc->linkData = (char *) 0;
801     tvc->cbExpires = 0;
802     tvc->opens = 0;
803     tvc->execsOrWriters = 0;
804     tvc->flockCount = 0;
805     tvc->anyAccess = 0;
806     tvc->states = 0;
807     tvc->last_looker = 0;
808     tvc->fid = *afid;
809     tvc->asynchrony = -1;
810     tvc->vc_error = 0;
811     afs_symhint_inval(tvc);
812 #ifdef AFS_TEXT_ENV
813     tvc->flushDV.low = tvc->flushDV.high =  AFS_MAXDV;
814 #endif
815     hzero(tvc->mapDV);
816     tvc->truncPos = AFS_NOTRUNC;        /* don't truncate until we need to */
817     hzero(tvc->m.DataVersion);          /* in case we copy it into flushDV */
818 #ifdef  AFS_OSF_ENV
819     /* Hold it for the LRU (should make count 2) */
820     VN_HOLD((struct vnode *)tvc);
821 #else   /* AFS_OSF_ENV */
822     VREFCOUNT_SET(tvc, 1);      /* us */
823 #endif  /* AFS_OSF_ENV */
824 #ifdef  AFS_AIX32_ENV
825     LOCK_INIT(&tvc->pvmlock, "vcache pvmlock");
826     tvc->vmh = tvc->segid = NULL;
827     tvc->credp = NULL;
828 #endif
829 #if defined(AFS_SUN_ENV) || defined(AFS_ALPHA_ENV) || defined(AFS_SUN5_ENV)
830 #if     defined(AFS_SUN5_ENV)
831     rw_init(&tvc->rwlock, "vcache rwlock", RW_DEFAULT, NULL);
832
833 #if     defined(AFS_SUN55_ENV)
834         /* This is required if the kaio (kernel aynchronous io)
835         ** module is installed. Inside the kernel, the function
836         ** check_vp( common/os/aio.c) checks to see if the kernel has 
837         ** to provide asynchronous io for this vnode. This
838         ** function extracts the device number by following the
839         ** v_data field of the vnode. If we do not set this field
840         ** then the system panics. The  value of the v_data field
841         ** is not really important for AFS vnodes because the kernel
842         ** does not do asynchronous io for regular files. Hence,
843         ** for the time being, we fill up the v_data field with the
844         ** vnode pointer itself. */
845     tvc->v.v_data = (char *)tvc;
846 #endif /* AFS_SUN55_ENV */
847 #endif
848     afs_BozonInit(&tvc->pvnLock, tvc);
849 #endif
850
851     tvc->Access = NULL;
852     tvc->callback = serverp;    /* to minimize chance that clear
853                                    request is lost */
854     /* initialize vnode data, note vrefCount is v.v_count */
855 #ifdef  AFS_AIX_ENV
856     /* Don't forget to free the gnode space */
857     tvc->v.v_gnode = gnodepnt = (struct gnode *) osi_AllocSmallSpace(sizeof(struct gnode));
858     memset((char *)gnodepnt, 0, sizeof(struct gnode));
859 #endif
860 #ifdef AFS_SGI64_ENV
861     memset((void*)&(tvc->vc_bhv_desc), 0, sizeof(tvc->vc_bhv_desc));
862     bhv_desc_init(&(tvc->vc_bhv_desc), tvc, tvc, &Afs_vnodeops);
863 #ifdef AFS_SGI65_ENV
864     vn_bhv_head_init(&(tvc->v.v_bh), "afsvp");
865     vn_bhv_insert_initial(&(tvc->v.v_bh), &(tvc->vc_bhv_desc));
866 #else
867     bhv_head_init(&(tvc->v.v_bh));
868     bhv_insert_initial(&(tvc->v.v_bh), &(tvc->vc_bhv_desc));
869 #endif
870 #ifdef AFS_SGI65_ENV
871     tvc->v.v_mreg = tvc->v.v_mregb = (struct pregion*)tvc;
872 #ifdef VNODE_TRACING
873     tvc->v.v_trace = ktrace_alloc(VNODE_TRACE_SIZE, 0);
874 #endif
875     init_bitlock(&tvc->v.v_pcacheflag, VNODE_PCACHE_LOCKBIT, "afs_pcache",
876                  tvc->v.v_number);
877     init_mutex(&tvc->v.v_filocksem, MUTEX_DEFAULT, "afsvfl", (long)tvc);
878     init_mutex(&tvc->v.v_buf_lock, MUTEX_DEFAULT, "afsvnbuf", (long)tvc);
879 #endif
880     vnode_pcache_init(&tvc->v);
881 #if defined(DEBUG) && defined(VNODE_INIT_BITLOCK)
882     /* Above define is never true execpt in SGI test kernels. */
883     init_bitlock(&(tvc->v.v_flag, VLOCK, "vnode", tvc->v.v_number);
884 #endif
885 #ifdef INTR_KTHREADS
886     AFS_VN_INIT_BUF_LOCK(&(tvc->v));
887 #endif
888 #else
889     SetAfsVnode((struct vnode *)tvc);
890 #endif /* AFS_SGI64_ENV */
891 #ifdef AFS_DARWIN_ENV
892     tvc->v.v_ubcinfo = UBC_INFO_NULL;
893     lockinit(&tvc->rwlock, PINOD, "vcache rwlock", 0, 0);
894     cache_purge((struct vnode *)tvc); 
895     tvc->v.v_data=tvc;
896     tvc->v.v_tag=VT_AFS;
897     /* VLISTNONE(&tvc->v); */
898     tvc->v.v_freelist.tqe_next=0;
899     tvc->v.v_freelist.tqe_prev=(struct vnode **)0xdeadb;
900     /*tvc->vrefCount++;*/
901 #endif 
902     /*
903      * The proper value for mvstat (for root fids) is setup by the caller.
904      */
905     tvc->mvstat = 0;           
906     if (afid->Fid.Vnode == 1 && afid->Fid.Unique == 1)
907         tvc->mvstat = 2;   
908     if (afs_globalVFS == 0) osi_Panic("afs globalvfs");
909     vSetVfsp(tvc, afs_globalVFS);
910     vSetType(tvc, VREG);
911 #ifdef  AFS_AIX_ENV
912     tvc->v.v_vfsnext = afs_globalVFS->vfs_vnodes;   /* link off vfs */
913     tvc->v.v_vfsprev = NULL;
914     afs_globalVFS->vfs_vnodes = &tvc->v;
915     if (tvc->v.v_vfsnext != NULL)
916         tvc->v.v_vfsnext->v_vfsprev = &tvc->v;
917     tvc->v.v_next = gnodepnt->gn_vnode;  /*Single vnode per gnode for us!*/
918     gnodepnt->gn_vnode = &tvc->v;
919 #endif
920 #ifdef  AFS_DEC_ENV
921     tvc->v.g_dev = ((struct mount *)afs_globalVFS->vfs_data)->m_dev;
922 #endif
923 #if     defined(AFS_DUX40_ENV)
924     insmntque(tvc, afs_globalVFS, &afs_ubcops);
925 #else
926 #ifdef  AFS_OSF_ENV
927     /* Is this needed??? */
928     insmntque(tvc, afs_globalVFS);
929 #endif  /* AFS_OSF_ENV */
930 #endif  /* AFS_DUX40_ENV */
931 #if defined(AFS_SGI_ENV)
932     VN_SET_DPAGES(&(tvc->v), (struct pfdat*)NULL);
933     osi_Assert((tvc->v.v_flag & VINACT) == 0);
934     tvc->v.v_flag = 0;
935     osi_Assert(VN_GET_PGCNT(&(tvc->v)) == 0);
936     osi_Assert(tvc->mapcnt == 0 && tvc->vc_locktrips == 0);
937     osi_Assert(tvc->vc_rwlockid == OSI_NO_LOCKID);
938     osi_Assert(tvc->v.v_filocks == NULL);
939 #if !defined(AFS_SGI65_ENV)
940     osi_Assert(tvc->v.v_filocksem == NULL);
941 #endif
942     osi_Assert(tvc->cred == NULL);
943 #ifdef AFS_SGI64_ENV
944     vnode_pcache_reinit(&tvc->v);
945     tvc->v.v_rdev = NODEV;
946 #endif
947     vn_initlist((struct vnlist *)&tvc->v);
948     tvc->lastr = 0;
949 #endif /* AFS_SGI_ENV */
950 #if defined(AFS_LINUX22_ENV)
951     {
952         struct inode *ip = (struct inode*)tvc;
953         sema_init(&ip->i_sem, 1);
954 #if defined(AFS_LINUX24_ENV)
955         sema_init(&ip->i_zombie, 1);
956         init_waitqueue_head(&ip->i_wait);
957         spin_lock_init(&ip->i_data.i_shared_lock);
958 #ifdef STRUCT_ADDRESS_SPACE_HAS_PAGE_LOCK
959         spin_lock_init(&ip->i_data.page_lock);
960 #endif
961         INIT_LIST_HEAD(&ip->i_data.clean_pages);
962         INIT_LIST_HEAD(&ip->i_data.dirty_pages);
963         INIT_LIST_HEAD(&ip->i_data.locked_pages);
964         INIT_LIST_HEAD(&ip->i_dirty_buffers);
965         ip->i_data.host = (void*) ip;
966         ip->i_mapping = &ip->i_data;
967 #else
968         sema_init(&ip->i_atomic_write, 1);
969         init_waitqueue(&ip->i_wait);
970 #endif
971         INIT_LIST_HEAD(&ip->i_hash);
972         INIT_LIST_HEAD(&ip->i_dentry);
973         if (afs_globalVFS) {
974             ip->i_dev = afs_globalVFS->s_dev;
975             ip->i_sb = afs_globalVFS;
976         }
977      }
978 #endif
979     tvc->h1.dchint = 0;
980     osi_dnlc_purgedp(tvc);  /* this may be overkill */
981     memset((char *)&(tvc->quick), 0, sizeof(struct vtodc));
982     memset((char *)&(tvc->callsort), 0, sizeof(struct afs_q));
983     tvc->slocks = (struct SimpleLocks *)0;
984     i = VCHash(afid);
985
986     tvc->hnext = afs_vhashT[i];
987     afs_vhashT[i] = tvc;
988     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
989        refpanic ("NewVCache VLRU inconsistent");
990     }
991     QAdd(&VLRU, &tvc->vlruq);                           /* put in lruq */
992     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
993        refpanic ("NewVCache VLRU inconsistent2");
994     }
995     if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
996        refpanic ("NewVCache VLRU inconsistent3");
997     }
998     if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
999        refpanic ("NewVCache VLRU inconsistent4");
1000     }
1001     vcachegen++;
1002
1003     return tvc;
1004
1005 } /*afs_NewVCache*/
1006
1007
1008 /*
1009  * afs_FlushActiveVcaches
1010  *
1011  * Description:
1012  *      ???
1013  *
1014  * Parameters:
1015  *      doflocks : Do we handle flocks?
1016  */
1017 /* LOCK: afs_FlushActiveVcaches afs_xvcache N */
1018 void
1019 afs_FlushActiveVcaches(doflocks)
1020     register afs_int32 doflocks;
1021
1022 { /*afs_FlushActiveVcaches*/
1023
1024     register struct vcache *tvc;
1025     register int i;
1026     register struct conn *tc;
1027     register afs_int32 code;
1028     register struct AFS_UCRED *cred;
1029     struct vrequest treq, ureq;
1030     struct AFSVolSync tsync;
1031     int didCore;
1032     XSTATS_DECLS
1033
1034     AFS_STATCNT(afs_FlushActiveVcaches);
1035     ObtainReadLock(&afs_xvcache);
1036     for(i=0;i<VCSIZE;i++) {
1037         for(tvc = afs_vhashT[i]; tvc; tvc=tvc->hnext) {
1038             if (doflocks && tvc->flockCount != 0) {
1039                 /* if this entry has an flock, send a keep-alive call out */
1040                 osi_vnhold(tvc, 0);
1041                 ReleaseReadLock(&afs_xvcache);
1042                 ObtainWriteLock(&tvc->lock,51);
1043                 do {
1044                     afs_InitReq(&treq, &afs_osi_cred);
1045                     treq.flags |= O_NONBLOCK;
1046
1047                     tc = afs_Conn(&tvc->fid, &treq, SHARED_LOCK);
1048                     if (tc) {
1049                       XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_EXTENDLOCK);
1050 #ifdef RX_ENABLE_LOCKS
1051                       AFS_GUNLOCK();
1052 #endif /* RX_ENABLE_LOCKS */
1053                       code =
1054                             RXAFS_ExtendLock(tc->id,
1055                                              (struct AFSFid *) &tvc->fid.Fid,
1056                                              &tsync);
1057 #ifdef RX_ENABLE_LOCKS
1058                       AFS_GLOCK();
1059 #endif /* RX_ENABLE_LOCKS */
1060                       XSTATS_END_TIME;
1061                     }
1062                     else code = -1;
1063                 } while
1064                     (afs_Analyze(tc, code, &tvc->fid, &treq,
1065                                  AFS_STATS_FS_RPCIDX_EXTENDLOCK,
1066                                  SHARED_LOCK, (struct cell *)0));
1067
1068                 ReleaseWriteLock(&tvc->lock);
1069                 ObtainReadLock(&afs_xvcache);
1070                 AFS_FAST_RELE(tvc);
1071             }
1072             didCore = 0;
1073             if ((tvc->states & CCore) || (tvc->states & CUnlinkedDel)) {
1074                 /*
1075                  * Don't let it evaporate in case someone else is in
1076                  * this code.  Also, drop the afs_xvcache lock while
1077                  * getting vcache locks.
1078                  */
1079                 osi_vnhold(tvc,0);
1080                 ReleaseReadLock(&afs_xvcache);
1081 #if defined(AFS_SUN_ENV) || defined(AFS_ALPHA_ENV) 
1082                 afs_BozonLock(&tvc->pvnLock, tvc);
1083 #endif
1084 #if defined(AFS_SGI_ENV)
1085                 /*
1086                  * That's because if we come in via the CUnlinkedDel bit state path we'll be have 0 refcnt
1087                  */
1088                 osi_Assert(VREFCOUNT(tvc) > 0);
1089                 AFS_RWLOCK((vnode_t *)tvc, VRWLOCK_WRITE);
1090 #endif
1091                 ObtainWriteLock(&tvc->lock,52);
1092                 if (tvc->states & CCore) {
1093                     tvc->states &= ~CCore;
1094                     /* XXXX Find better place-holder for cred XXXX */
1095                     cred = (struct AFS_UCRED *) tvc->linkData;
1096                     tvc->linkData = (char *) 0; /* XXX */
1097                     afs_InitReq(&ureq, cred);
1098                     afs_Trace2(afs_iclSetp, CM_TRACE_ACTCCORE,
1099                                ICL_TYPE_POINTER, tvc,
1100                                ICL_TYPE_INT32, tvc->execsOrWriters);
1101                     code = afs_StoreOnLastReference(tvc, &ureq);
1102                     ReleaseWriteLock(&tvc->lock);
1103 #if defined(AFS_SUN_ENV) || defined(AFS_ALPHA_ENV) 
1104                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1105 #endif
1106                     hzero(tvc->flushDV);
1107                     osi_FlushText(tvc);
1108                     didCore = 1;
1109                     if (code && code != VNOVNODE) {
1110                         afs_StoreWarn(code, tvc->fid.Fid.Volume,
1111                                       /* /dev/console */ 1);
1112                     }
1113                 } else if (tvc->states & CUnlinkedDel) {
1114                     /*
1115                      * Ignore errors 
1116                      */
1117                     ReleaseWriteLock(&tvc->lock);
1118 #if defined(AFS_SUN_ENV) || defined(AFS_ALPHA_ENV) 
1119                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1120 #endif
1121 #if defined(AFS_SGI_ENV)
1122                     AFS_RWUNLOCK((vnode_t *)tvc, VRWLOCK_WRITE);
1123 #endif
1124                     afs_remunlink(tvc, 0);
1125 #if defined(AFS_SGI_ENV)
1126                     AFS_RWLOCK((vnode_t *)tvc, VRWLOCK_WRITE);
1127 #endif
1128                 }
1129                 else {
1130                     /* lost (or won, perhaps) the race condition */
1131                     ReleaseWriteLock(&tvc->lock);
1132 #if defined(AFS_SUN_ENV) || defined(AFS_ALPHA_ENV)
1133                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1134 #endif
1135                 }
1136 #if defined(AFS_SGI_ENV)
1137                 AFS_RWUNLOCK((vnode_t *)tvc, VRWLOCK_WRITE);
1138 #endif
1139                 ObtainReadLock(&afs_xvcache);
1140                 AFS_FAST_RELE(tvc);
1141                 if (didCore) {
1142 #ifdef  AFS_GFS_ENV
1143                     VREFCOUNT_DEC(tvc);
1144 #else
1145                     AFS_RELE((struct vnode *)tvc);
1146 #endif
1147                     /* Matches write code setting CCore flag */
1148                     crfree(cred);
1149                 }
1150             }          
1151 #ifdef AFS_DARWIN_ENV
1152             if (VREFCOUNT(tvc) == 1 && UBCINFOEXISTS(&tvc->v)) {
1153                 if (tvc->opens) panic("flushactive open, hasubc, but refcnt 1");
1154                 osi_VM_TryReclaim(tvc,0);
1155             }
1156 #endif
1157         }
1158     }
1159     ReleaseReadLock(&afs_xvcache);
1160
1161 } /*afs_FlushActiveVcaches*/
1162
1163
1164 /*
1165  * afs_VerifyVCache
1166  *
1167  * Description:
1168  *      Make sure a cache entry is up-to-date status-wise.
1169  * 
1170  * NOTE: everywhere that calls this can potentially be sped up
1171  *       by checking CStatd first, and avoiding doing the InitReq
1172  *       if this is up-to-date.
1173  *
1174  *  Anymore, the only places that call this KNOW already that the 
1175  *  vcache is not up-to-date, so we don't screw around.
1176  *
1177  * Parameters:
1178  *      avc  : Ptr to vcache entry to verify.
1179  *      areq : ???
1180  */
1181
1182 int afs_VerifyVCache2(struct vcache *avc, struct vrequest *areq)
1183 {
1184     register struct vcache *tvc;
1185
1186     AFS_STATCNT(afs_VerifyVCache);
1187
1188 #if defined(AFS_OSF_ENV)
1189     ObtainReadLock(&avc->lock);
1190     if (afs_IsWired(avc)) {
1191         ReleaseReadLock(&avc->lock);
1192         return 0;
1193     }
1194     ReleaseReadLock(&avc->lock);
1195 #endif /* AFS_OSF_ENV */
1196     /* otherwise we must fetch the status info */
1197
1198     ObtainWriteLock(&avc->lock,53);
1199     if (avc->states & CStatd) {
1200         ReleaseWriteLock(&avc->lock);
1201         return 0;
1202     }
1203     ObtainWriteLock(&afs_xcbhash, 461);
1204     avc->states &= ~( CStatd | CUnique );   
1205     avc->callback = (struct server *)0;
1206     afs_DequeueCallback(avc);
1207     ReleaseWriteLock(&afs_xcbhash);
1208     ReleaseWriteLock(&avc->lock);
1209
1210     /* since we've been called back, or the callback has expired, 
1211      * it's possible that the contents of this directory, or this 
1212      * file's name have changed, thus invalidating the dnlc contents.
1213      */
1214     if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1)) 
1215       osi_dnlc_purgedp (avc);
1216     else
1217       osi_dnlc_purgevp (avc);
1218     
1219     /* fetch the status info */
1220     tvc = afs_GetVCache(&avc->fid, areq, (afs_int32*)0, avc, READ_LOCK);
1221     if (!tvc) return ENOENT;
1222     /* Put it back; caller has already incremented vrefCount */
1223     afs_PutVCache(tvc, READ_LOCK);
1224     return 0;
1225
1226 } /*afs_VerifyVCache*/
1227
1228
1229 /*
1230  * afs_SimpleVStat
1231  *
1232  * Description:
1233  *      Simple copy of stat info into cache.
1234  *
1235  * Parameters:
1236  *      avc   : Ptr to vcache entry involved.
1237  *      astat : Ptr to stat info to copy.
1238  *
1239  * Environment:
1240  *      Nothing interesting.
1241  *
1242  * Callers:  as of 1992-04-29, only called by WriteVCache
1243  */
1244 static void
1245 afs_SimpleVStat(avc, astat, areq)
1246     register struct vcache *avc;
1247     register struct AFSFetchStatus *astat;
1248     struct vrequest *areq;
1249 { /*afs_SimpleVStat*/
1250
1251     AFS_STATCNT(afs_SimpleVStat);
1252
1253 #ifdef AFS_SGI_ENV
1254     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1255         && !AFS_VN_MAPPED((vnode_t*)avc))
1256 #else
1257     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc))
1258 #endif
1259
1260         {
1261 #if defined(AFS_SGI_ENV)
1262             osi_Assert((valusema(&avc->vc_rwlock) <= 0) &&
1263                    (OSI_GET_LOCKID() == avc->vc_rwlockid));
1264             if (astat->Length < avc->m.Length) {
1265                 vnode_t *vp = (vnode_t *)avc;
1266                 
1267                 osi_Assert(WriteLocked(&avc->lock));
1268                 ReleaseWriteLock(&avc->lock);
1269                 AFS_GUNLOCK();
1270                 PTOSSVP(vp, (off_t)astat->Length, (off_t)MAXLONG);
1271                 AFS_GLOCK();
1272                 ObtainWriteLock(&avc->lock,67);
1273             }
1274 #endif
1275             /* if writing the file, don't fetch over this value */
1276             afs_Trace3(afs_iclSetp, CM_TRACE_SIMPLEVSTAT,
1277                        ICL_TYPE_POINTER, avc,
1278                        ICL_TYPE_INT32, avc->m.Length,
1279                        ICL_TYPE_INT32, astat->Length);
1280             avc->m.Length = astat->Length;
1281             avc->m.Date = astat->ClientModTime;
1282         }
1283     avc->m.Owner = astat->Owner;
1284     avc->m.Group = astat->Group;
1285     avc->m.Mode = astat->UnixModeBits;
1286     if (vType(avc) == VREG) {
1287         avc->m.Mode |= S_IFREG;
1288     }
1289     else if (vType(avc) == VDIR) {
1290         avc->m.Mode |= S_IFDIR;
1291     }
1292     else if (vType(avc) == VLNK) {
1293
1294
1295
1296         avc->m.Mode |= S_IFLNK;
1297         if ((avc->m.Mode & 0111) == 0) avc->mvstat = 1;
1298     }
1299     if (avc->states & CForeign) {
1300       struct axscache *ac;
1301         avc->anyAccess = astat->AnonymousAccess;
1302 #ifdef badidea
1303         if ((astat->CallerAccess & ~astat->AnonymousAccess)) 
1304          /*   USED TO SAY : 
1305           * Caller has at least one bit not covered by anonymous, and
1306           * thus may have interesting rights.
1307           *
1308           * HOWEVER, this is a really bad idea, because any access query
1309           * for bits which aren't covered by anonymous, on behalf of a user
1310           * who doesn't have any special rights, will result in an answer of 
1311           * the form "I don't know, lets make a FetchStatus RPC and find out!"
1312           * It's an especially bad idea under Ultrix, since (due to the lack of
1313           * a proper access() call) it must perform several afs_access() calls 
1314           * in order to create magic mode bits that vary according to who makes
1315           * the call.  In other words, _every_ stat() generates a test for 
1316           * writeability...
1317           */
1318 #endif /* badidea */
1319           if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1320             ac->axess =  astat->CallerAccess;
1321           else  /* not found, add a new one if possible */
1322             afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1323     }
1324
1325
1326 } /*afs_SimpleVStat*/
1327
1328
1329 /*
1330  * afs_WriteVCache
1331  *
1332  * Description:
1333  *      Store the status info *only* back to the server for a
1334  *      fid/vrequest.
1335  *
1336  * Parameters:
1337  *      avc     : Ptr to the vcache entry.
1338  *      astatus : Ptr to the status info to store.
1339  *      areq    : Ptr to the associated vrequest.
1340  *
1341  * Environment:
1342  *      Must be called with a shared lock held on the vnode.
1343  */
1344
1345 afs_WriteVCache(avc, astatus, areq)
1346     register struct vcache *avc;
1347     register struct AFSStoreStatus *astatus;
1348     struct vrequest *areq;
1349
1350 { /*afs_WriteVCache*/
1351   afs_int32 code;
1352   struct conn *tc;
1353     struct AFSFetchStatus OutStatus;
1354     struct AFSVolSync tsync;
1355     XSTATS_DECLS
1356
1357     AFS_STATCNT(afs_WriteVCache);
1358     afs_Trace2(afs_iclSetp, CM_TRACE_WVCACHE, ICL_TYPE_POINTER, avc,
1359                ICL_TYPE_INT32, avc->m.Length);
1360
1361     do {
1362         tc = afs_Conn(&avc->fid, areq, SHARED_LOCK);
1363         if (tc) {
1364           XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STORESTATUS);
1365 #ifdef RX_ENABLE_LOCKS
1366           AFS_GUNLOCK();
1367 #endif /* RX_ENABLE_LOCKS */
1368           code = RXAFS_StoreStatus(tc->id,
1369                                    (struct AFSFid *) &avc->fid.Fid,
1370                                    astatus, &OutStatus, &tsync);
1371 #ifdef RX_ENABLE_LOCKS
1372           AFS_GLOCK();
1373 #endif /* RX_ENABLE_LOCKS */
1374           XSTATS_END_TIME;
1375         }
1376         else code = -1;
1377     } while
1378         (afs_Analyze(tc, code, &avc->fid, areq,
1379                      AFS_STATS_FS_RPCIDX_STORESTATUS,
1380                      SHARED_LOCK, (struct cell *)0));
1381
1382     UpgradeSToWLock(&avc->lock,20);
1383     if (code == 0) {
1384         /* success, do the changes locally */
1385         afs_SimpleVStat(avc, &OutStatus, areq);
1386         /*
1387          * Update the date, too.  SimpleVStat didn't do this, since
1388          * it thought we were doing this after fetching new status
1389          * over a file being written.
1390          */
1391         avc->m.Date = OutStatus.ClientModTime;
1392     }
1393     else {
1394         /* failure, set up to check with server next time */
1395         ObtainWriteLock(&afs_xcbhash, 462);
1396         afs_DequeueCallback(avc);
1397         avc->states &= ~( CStatd | CUnique);  /* turn off stat valid flag */
1398         ReleaseWriteLock(&afs_xcbhash);
1399         if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1)) 
1400           osi_dnlc_purgedp (avc);  /* if it (could be) a directory */
1401     }
1402     ConvertWToSLock(&avc->lock);
1403     return code;
1404
1405 } /*afs_WriteVCache*/
1406
1407 /*
1408  * afs_ProcessFS
1409  *
1410  * Description:
1411  *      Copy astat block into vcache info
1412  *
1413  * Parameters:
1414  *      avc   : Ptr to vcache entry.
1415  *      astat : Ptr to stat block to copy in.
1416  *      areq  : Ptr to associated request.
1417  *
1418  * Environment:
1419  *      Must be called under a write lock
1420  *
1421  * Note: this code may get dataversion and length out of sync if the file has
1422  *       been modified.  This is less than ideal.  I haven't thought about
1423  *       it sufficiently to be certain that it is adequate.
1424  */
1425 void
1426 afs_ProcessFS(avc, astat, areq)
1427     register struct vcache *avc;
1428     struct vrequest *areq;
1429     register struct AFSFetchStatus *astat;
1430
1431 { /*afs_ProcessFS*/
1432
1433     register int i;
1434     AFS_STATCNT(afs_ProcessFS);
1435
1436     /* WARNING: afs_DoBulkStat uses the Length field to store a sequence
1437      * number for each bulk status request. Under no circumstances
1438      * should afs_DoBulkStat store a sequence number if the new
1439      * length will be ignored when afs_ProcessFS is called with
1440      * new stats. If you change the following conditional then you
1441      * also need to change the conditional in afs_DoBulkStat.  */
1442 #ifdef AFS_SGI_ENV
1443     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1444         && !AFS_VN_MAPPED((vnode_t*)avc))
1445 #else
1446     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc))
1447 #endif
1448         {
1449             /* if we're writing or mapping this file, don't fetch over these
1450              *  values.
1451              */
1452             afs_Trace3(afs_iclSetp, CM_TRACE_PROCESSFS, ICL_TYPE_POINTER, avc,
1453                        ICL_TYPE_INT32, avc->m.Length,
1454                        ICL_TYPE_INT32, astat->Length);
1455             avc->m.Length = astat->Length;
1456             avc->m.Date = astat->ClientModTime;
1457         }
1458     hset64(avc->m.DataVersion, astat->dataVersionHigh, astat->DataVersion);
1459     avc->m.Owner = astat->Owner;
1460     avc->m.Mode = astat->UnixModeBits;
1461     avc->m.Group = astat->Group;
1462     avc->m.LinkCount = astat->LinkCount;
1463     if (astat->FileType == File) {
1464         vSetType(avc, VREG);
1465         avc->m.Mode |= S_IFREG;
1466     }
1467     else if (astat->FileType == Directory) {
1468         vSetType(avc, VDIR);
1469         avc->m.Mode |= S_IFDIR;
1470     }
1471     else if (astat->FileType == SymbolicLink) {
1472         vSetType(avc, VLNK);
1473         avc->m.Mode |= S_IFLNK;
1474         if ((avc->m.Mode & 0111) == 0) avc->mvstat = 1;
1475     }
1476     avc->anyAccess = astat->AnonymousAccess;
1477 #ifdef badidea
1478     if ((astat->CallerAccess & ~astat->AnonymousAccess)) 
1479       /*   USED TO SAY : 
1480        * Caller has at least one bit not covered by anonymous, and
1481        * thus may have interesting rights.
1482        *
1483        * HOWEVER, this is a really bad idea, because any access query
1484        * for bits which aren't covered by anonymous, on behalf of a user
1485        * who doesn't have any special rights, will result in an answer of 
1486        * the form "I don't know, lets make a FetchStatus RPC and find out!"
1487        * It's an especially bad idea under Ultrix, since (due to the lack of
1488        * a proper access() call) it must perform several afs_access() calls 
1489        * in order to create magic mode bits that vary according to who makes
1490        * the call.  In other words, _every_ stat() generates a test for 
1491        * writeability...
1492        */
1493 #endif /* badidea */
1494       {
1495         struct axscache *ac;
1496         if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1497           ac->axess =  astat->CallerAccess;
1498         else  /* not found, add a new one if possible */
1499           afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1500       }
1501
1502 #ifdef AFS_LINUX22_ENV
1503     vcache2inode(avc);    /* Set the inode attr cache */
1504 #endif
1505
1506 } /*afs_ProcessFS*/
1507
1508
1509 afs_RemoteLookup(afid, areq, name, nfid, OutStatusp, CallBackp, serverp, tsyncp)
1510     register struct VenusFid *afid;
1511     struct vrequest *areq;
1512     char *name;
1513     struct VenusFid *nfid;
1514     struct AFSFetchStatus *OutStatusp;
1515     struct AFSCallBack *CallBackp;
1516     struct server **serverp;
1517     struct AFSVolSync *tsyncp;
1518 {
1519     afs_int32 code, i;
1520     register struct vcache *tvc;
1521     struct volume *tvp;
1522     afs_uint32 start;
1523     register struct conn *tc;
1524     struct AFSFetchStatus OutDirStatus;
1525     XSTATS_DECLS
1526
1527     if (!name) name = "";       /* XXX */
1528     do {
1529         tc = afs_Conn(afid, areq, SHARED_LOCK);
1530         if (tc) {
1531             if (serverp) *serverp = tc->srvr->server;
1532             start = osi_Time();
1533             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_XLOOKUP);
1534 #ifdef RX_ENABLE_LOCKS
1535             AFS_GUNLOCK();
1536 #endif /* RX_ENABLE_LOCKS */
1537             code = RXAFS_Lookup(tc->id, (struct AFSFid *) &afid->Fid, name,
1538                                 (struct AFSFid *) &nfid->Fid, 
1539                                 OutStatusp, &OutDirStatus, CallBackp, tsyncp);
1540 #ifdef RX_ENABLE_LOCKS
1541             AFS_GLOCK();
1542 #endif /* RX_ENABLE_LOCKS */
1543             XSTATS_END_TIME;
1544         } else 
1545             code = -1;
1546     } while
1547         (afs_Analyze(tc, code, afid, areq,
1548                      AFS_STATS_FS_RPCIDX_XLOOKUP,
1549                      SHARED_LOCK, (struct cell *)0));
1550
1551     return code;
1552 }
1553
1554
1555 /*
1556  * afs_GetVCache
1557  *
1558  * Description:
1559  *      Given a file id and a vrequest structure, fetch the status
1560  *      information associated with the file.
1561  *
1562  * Parameters:
1563  *      afid : File ID.
1564  *      areq : Ptr to associated vrequest structure, specifying the
1565  *              user whose authentication tokens will be used.
1566  *      avc  : caller may already have a vcache for this file, which is 
1567  *             already held.
1568  *
1569  * Environment:
1570  *      The cache entry is returned with an increased vrefCount field.
1571  *      The entry must be discarded by calling afs_PutVCache when you
1572  *      are through using the pointer to the cache entry.
1573  *
1574  *      You should not hold any locks when calling this function, except
1575  *      locks on other vcache entries.  If you lock more than one vcache
1576  *      entry simultaneously, you should lock them in this order:
1577  *
1578  *          1. Lock all files first, then directories.
1579  *          2.  Within a particular type, lock entries in Fid.Vnode order.
1580  *  
1581  *      This locking hierarchy is convenient because it allows locking
1582  *      of a parent dir cache entry, given a file (to check its access
1583  *      control list).  It also allows renames to be handled easily by
1584  *      locking directories in a constant order.
1585  * NB.  NewVCache -> FlushVCache presently (4/10/95) drops the xvcache lock.
1586  */
1587 struct vcache *afs_GetVCache(afid, areq, cached, avc, locktype)
1588     register struct VenusFid *afid;
1589     struct vrequest *areq;
1590     afs_int32 *cached;
1591     afs_int32 locktype;
1592     struct vcache *avc; /* might have a vcache structure already, which must
1593                          * already be held by the caller */
1594 { /*afs_GetVCache*/
1595
1596     afs_int32 code, i, newvcache=0;
1597     register struct vcache *tvc;
1598     struct volume *tvp;
1599     afs_int32 retry;
1600
1601     AFS_STATCNT(afs_GetVCache);
1602
1603     if (cached) *cached = 0;            /* Init just in case */
1604
1605 loop:
1606     ObtainSharedLock(&afs_xvcache,5); 
1607
1608     tvc = afs_FindVCache(afid, 0, 0, &retry, DO_STATS | DO_VLRU );
1609     if (tvc && retry) {
1610 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1611         ReleaseSharedLock(&afs_xvcache);
1612         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1613         goto loop;
1614 #endif
1615    }
1616    
1617     if (tvc) {
1618       if (cached) 
1619         *cached = 1;
1620       if (tvc->states & CStatd) {               
1621         ReleaseSharedLock(&afs_xvcache);
1622         return tvc;
1623       }
1624     }
1625     else {      
1626         UpgradeSToWLock(&afs_xvcache,21);
1627
1628         /* no cache entry, better grab one */
1629         tvc = afs_NewVCache(afid, (struct server *)0, 1, WRITE_LOCK);
1630         newvcache = 1;
1631
1632         ConvertWToSLock(&afs_xvcache);
1633         afs_stats_cmperf.vcacheMisses++;
1634     }
1635
1636     ReleaseSharedLock(&afs_xvcache);
1637
1638     ObtainWriteLock(&tvc->lock,54);
1639
1640     if (tvc->states & CStatd) {
1641 #ifdef AFS_LINUX22_ENV
1642         vcache2inode(tvc);
1643 #endif
1644         ReleaseWriteLock(&tvc->lock);
1645 #ifdef AFS_DARWIN_ENV
1646         osi_VM_Setup(tvc);
1647 #endif
1648         return tvc;
1649     }
1650
1651 #if defined(AFS_OSF_ENV)
1652       if (afs_IsWired(tvc)) {
1653           ReleaseWriteLock(&tvc->lock);
1654           return tvc;
1655       }
1656 #endif /* AFS_OSF_ENV */
1657
1658     ObtainWriteLock(&afs_xcbhash, 464);
1659     tvc->states &= ~CUnique;   
1660     tvc->callback = 0;
1661     afs_DequeueCallback(tvc);
1662     ReleaseWriteLock(&afs_xcbhash);
1663
1664     /* It is always appropriate to throw away all the access rights? */
1665     afs_FreeAllAxs(&(tvc->Access));
1666     tvp = afs_GetVolume(afid, areq, READ_LOCK);   /* copy useful per-volume info */
1667     if (tvp) {
1668         if ((tvp->states & VForeign)) {
1669             if (newvcache) tvc->states |= CForeign;
1670             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode) 
1671                 && (tvp->rootUnique == afid->Fid.Unique)) {
1672                 tvc->mvstat = 2;
1673               }
1674         }
1675         if (tvp->states & VRO) tvc->states |= CRO;
1676         if (tvp->states & VBackup) tvc->states |= CBackup;
1677         /* now copy ".." entry back out of volume structure, if necessary */
1678         if (tvc->mvstat == 2  && tvp->dotdot.Fid.Volume != 0) {
1679             if (!tvc->mvid)
1680                 tvc->mvid = (struct VenusFid *)
1681                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1682             *tvc->mvid = tvp->dotdot;
1683         }
1684         afs_PutVolume(tvp, READ_LOCK);
1685     }
1686
1687     /* stat the file */
1688     afs_RemoveVCB(afid);
1689     {
1690     struct AFSFetchStatus OutStatus;
1691     code = afs_FetchStatus(tvc, afid, areq, &OutStatus);
1692     }
1693
1694     if (code) {
1695         ReleaseWriteLock(&tvc->lock);
1696
1697         ObtainReadLock(&afs_xvcache);
1698         AFS_FAST_RELE(tvc);
1699         ReleaseReadLock(&afs_xvcache);
1700         return (struct vcache *) 0;
1701     }
1702
1703     ReleaseWriteLock(&tvc->lock);
1704 #ifdef AFS_DARWIN_ENV
1705     osi_VM_Setup(avc);
1706 #endif
1707     return tvc;
1708
1709 } /*afs_GetVCache*/
1710
1711
1712
1713 struct vcache *afs_LookupVCache(struct VenusFid *afid, struct vrequest *areq,
1714                                 afs_int32 *cached, afs_int32 locktype,
1715                                 struct vcache *adp, char *aname)
1716 {
1717     afs_int32 code, now, newvcache=0, hash;
1718     struct VenusFid nfid;
1719     register struct vcache *tvc;
1720     struct volume *tvp;
1721     struct AFSFetchStatus OutStatus;
1722     struct AFSCallBack CallBack;
1723     struct AFSVolSync tsync;
1724     struct server *serverp = 0;
1725     afs_int32 origCBs;
1726     afs_int32 retry;
1727
1728     AFS_STATCNT(afs_GetVCache);
1729     if (cached) *cached = 0;            /* Init just in case */
1730
1731   loop1:
1732     ObtainReadLock(&afs_xvcache);
1733     tvc = afs_FindVCache(afid, 0, 0, &retry, DO_STATS /* no vlru */);
1734
1735     if (tvc) {
1736       ReleaseReadLock(&afs_xvcache);
1737       if (retry) {
1738 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1739         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1740         goto loop1;
1741 #endif
1742       }
1743       ObtainReadLock(&tvc->lock);
1744
1745       if (tvc->states & CStatd) {
1746         if (cached) {
1747           *cached = 1;
1748         }
1749         ReleaseReadLock(&tvc->lock);
1750         return tvc;
1751       } 
1752       tvc->states &= ~CUnique;   
1753
1754         ReleaseReadLock(&tvc->lock);
1755         ObtainReadLock(&afs_xvcache);
1756         AFS_FAST_RELE(tvc);
1757     }  /* if (tvc) */
1758
1759     ReleaseReadLock(&afs_xvcache);
1760
1761     /* lookup the file */
1762     nfid = *afid;
1763     now = osi_Time();
1764     origCBs = afs_allCBs;       /* if anything changes, we don't have a cb */
1765     code = afs_RemoteLookup(&adp->fid, areq, aname, &nfid, &OutStatus, &CallBack,
1766                             &serverp, &tsync);  
1767
1768   loop2:
1769     ObtainSharedLock(&afs_xvcache,6);
1770     tvc = afs_FindVCache(&nfid, 0, 0, &retry, DO_VLRU /* no xstats now*/);
1771     if (tvc && retry) {
1772 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1773       ReleaseSharedLock(&afs_xvcache);
1774       spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1775       goto loop2;
1776 #endif
1777     }
1778
1779     if (!tvc) {
1780         /* no cache entry, better grab one */
1781         UpgradeSToWLock(&afs_xvcache,22);
1782         tvc = afs_NewVCache(&nfid, (struct server *)0, 1, WRITE_LOCK);
1783         newvcache = 1;
1784         ConvertWToSLock(&afs_xvcache);
1785     }
1786
1787     ReleaseSharedLock(&afs_xvcache);
1788     ObtainWriteLock(&tvc->lock,55);
1789  
1790     /* It is always appropriate to throw away all the access rights? */
1791     afs_FreeAllAxs(&(tvc->Access));
1792     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-vol info */
1793     if (tvp) {
1794         if ((tvp->states & VForeign)) {
1795             if (newvcache) tvc->states |= CForeign;
1796             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1797                 && (tvp->rootUnique == afid->Fid.Unique))
1798                 tvc->mvstat = 2;
1799         }
1800         if (tvp->states & VRO) tvc->states |= CRO;
1801         if (tvp->states & VBackup) tvc->states |= CBackup;
1802         /* now copy ".." entry back out of volume structure, if necessary */
1803         if (tvc->mvstat == 2  && tvp->dotdot.Fid.Volume != 0) {
1804             if (!tvc->mvid)
1805                 tvc->mvid = (struct VenusFid *)
1806                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1807             *tvc->mvid = tvp->dotdot;
1808         }
1809     }
1810
1811     if (code) {
1812         ObtainWriteLock(&afs_xcbhash, 465);
1813         afs_DequeueCallback(tvc);
1814         tvc->states &= ~( CStatd | CUnique );
1815         ReleaseWriteLock(&afs_xcbhash);
1816         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
1817           osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
1818         if ( tvp )
1819                 afs_PutVolume(tvp, READ_LOCK);
1820         ReleaseWriteLock(&tvc->lock);
1821         ObtainReadLock(&afs_xvcache);
1822         AFS_FAST_RELE(tvc);
1823         ReleaseReadLock(&afs_xvcache);
1824         return (struct vcache *) 0;
1825     }
1826
1827     ObtainWriteLock(&afs_xcbhash, 466);
1828     if (origCBs == afs_allCBs) {
1829         if (CallBack.ExpirationTime) {
1830             tvc->callback = serverp;
1831             tvc->cbExpires = CallBack.ExpirationTime+now;
1832             tvc->states |= CStatd | CUnique;
1833             tvc->states &= ~CBulkFetching;
1834             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvp);
1835         } else if (tvc->states & CRO) {
1836             /* adapt gives us an hour. */
1837             tvc->cbExpires = 3600+osi_Time(); /*XXX*/
1838             tvc->states |= CStatd | CUnique;
1839             tvc->states &= ~CBulkFetching;
1840             afs_QueueCallback(tvc, CBHash(3600), tvp); 
1841         } else {
1842             tvc->callback = (struct server *)0;
1843             afs_DequeueCallback(tvc);
1844             tvc->states &= ~(CStatd | CUnique);   
1845             if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
1846               osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
1847         }
1848     } else {
1849         afs_DequeueCallback(tvc);
1850         tvc->states &= ~CStatd; 
1851         tvc->states &= ~CUnique;   
1852         tvc->callback = (struct server *)0;
1853         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
1854           osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
1855     }   
1856     ReleaseWriteLock(&afs_xcbhash);
1857     if ( tvp )
1858         afs_PutVolume(tvp, READ_LOCK);
1859     afs_ProcessFS(tvc, &OutStatus, areq);
1860
1861     ReleaseWriteLock(&tvc->lock);
1862 #ifdef AFS_DARWIN_ENV
1863     osi_VM_Setup(tvc);
1864 #endif
1865     return tvc;
1866
1867 }
1868
1869 struct vcache *afs_GetRootVCache(struct VenusFid *afid,
1870                                  struct vrequest *areq, afs_int32 *cached,
1871                                  struct volume *tvolp, afs_int32 locktype)
1872 {
1873     afs_int32 code, i, newvcache = 0, haveStatus = 0;
1874     afs_int32 getNewFid = 0;
1875     afs_uint32 start;
1876     struct VenusFid nfid;
1877     register struct vcache *tvc;
1878     struct server *serverp = 0;
1879     struct AFSFetchStatus OutStatus;
1880     struct AFSCallBack CallBack;
1881     struct AFSVolSync tsync;
1882     int origCBs;
1883
1884     start = osi_Time();
1885
1886  newmtpt:
1887     if (!tvolp->rootVnode || getNewFid) {
1888         struct VenusFid tfid;
1889
1890         tfid = *afid;
1891         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
1892         origCBs = afs_allCBs; /* ignore InitCallBackState */
1893         code = afs_RemoteLookup(&tfid, areq, (char *)0, &nfid, 
1894                                 &OutStatus, &CallBack, &serverp, &tsync);
1895         if (code) {
1896             return (struct vcache *)0;
1897         }
1898 /*      ReleaseReadLock(&tvolp->lock);           */
1899         ObtainWriteLock(&tvolp->lock,56);
1900         tvolp->rootVnode = afid->Fid.Vnode = nfid.Fid.Vnode;
1901         tvolp->rootUnique = afid->Fid.Unique = nfid.Fid.Unique;
1902         ReleaseWriteLock(&tvolp->lock); 
1903 /*      ObtainReadLock(&tvolp->lock);*/
1904         haveStatus = 1;
1905     } else {
1906         afid->Fid.Vnode = tvolp->rootVnode;
1907         afid->Fid.Unique = tvolp->rootUnique;
1908     }   
1909     
1910     ObtainSharedLock(&afs_xvcache,7);
1911     i = VCHash(afid);
1912     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
1913         if (!FidCmp(&(tvc->fid), afid)) {
1914 #ifdef  AFS_OSF_ENV
1915             /* Grab this vnode, possibly reactivating from the free list */
1916             /* for the present (95.05.25) everything on the hash table is 
1917              * definitively NOT in the free list -- at least until afs_reclaim
1918              * can be safely implemented */
1919             int vg;
1920             AFS_GUNLOCK();
1921             vg = vget((struct vnode *)tvc);   /* this bumps ref count */
1922             AFS_GLOCK();
1923             if (vg)
1924                 continue;
1925 #endif  /* AFS_OSF_ENV */
1926             break;
1927         }
1928     }
1929
1930     if (!haveStatus && (!tvc || !(tvc->states & CStatd))) {
1931         /* Mount point no longer stat'd or unknown. FID may have changed. */
1932 #ifdef AFS_OSF_ENV
1933         if (tvc)
1934             AFS_RELE(tvc);
1935 #endif
1936         tvc = (struct vcache*)0;
1937         getNewFid = 1;
1938         ReleaseSharedLock(&afs_xvcache);
1939         goto newmtpt;
1940     }
1941
1942     if (!tvc) {
1943         UpgradeSToWLock(&afs_xvcache,23);
1944         /* no cache entry, better grab one */
1945         tvc = afs_NewVCache(afid, (struct server *)0, 1, WRITE_LOCK);
1946         newvcache = 1;
1947         afs_stats_cmperf.vcacheMisses++;
1948     }
1949     else {
1950         if (cached) *cached = 1;
1951         afs_stats_cmperf.vcacheHits++;
1952 #ifdef  AFS_OSF_ENV
1953         /* we already bumped the ref count in the for loop above */
1954 #else   /* AFS_OSF_ENV */
1955         osi_vnhold(tvc,0);
1956 #endif
1957         UpgradeSToWLock(&afs_xvcache,24);
1958         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
1959            refpanic ("GRVC VLRU inconsistent0");
1960         }
1961         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
1962            refpanic ("GRVC VLRU inconsistent1");
1963         }
1964         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
1965            refpanic ("GRVC VLRU inconsistent2");
1966         }
1967         QRemove(&tvc->vlruq);           /* move to lruq head */
1968         QAdd(&VLRU, &tvc->vlruq);
1969         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
1970            refpanic ("GRVC VLRU inconsistent3");
1971         }
1972         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
1973            refpanic ("GRVC VLRU inconsistent4");
1974         }
1975         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
1976            refpanic ("GRVC VLRU inconsistent5");
1977         }
1978         vcachegen++;
1979     }
1980
1981     ReleaseWriteLock(&afs_xvcache);
1982
1983     if (tvc->states & CStatd) {
1984         return tvc;
1985     } else {  
1986
1987       ObtainReadLock(&tvc->lock);
1988       tvc->states &= ~CUnique;   
1989       tvc->callback = (struct server *)0;              /* redundant, perhaps */
1990       ReleaseReadLock(&tvc->lock);
1991     }
1992
1993     ObtainWriteLock(&tvc->lock,57);
1994
1995     /* It is always appropriate to throw away all the access rights? */
1996     afs_FreeAllAxs(&(tvc->Access));
1997
1998     if (newvcache) tvc->states |= CForeign;
1999     if (tvolp->states & VRO) tvc->states |= CRO;
2000     if (tvolp->states & VBackup) tvc->states |= CBackup;
2001     /* now copy ".." entry back out of volume structure, if necessary */
2002     if (newvcache && (tvolp->rootVnode == afid->Fid.Vnode) 
2003         && (tvolp->rootUnique == afid->Fid.Unique)) {
2004         tvc->mvstat = 2;
2005     }
2006     if (tvc->mvstat == 2  && tvolp->dotdot.Fid.Volume != 0) {
2007         if (!tvc->mvid)
2008             tvc->mvid = (struct VenusFid *)osi_AllocSmallSpace(sizeof(struct VenusFid));
2009         *tvc->mvid = tvolp->dotdot;
2010     }
2011
2012     /* stat the file */
2013     afs_RemoveVCB(afid);
2014
2015     if (!haveStatus) {
2016         struct VenusFid tfid;
2017
2018         tfid = *afid;
2019         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
2020         origCBs = afs_allCBs; /* ignore InitCallBackState */
2021         code = afs_RemoteLookup(&tfid, areq, (char *)0, &nfid, &OutStatus,
2022                                 &CallBack, &serverp, &tsync);
2023     }
2024
2025     if (code) {
2026         ObtainWriteLock(&afs_xcbhash, 467);
2027         afs_DequeueCallback(tvc);
2028         tvc->callback = (struct server *)0;
2029         tvc->states &= ~(CStatd|CUnique);  
2030         ReleaseWriteLock(&afs_xcbhash);
2031         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
2032           osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
2033         ReleaseWriteLock(&tvc->lock);
2034         ObtainReadLock(&afs_xvcache);
2035         AFS_FAST_RELE(tvc);
2036         ReleaseReadLock(&afs_xvcache);
2037         return (struct vcache *) 0;
2038     }
2039         
2040     ObtainWriteLock(&afs_xcbhash, 468);
2041     if (origCBs == afs_allCBs) {
2042         tvc->states |= CTruth;
2043         tvc->callback = serverp;
2044         if (CallBack.ExpirationTime != 0) {  
2045             tvc->cbExpires = CallBack.ExpirationTime+start;
2046             tvc->states |= CStatd;
2047             tvc->states &= ~CBulkFetching;
2048             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvolp);
2049         } else if (tvc->states & CRO) {
2050             /* adapt gives us an hour. */
2051             tvc->cbExpires = 3600+osi_Time(); /*XXX*/
2052             tvc->states |= CStatd;
2053             tvc->states &= ~CBulkFetching;
2054             afs_QueueCallback(tvc, CBHash(3600), tvolp);
2055         }
2056     } else {
2057         afs_DequeueCallback(tvc);
2058         tvc->callback = (struct server *)0;
2059         tvc->states &= ~(CStatd | CUnique);
2060         if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
2061           osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
2062     }
2063     ReleaseWriteLock(&afs_xcbhash);
2064     afs_ProcessFS(tvc, &OutStatus, areq);
2065     
2066     ReleaseWriteLock(&tvc->lock);
2067     return tvc;
2068 }
2069
2070
2071
2072 /*
2073  * must be called with avc write-locked 
2074  * don't absolutely have to invalidate the hint unless the dv has 
2075  * changed, but be sure to get it right else there will be consistency bugs.
2076  */
2077 afs_int32 afs_FetchStatus(struct vcache *avc, struct VenusFid *afid,
2078                       struct vrequest *areq, struct AFSFetchStatus *Outsp)
2079 {
2080   int code;
2081   afs_uint32 start;
2082   register struct conn *tc;
2083   struct AFSCallBack CallBack;
2084   struct AFSVolSync tsync;
2085   struct volume*    volp;
2086   XSTATS_DECLS
2087
2088     do {
2089         tc = afs_Conn(afid, areq, SHARED_LOCK);
2090         avc->quick.stamp = 0; avc->h1.dchint = NULL; /* invalidate hints */
2091         if (tc) {
2092             avc->callback = tc->srvr->server;
2093             start = osi_Time();
2094             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_FETCHSTATUS);
2095 #ifdef RX_ENABLE_LOCKS
2096             AFS_GUNLOCK();
2097 #endif /* RX_ENABLE_LOCKS */
2098             code = RXAFS_FetchStatus(tc->id,
2099                                      (struct AFSFid *) &afid->Fid,
2100                                      Outsp, &CallBack, &tsync);
2101 #ifdef RX_ENABLE_LOCKS
2102             AFS_GLOCK();
2103 #endif /* RX_ENABLE_LOCKS */
2104
2105             XSTATS_END_TIME;
2106
2107         }
2108         else code = -1;
2109     } while
2110         (afs_Analyze(tc, code, afid, areq,
2111                      AFS_STATS_FS_RPCIDX_FETCHSTATUS,
2112                      SHARED_LOCK, (struct cell *)0));
2113
2114 if (!code) {
2115   afs_ProcessFS(avc, Outsp, areq);
2116   volp = afs_GetVolume(afid, areq, READ_LOCK);
2117   ObtainWriteLock(&afs_xcbhash, 469);
2118   avc->states |= CTruth;
2119   if (avc->callback /* check for race */) {
2120     if (CallBack.ExpirationTime != 0) {  
2121       avc->cbExpires = CallBack.ExpirationTime+start;
2122       avc->states |= CStatd;
2123       avc->states &= ~CBulkFetching;
2124       afs_QueueCallback(avc, CBHash(CallBack.ExpirationTime), volp);
2125     }
2126     else if (avc->states & CRO) 
2127       { /* ordinary callback on a read-only volume -- AFS 3.2 style */
2128         avc->cbExpires = 3600+start;
2129         avc->states |= CStatd;
2130         avc->states &= ~CBulkFetching;
2131         afs_QueueCallback(avc, CBHash(3600), volp);
2132        }
2133     else {
2134       afs_DequeueCallback(avc);
2135       avc->callback = (struct server *)0;
2136       avc->states &= ~(CStatd|CUnique);  
2137       if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1)) 
2138         osi_dnlc_purgedp (avc);  /* if it (could be) a directory */
2139     }
2140   }
2141   else {
2142     afs_DequeueCallback(avc);
2143     avc->callback = (struct server *)0;
2144     avc->states &= ~(CStatd|CUnique);  
2145     if ((avc->states & CForeign) || (avc->fid.Fid.Vnode & 1)) 
2146       osi_dnlc_purgedp (avc);  /* if it (could be) a directory */
2147   }
2148   ReleaseWriteLock(&afs_xcbhash);
2149   if ( volp )
2150     afs_PutVolume(volp, READ_LOCK);
2151 }
2152 else {     /* used to undo the local callback, but that's too extreme. 
2153             * There are plenty of good reasons that fetchstatus might return 
2154             * an error, such as EPERM.  If we have the vnode cached, statd, 
2155             * with callback, might as well keep track of the fact that we 
2156             * don't have access...
2157             */
2158      if (code == EPERM || code == EACCES) {
2159        struct axscache *ac;
2160        if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
2161          ac->axess = 0;
2162        else  /* not found, add a new one if possible */
2163          afs_AddAxs(avc->Access, areq->uid, 0);
2164      }
2165 }
2166 return code;
2167 }
2168
2169 #if 0
2170 /*
2171  * afs_StuffVcache
2172  *
2173  * Description:
2174  *      Stuff some information into the vcache for the given file.
2175  *
2176  * Parameters:
2177  *      afid      : File in question.
2178  *      OutStatus : Fetch status on the file.
2179  *      CallBack  : Callback info.
2180  *      tc        : RPC connection involved.
2181  *      areq      : vrequest involved.
2182  *
2183  * Environment:
2184  *      Nothing interesting.
2185  */
2186 void
2187 afs_StuffVcache(afid, OutStatus, CallBack, tc, areq)
2188     register struct VenusFid *afid;
2189     struct AFSFetchStatus *OutStatus;
2190     struct AFSCallBack *CallBack;
2191     register struct conn *tc;
2192     struct vrequest *areq;
2193
2194 { /*afs_StuffVcache*/
2195
2196     register afs_int32 code, i, newvcache=0;
2197     register struct vcache *tvc;
2198     struct AFSVolSync tsync;
2199     struct volume *tvp;
2200     struct axscache *ac;
2201     afs_int32 retry;
2202
2203     AFS_STATCNT(afs_StuffVcache);
2204 #ifdef IFS_VCACHECOUNT
2205     ifs_gvcachecall++;
2206 #endif
2207
2208   loop:
2209     ObtainSharedLock(&afs_xvcache,8);
2210
2211     tvc = afs_FindVCache(afid, 0, 0, &retry, DO_VLRU /* no stats */);
2212     if (tvc && retry) {
2213 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2214         ReleaseSharedLock(&afs_xvcache);
2215         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2216         goto loop;
2217 #endif
2218    }
2219
2220     if (!tvc) {
2221         /* no cache entry, better grab one */
2222         UpgradeSToWLock(&afs_xvcache,25);
2223         tvc = afs_NewVCache(afid, (struct server *)0, 1, WRITE_LOCK);
2224         newvcache = 1;
2225         ConvertWToSLock(&afs_xvcache);
2226     }
2227
2228     ReleaseSharedLock(&afs_xvcache);
2229     ObtainWriteLock(&tvc->lock,58);
2230
2231     tvc->states &= ~CStatd;
2232     if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
2233       osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
2234
2235     /* Is it always appropriate to throw away all the access rights? */
2236     afs_FreeAllAxs(&(tvc->Access));
2237
2238     /*Copy useful per-volume info*/
2239     tvp = afs_GetVolume(afid, areq, READ_LOCK);
2240     if (tvp) {
2241         if (newvcache && (tvp->states & VForeign)) tvc->states |= CForeign;
2242         if (tvp->states & VRO) tvc->states |= CRO;
2243         if (tvp->states & VBackup) tvc->states |= CBackup;
2244         /*
2245          * Now, copy ".." entry back out of volume structure, if
2246          * necessary
2247          */
2248         if (tvc->mvstat == 2  && tvp->dotdot.Fid.Volume != 0) {
2249             if (!tvc->mvid) tvc->mvid =
2250                 (struct VenusFid *) osi_AllocSmallSpace(sizeof(struct VenusFid));
2251             *tvc->mvid = tvp->dotdot;
2252         }
2253     }
2254     /* store the stat on the file */
2255     afs_RemoveVCB(afid);
2256     afs_ProcessFS(tvc, OutStatus, areq);
2257     tvc->callback = tc->srvr->server;
2258
2259     /* we use osi_Time twice below.  Ideally, we would use the time at which 
2260      * the FetchStatus call began, instead, but we don't have it here.  So we
2261      * make do with "now".  In the CRO case, it doesn't really matter. In 
2262      * the other case, we hope that the difference between "now" and when the 
2263      * call actually began execution on the server won't be larger than the
2264      * padding which the server keeps.  Subtract 1 second anyway, to be on 
2265      * the safe side.  Can't subtract more because we don't know how big
2266      * ExpirationTime is.  Possible consistency problems may arise if the call
2267      * timeout period becomes longer than the server's expiration padding.  */
2268     ObtainWriteLock(&afs_xcbhash, 470);
2269     if (CallBack->ExpirationTime != 0) {
2270         tvc->cbExpires = CallBack->ExpirationTime+osi_Time()-1; 
2271         tvc->states |= CStatd;
2272         tvc->states &= ~CBulkFetching;
2273         afs_QueueCallback(tvc, CBHash(CallBack->ExpirationTime), tvp);
2274         }
2275     else if (tvc->states & CRO) {
2276        /* old-fashioned AFS 3.2 style */
2277        tvc->cbExpires = 3600+osi_Time(); /*XXX*/
2278        tvc->states |= CStatd;
2279        tvc->states &= ~CBulkFetching;
2280        afs_QueueCallback(tvc, CBHash(3600), tvp); 
2281      }
2282     else {
2283       afs_DequeueCallback(tvc);
2284       tvc->callback = (struct server *)0;
2285       tvc->states &= ~(CStatd|CUnique);  
2286       if ((tvc->states & CForeign) || (tvc->fid.Fid.Vnode & 1)) 
2287         osi_dnlc_purgedp (tvc);  /* if it (could be) a directory */
2288     }
2289     ReleaseWriteLock(&afs_xcbhash);
2290     if ( tvp )
2291         afs_PutVolume(tvp, READ_LOCK);
2292         
2293     /* look in per-pag cache */
2294       if (tvc->Access && (ac = afs_FindAxs(tvc->Access, areq->uid)))
2295           ac->axess = OutStatus->CallerAccess;   /* substitute pags */
2296       else  /* not found, add a new one if possible */
2297           afs_AddAxs(tvc->Access, areq->uid, OutStatus->CallerAccess);
2298
2299     ReleaseWriteLock(&tvc->lock);
2300     afs_Trace4(afs_iclSetp, CM_TRACE_STUFFVCACHE, ICL_TYPE_POINTER, tvc,
2301                ICL_TYPE_POINTER, tvc->callback, ICL_TYPE_INT32, tvc->cbExpires,
2302                ICL_TYPE_INT32, tvc->cbExpires-osi_Time());
2303     /*
2304      * Release ref count... hope this guy stays around...
2305      */
2306     afs_PutVCache(tvc, WRITE_LOCK);
2307 } /*afs_StuffVcache*/
2308 #endif
2309
2310 /*
2311  * afs_PutVCache
2312  *
2313  * Description:
2314  *      Decrements the reference count on a cache entry.
2315  *
2316  * Parameters:
2317  *      avc : Pointer to the cache entry to decrement.
2318  *
2319  * Environment:
2320  *      Nothing interesting.
2321  */
2322 void
2323 afs_PutVCache(avc, locktype)
2324     register struct vcache *avc;
2325     afs_int32 locktype;
2326 { /*afs_PutVCache*/
2327
2328     AFS_STATCNT(afs_PutVCache);
2329     /*
2330      * Can we use a read lock here?
2331      */
2332     ObtainReadLock(&afs_xvcache);
2333     AFS_FAST_RELE(avc);
2334     ReleaseReadLock(&afs_xvcache);
2335 } /*afs_PutVCache*/
2336
2337 /*
2338  * afs_FindVCache
2339  *
2340  * Description:
2341  *      Find a vcache entry given a fid.
2342  *
2343  * Parameters:
2344  *      afid : Pointer to the fid whose cache entry we desire.
2345  *      retry: (SGI-specific) tell the caller to drop the lock on xvcache, 
2346  *             unlock the vnode, and try again.
2347  *      flags: bit 1 to specify whether to compute hit statistics.  Not
2348  *             set if FindVCache is called as part of internal bookkeeping.
2349  *
2350  * Environment:
2351  *      Must be called with the afs_xvcache lock at least held at
2352  *      the read level.  In order to do the VLRU adjustment, the xvcache lock
2353  *      must be shared-- we upgrade it here.
2354  */
2355
2356 struct vcache *afs_FindVCache(struct VenusFid *afid, afs_int32 lockit,
2357                               afs_int32 locktype, afs_int32 *retry, afs_int32 flag)
2358 {
2359
2360     register struct vcache *tvc;
2361     afs_int32 i;
2362
2363     AFS_STATCNT(afs_FindVCache);
2364
2365     i = VCHash(afid);
2366     for(tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2367         if (FidMatches(afid, tvc)) {
2368 #ifdef  AFS_OSF_ENV
2369             /* Grab this vnode, possibly reactivating from the free list */
2370             int vg;
2371             AFS_GUNLOCK();
2372             vg = vget((struct vnode *)tvc);
2373             AFS_GLOCK();
2374             if (vg)
2375                 continue;
2376 #endif  /* AFS_OSF_ENV */
2377             break;
2378         }
2379     }
2380
2381     /* should I have a read lock on the vnode here? */
2382     if (tvc) {
2383         if (retry) *retry = 0;
2384 #if !defined(AFS_OSF_ENV)
2385         osi_vnhold(tvc, retry);  /* already held, above */
2386         if (retry && *retry) 
2387           return 0;
2388 #endif
2389         /*
2390          * only move to front of vlru if we have proper vcache locking)
2391          */
2392         if (flag & DO_VLRU) {
2393            if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2394               refpanic ("FindVC VLRU inconsistent1");
2395            }
2396            if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2397               refpanic ("FindVC VLRU inconsistent1");
2398            }
2399            if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2400               refpanic ("FindVC VLRU inconsistent2");
2401            }
2402             UpgradeSToWLock(&afs_xvcache,26);
2403             QRemove(&tvc->vlruq);
2404             QAdd(&VLRU, &tvc->vlruq);
2405             ConvertWToSLock(&afs_xvcache);
2406            if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2407               refpanic ("FindVC VLRU inconsistent1");
2408            }
2409            if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2410               refpanic ("FindVC VLRU inconsistent2");
2411            }
2412            if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2413               refpanic ("FindVC VLRU inconsistent3");
2414            }
2415         }
2416         vcachegen++;
2417     } 
2418
2419     if (flag & DO_STATS) {
2420       if (tvc)  afs_stats_cmperf.vcacheHits++;
2421       else      afs_stats_cmperf.vcacheMisses++;
2422       if (afid->Cell == LOCALCELL)
2423         afs_stats_cmperf.vlocalAccesses++;
2424       else
2425         afs_stats_cmperf.vremoteAccesses++;
2426     }
2427
2428 #ifdef AFS_LINUX22_ENV
2429     if (tvc && (tvc->states & CStatd))
2430         vcache2inode(tvc); /* mainly to reset i_nlink */
2431 #endif
2432 #ifdef AFS_DARWIN_ENV
2433     if (tvc)
2434         osi_VM_Setup(tvc);
2435 #endif
2436     return tvc;
2437 } /*afs_FindVCache*/
2438
2439 /*
2440  * afs_NFSFindVCache
2441  *
2442  * Description:
2443  *      Find a vcache entry given a fid. Does a wildcard match on what we
2444  *      have for the fid. If more than one entry, don't return anything.
2445  *
2446  * Parameters:
2447  *      avcp : Fill in pointer if we found one and only one.
2448  *      afid : Pointer to the fid whose cache entry we desire.
2449  *      retry: (SGI-specific) tell the caller to drop the lock on xvcache, 
2450  *             unlock the vnode, and try again.
2451  *      flags: bit 1 to specify whether to compute hit statistics.  Not
2452  *             set if FindVCache is called as part of internal bookkeeping.
2453  *
2454  * Environment:
2455  *      Must be called with the afs_xvcache lock at least held at
2456  *      the read level.  In order to do the VLRU adjustment, the xvcache lock
2457  *      must be shared-- we upgrade it here.
2458  *
2459  * Return value:
2460  *      number of matches found.
2461  */
2462
2463 int afs_duplicate_nfs_fids=0;
2464
2465 afs_int32 afs_NFSFindVCache(avcp, afid, lockit)
2466      struct vcache **avcp;
2467     struct VenusFid *afid;
2468     afs_int32 lockit;
2469 { /*afs_FindVCache*/
2470
2471     register struct vcache *tvc;
2472     afs_int32 i;
2473     afs_int32 retry = 0;
2474     afs_int32 count = 0;
2475     struct vcache *found_tvc = NULL;
2476
2477     AFS_STATCNT(afs_FindVCache);
2478
2479  loop:
2480
2481     ObtainSharedLock(&afs_xvcache,331); 
2482
2483     i = VCHash(afid);
2484     for(tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2485         /* Match only on what we have.... */
2486         if (((tvc->fid.Fid.Vnode & 0xffff) == afid->Fid.Vnode)
2487             && (tvc->fid.Fid.Volume == afid->Fid.Volume)
2488             && ((tvc->fid.Fid.Unique & 0xffffff) == afid->Fid.Unique)
2489             && (tvc->fid.Cell == afid->Cell)) {
2490 #ifdef  AFS_OSF_ENV
2491             /* Grab this vnode, possibly reactivating from the free list */
2492             int vg;
2493             AFS_GUNLOCK();
2494             vg = vget((struct vnode *)tvc);
2495             AFS_GLOCK();
2496             if (vg) {
2497                 /* This vnode no longer exists. */
2498                 continue;
2499             }
2500 #endif  /* AFS_OSF_ENV */
2501             count ++;
2502             if (found_tvc) {
2503                 /* Duplicates */
2504 #ifdef AFS_OSF_ENV
2505                 /* Drop our reference counts. */
2506                 vrele((struct vnode *)tvc);
2507                 vrele((struct vnode *)found_tvc);
2508 #endif
2509                 afs_duplicate_nfs_fids++;
2510                 ReleaseSharedLock(&afs_xvcache);
2511                 return count;
2512             }
2513             found_tvc = tvc;
2514         }
2515     }
2516
2517     tvc = found_tvc;
2518     /* should I have a read lock on the vnode here? */
2519     if (tvc) {
2520 #if defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2521         osi_vnhold(tvc, &retry); 
2522         if (retry) {
2523             count = 0;
2524             found_tvc = (struct vcache*)0;
2525             ReleaseSharedLock(&afs_xvcache);
2526             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2527             goto loop;
2528         }
2529 #else
2530 #if !defined(AFS_OSF_ENV)
2531         osi_vnhold(tvc, (int*)0);  /* already held, above */
2532 #endif
2533 #endif
2534         /*
2535          * We obtained the xvcache lock above.
2536          */
2537         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2538             refpanic ("FindVC VLRU inconsistent1");
2539         }
2540         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2541             refpanic ("FindVC VLRU inconsistent1");
2542         }
2543         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2544             refpanic ("FindVC VLRU inconsistent2");
2545         }
2546         UpgradeSToWLock(&afs_xvcache,568);
2547         QRemove(&tvc->vlruq);
2548         QAdd(&VLRU, &tvc->vlruq);
2549         ConvertWToSLock(&afs_xvcache);
2550         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2551             refpanic ("FindVC VLRU inconsistent1");
2552         }
2553         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2554             refpanic ("FindVC VLRU inconsistent2");
2555         }
2556         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2557             refpanic ("FindVC VLRU inconsistent3");
2558         }
2559     }
2560     vcachegen++;
2561
2562     if (tvc)    afs_stats_cmperf.vcacheHits++;
2563     else        afs_stats_cmperf.vcacheMisses++;
2564     if (afid->Cell == LOCALCELL)
2565         afs_stats_cmperf.vlocalAccesses++;
2566     else
2567         afs_stats_cmperf.vremoteAccesses++;
2568
2569     *avcp = tvc; /* May be null */
2570
2571     ReleaseSharedLock(&afs_xvcache);
2572     return (tvc ? 1 : 0);
2573
2574 } /*afs_NFSFindVCache*/
2575
2576
2577
2578
2579 /*
2580  * afs_vcacheInit
2581  *
2582  * Initialize vcache related variables
2583  */
2584 void afs_vcacheInit(int astatSize)
2585 {
2586     register struct vcache *tvp;
2587     int i;
2588 #if     defined(AFS_OSF_ENV)
2589     if (!afs_maxvcount) {
2590 #if     defined(AFS_OSF30_ENV)
2591         afs_maxvcount = max_vnodes/2;  /* limit ourselves to half the total */
2592 #else
2593         afs_maxvcount = nvnode/2;  /* limit ourselves to half the total */  
2594 #endif 
2595         if (astatSize < afs_maxvcount) {
2596             afs_maxvcount = astatSize;
2597         }
2598     }
2599 #else   /* AFS_OSF_ENV */
2600     freeVCList = (struct vcache *)0;
2601 #endif
2602
2603     RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2604     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2605
2606 #if     !defined(AFS_OSF_ENV)
2607     /* Allocate and thread the struct vcache entries */
2608     tvp = (struct vcache *) afs_osi_Alloc(astatSize * sizeof(struct vcache));
2609     memset((char *)tvp, 0, sizeof(struct vcache)*astatSize);
2610
2611     Initial_freeVCList = tvp;
2612     freeVCList = &(tvp[0]);
2613     for(i=0; i < astatSize-1; i++) {
2614        tvp[i].nextfree = &(tvp[i+1]);
2615     }   
2616     tvp[astatSize-1].nextfree = (struct vcache *) 0;
2617 #ifdef  AFS_AIX32_ENV
2618     pin((char *)tvp, astatSize * sizeof(struct vcache));        /* XXX */    
2619 #endif
2620 #endif
2621
2622
2623 #if defined(AFS_SGI_ENV)
2624     for(i=0; i < astatSize; i++) {
2625         char name[METER_NAMSZ];
2626         struct vcache *tvc = &tvp[i];
2627
2628         tvc->v.v_number = ++afsvnumbers;
2629         tvc->vc_rwlockid = OSI_NO_LOCKID;
2630         initnsema(&tvc->vc_rwlock, 1, makesname(name, "vrw", tvc->v.v_number));
2631 #ifndef AFS_SGI53_ENV
2632         initnsema(&tvc->v.v_sync, 0, makesname(name, "vsy", tvc->v.v_number));
2633 #endif
2634 #ifndef AFS_SGI62_ENV
2635         initnlock(&tvc->v.v_lock, makesname(name, "vlk", tvc->v.v_number));
2636 #endif /* AFS_SGI62_ENV */
2637     }
2638 #endif
2639
2640     QInit(&VLRU);
2641
2642
2643 }
2644
2645 /*
2646  * shutdown_vcache
2647  *
2648  */
2649 void shutdown_vcache(void)
2650 {
2651     int i;
2652     struct afs_cbr *tsp, *nsp;
2653     /*
2654      * XXX We may potentially miss some of the vcaches because if when there're no
2655      * free vcache entries and all the vcache entries are active ones then we allocate
2656      * an additional one - admittedly we almost never had that occur.
2657      */
2658 #if     !defined(AFS_OSF_ENV)
2659     afs_osi_Free(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2660 #endif
2661 #ifdef  AFS_AIX32_ENV
2662     unpin(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2663 #endif
2664
2665     {
2666         register struct afs_q *tq, *uq;
2667         register struct vcache *tvc;
2668         for (tq = VLRU.prev; tq != &VLRU; tq = uq) {
2669             tvc = QTOV(tq);
2670             uq = QPrev(tq);
2671             if (tvc->mvid) {
2672                 osi_FreeSmallSpace(tvc->mvid);
2673                 tvc->mvid = (struct VenusFid*)0;
2674             }
2675 #ifdef  AFS_AIX_ENV
2676             aix_gnode_rele((struct vnode *)tvc);
2677 #endif
2678             if (tvc->linkData) {
2679                 afs_osi_Free(tvc->linkData, strlen(tvc->linkData)+1);
2680                 tvc->linkData = 0;
2681             }
2682         }
2683         /* 
2684          * Also free the remaining ones in the Cache 
2685          */
2686         for (i=0; i < VCSIZE; i++) {
2687             for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2688                 if (tvc->mvid) {
2689                     osi_FreeSmallSpace(tvc->mvid);
2690                     tvc->mvid = (struct VenusFid*)0;
2691                 }
2692 #ifdef  AFS_AIX_ENV
2693                 if (tvc->v.v_gnode)
2694                     afs_osi_Free(tvc->v.v_gnode, sizeof(struct gnode));
2695 #ifdef  AFS_AIX32_ENV
2696                 if (tvc->segid) {
2697                     AFS_GUNLOCK();
2698                     vms_delete(tvc->segid);
2699                     AFS_GLOCK();
2700                     tvc->segid = tvc->vmh = NULL;
2701                     if (VREFCOUNT(tvc)) osi_Panic("flushVcache: vm race");
2702                 }
2703                 if (tvc->credp) {
2704                     crfree(tvc->credp);
2705                     tvc->credp = NULL;
2706                 }
2707 #endif
2708 #endif
2709 #if     defined(AFS_SUN5_ENV)
2710                 if (tvc->credp) {
2711                     crfree(tvc->credp);
2712                     tvc->credp = NULL;
2713                 }
2714 #endif
2715                 if (tvc->linkData) {
2716                     afs_osi_Free(tvc->linkData, strlen(tvc->linkData)+1);
2717                     tvc->linkData = 0;
2718                 }
2719
2720                 afs_FreeAllAxs(&(tvc->Access));
2721             }
2722             afs_vhashT[i] = 0;
2723         }
2724     }
2725     /*
2726      * Free any leftover callback queue
2727      */
2728     for (tsp = afs_cbrSpace; tsp; tsp = nsp ) {
2729         nsp = tsp->next;
2730         afs_osi_Free((char *)tsp, AFS_NCBRS * sizeof(struct afs_cbr));
2731     }
2732     afs_cbrSpace = 0;
2733
2734 #if     !defined(AFS_OSF_ENV)
2735     freeVCList = Initial_freeVCList = 0;
2736 #endif
2737     RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2738     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2739     QInit(&VLRU);
2740
2741 }