LINUX: Avoid unnecessary afs_ShakeLooseVCaches
[openafs.git] / src / afs / afs_vcache.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * Implements:
12  * afs_FlushVCache
13  * afs_AllocCBR
14  * afs_FreeCBR
15  * afs_FlushVCBs
16  * afs_QueueVCB
17  * afs_RemoveVCB
18  * afs_NewVCache
19  * afs_FlushActiveVcaches
20  * afs_VerifyVCache2
21  * afs_WriteVCache
22  * afs_WriteVCacheDiscon
23  * afs_SimpleVStat
24  * afs_ProcessFS
25  * TellALittleWhiteLie
26  * afs_RemoteLookup
27  * afs_GetVCache
28  * afs_LookupVCache
29  * afs_GetRootVCache
30  * afs_UpdateStatus
31  * afs_FetchStatus
32  * afs_StuffVcache
33  * afs_PutVCache
34  * afs_FindVCache
35  * afs_NFSFindVCache
36  * afs_vcacheInit
37  * shutdown_vcache
38  *
39  */
40 #include <afsconfig.h>
41 #include "afs/param.h"
42
43 #include "afs/sysincludes.h"   /*Standard vendor system headers */
44 #include "afsincludes.h"       /*AFS-based standard headers */
45 #include "afs/afs_stats.h"
46 #include "afs/afs_cbqueue.h"
47 #include "afs/afs_osidnlc.h"
48
49 afs_int32 afs_maxvcount = 0;    /* max number of vcache entries */
50 afs_int32 afs_vcount = 0;       /* number of vcache in use now */
51
52 #ifdef AFS_SGI_ENV
53 int afsvnumbers = 0;
54 #endif
55
56 #ifdef AFS_SGI64_ENV
57 char *makesname();
58 #endif /* AFS_SGI64_ENV */
59
60 /* Exported variables */
61 afs_rwlock_t afs_xvcdirty;      /*Lock: discon vcache dirty list mgmt */
62 afs_rwlock_t afs_xvcache;       /*Lock: alloc new stat cache entries */
63 afs_rwlock_t afs_xvreclaim;     /*Lock: entries reclaimed, not on free list */
64 afs_lock_t afs_xvcb;            /*Lock: fids on which there are callbacks */
65 #if !defined(AFS_LINUX22_ENV)
66 static struct vcache *freeVCList;       /*Free list for stat cache entries */
67 struct vcache *ReclaimedVCList; /*Reclaimed list for stat entries */
68 static struct vcache *Initial_freeVCList;       /*Initial list for above */
69 #endif
70 struct afs_q VLRU;              /*vcache LRU */
71 afs_int32 vcachegen = 0;
72 unsigned int afs_paniconwarn = 0;
73 struct vcache *afs_vhashT[VCSIZE];
74 struct afs_q afs_vhashTV[VCSIZE];
75 static struct afs_cbr *afs_cbrHashT[CBRSIZE];
76 afs_int32 afs_bulkStatsLost;
77 int afs_norefpanic = 0;
78
79
80 /* Disk backed vcache definitions
81  * Both protected by xvcache */
82 static int afs_nextVcacheSlot = 0;
83 static struct afs_slotlist *afs_freeSlotList = NULL;
84
85 /* Forward declarations */
86 static afs_int32 afs_QueueVCB(struct vcache *avc);
87
88 /*!
89  * Generate an index into the hash table for a given Fid.
90  * \param fid
91  * \return The hash value.
92  */
93 static int
94 afs_HashCBRFid(struct AFSFid *fid)
95 {
96     return (fid->Volume + fid->Vnode + fid->Unique) % CBRSIZE;
97 }
98
99 /*!
100  * Insert a CBR entry into the hash table.
101  * Must be called with afs_xvcb held.
102  * \param cbr
103  * \return
104  */
105 static void
106 afs_InsertHashCBR(struct afs_cbr *cbr)
107 {
108     int slot = afs_HashCBRFid(&cbr->fid);
109
110     cbr->hash_next = afs_cbrHashT[slot];
111     if (afs_cbrHashT[slot])
112         afs_cbrHashT[slot]->hash_pprev = &cbr->hash_next;
113
114     cbr->hash_pprev = &afs_cbrHashT[slot];
115     afs_cbrHashT[slot] = cbr;
116 }
117
118 /*!
119  *
120  * Flush the given vcache entry.
121  *
122  * Environment:
123  *      afs_xvcache lock must be held for writing upon entry to
124  *      prevent people from changing the vrefCount field, and to
125  *      protect the lruq and hnext fields.
126  * LOCK: afs_FlushVCache afs_xvcache W
127  * REFCNT: vcache ref count must be zero on entry except for osf1
128  * RACE: lock is dropped and reobtained, permitting race in caller
129  *
130  * \param avc Pointer to vcache entry to flush.
131  * \param slept Pointer to int to set 1 if we sleep/drop locks, 0 if we don't.
132  *
133  */
134 int
135 afs_FlushVCache(struct vcache *avc, int *slept)
136 {                               /*afs_FlushVCache */
137
138     afs_int32 i, code;
139     struct vcache **uvc, *wvc;
140
141     *slept = 0;
142     AFS_STATCNT(afs_FlushVCache);
143     afs_Trace2(afs_iclSetp, CM_TRACE_FLUSHV, ICL_TYPE_POINTER, avc,
144                ICL_TYPE_INT32, avc->f.states);
145
146     code = osi_VM_FlushVCache(avc, slept);
147     if (code)
148         goto bad;
149
150     if (avc->f.states & CVFlushed) {
151         code = EBUSY;
152         goto bad;
153     }
154 #if !defined(AFS_LINUX22_ENV)
155     if (avc->nextfree || !avc->vlruq.prev || !avc->vlruq.next) {        /* qv afs.h */
156         refpanic("LRU vs. Free inconsistency");
157     }
158 #endif
159     avc->f.states |= CVFlushed;
160     /* pull the entry out of the lruq and put it on the free list */
161     QRemove(&avc->vlruq);
162
163     /* keep track of # of files that we bulk stat'd, but never used
164      * before they got recycled.
165      */
166     if (avc->f.states & CBulkStat)
167         afs_bulkStatsLost++;
168     vcachegen++;
169     /* remove entry from the hash chain */
170     i = VCHash(&avc->f.fid);
171     uvc = &afs_vhashT[i];
172     for (wvc = *uvc; wvc; uvc = &wvc->hnext, wvc = *uvc) {
173         if (avc == wvc) {
174             *uvc = avc->hnext;
175             avc->hnext = (struct vcache *)NULL;
176             break;
177         }
178     }
179
180     /* remove entry from the volume hash table */
181     QRemove(&avc->vhashq);
182
183     if (avc->mvid)
184         osi_FreeSmallSpace(avc->mvid);
185     avc->mvid = (struct VenusFid *)0;
186     if (avc->linkData) {
187         afs_osi_Free(avc->linkData, strlen(avc->linkData) + 1);
188         avc->linkData = NULL;
189     }
190 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
191     /* OK, there are no internal vrefCounts, so there shouldn't
192      * be any more refs here. */
193     if (avc->v) {
194 #ifdef AFS_DARWIN80_ENV
195         vnode_clearfsnode(AFSTOV(avc));
196         vnode_removefsref(AFSTOV(avc));
197 #else
198         avc->v->v_data = NULL;  /* remove from vnode */
199 #endif
200         AFSTOV(avc) = NULL;             /* also drop the ptr to vnode */
201     }
202 #endif
203 #ifdef AFS_SUN510_ENV
204     /* As we use private vnodes, cleanup is up to us */
205     vn_reinit(AFSTOV(avc));
206 #endif
207     afs_FreeAllAxs(&(avc->Access));
208     if (!afs_shuttingdown)
209         afs_QueueVCB(avc);
210     ObtainWriteLock(&afs_xcbhash, 460);
211     afs_DequeueCallback(avc);   /* remove it from queued callbacks list */
212     avc->f.states &= ~(CStatd | CUnique);
213     ReleaseWriteLock(&afs_xcbhash);
214     if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
215         osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
216     else
217         osi_dnlc_purgevp(avc);
218
219     /*
220      * Next, keep track of which vnodes we've deleted for create's
221      * optimistic synchronization algorithm
222      */
223     afs_allZaps++;
224     if (avc->f.fid.Fid.Vnode & 1)
225         afs_oddZaps++;
226     else
227         afs_evenZaps++;
228
229     afs_vcount--;
230 #if !defined(AFS_LINUX22_ENV)
231     /* put the entry in the free list */
232     avc->nextfree = freeVCList;
233     freeVCList = avc;
234     if (avc->vlruq.prev || avc->vlruq.next) {
235         refpanic("LRU vs. Free inconsistency");
236     }
237     avc->f.states |= CVFlushed;
238 #else
239     /* This should put it back on the vnode free list since usecount is 1 */
240     vSetType(avc, VREG);
241     if (VREFCOUNT_GT(avc,0)) {
242         AFS_RELE(AFSTOV(avc));
243         afs_stats_cmperf.vcacheXAllocs--;
244     } else {
245         if (afs_norefpanic) {
246             afs_warn("flush vc refcnt < 1");
247             afs_norefpanic++;
248         } else
249             osi_Panic("flush vc refcnt < 1");
250     }
251 #endif /* AFS_LINUX22_ENV */
252     return 0;
253
254   bad:
255     return code;
256 }                               /*afs_FlushVCache */
257
258 #ifndef AFS_SGI_ENV
259 /*!
260  *  The core of the inactive vnode op for all but IRIX.
261  *
262  * \param avc
263  * \param acred
264  */
265 void
266 afs_InactiveVCache(struct vcache *avc, afs_ucred_t *acred)
267 {
268     AFS_STATCNT(afs_inactive);
269     if (avc->f.states & CDirty) {
270         /* we can't keep trying to push back dirty data forever.  Give up. */
271         afs_InvalidateAllSegments(avc); /* turns off dirty bit */
272     }
273     avc->f.states &= ~CMAPPED;  /* mainly used by SunOS 4.0.x */
274     avc->f.states &= ~CDirty;   /* Turn it off */
275     if (avc->f.states & CUnlinked) {
276         if (CheckLock(&afs_xvcache) || CheckLock(&afs_xdcache)) {
277             avc->f.states |= CUnlinkedDel;
278             return;
279         }
280         afs_remunlink(avc, 1);  /* ignore any return code */
281     }
282
283 }
284 #endif
285
286 /*!
287  *   Allocate a callback return structure from the
288  * free list and return it.
289  *
290  * Environment: The alloc and free routines are both called with the afs_xvcb lock
291  * held, so we don't have to worry about blocking in osi_Alloc.
292  *
293  * \return The allocated afs_cbr.
294  */
295 static struct afs_cbr *afs_cbrSpace = 0;
296 /* if alloc limit below changes, fix me! */
297 static struct afs_cbr *afs_cbrHeads[16];
298 struct afs_cbr *
299 afs_AllocCBR(void)
300 {
301     struct afs_cbr *tsp;
302     int i;
303
304     if (!afs_cbrSpace) {
305         afs_osi_CancelWait(&AFS_WaitHandler);   /* trigger FlushVCBs asap */
306
307         if (afs_stats_cmperf.CallBackAlloced >= sizeof(afs_cbrHeads)/sizeof(afs_cbrHeads[0])) {
308             /* don't allocate more than 16 * AFS_NCBRS for now */
309             tsp = (struct afs_cbr *)osi_AllocSmallSpace(sizeof(*tsp));
310             tsp->dynalloc = 1;
311             tsp->next = NULL;
312             afs_stats_cmperf.CallBackFlushes++;
313         } else {
314             /* try allocating */
315             tsp = afs_osi_Alloc(AFS_NCBRS * sizeof(struct afs_cbr));
316             osi_Assert(tsp != NULL);
317             for (i = 0; i < AFS_NCBRS - 1; i++) {
318                 tsp[i].next = &tsp[i + 1];
319                 tsp[i].dynalloc = 0;
320             }
321             tsp[AFS_NCBRS - 1].next = 0;
322             tsp[AFS_NCBRS - 1].dynalloc = 0;
323             afs_cbrSpace = tsp->next;
324             afs_cbrHeads[afs_stats_cmperf.CallBackAlloced] = tsp;
325             afs_stats_cmperf.CallBackAlloced++;
326         }
327     } else {
328         tsp = afs_cbrSpace;
329         afs_cbrSpace = tsp->next;
330     }
331     return tsp;
332 }
333
334 /*!
335  * Free a callback return structure, removing it from all lists.
336  *
337  * Environment: the xvcb lock is held over these calls.
338  *
339  * \param asp The address of the structure to free.
340  *
341  * \rerurn 0
342  */
343 int
344 afs_FreeCBR(struct afs_cbr *asp)
345 {
346     *(asp->pprev) = asp->next;
347     if (asp->next)
348         asp->next->pprev = asp->pprev;
349
350     *(asp->hash_pprev) = asp->hash_next;
351     if (asp->hash_next)
352         asp->hash_next->hash_pprev = asp->hash_pprev;
353
354     if (asp->dynalloc) {
355         osi_FreeSmallSpace(asp);
356     } else {
357         asp->next = afs_cbrSpace;
358         afs_cbrSpace = asp;
359     }
360     return 0;
361 }
362
363 /*!
364  *   Flush all queued callbacks to all servers.
365  *
366  * Environment: holds xvcb lock over RPC to guard against race conditions
367  *      when a new callback is granted for the same file later on.
368  *
369  * \return 0 for success.
370  */
371 afs_int32
372 afs_FlushVCBs(afs_int32 lockit)
373 {
374     struct AFSFid *tfids;
375     struct AFSCallBack callBacks[1];
376     struct AFSCBFids fidArray;
377     struct AFSCBs cbArray;
378     afs_int32 code;
379     struct afs_cbr *tcbrp;
380     int tcount;
381     struct server *tsp;
382     int i;
383     struct vrequest treq;
384     struct afs_conn *tc;
385     int safety1, safety2, safety3;
386     XSTATS_DECLS;
387     if ((code = afs_InitReq(&treq, afs_osi_credp)))
388         return code;
389     treq.flags |= O_NONBLOCK;
390     tfids = afs_osi_Alloc(sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
391     osi_Assert(tfids != NULL);
392
393     if (lockit)
394         ObtainWriteLock(&afs_xvcb, 273);
395     ObtainReadLock(&afs_xserver);
396     for (i = 0; i < NSERVERS; i++) {
397         for (safety1 = 0, tsp = afs_servers[i];
398              tsp && safety1 < afs_totalServers + 10;
399              tsp = tsp->next, safety1++) {
400             /* don't have any */
401             if (tsp->cbrs == (struct afs_cbr *)0)
402                 continue;
403
404             /* otherwise, grab a block of AFS_MAXCBRSCALL from the list
405              * and make an RPC, over and over again.
406              */
407             tcount = 0;         /* number found so far */
408             for (safety2 = 0; safety2 < afs_cacheStats; safety2++) {
409                 if (tcount >= AFS_MAXCBRSCALL || !tsp->cbrs) {
410                     /* if buffer is full, or we've queued all we're going
411                      * to from this server, we should flush out the
412                      * callbacks.
413                      */
414                     fidArray.AFSCBFids_len = tcount;
415                     fidArray.AFSCBFids_val = (struct AFSFid *)tfids;
416                     cbArray.AFSCBs_len = 1;
417                     cbArray.AFSCBs_val = callBacks;
418                     memset(&callBacks[0], 0, sizeof(callBacks[0]));
419                     callBacks[0].CallBackType = CB_EXCLUSIVE;
420                     for (safety3 = 0; safety3 < AFS_MAXHOSTS * 2; safety3++) {
421                         tc = afs_ConnByHost(tsp, tsp->cell->fsport,
422                                             tsp->cell->cellNum, &treq, 0,
423                                             SHARED_LOCK);
424                         if (tc) {
425                             XSTATS_START_TIME
426                                 (AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS);
427                             RX_AFS_GUNLOCK();
428                             code =
429                                 RXAFS_GiveUpCallBacks(tc->id, &fidArray,
430                                                       &cbArray);
431                             RX_AFS_GLOCK();
432                             XSTATS_END_TIME;
433                         } else
434                             code = -1;
435                         if (!afs_Analyze
436                             (tc, code, 0, &treq,
437                              AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS, SHARED_LOCK,
438                              tsp->cell)) {
439                             break;
440                         }
441                     }
442                     /* ignore return code, since callbacks may have
443                      * been returned anyway, we shouldn't leave them
444                      * around to be returned again.
445                      *
446                      * Next, see if we are done with this server, and if so,
447                      * break to deal with the next one.
448                      */
449                     if (!tsp->cbrs)
450                         break;
451                     tcount = 0;
452                 }
453                 /* if to flush full buffer */
454                 /* if we make it here, we have an entry at the head of cbrs,
455                  * which we should copy to the file ID array and then free.
456                  */
457                 tcbrp = tsp->cbrs;
458                 tfids[tcount++] = tcbrp->fid;
459
460                 /* Freeing the CBR will unlink it from the server's CBR list */
461                 afs_FreeCBR(tcbrp);
462             }                   /* while loop for this one server */
463             if (safety2 > afs_cacheStats) {
464                 afs_warn("possible internal error afs_flushVCBs (%d)\n",
465                          safety2);
466             }
467         }                       /* for loop for this hash chain */
468     }                           /* loop through all hash chains */
469     if (safety1 > afs_totalServers + 2) {
470         afs_warn
471             ("AFS internal error (afs_flushVCBs) (%d > %d), continuing...\n",
472              safety1, afs_totalServers + 2);
473         if (afs_paniconwarn)
474             osi_Panic("afs_flushVCBS safety1");
475     }
476
477     ReleaseReadLock(&afs_xserver);
478     if (lockit)
479         ReleaseWriteLock(&afs_xvcb);
480     afs_osi_Free(tfids, sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
481     return 0;
482 }
483
484 /*!
485  *  Queue a callback on the given fid.
486  *
487  * Environment:
488  *      Locks the xvcb lock.
489  *      Called when the xvcache lock is already held.
490  *
491  * \param avc vcache entry
492  * \return 1 if queued, 0 otherwise
493  */
494
495 static afs_int32
496 afs_QueueVCB(struct vcache *avc)
497 {
498     int queued = 0;
499     struct server *tsp;
500     struct afs_cbr *tcbp;
501
502     AFS_STATCNT(afs_QueueVCB);
503
504     ObtainWriteLock(&afs_xvcb, 274);
505
506     /* we can't really give back callbacks on RO files, since the
507      * server only tracks them on a per-volume basis, and we don't
508      * know whether we still have some other files from the same
509      * volume. */
510     if (!((avc->f.states & CRO) == 0 && avc->callback)) {
511         goto done;
512     }
513
514     /* The callback is really just a struct server ptr. */
515     tsp = (struct server *)(avc->callback);
516
517     /* we now have a pointer to the server, so we just allocate
518      * a queue entry and queue it.
519      */
520     tcbp = afs_AllocCBR();
521     tcbp->fid = avc->f.fid.Fid;
522
523     tcbp->next = tsp->cbrs;
524     if (tsp->cbrs)
525         tsp->cbrs->pprev = &tcbp->next;
526
527     tsp->cbrs = tcbp;
528     tcbp->pprev = &tsp->cbrs;
529
530     afs_InsertHashCBR(tcbp);
531     queued = 1;
532
533  done:
534     /* now release locks and return */
535     ReleaseWriteLock(&afs_xvcb);
536     return queued;
537 }
538
539
540 /*!
541  *   Remove a queued callback for a given Fid.
542  *
543  * Environment:
544  *      Locks xvcb and xserver locks.
545  *      Typically called with xdcache, xvcache and/or individual vcache
546  *      entries locked.
547  *
548  * \param afid The fid we want cleansed of queued callbacks.
549  *
550  */
551
552 void
553 afs_RemoveVCB(struct VenusFid *afid)
554 {
555     int slot;
556     struct afs_cbr *cbr, *ncbr;
557
558     AFS_STATCNT(afs_RemoveVCB);
559     ObtainWriteLock(&afs_xvcb, 275);
560
561     slot = afs_HashCBRFid(&afid->Fid);
562     ncbr = afs_cbrHashT[slot];
563
564     while (ncbr) {
565         cbr = ncbr;
566         ncbr = cbr->hash_next;
567
568         if (afid->Fid.Volume == cbr->fid.Volume &&
569             afid->Fid.Vnode == cbr->fid.Vnode &&
570             afid->Fid.Unique == cbr->fid.Unique) {
571             afs_FreeCBR(cbr);
572         }
573     }
574
575     ReleaseWriteLock(&afs_xvcb);
576 }
577
578 void
579 afs_FlushReclaimedVcaches(void)
580 {
581 #if !defined(AFS_LINUX22_ENV)
582     struct vcache *tvc;
583     int code, fv_slept;
584     struct vcache *tmpReclaimedVCList = NULL;
585
586     ObtainWriteLock(&afs_xvreclaim, 76);
587     while (ReclaimedVCList) {
588         tvc = ReclaimedVCList;  /* take from free list */
589         ReclaimedVCList = tvc->nextfree;
590         tvc->nextfree = NULL;
591         code = afs_FlushVCache(tvc, &fv_slept);
592         if (code) {
593             /* Ok, so, if we got code != 0, uh, wtf do we do? */
594             /* Probably, build a temporary list and then put all back when we
595                get to the end of the list */
596             /* This is actually really crappy, but we need to not leak these.
597                We probably need a way to be smarter about this. */
598             tvc->nextfree = tmpReclaimedVCList;
599             tmpReclaimedVCList = tvc;
600             /* printf("Reclaim list flush %lx failed: %d\n", (unsigned long) tvc, code); */
601         }
602         if (tvc->f.states & (CVInit
603 #ifdef AFS_DARWIN80_ENV
604                           | CDeadVnode
605 #endif
606            )) {
607            tvc->f.states &= ~(CVInit
608 #ifdef AFS_DARWIN80_ENV
609                             | CDeadVnode
610 #endif
611            );
612            afs_osi_Wakeup(&tvc->f.states);
613         }
614     }
615     if (tmpReclaimedVCList)
616         ReclaimedVCList = tmpReclaimedVCList;
617
618     ReleaseWriteLock(&afs_xvreclaim);
619 #endif
620 }
621
622 void
623 afs_PostPopulateVCache(struct vcache *avc, struct VenusFid *afid, int seq)
624 {
625     /*
626      * The proper value for mvstat (for root fids) is setup by the caller.
627      */
628     avc->mvstat = 0;
629     if (afid->Fid.Vnode == 1 && afid->Fid.Unique == 1)
630         avc->mvstat = 2;
631
632     if (afs_globalVFS == 0)
633         osi_Panic("afs globalvfs");
634
635     osi_PostPopulateVCache(avc);
636
637     avc->dchint = NULL;
638     osi_dnlc_purgedp(avc);      /* this may be overkill */
639     memset(&(avc->callsort), 0, sizeof(struct afs_q));
640     avc->slocks = NULL;
641     avc->f.states &=~ CVInit;
642     if (seq) {
643         avc->f.states |= CBulkFetching;
644         avc->f.m.Length = seq;
645     }
646     afs_osi_Wakeup(&avc->f.states);
647 }
648
649 int
650 afs_ShakeLooseVCaches(afs_int32 anumber)
651 {
652     afs_int32 i, loop;
653     struct vcache *tvc;
654     struct afs_q *tq, *uq;
655     int fv_slept;
656     afs_int32 target = anumber;
657
658     i = 0;
659     loop = 0;
660     for (tq = VLRU.prev; tq != &VLRU && anumber > 0; tq = uq) {
661         tvc = QTOV(tq);
662         uq = QPrev(tq);
663         if (tvc->f.states & CVFlushed) {
664             refpanic("CVFlushed on VLRU");
665             /* In the other path, this was 2 * afs_cacheStats */
666         } else if (!afsd_dynamic_vcaches && i++ > afs_maxvcount) {
667             refpanic("Exceeded pool of AFS vnodes(VLRU cycle?)");
668         } else if (QNext(uq) != tq) {
669             refpanic("VLRU inconsistent");
670         } else if (tvc->f.states & CVInit) {
671             continue;
672         }
673
674         fv_slept = 0;
675         if (osi_TryEvictVCache(tvc, &fv_slept))
676             anumber--;
677
678         if (fv_slept) {
679             if (loop++ > 100)
680                 break;
681             uq = VLRU.prev;
682             i = 0;
683             continue;   /* start over - may have raced. */
684         }
685         if (tq == uq)
686             break;
687     }
688     if (!afsd_dynamic_vcaches && anumber == target) {
689         afs_warn("afs_ShakeLooseVCaches: warning none freed, using %d of %d\n",
690                afs_vcount, afs_maxvcount);
691     }
692
693     return 0;
694 }
695
696 /* Alloc new vnode. */
697
698 static struct vcache *
699 afs_AllocVCache(void)
700 {
701     struct vcache *tvc;
702
703     tvc = osi_NewVnode();
704
705     afs_vcount++;
706
707     /* track the peak */
708     if (afsd_dynamic_vcaches && afs_maxvcount < afs_vcount) {
709         afs_maxvcount = afs_vcount;
710         /*printf("peak vnodes: %d\n", afs_maxvcount);*/
711     }
712
713     afs_stats_cmperf.vcacheXAllocs++;   /* count in case we have a leak */
714
715     /* If we create a new inode, we either give it a new slot number,
716      * or if one's available, use a slot number from the slot free list
717      */
718     if (afs_freeSlotList != NULL) {
719        struct afs_slotlist *tmp;
720
721        tvc->diskSlot = afs_freeSlotList->slot;
722        tmp = afs_freeSlotList;
723        afs_freeSlotList = tmp->next;
724        afs_osi_Free(tmp, sizeof(struct afs_slotlist));
725     }  else {
726        tvc->diskSlot = afs_nextVcacheSlot++;
727     }
728
729     return tvc;
730 }
731
732 /* Pre populate a newly allocated vcache. On platforms where the actual
733  * vnode is attached to the vcache, this function is called before attachment,
734  * therefore it cannot perform any actions on the vnode itself */
735
736 static void
737 afs_PrePopulateVCache(struct vcache *avc, struct VenusFid *afid,
738                       struct server *serverp) {
739
740     afs_uint32 slot;
741     slot = avc->diskSlot;
742
743     osi_PrePopulateVCache(avc);
744
745     avc->diskSlot = slot;
746     QZero(&avc->metadirty);
747
748     AFS_RWLOCK_INIT(&avc->lock, "vcache lock");
749
750     avc->mvid = NULL;
751     avc->linkData = NULL;
752     avc->cbExpires = 0;
753     avc->opens = 0;
754     avc->execsOrWriters = 0;
755     avc->flockCount = 0;
756     avc->f.states = CVInit;
757     avc->last_looker = 0;
758     avc->f.fid = *afid;
759     avc->asynchrony = -1;
760     avc->vc_error = 0;
761
762     hzero(avc->mapDV);
763     avc->f.truncPos = AFS_NOTRUNC;   /* don't truncate until we need to */
764     hzero(avc->f.m.DataVersion);     /* in case we copy it into flushDV */
765     avc->Access = NULL;
766     avc->callback = serverp;         /* to minimize chance that clear
767                                       * request is lost */
768
769 #if defined(AFS_CACHE_BYPASS)
770     avc->cachingStates = 0;
771     avc->cachingTransitions = 0;
772 #endif
773 }
774
775 /*!
776  *   This routine is responsible for allocating a new cache entry
777  * from the free list.  It formats the cache entry and inserts it
778  * into the appropriate hash tables.  It must be called with
779  * afs_xvcache write-locked so as to prevent several processes from
780  * trying to create a new cache entry simultaneously.
781  *
782  * LOCK: afs_NewVCache  afs_xvcache W
783  *
784  * \param afid The file id of the file whose cache entry is being created.
785  *
786  * \return The new vcache struct.
787  */
788
789 static_inline struct vcache *
790 afs_NewVCache_int(struct VenusFid *afid, struct server *serverp, int seq)
791 {
792     struct vcache *tvc;
793     afs_int32 i, j;
794     afs_int32 anumber = VCACHE_FREE;
795
796     AFS_STATCNT(afs_NewVCache);
797
798     afs_FlushReclaimedVcaches();
799
800 #if defined(AFS_LINUX22_ENV)
801     if(!afsd_dynamic_vcaches && afs_vcount >= afs_maxvcount) {
802         afs_ShakeLooseVCaches(anumber);
803         if (afs_vcount >= afs_maxvcount) {
804             afs_warn("afs_NewVCache - none freed\n");
805             return NULL;
806         }
807     }
808     tvc = afs_AllocVCache();
809 #else /* AFS_LINUX22_ENV */
810     /* pull out a free cache entry */
811     if (!freeVCList) {
812         afs_ShakeLooseVCaches(anumber);
813     }
814
815     if (!freeVCList) {
816         tvc = afs_AllocVCache();
817     } else {
818         tvc = freeVCList;       /* take from free list */
819         freeVCList = tvc->nextfree;
820         tvc->nextfree = NULL;
821         afs_vcount++; /* balanced by FlushVCache */
822     } /* end of if (!freeVCList) */
823
824 #endif /* AFS_LINUX22_ENV */
825
826 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
827     if (tvc->v)
828         panic("afs_NewVCache(): free vcache with vnode attached");
829 #endif
830
831     /* Populate the vcache with as much as we can. */
832     afs_PrePopulateVCache(tvc, afid, serverp);
833
834     /* Thread the vcache onto the VLRU */
835
836     i = VCHash(afid);
837     j = VCHashV(afid);
838
839     tvc->hnext = afs_vhashT[i];
840     afs_vhashT[i] = tvc;
841     QAdd(&afs_vhashTV[j], &tvc->vhashq);
842
843     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
844         refpanic("NewVCache VLRU inconsistent");
845     }
846     QAdd(&VLRU, &tvc->vlruq);   /* put in lruq */
847     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
848         refpanic("NewVCache VLRU inconsistent2");
849     }
850     if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
851         refpanic("NewVCache VLRU inconsistent3");
852     }
853     if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
854         refpanic("NewVCache VLRU inconsistent4");
855     }
856     vcachegen++;
857
858     /* it should now be safe to drop the xvcache lock - so attach an inode
859      * to this vcache, where necessary */
860     osi_AttachVnode(tvc, seq);
861
862     /* Get a reference count to hold this vcache for the VLRUQ. Note that
863      * we have to do this after attaching the vnode, because the reference
864      * count may be held in the vnode itself */
865
866 #if defined(AFS_LINUX22_ENV)
867     /* Hold it for the LRU (should make count 2) */
868     AFS_FAST_HOLD(tvc);
869 #elif !(defined (AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV))
870     VREFCOUNT_SET(tvc, 1);      /* us */
871 #endif
872
873 #if defined (AFS_FBSD_ENV)
874     if (tvc->f.states & CVInit)
875 #endif
876     afs_PostPopulateVCache(tvc, afid, seq);
877
878     return tvc;
879 }                               /*afs_NewVCache */
880
881
882 struct vcache *
883 afs_NewVCache(struct VenusFid *afid, struct server *serverp)
884 {
885     return afs_NewVCache_int(afid, serverp, 0);
886 }
887
888 struct vcache *
889 afs_NewBulkVCache(struct VenusFid *afid, struct server *serverp, int seq)
890 {
891     return afs_NewVCache_int(afid, serverp, seq);
892 }
893
894 /*!
895  * ???
896  *
897  * LOCK: afs_FlushActiveVcaches afs_xvcache N
898  *
899  * \param doflocks : Do we handle flocks?
900  */
901 void
902 afs_FlushActiveVcaches(afs_int32 doflocks)
903 {
904     struct vcache *tvc;
905     int i;
906     struct afs_conn *tc;
907     afs_int32 code;
908     afs_ucred_t *cred = NULL;
909     struct vrequest treq, ureq;
910     struct AFSVolSync tsync;
911     int didCore;
912     XSTATS_DECLS;
913     AFS_STATCNT(afs_FlushActiveVcaches);
914     ObtainReadLock(&afs_xvcache);
915     for (i = 0; i < VCSIZE; i++) {
916         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
917             if (tvc->f.states & CVInit) continue;
918 #ifdef AFS_DARWIN80_ENV
919             if (tvc->f.states & CDeadVnode &&
920                 (tvc->f.states & (CCore|CUnlinkedDel) ||
921                  tvc->flockCount)) panic("Dead vnode has core/unlinkedel/flock");
922 #endif
923             if (doflocks && tvc->flockCount != 0) {
924                 /* if this entry has an flock, send a keep-alive call out */
925                 osi_vnhold(tvc, 0);
926                 ReleaseReadLock(&afs_xvcache);
927                 ObtainWriteLock(&tvc->lock, 51);
928                 do {
929                     afs_InitReq(&treq, afs_osi_credp);
930                     treq.flags |= O_NONBLOCK;
931
932                     tc = afs_Conn(&tvc->f.fid, &treq, SHARED_LOCK);
933                     if (tc) {
934                         XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_EXTENDLOCK);
935                         RX_AFS_GUNLOCK();
936                         code =
937                             RXAFS_ExtendLock(tc->id,
938                                              (struct AFSFid *)&tvc->f.fid.Fid,
939                                              &tsync);
940                         RX_AFS_GLOCK();
941                         XSTATS_END_TIME;
942                     } else
943                         code = -1;
944                 } while (afs_Analyze
945                          (tc, code, &tvc->f.fid, &treq,
946                           AFS_STATS_FS_RPCIDX_EXTENDLOCK, SHARED_LOCK, NULL));
947
948                 ReleaseWriteLock(&tvc->lock);
949 #ifdef AFS_DARWIN80_ENV
950                 AFS_FAST_RELE(tvc);
951                 ObtainReadLock(&afs_xvcache);
952 #else
953                 ObtainReadLock(&afs_xvcache);
954                 AFS_FAST_RELE(tvc);
955 #endif
956             }
957             didCore = 0;
958             if ((tvc->f.states & CCore) || (tvc->f.states & CUnlinkedDel)) {
959                 /*
960                  * Don't let it evaporate in case someone else is in
961                  * this code.  Also, drop the afs_xvcache lock while
962                  * getting vcache locks.
963                  */
964                 osi_vnhold(tvc, 0);
965                 ReleaseReadLock(&afs_xvcache);
966 #ifdef AFS_BOZONLOCK_ENV
967                 afs_BozonLock(&tvc->pvnLock, tvc);
968 #endif
969 #if defined(AFS_SGI_ENV)
970                 /*
971                  * That's because if we come in via the CUnlinkedDel bit state path we'll be have 0 refcnt
972                  */
973                 osi_Assert(VREFCOUNT_GT(tvc,0));
974                 AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
975 #endif
976                 ObtainWriteLock(&tvc->lock, 52);
977                 if (tvc->f.states & CCore) {
978                     tvc->f.states &= ~CCore;
979                     /* XXXX Find better place-holder for cred XXXX */
980                     cred = (afs_ucred_t *)tvc->linkData;
981                     tvc->linkData = NULL;       /* XXX */
982                     afs_InitReq(&ureq, cred);
983                     afs_Trace2(afs_iclSetp, CM_TRACE_ACTCCORE,
984                                ICL_TYPE_POINTER, tvc, ICL_TYPE_INT32,
985                                tvc->execsOrWriters);
986                     code = afs_StoreOnLastReference(tvc, &ureq);
987                     ReleaseWriteLock(&tvc->lock);
988 #ifdef AFS_BOZONLOCK_ENV
989                     afs_BozonUnlock(&tvc->pvnLock, tvc);
990 #endif
991                     hzero(tvc->flushDV);
992                     osi_FlushText(tvc);
993                     didCore = 1;
994                     if (code && code != VNOVNODE) {
995                         afs_StoreWarn(code, tvc->f.fid.Fid.Volume,
996                                       /* /dev/console */ 1);
997                     }
998                 } else if (tvc->f.states & CUnlinkedDel) {
999                     /*
1000                      * Ignore errors
1001                      */
1002                     ReleaseWriteLock(&tvc->lock);
1003 #ifdef AFS_BOZONLOCK_ENV
1004                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1005 #endif
1006 #if defined(AFS_SGI_ENV)
1007                     AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1008 #endif
1009                     afs_remunlink(tvc, 0);
1010 #if defined(AFS_SGI_ENV)
1011                     AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1012 #endif
1013                 } else {
1014                     /* lost (or won, perhaps) the race condition */
1015                     ReleaseWriteLock(&tvc->lock);
1016 #ifdef AFS_BOZONLOCK_ENV
1017                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1018 #endif
1019                 }
1020 #if defined(AFS_SGI_ENV)
1021                 AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1022 #endif
1023 #ifdef AFS_DARWIN80_ENV
1024                 AFS_FAST_RELE(tvc);
1025                 if (didCore) {
1026                     AFS_RELE(AFSTOV(tvc));
1027                     /* Matches write code setting CCore flag */
1028                     crfree(cred);
1029                 }
1030                 ObtainReadLock(&afs_xvcache);
1031 #else
1032                 ObtainReadLock(&afs_xvcache);
1033                 AFS_FAST_RELE(tvc);
1034                 if (didCore) {
1035                     AFS_RELE(AFSTOV(tvc));
1036                     /* Matches write code setting CCore flag */
1037                     crfree(cred);
1038                 }
1039 #endif
1040             }
1041         }
1042     }
1043     ReleaseReadLock(&afs_xvcache);
1044 }
1045
1046
1047
1048 /*!
1049  *   Make sure a cache entry is up-to-date status-wise.
1050  *
1051  * NOTE: everywhere that calls this can potentially be sped up
1052  *       by checking CStatd first, and avoiding doing the InitReq
1053  *       if this is up-to-date.
1054  *
1055  *  Anymore, the only places that call this KNOW already that the
1056  *  vcache is not up-to-date, so we don't screw around.
1057  *
1058  * \param avc  : Ptr to vcache entry to verify.
1059  * \param areq : ???
1060  */
1061
1062 /*!
1063  *
1064  *   Make sure a cache entry is up-to-date status-wise.
1065  *
1066  *   NOTE: everywhere that calls this can potentially be sped up
1067  *       by checking CStatd first, and avoiding doing the InitReq
1068  *       if this is up-to-date.
1069  *
1070  *   Anymore, the only places that call this KNOW already that the
1071  * vcache is not up-to-date, so we don't screw around.
1072  *
1073  * \param avc Pointer to vcache entry to verify.
1074  * \param areq
1075  *
1076  * \return 0 for success or other error codes.
1077  */
1078 int
1079 afs_VerifyVCache2(struct vcache *avc, struct vrequest *areq)
1080 {
1081     struct vcache *tvc;
1082
1083     AFS_STATCNT(afs_VerifyVCache);
1084
1085     /* otherwise we must fetch the status info */
1086
1087     ObtainWriteLock(&avc->lock, 53);
1088     if (avc->f.states & CStatd) {
1089         ReleaseWriteLock(&avc->lock);
1090         return 0;
1091     }
1092     ObtainWriteLock(&afs_xcbhash, 461);
1093     avc->f.states &= ~(CStatd | CUnique);
1094     avc->callback = NULL;
1095     afs_DequeueCallback(avc);
1096     ReleaseWriteLock(&afs_xcbhash);
1097     ReleaseWriteLock(&avc->lock);
1098
1099     /* since we've been called back, or the callback has expired,
1100      * it's possible that the contents of this directory, or this
1101      * file's name have changed, thus invalidating the dnlc contents.
1102      */
1103     if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
1104         osi_dnlc_purgedp(avc);
1105     else
1106         osi_dnlc_purgevp(avc);
1107
1108     /* fetch the status info */
1109     tvc = afs_GetVCache(&avc->f.fid, areq, NULL, avc);
1110     if (!tvc)
1111         return ENOENT;
1112     /* Put it back; caller has already incremented vrefCount */
1113     afs_PutVCache(tvc);
1114     return 0;
1115
1116 }                               /*afs_VerifyVCache */
1117
1118
1119 /*!
1120  * Simple copy of stat info into cache.
1121  *
1122  * Callers:as of 1992-04-29, only called by WriteVCache
1123  *
1124  * \param avc   Ptr to vcache entry involved.
1125  * \param astat Ptr to stat info to copy.
1126  *
1127  */
1128 static void
1129 afs_SimpleVStat(struct vcache *avc,
1130                 struct AFSFetchStatus *astat, struct vrequest *areq)
1131 {
1132     afs_size_t length;
1133     AFS_STATCNT(afs_SimpleVStat);
1134
1135 #ifdef AFS_64BIT_CLIENT
1136         FillInt64(length, astat->Length_hi, astat->Length);
1137 #else /* AFS_64BIT_CLIENT */
1138         length = astat->Length;
1139 #endif /* AFS_64BIT_CLIENT */
1140
1141 #if defined(AFS_SGI_ENV)
1142     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1143         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1144         osi_Assert((valusema(&avc->vc_rwlock) <= 0)
1145                    && (OSI_GET_LOCKID() == avc->vc_rwlockid));
1146         if (length < avc->f.m.Length) {
1147             vnode_t *vp = (vnode_t *) avc;
1148
1149             osi_Assert(WriteLocked(&avc->lock));
1150             ReleaseWriteLock(&avc->lock);
1151             AFS_GUNLOCK();
1152             PTOSSVP(vp, (off_t) length, (off_t) MAXLONG);
1153             AFS_GLOCK();
1154             ObtainWriteLock(&avc->lock, 67);
1155         }
1156     }
1157 #endif
1158
1159     if (!afs_DirtyPages(avc)) {
1160         /* if actively writing the file, don't fetch over this value */
1161         afs_Trace3(afs_iclSetp, CM_TRACE_SIMPLEVSTAT, ICL_TYPE_POINTER, avc,
1162                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length),
1163                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1164         avc->f.m.Length = length;
1165         avc->f.m.Date = astat->ClientModTime;
1166     }
1167     avc->f.m.Owner = astat->Owner;
1168     avc->f.m.Group = astat->Group;
1169     avc->f.m.Mode = astat->UnixModeBits;
1170     if (vType(avc) == VREG) {
1171         avc->f.m.Mode |= S_IFREG;
1172     } else if (vType(avc) == VDIR) {
1173         avc->f.m.Mode |= S_IFDIR;
1174     } else if (vType(avc) == VLNK) {
1175         avc->f.m.Mode |= S_IFLNK;
1176         if ((avc->f.m.Mode & 0111) == 0)
1177             avc->mvstat = 1;
1178     }
1179     if (avc->f.states & CForeign) {
1180         struct axscache *ac;
1181         avc->f.anyAccess = astat->AnonymousAccess;
1182 #ifdef badidea
1183         if ((astat->CallerAccess & ~astat->AnonymousAccess))
1184             /*   USED TO SAY :
1185              * Caller has at least one bit not covered by anonymous, and
1186              * thus may have interesting rights.
1187              *
1188              * HOWEVER, this is a really bad idea, because any access query
1189              * for bits which aren't covered by anonymous, on behalf of a user
1190              * who doesn't have any special rights, will result in an answer of
1191              * the form "I don't know, lets make a FetchStatus RPC and find out!"
1192              * It's an especially bad idea under Ultrix, since (due to the lack of
1193              * a proper access() call) it must perform several afs_access() calls
1194              * in order to create magic mode bits that vary according to who makes
1195              * the call.  In other words, _every_ stat() generates a test for
1196              * writeability...
1197              */
1198 #endif /* badidea */
1199             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1200                 ac->axess = astat->CallerAccess;
1201             else                /* not found, add a new one if possible */
1202                 afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1203     }
1204
1205 }                               /*afs_SimpleVStat */
1206
1207
1208 /*!
1209  * Store the status info *only* back to the server for a
1210  * fid/vrequest.
1211  *
1212  * Environment: Must be called with a shared lock held on the vnode.
1213  *
1214  * \param avc Ptr to the vcache entry.
1215  * \param astatus Ptr to the status info to store.
1216  * \param areq Ptr to the associated vrequest.
1217  *
1218  * \return Operation status.
1219  */
1220
1221 int
1222 afs_WriteVCache(struct vcache *avc,
1223                 struct AFSStoreStatus *astatus,
1224                 struct vrequest *areq)
1225 {
1226     afs_int32 code;
1227     struct afs_conn *tc;
1228     struct AFSFetchStatus OutStatus;
1229     struct AFSVolSync tsync;
1230     XSTATS_DECLS;
1231     AFS_STATCNT(afs_WriteVCache);
1232     afs_Trace2(afs_iclSetp, CM_TRACE_WVCACHE, ICL_TYPE_POINTER, avc,
1233                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length));
1234     do {
1235         tc = afs_Conn(&avc->f.fid, areq, SHARED_LOCK);
1236         if (tc) {
1237             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STORESTATUS);
1238             RX_AFS_GUNLOCK();
1239             code =
1240                 RXAFS_StoreStatus(tc->id, (struct AFSFid *)&avc->f.fid.Fid,
1241                                   astatus, &OutStatus, &tsync);
1242             RX_AFS_GLOCK();
1243             XSTATS_END_TIME;
1244         } else
1245             code = -1;
1246     } while (afs_Analyze
1247              (tc, code, &avc->f.fid, areq, AFS_STATS_FS_RPCIDX_STORESTATUS,
1248               SHARED_LOCK, NULL));
1249
1250     UpgradeSToWLock(&avc->lock, 20);
1251     if (code == 0) {
1252         /* success, do the changes locally */
1253         afs_SimpleVStat(avc, &OutStatus, areq);
1254         /*
1255          * Update the date, too.  SimpleVStat didn't do this, since
1256          * it thought we were doing this after fetching new status
1257          * over a file being written.
1258          */
1259         avc->f.m.Date = OutStatus.ClientModTime;
1260     } else {
1261         /* failure, set up to check with server next time */
1262         ObtainWriteLock(&afs_xcbhash, 462);
1263         afs_DequeueCallback(avc);
1264         avc->f.states &= ~(CStatd | CUnique);   /* turn off stat valid flag */
1265         ReleaseWriteLock(&afs_xcbhash);
1266         if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
1267             osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
1268     }
1269     ConvertWToSLock(&avc->lock);
1270     return code;
1271
1272 }                               /*afs_WriteVCache */
1273
1274 /*!
1275  * Store status info only locally, set the proper disconnection flags
1276  * and add to dirty list.
1277  *
1278  * \param avc The vcache to be written locally.
1279  * \param astatus Get attr fields from local store.
1280  * \param attrs This one is only of the vs_size.
1281  *
1282  * \note Must be called with a shared lock on the vnode
1283  */
1284 int
1285 afs_WriteVCacheDiscon(struct vcache *avc,
1286                       struct AFSStoreStatus *astatus,
1287                       struct vattr *attrs)
1288 {
1289     afs_int32 code = 0;
1290     afs_int32 flags = 0;
1291
1292     UpgradeSToWLock(&avc->lock, 700);
1293
1294     if (!astatus->Mask) {
1295
1296         return code;
1297
1298     } else {
1299
1300         /* Set attributes. */
1301         if (astatus->Mask & AFS_SETMODTIME) {
1302                 avc->f.m.Date = astatus->ClientModTime;
1303                 flags |= VDisconSetTime;
1304         }
1305
1306         if (astatus->Mask & AFS_SETOWNER) {
1307             /* printf("Not allowed yet. \n"); */
1308             /*avc->f.m.Owner = astatus->Owner;*/
1309         }
1310
1311         if (astatus->Mask & AFS_SETGROUP) {
1312             /* printf("Not allowed yet. \n"); */
1313             /*avc->f.m.Group =  astatus->Group;*/
1314         }
1315
1316         if (astatus->Mask & AFS_SETMODE) {
1317                 avc->f.m.Mode = astatus->UnixModeBits;
1318
1319 #if 0   /* XXX: Leaving this out, so it doesn't mess up the file type flag.*/
1320
1321                 if (vType(avc) == VREG) {
1322                         avc->f.m.Mode |= S_IFREG;
1323                 } else if (vType(avc) == VDIR) {
1324                         avc->f.m.Mode |= S_IFDIR;
1325                 } else if (vType(avc) == VLNK) {
1326                         avc->f.m.Mode |= S_IFLNK;
1327                         if ((avc->f.m.Mode & 0111) == 0)
1328                                 avc->mvstat = 1;
1329                 }
1330 #endif
1331                 flags |= VDisconSetMode;
1332          }              /* if(astatus.Mask & AFS_SETMODE) */
1333
1334      }                  /* if (!astatus->Mask) */
1335
1336      if (attrs->va_size > 0) {
1337         /* XXX: Do I need more checks? */
1338         /* Truncation operation. */
1339         flags |= VDisconTrunc;
1340      }
1341
1342     if (flags)
1343         afs_DisconAddDirty(avc, flags, 1);
1344
1345     /* XXX: How about the rest of the fields? */
1346
1347     ConvertWToSLock(&avc->lock);
1348
1349     return code;
1350 }
1351
1352 /*!
1353  * Copy astat block into vcache info
1354  *
1355  * \note This code may get dataversion and length out of sync if the file has
1356  * been modified.  This is less than ideal.  I haven't thought about it sufficiently
1357  * to be certain that it is adequate.
1358  *
1359  * \note Environment: Must be called under a write lock
1360  *
1361  * \param avc  Ptr to vcache entry.
1362  * \param astat Ptr to stat block to copy in.
1363  * \param areq Ptr to associated request.
1364  */
1365 void
1366 afs_ProcessFS(struct vcache *avc,
1367               struct AFSFetchStatus *astat, struct vrequest *areq)
1368 {
1369     afs_size_t length;
1370     AFS_STATCNT(afs_ProcessFS);
1371
1372 #ifdef AFS_64BIT_CLIENT
1373     FillInt64(length, astat->Length_hi, astat->Length);
1374 #else /* AFS_64BIT_CLIENT */
1375     length = astat->Length;
1376 #endif /* AFS_64BIT_CLIENT */
1377     /* WARNING: afs_DoBulkStat uses the Length field to store a sequence
1378      * number for each bulk status request. Under no circumstances
1379      * should afs_DoBulkStat store a sequence number if the new
1380      * length will be ignored when afs_ProcessFS is called with
1381      * new stats. If you change the following conditional then you
1382      * also need to change the conditional in afs_DoBulkStat.  */
1383 #ifdef AFS_SGI_ENV
1384     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1385         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1386 #else
1387     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)) {
1388 #endif
1389         /* if we're writing or mapping this file, don't fetch over these
1390          *  values.
1391          */
1392         afs_Trace3(afs_iclSetp, CM_TRACE_PROCESSFS, ICL_TYPE_POINTER, avc,
1393                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length),
1394                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1395         avc->f.m.Length = length;
1396         avc->f.m.Date = astat->ClientModTime;
1397     }
1398     hset64(avc->f.m.DataVersion, astat->dataVersionHigh, astat->DataVersion);
1399     avc->f.m.Owner = astat->Owner;
1400     avc->f.m.Mode = astat->UnixModeBits;
1401     avc->f.m.Group = astat->Group;
1402     avc->f.m.LinkCount = astat->LinkCount;
1403     if (astat->FileType == File) {
1404         vSetType(avc, VREG);
1405         avc->f.m.Mode |= S_IFREG;
1406     } else if (astat->FileType == Directory) {
1407         vSetType(avc, VDIR);
1408         avc->f.m.Mode |= S_IFDIR;
1409     } else if (astat->FileType == SymbolicLink) {
1410         if (afs_fakestat_enable && (avc->f.m.Mode & 0111) == 0) {
1411             vSetType(avc, VDIR);
1412             avc->f.m.Mode |= S_IFDIR;
1413         } else {
1414             vSetType(avc, VLNK);
1415             avc->f.m.Mode |= S_IFLNK;
1416         }
1417         if ((avc->f.m.Mode & 0111) == 0) {
1418             avc->mvstat = 1;
1419         }
1420     }
1421     avc->f.anyAccess = astat->AnonymousAccess;
1422 #ifdef badidea
1423     if ((astat->CallerAccess & ~astat->AnonymousAccess))
1424         /*   USED TO SAY :
1425          * Caller has at least one bit not covered by anonymous, and
1426          * thus may have interesting rights.
1427          *
1428          * HOWEVER, this is a really bad idea, because any access query
1429          * for bits which aren't covered by anonymous, on behalf of a user
1430          * who doesn't have any special rights, will result in an answer of
1431          * the form "I don't know, lets make a FetchStatus RPC and find out!"
1432          * It's an especially bad idea under Ultrix, since (due to the lack of
1433          * a proper access() call) it must perform several afs_access() calls
1434          * in order to create magic mode bits that vary according to who makes
1435          * the call.  In other words, _every_ stat() generates a test for
1436          * writeability...
1437          */
1438 #endif /* badidea */
1439     {
1440         struct axscache *ac;
1441         if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1442             ac->axess = astat->CallerAccess;
1443         else                    /* not found, add a new one if possible */
1444             afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1445     }
1446 }                               /*afs_ProcessFS */
1447
1448
1449 /*!
1450  * Get fid from server.
1451  *
1452  * \param afid
1453  * \param areq Request to be passed on.
1454  * \param name Name of ?? to lookup.
1455  * \param OutStatus Fetch status.
1456  * \param CallBackp
1457  * \param serverp
1458  * \param tsyncp
1459  *
1460  * \return Success status of operation.
1461  */
1462 int
1463 afs_RemoteLookup(struct VenusFid *afid, struct vrequest *areq,
1464                  char *name, struct VenusFid *nfid,
1465                  struct AFSFetchStatus *OutStatusp,
1466                  struct AFSCallBack *CallBackp, struct server **serverp,
1467                  struct AFSVolSync *tsyncp)
1468 {
1469     afs_int32 code;
1470     afs_uint32 start;
1471     struct afs_conn *tc;
1472     struct AFSFetchStatus OutDirStatus;
1473     XSTATS_DECLS;
1474     if (!name)
1475         name = "";              /* XXX */
1476     do {
1477         tc = afs_Conn(afid, areq, SHARED_LOCK);
1478         if (tc) {
1479             if (serverp)
1480                 *serverp = tc->parent->srvr->server;
1481             start = osi_Time();
1482             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_XLOOKUP);
1483             RX_AFS_GUNLOCK();
1484             code =
1485                 RXAFS_Lookup(tc->id, (struct AFSFid *)&afid->Fid, name,
1486                              (struct AFSFid *)&nfid->Fid, OutStatusp,
1487                              &OutDirStatus, CallBackp, tsyncp);
1488             RX_AFS_GLOCK();
1489             XSTATS_END_TIME;
1490         } else
1491             code = -1;
1492     } while (afs_Analyze
1493              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_XLOOKUP, SHARED_LOCK,
1494               NULL));
1495
1496     return code;
1497 }
1498
1499
1500 /*!
1501  * afs_GetVCache
1502  *
1503  * Given a file id and a vrequest structure, fetch the status
1504  * information associated with the file.
1505  *
1506  * \param afid File ID.
1507  * \param areq Ptr to associated vrequest structure, specifying the
1508  *  user whose authentication tokens will be used.
1509  * \param avc Caller may already have a vcache for this file, which is
1510  *  already held.
1511  *
1512  * \note Environment:
1513  *      The cache entry is returned with an increased vrefCount field.
1514  *      The entry must be discarded by calling afs_PutVCache when you
1515  *      are through using the pointer to the cache entry.
1516  *
1517  *      You should not hold any locks when calling this function, except
1518  *      locks on other vcache entries.  If you lock more than one vcache
1519  *      entry simultaneously, you should lock them in this order:
1520  *
1521  *          1. Lock all files first, then directories.
1522  *          2.  Within a particular type, lock entries in Fid.Vnode order.
1523  *
1524  *      This locking hierarchy is convenient because it allows locking
1525  *      of a parent dir cache entry, given a file (to check its access
1526  *      control list).  It also allows renames to be handled easily by
1527  *      locking directories in a constant order.
1528  *
1529  * \note NB.  NewVCache -> FlushVCache presently (4/10/95) drops the xvcache lock.
1530  *
1531  * \note Might have a vcache structure already, which must
1532  *  already be held by the caller
1533  */
1534 struct vcache *
1535 afs_GetVCache(struct VenusFid *afid, struct vrequest *areq,
1536               afs_int32 * cached, struct vcache *avc)
1537 {
1538
1539     afs_int32 code, newvcache = 0;
1540     struct vcache *tvc;
1541     struct volume *tvp;
1542     afs_int32 retry;
1543
1544     AFS_STATCNT(afs_GetVCache);
1545
1546     if (cached)
1547         *cached = 0;            /* Init just in case */
1548
1549 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1550   loop:
1551 #endif
1552
1553     ObtainSharedLock(&afs_xvcache, 5);
1554
1555     tvc = afs_FindVCache(afid, &retry, DO_STATS | DO_VLRU | IS_SLOCK);
1556     if (tvc && retry) {
1557 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1558         ReleaseSharedLock(&afs_xvcache);
1559         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1560         goto loop;
1561 #endif
1562     }
1563     if (tvc) {
1564         if (cached)
1565             *cached = 1;
1566         osi_Assert((tvc->f.states & CVInit) == 0);
1567         /* If we are in readdir, return the vnode even if not statd */
1568         if ((tvc->f.states & CStatd) || afs_InReadDir(tvc)) {
1569             ReleaseSharedLock(&afs_xvcache);
1570             return tvc;
1571         }
1572     } else {
1573         UpgradeSToWLock(&afs_xvcache, 21);
1574
1575         /* no cache entry, better grab one */
1576         tvc = afs_NewVCache(afid, NULL);
1577         newvcache = 1;
1578
1579         ConvertWToSLock(&afs_xvcache);
1580         if (tvc == NULL)
1581         {
1582                 ReleaseSharedLock(&afs_xvcache);
1583                 return NULL;
1584         }
1585
1586         afs_stats_cmperf.vcacheMisses++;
1587     }
1588
1589     ReleaseSharedLock(&afs_xvcache);
1590
1591     ObtainWriteLock(&tvc->lock, 54);
1592
1593     if (tvc->f.states & CStatd) {
1594         ReleaseWriteLock(&tvc->lock);
1595         return tvc;
1596     }
1597 #ifdef AFS_DARWIN80_ENV
1598 /* Darwin 8.0 only has bufs in nfs, so we shouldn't have to worry about them.
1599    What about ubc? */
1600 #else
1601 #if defined(AFS_DARWIN_ENV) || defined(AFS_FBSD_ENV)
1602     /*
1603      * XXX - I really don't like this.  Should try to understand better.
1604      * It seems that sometimes, when we get called, we already hold the
1605      * lock on the vnode (e.g., from afs_getattr via afs_VerifyVCache).
1606      * We can't drop the vnode lock, because that could result in a race.
1607      * Sometimes, though, we get here and don't hold the vnode lock.
1608      * I hate code paths that sometimes hold locks and sometimes don't.
1609      * In any event, the dodge we use here is to check whether the vnode
1610      * is locked, and if it isn't, then we gain and drop it around the call
1611      * to vinvalbuf; otherwise, we leave it alone.
1612      */
1613     {
1614         struct vnode *vp = AFSTOV(tvc);
1615         int iheldthelock;
1616
1617 #if defined(AFS_DARWIN_ENV)
1618         iheldthelock = VOP_ISLOCKED(vp);
1619         if (!iheldthelock)
1620             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, current_proc());
1621         /* this is messy. we can call fsync which will try to reobtain this */
1622         if (VTOAFS(vp) == tvc)
1623           ReleaseWriteLock(&tvc->lock);
1624         if (UBCINFOEXISTS(vp)) {
1625           vinvalbuf(vp, V_SAVE, &afs_osi_cred, current_proc(), PINOD, 0);
1626         }
1627         if (VTOAFS(vp) == tvc)
1628           ObtainWriteLock(&tvc->lock, 954);
1629         if (!iheldthelock)
1630             VOP_UNLOCK(vp, LK_EXCLUSIVE, current_proc());
1631 #elif defined(AFS_FBSD80_ENV)
1632         iheldthelock = VOP_ISLOCKED(vp);
1633         if (!iheldthelock) {
1634             /* nosleep/sleep lock order reversal */
1635             int glocked = ISAFS_GLOCK();
1636             if (glocked)
1637                 AFS_GUNLOCK();
1638             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
1639             if (glocked)
1640                 AFS_GLOCK();
1641         }
1642         vinvalbuf(vp, V_SAVE, PINOD, 0); /* changed late in 8.0-CURRENT */
1643         if (!iheldthelock)
1644             VOP_UNLOCK(vp, 0);
1645 #elif defined(AFS_FBSD60_ENV)
1646         iheldthelock = VOP_ISLOCKED(vp, curthread);
1647         if (!iheldthelock)
1648             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1649         AFS_GUNLOCK();
1650         vinvalbuf(vp, V_SAVE, curthread, PINOD, 0);
1651         AFS_GLOCK();
1652         if (!iheldthelock)
1653             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1654 #elif defined(AFS_FBSD_ENV)
1655         iheldthelock = VOP_ISLOCKED(vp, curthread);
1656         if (!iheldthelock)
1657             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1658         vinvalbuf(vp, V_SAVE, osi_curcred(), curthread, PINOD, 0);
1659         if (!iheldthelock)
1660             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1661 #elif defined(AFS_OBSD_ENV)
1662         iheldthelock = VOP_ISLOCKED(vp, curproc);
1663         if (!iheldthelock)
1664             VOP_LOCK(vp, LK_EXCLUSIVE | LK_RETRY, curproc);
1665         uvm_vnp_uncache(vp);
1666         if (!iheldthelock)
1667             VOP_UNLOCK(vp, 0, curproc);
1668 #elif defined(AFS_NBSD40_ENV)
1669         iheldthelock = VOP_ISLOCKED(vp);
1670         if (!iheldthelock) {
1671             VOP_LOCK(vp, LK_EXCLUSIVE | LK_RETRY);
1672         }
1673         uvm_vnp_uncache(vp);
1674         if (!iheldthelock)
1675             VOP_UNLOCK(vp, 0);
1676 #endif
1677     }
1678 #endif
1679 #endif
1680
1681     ObtainWriteLock(&afs_xcbhash, 464);
1682     tvc->f.states &= ~CUnique;
1683     tvc->callback = 0;
1684     afs_DequeueCallback(tvc);
1685     ReleaseWriteLock(&afs_xcbhash);
1686
1687     /* It is always appropriate to throw away all the access rights? */
1688     afs_FreeAllAxs(&(tvc->Access));
1689     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-volume info */
1690     if (tvp) {
1691         if ((tvp->states & VForeign)) {
1692             if (newvcache)
1693                 tvc->f.states |= CForeign;
1694             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1695                 && (tvp->rootUnique == afid->Fid.Unique)) {
1696                 tvc->mvstat = 2;
1697             }
1698         }
1699         if (tvp->states & VRO)
1700             tvc->f.states |= CRO;
1701         if (tvp->states & VBackup)
1702             tvc->f.states |= CBackup;
1703         /* now copy ".." entry back out of volume structure, if necessary */
1704         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1705             if (!tvc->mvid)
1706                 tvc->mvid = (struct VenusFid *)
1707                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1708             *tvc->mvid = tvp->dotdot;
1709         }
1710         afs_PutVolume(tvp, READ_LOCK);
1711     }
1712
1713     /* stat the file */
1714     afs_RemoveVCB(afid);
1715     {
1716         struct AFSFetchStatus OutStatus;
1717
1718         if (afs_DynrootNewVnode(tvc, &OutStatus)) {
1719             afs_ProcessFS(tvc, &OutStatus, areq);
1720             tvc->f.states |= CStatd | CUnique;
1721             tvc->f.parent.vnode  = OutStatus.ParentVnode;
1722             tvc->f.parent.unique = OutStatus.ParentUnique;
1723             code = 0;
1724         } else {
1725
1726             if (AFS_IS_DISCONNECTED) {
1727                 /* Nothing to do otherwise...*/
1728                 code = ENETDOWN;
1729                 /* printf("Network is down in afs_GetCache"); */
1730             } else
1731                 code = afs_FetchStatus(tvc, afid, areq, &OutStatus);
1732
1733             /* For the NFS translator's benefit, make sure
1734              * non-directory vnodes always have their parent FID set
1735              * correctly, even when created as a result of decoding an
1736              * NFS filehandle.  It would be nice to also do this for
1737              * directories, but we can't because the fileserver fills
1738              * in the FID of the directory itself instead of that of
1739              * its parent.
1740              */
1741             if (!code && OutStatus.FileType != Directory &&
1742                 !tvc->f.parent.vnode) {
1743                 tvc->f.parent.vnode  = OutStatus.ParentVnode;
1744                 tvc->f.parent.unique = OutStatus.ParentUnique;
1745                 /* XXX - SXW - It's conceivable we should mark ourselves
1746                  *             as dirty again here, incase we've been raced
1747                  *             out of the FetchStatus call.
1748                  */
1749             }
1750         }
1751     }
1752
1753     if (code) {
1754         ReleaseWriteLock(&tvc->lock);
1755
1756         afs_PutVCache(tvc);
1757         return NULL;
1758     }
1759
1760     ReleaseWriteLock(&tvc->lock);
1761     return tvc;
1762
1763 }                               /*afs_GetVCache */
1764
1765
1766
1767 /*!
1768  * Lookup a vcache by fid. Look inside the cache first, if not
1769  * there, lookup the file on the server, and then get it's fresh
1770  * cache entry.
1771  *
1772  * \param afid
1773  * \param areq
1774  * \param cached Is element cached? If NULL, don't answer.
1775  * \param adp
1776  * \param aname
1777  *
1778  * \return The found element or NULL.
1779  */
1780 struct vcache *
1781 afs_LookupVCache(struct VenusFid *afid, struct vrequest *areq,
1782                  afs_int32 * cached, struct vcache *adp, char *aname)
1783 {
1784     afs_int32 code, now, newvcache = 0;
1785     struct VenusFid nfid;
1786     struct vcache *tvc;
1787     struct volume *tvp;
1788     struct AFSFetchStatus OutStatus;
1789     struct AFSCallBack CallBack;
1790     struct AFSVolSync tsync;
1791     struct server *serverp = 0;
1792     afs_int32 origCBs;
1793     afs_int32 retry;
1794
1795     AFS_STATCNT(afs_GetVCache);
1796     if (cached)
1797         *cached = 0;            /* Init just in case */
1798
1799 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1800   loop1:
1801 #endif
1802
1803     ObtainReadLock(&afs_xvcache);
1804     tvc = afs_FindVCache(afid, &retry, DO_STATS /* no vlru */ );
1805
1806     if (tvc) {
1807         ReleaseReadLock(&afs_xvcache);
1808         if (retry) {
1809 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1810             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1811             goto loop1;
1812 #endif
1813         }
1814         ObtainReadLock(&tvc->lock);
1815
1816         if (tvc->f.states & CStatd) {
1817             if (cached) {
1818                 *cached = 1;
1819             }
1820             ReleaseReadLock(&tvc->lock);
1821             return tvc;
1822         }
1823         tvc->f.states &= ~CUnique;
1824
1825         ReleaseReadLock(&tvc->lock);
1826         afs_PutVCache(tvc);
1827         ObtainReadLock(&afs_xvcache);
1828     }
1829     /* if (tvc) */
1830     ReleaseReadLock(&afs_xvcache);
1831
1832     /* lookup the file */
1833     nfid = *afid;
1834     now = osi_Time();
1835     origCBs = afs_allCBs;       /* if anything changes, we don't have a cb */
1836
1837     if (AFS_IS_DISCONNECTED) {
1838         /* printf("Network is down in afs_LookupVcache\n"); */
1839         code = ENETDOWN;
1840     } else
1841         code =
1842             afs_RemoteLookup(&adp->f.fid, areq, aname, &nfid, &OutStatus,
1843                              &CallBack, &serverp, &tsync);
1844
1845 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1846   loop2:
1847 #endif
1848
1849     ObtainSharedLock(&afs_xvcache, 6);
1850     tvc = afs_FindVCache(&nfid, &retry, DO_VLRU | IS_SLOCK/* no xstats now */ );
1851     if (tvc && retry) {
1852 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1853         ReleaseSharedLock(&afs_xvcache);
1854         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1855         goto loop2;
1856 #endif
1857     }
1858
1859     if (!tvc) {
1860         /* no cache entry, better grab one */
1861         UpgradeSToWLock(&afs_xvcache, 22);
1862         tvc = afs_NewVCache(&nfid, serverp);
1863         newvcache = 1;
1864         ConvertWToSLock(&afs_xvcache);
1865         if (!tvc)
1866         {
1867                 ReleaseSharedLock(&afs_xvcache);
1868                 return NULL;
1869         }
1870     }
1871
1872     ReleaseSharedLock(&afs_xvcache);
1873     ObtainWriteLock(&tvc->lock, 55);
1874
1875     /* It is always appropriate to throw away all the access rights? */
1876     afs_FreeAllAxs(&(tvc->Access));
1877     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-vol info */
1878     if (tvp) {
1879         if ((tvp->states & VForeign)) {
1880             if (newvcache)
1881                 tvc->f.states |= CForeign;
1882             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1883                 && (tvp->rootUnique == afid->Fid.Unique))
1884                 tvc->mvstat = 2;
1885         }
1886         if (tvp->states & VRO)
1887             tvc->f.states |= CRO;
1888         if (tvp->states & VBackup)
1889             tvc->f.states |= CBackup;
1890         /* now copy ".." entry back out of volume structure, if necessary */
1891         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1892             if (!tvc->mvid)
1893                 tvc->mvid = (struct VenusFid *)
1894                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1895             *tvc->mvid = tvp->dotdot;
1896         }
1897     }
1898
1899     if (code) {
1900         ObtainWriteLock(&afs_xcbhash, 465);
1901         afs_DequeueCallback(tvc);
1902         tvc->f.states &= ~(CStatd | CUnique);
1903         ReleaseWriteLock(&afs_xcbhash);
1904         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1905             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1906         if (tvp)
1907             afs_PutVolume(tvp, READ_LOCK);
1908         ReleaseWriteLock(&tvc->lock);
1909         afs_PutVCache(tvc);
1910         return NULL;
1911     }
1912
1913     ObtainWriteLock(&afs_xcbhash, 466);
1914     if (origCBs == afs_allCBs) {
1915         if (CallBack.ExpirationTime) {
1916             tvc->callback = serverp;
1917             tvc->cbExpires = CallBack.ExpirationTime + now;
1918             tvc->f.states |= CStatd | CUnique;
1919             tvc->f.states &= ~CBulkFetching;
1920             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvp);
1921         } else if (tvc->f.states & CRO) {
1922             /* adapt gives us an hour. */
1923             tvc->cbExpires = 3600 + osi_Time();
1924              /*XXX*/ tvc->f.states |= CStatd | CUnique;
1925             tvc->f.states &= ~CBulkFetching;
1926             afs_QueueCallback(tvc, CBHash(3600), tvp);
1927         } else {
1928             tvc->callback = NULL;
1929             afs_DequeueCallback(tvc);
1930             tvc->f.states &= ~(CStatd | CUnique);
1931             if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1932                 osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
1933         }
1934     } else {
1935         afs_DequeueCallback(tvc);
1936         tvc->f.states &= ~CStatd;
1937         tvc->f.states &= ~CUnique;
1938         tvc->callback = NULL;
1939         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1940             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1941     }
1942     ReleaseWriteLock(&afs_xcbhash);
1943     if (tvp)
1944         afs_PutVolume(tvp, READ_LOCK);
1945     afs_ProcessFS(tvc, &OutStatus, areq);
1946
1947     ReleaseWriteLock(&tvc->lock);
1948     return tvc;
1949
1950 }
1951
1952 struct vcache *
1953 afs_GetRootVCache(struct VenusFid *afid, struct vrequest *areq,
1954                   afs_int32 * cached, struct volume *tvolp)
1955 {
1956     afs_int32 code = 0, i, newvcache = 0, haveStatus = 0;
1957     afs_int32 getNewFid = 0;
1958     afs_uint32 start;
1959     struct VenusFid nfid;
1960     struct vcache *tvc;
1961     struct server *serverp = 0;
1962     struct AFSFetchStatus OutStatus;
1963     struct AFSCallBack CallBack;
1964     struct AFSVolSync tsync;
1965     int origCBs = 0;
1966 #ifdef AFS_DARWIN80_ENV
1967     vnode_t tvp;
1968 #endif
1969
1970     start = osi_Time();
1971
1972   newmtpt:
1973     if (!tvolp->rootVnode || getNewFid) {
1974         struct VenusFid tfid;
1975
1976         tfid = *afid;
1977         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
1978         origCBs = afs_allCBs;   /* ignore InitCallBackState */
1979         code =
1980             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
1981                              &serverp, &tsync);
1982         if (code) {
1983             return NULL;
1984         }
1985 /*      ReleaseReadLock(&tvolp->lock);           */
1986         ObtainWriteLock(&tvolp->lock, 56);
1987         tvolp->rootVnode = afid->Fid.Vnode = nfid.Fid.Vnode;
1988         tvolp->rootUnique = afid->Fid.Unique = nfid.Fid.Unique;
1989         ReleaseWriteLock(&tvolp->lock);
1990 /*      ObtainReadLock(&tvolp->lock);*/
1991         haveStatus = 1;
1992     } else {
1993         afid->Fid.Vnode = tvolp->rootVnode;
1994         afid->Fid.Unique = tvolp->rootUnique;
1995     }
1996
1997  rootvc_loop:
1998     ObtainSharedLock(&afs_xvcache, 7);
1999     i = VCHash(afid);
2000     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2001         if (!FidCmp(&(tvc->f.fid), afid)) {
2002             if (tvc->f.states & CVInit) {
2003                 ReleaseSharedLock(&afs_xvcache);
2004                 afs_osi_Sleep(&tvc->f.states);
2005                 goto rootvc_loop;
2006             }
2007 #ifdef AFS_DARWIN80_ENV
2008             if (tvc->f.states & CDeadVnode) {
2009                 if (!(tvc->f.states & CBulkFetching)) {
2010                     ReleaseSharedLock(&afs_xvcache);
2011                     afs_osi_Sleep(&tvc->f.states);
2012                     goto rootvc_loop;
2013                 }
2014             }
2015             tvp = AFSTOV(tvc);
2016             if (vnode_get(tvp))       /* this bumps ref count */
2017                 continue;
2018             if (vnode_ref(tvp)) {
2019                 AFS_GUNLOCK();
2020                 /* AFSTOV(tvc) may be NULL */
2021                 vnode_put(tvp);
2022                 AFS_GLOCK();
2023                 continue;
2024             }
2025             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2026                 AFS_GUNLOCK();
2027                 vnode_recycle(AFSTOV(tvc));
2028                 AFS_GLOCK();
2029             }
2030 #endif
2031             break;
2032         }
2033     }
2034
2035     if (!haveStatus && (!tvc || !(tvc->f.states & CStatd))) {
2036         /* Mount point no longer stat'd or unknown. FID may have changed. */
2037         getNewFid = 1;
2038         ReleaseSharedLock(&afs_xvcache);
2039 #ifdef AFS_DARWIN80_ENV
2040         if (tvc) {
2041             AFS_GUNLOCK();
2042             vnode_put(AFSTOV(tvc));
2043             vnode_rele(AFSTOV(tvc));
2044             AFS_GLOCK();
2045         }
2046 #endif
2047         tvc = NULL;
2048         goto newmtpt;
2049     }
2050
2051     if (!tvc) {
2052         UpgradeSToWLock(&afs_xvcache, 23);
2053         /* no cache entry, better grab one */
2054         tvc = afs_NewVCache(afid, NULL);
2055         if (!tvc)
2056         {
2057                 ReleaseWriteLock(&afs_xvcache);
2058                 return NULL;
2059         }
2060         newvcache = 1;
2061         afs_stats_cmperf.vcacheMisses++;
2062     } else {
2063         if (cached)
2064             *cached = 1;
2065         afs_stats_cmperf.vcacheHits++;
2066 #if     defined(AFS_DARWIN80_ENV)
2067         /* we already bumped the ref count in the for loop above */
2068 #else /* AFS_DARWIN80_ENV */
2069         osi_vnhold(tvc, 0);
2070 #endif
2071         UpgradeSToWLock(&afs_xvcache, 24);
2072         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2073             refpanic("GRVC VLRU inconsistent0");
2074         }
2075         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2076             refpanic("GRVC VLRU inconsistent1");
2077         }
2078         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2079             refpanic("GRVC VLRU inconsistent2");
2080         }
2081         QRemove(&tvc->vlruq);   /* move to lruq head */
2082         QAdd(&VLRU, &tvc->vlruq);
2083         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2084             refpanic("GRVC VLRU inconsistent3");
2085         }
2086         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2087             refpanic("GRVC VLRU inconsistent4");
2088         }
2089         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2090             refpanic("GRVC VLRU inconsistent5");
2091         }
2092         vcachegen++;
2093     }
2094
2095     ReleaseWriteLock(&afs_xvcache);
2096
2097     if (tvc->f.states & CStatd) {
2098         return tvc;
2099     } else {
2100
2101         ObtainReadLock(&tvc->lock);
2102         tvc->f.states &= ~CUnique;
2103         tvc->callback = NULL;   /* redundant, perhaps */
2104         ReleaseReadLock(&tvc->lock);
2105     }
2106
2107     ObtainWriteLock(&tvc->lock, 57);
2108
2109     /* It is always appropriate to throw away all the access rights? */
2110     afs_FreeAllAxs(&(tvc->Access));
2111
2112     if (newvcache)
2113         tvc->f.states |= CForeign;
2114     if (tvolp->states & VRO)
2115         tvc->f.states |= CRO;
2116     if (tvolp->states & VBackup)
2117         tvc->f.states |= CBackup;
2118     /* now copy ".." entry back out of volume structure, if necessary */
2119     if (newvcache && (tvolp->rootVnode == afid->Fid.Vnode)
2120         && (tvolp->rootUnique == afid->Fid.Unique)) {
2121         tvc->mvstat = 2;
2122     }
2123     if (tvc->mvstat == 2 && tvolp->dotdot.Fid.Volume != 0) {
2124         if (!tvc->mvid)
2125             tvc->mvid = (struct VenusFid *)
2126                 osi_AllocSmallSpace(sizeof(struct VenusFid));
2127         *tvc->mvid = tvolp->dotdot;
2128     }
2129
2130     /* stat the file */
2131     afs_RemoveVCB(afid);
2132
2133     if (!haveStatus) {
2134         struct VenusFid tfid;
2135
2136         tfid = *afid;
2137         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
2138         origCBs = afs_allCBs;   /* ignore InitCallBackState */
2139         code =
2140             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
2141                              &serverp, &tsync);
2142     }
2143
2144     if (code) {
2145         ObtainWriteLock(&afs_xcbhash, 467);
2146         afs_DequeueCallback(tvc);
2147         tvc->callback = NULL;
2148         tvc->f.states &= ~(CStatd | CUnique);
2149         ReleaseWriteLock(&afs_xcbhash);
2150         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2151             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2152         ReleaseWriteLock(&tvc->lock);
2153         afs_PutVCache(tvc);
2154         return NULL;
2155     }
2156
2157     ObtainWriteLock(&afs_xcbhash, 468);
2158     if (origCBs == afs_allCBs) {
2159         tvc->f.states |= CTruth;
2160         tvc->callback = serverp;
2161         if (CallBack.ExpirationTime != 0) {
2162             tvc->cbExpires = CallBack.ExpirationTime + start;
2163             tvc->f.states |= CStatd;
2164             tvc->f.states &= ~CBulkFetching;
2165             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvolp);
2166         } else if (tvc->f.states & CRO) {
2167             /* adapt gives us an hour. */
2168             tvc->cbExpires = 3600 + osi_Time();
2169              /*XXX*/ tvc->f.states |= CStatd;
2170             tvc->f.states &= ~CBulkFetching;
2171             afs_QueueCallback(tvc, CBHash(3600), tvolp);
2172         }
2173     } else {
2174         afs_DequeueCallback(tvc);
2175         tvc->callback = NULL;
2176         tvc->f.states &= ~(CStatd | CUnique);
2177         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2178             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2179     }
2180     ReleaseWriteLock(&afs_xcbhash);
2181     afs_ProcessFS(tvc, &OutStatus, areq);
2182
2183     ReleaseWriteLock(&tvc->lock);
2184     return tvc;
2185 }
2186
2187
2188 /*!
2189  * Update callback status and (sometimes) attributes of a vnode.
2190  * Called after doing a fetch status RPC. Whilst disconnected, attributes
2191  * shouldn't be written to the vcache here.
2192  *
2193  * \param avc
2194  * \param afid
2195  * \param areq
2196  * \param Outsp Server status after rpc call.
2197  * \param acb Callback for this vnode.
2198  *
2199  * \note The vcache must be write locked.
2200  */
2201 void
2202 afs_UpdateStatus(struct vcache *avc, struct VenusFid *afid,
2203                  struct vrequest *areq, struct AFSFetchStatus *Outsp,
2204                  struct AFSCallBack *acb, afs_uint32 start)
2205 {
2206     struct volume *volp;
2207
2208     if (!AFS_IN_SYNC)
2209         /* Dont write status in vcache if resyncing after a disconnection. */
2210         afs_ProcessFS(avc, Outsp, areq);
2211
2212     volp = afs_GetVolume(afid, areq, READ_LOCK);
2213     ObtainWriteLock(&afs_xcbhash, 469);
2214     avc->f.states |= CTruth;
2215     if (avc->callback /* check for race */ ) {
2216         if (acb->ExpirationTime != 0) {
2217             avc->cbExpires = acb->ExpirationTime + start;
2218             avc->f.states |= CStatd;
2219             avc->f.states &= ~CBulkFetching;
2220             afs_QueueCallback(avc, CBHash(acb->ExpirationTime), volp);
2221         } else if (avc->f.states & CRO) {
2222             /* ordinary callback on a read-only volume -- AFS 3.2 style */
2223             avc->cbExpires = 3600 + start;
2224             avc->f.states |= CStatd;
2225             avc->f.states &= ~CBulkFetching;
2226             afs_QueueCallback(avc, CBHash(3600), volp);
2227         } else {
2228             afs_DequeueCallback(avc);
2229             avc->callback = NULL;
2230             avc->f.states &= ~(CStatd | CUnique);
2231             if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
2232                 osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
2233         }
2234     } else {
2235         afs_DequeueCallback(avc);
2236         avc->callback = NULL;
2237         avc->f.states &= ~(CStatd | CUnique);
2238         if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
2239             osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
2240     }
2241     ReleaseWriteLock(&afs_xcbhash);
2242     if (volp)
2243         afs_PutVolume(volp, READ_LOCK);
2244 }
2245
2246 /*!
2247  * Must be called with avc write-locked
2248  * don't absolutely have to invalidate the hint unless the dv has
2249  * changed, but be sure to get it right else there will be consistency bugs.
2250  */
2251 afs_int32
2252 afs_FetchStatus(struct vcache * avc, struct VenusFid * afid,
2253                 struct vrequest * areq, struct AFSFetchStatus * Outsp)
2254 {
2255     int code;
2256     afs_uint32 start = 0;
2257     struct afs_conn *tc;
2258     struct AFSCallBack CallBack;
2259     struct AFSVolSync tsync;
2260     XSTATS_DECLS;
2261     do {
2262         tc = afs_Conn(afid, areq, SHARED_LOCK);
2263         avc->dchint = NULL;     /* invalidate hints */
2264         if (tc) {
2265             avc->callback = tc->parent->srvr->server;
2266             start = osi_Time();
2267             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_FETCHSTATUS);
2268             RX_AFS_GUNLOCK();
2269             code =
2270                 RXAFS_FetchStatus(tc->id, (struct AFSFid *)&afid->Fid, Outsp,
2271                                   &CallBack, &tsync);
2272             RX_AFS_GLOCK();
2273
2274             XSTATS_END_TIME;
2275
2276         } else
2277             code = -1;
2278     } while (afs_Analyze
2279              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_FETCHSTATUS,
2280               SHARED_LOCK, NULL));
2281
2282     if (!code) {
2283         afs_UpdateStatus(avc, afid, areq, Outsp, &CallBack, start);
2284     } else {
2285         /* used to undo the local callback, but that's too extreme.
2286          * There are plenty of good reasons that fetchstatus might return
2287          * an error, such as EPERM.  If we have the vnode cached, statd,
2288          * with callback, might as well keep track of the fact that we
2289          * don't have access...
2290          */
2291         if (code == EPERM || code == EACCES) {
2292             struct axscache *ac;
2293             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
2294                 ac->axess = 0;
2295             else                /* not found, add a new one if possible */
2296                 afs_AddAxs(avc->Access, areq->uid, 0);
2297         }
2298     }
2299     return code;
2300 }
2301
2302 #if 0
2303 /*
2304  * afs_StuffVcache
2305  *
2306  * Description:
2307  *      Stuff some information into the vcache for the given file.
2308  *
2309  * Parameters:
2310  *      afid      : File in question.
2311  *      OutStatus : Fetch status on the file.
2312  *      CallBack  : Callback info.
2313  *      tc        : RPC connection involved.
2314  *      areq      : vrequest involved.
2315  *
2316  * Environment:
2317  *      Nothing interesting.
2318  */
2319 void
2320 afs_StuffVcache(struct VenusFid *afid,
2321                 struct AFSFetchStatus *OutStatus,
2322                 struct AFSCallBack *CallBack, struct afs_conn *tc,
2323                 struct vrequest *areq)
2324 {
2325     afs_int32 code, i, newvcache = 0;
2326     struct vcache *tvc;
2327     struct AFSVolSync tsync;
2328     struct volume *tvp;
2329     struct axscache *ac;
2330     afs_int32 retry;
2331
2332     AFS_STATCNT(afs_StuffVcache);
2333 #ifdef IFS_VCACHECOUNT
2334     ifs_gvcachecall++;
2335 #endif
2336
2337   loop:
2338     ObtainSharedLock(&afs_xvcache, 8);
2339
2340     tvc = afs_FindVCache(afid, &retry, DO_VLRU| IS_SLOCK /* no stats */ );
2341     if (tvc && retry) {
2342 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2343         ReleaseSharedLock(&afs_xvcache);
2344         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2345         goto loop;
2346 #endif
2347     }
2348
2349     if (!tvc) {
2350         /* no cache entry, better grab one */
2351         UpgradeSToWLock(&afs_xvcache, 25);
2352         tvc = afs_NewVCache(afid, NULL);
2353         newvcache = 1;
2354         ConvertWToSLock(&afs_xvcache);
2355         if (!tvc)
2356         {
2357                 ReleaseSharedLock(&afs_xvcache);
2358                 return NULL;
2359         }
2360     }
2361
2362     ReleaseSharedLock(&afs_xvcache);
2363     ObtainWriteLock(&tvc->lock, 58);
2364
2365     tvc->f.states &= ~CStatd;
2366     if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2367         osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
2368
2369     /* Is it always appropriate to throw away all the access rights? */
2370     afs_FreeAllAxs(&(tvc->Access));
2371
2372     /*Copy useful per-volume info */
2373     tvp = afs_GetVolume(afid, areq, READ_LOCK);
2374     if (tvp) {
2375         if (newvcache && (tvp->states & VForeign))
2376             tvc->f.states |= CForeign;
2377         if (tvp->states & VRO)
2378             tvc->f.states |= CRO;
2379         if (tvp->states & VBackup)
2380             tvc->f.states |= CBackup;
2381         /*
2382          * Now, copy ".." entry back out of volume structure, if
2383          * necessary
2384          */
2385         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
2386             if (!tvc->mvid)
2387                 tvc->mvid = (struct VenusFid *)
2388                     osi_AllocSmallSpace(sizeof(struct VenusFid));
2389             *tvc->mvid = tvp->dotdot;
2390         }
2391     }
2392     /* store the stat on the file */
2393     afs_RemoveVCB(afid);
2394     afs_ProcessFS(tvc, OutStatus, areq);
2395     tvc->callback = tc->srvr->server;
2396
2397     /* we use osi_Time twice below.  Ideally, we would use the time at which
2398      * the FetchStatus call began, instead, but we don't have it here.  So we
2399      * make do with "now".  In the CRO case, it doesn't really matter. In
2400      * the other case, we hope that the difference between "now" and when the
2401      * call actually began execution on the server won't be larger than the
2402      * padding which the server keeps.  Subtract 1 second anyway, to be on
2403      * the safe side.  Can't subtract more because we don't know how big
2404      * ExpirationTime is.  Possible consistency problems may arise if the call
2405      * timeout period becomes longer than the server's expiration padding.  */
2406     ObtainWriteLock(&afs_xcbhash, 470);
2407     if (CallBack->ExpirationTime != 0) {
2408         tvc->cbExpires = CallBack->ExpirationTime + osi_Time() - 1;
2409         tvc->f.states |= CStatd;
2410         tvc->f.states &= ~CBulkFetching;
2411         afs_QueueCallback(tvc, CBHash(CallBack->ExpirationTime), tvp);
2412     } else if (tvc->f.states & CRO) {
2413         /* old-fashioned AFS 3.2 style */
2414         tvc->cbExpires = 3600 + osi_Time();
2415          /*XXX*/ tvc->f.states |= CStatd;
2416         tvc->f.states &= ~CBulkFetching;
2417         afs_QueueCallback(tvc, CBHash(3600), tvp);
2418     } else {
2419         afs_DequeueCallback(tvc);
2420         tvc->callback = NULL;
2421         tvc->f.states &= ~(CStatd | CUnique);
2422         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2423             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2424     }
2425     ReleaseWriteLock(&afs_xcbhash);
2426     if (tvp)
2427         afs_PutVolume(tvp, READ_LOCK);
2428
2429     /* look in per-pag cache */
2430     if (tvc->Access && (ac = afs_FindAxs(tvc->Access, areq->uid)))
2431         ac->axess = OutStatus->CallerAccess;    /* substitute pags */
2432     else                        /* not found, add a new one if possible */
2433         afs_AddAxs(tvc->Access, areq->uid, OutStatus->CallerAccess);
2434
2435     ReleaseWriteLock(&tvc->lock);
2436     afs_Trace4(afs_iclSetp, CM_TRACE_STUFFVCACHE, ICL_TYPE_POINTER, tvc,
2437                ICL_TYPE_POINTER, tvc->callback, ICL_TYPE_INT32,
2438                tvc->cbExpires, ICL_TYPE_INT32, tvc->cbExpires - osi_Time());
2439     /*
2440      * Release ref count... hope this guy stays around...
2441      */
2442     afs_PutVCache(tvc);
2443 }                               /*afs_StuffVcache */
2444 #endif
2445
2446 /*!
2447  * Decrements the reference count on a cache entry.
2448  *
2449  * \param avc Pointer to the cache entry to decrement.
2450  *
2451  * \note Environment: Nothing interesting.
2452  */
2453 void
2454 afs_PutVCache(struct vcache *avc)
2455 {
2456     AFS_STATCNT(afs_PutVCache);
2457 #ifdef AFS_DARWIN80_ENV
2458     vnode_put(AFSTOV(avc));
2459     AFS_FAST_RELE(avc);
2460 #else
2461     /*
2462      * Can we use a read lock here?
2463      */
2464     ObtainReadLock(&afs_xvcache);
2465     AFS_FAST_RELE(avc);
2466     ReleaseReadLock(&afs_xvcache);
2467 #endif
2468 }                               /*afs_PutVCache */
2469
2470
2471 /*!
2472  * Reset a vcache entry, so local contents are ignored, and the
2473  * server will be reconsulted next time the vcache is used
2474  *
2475  * \param avc Pointer to the cache entry to reset
2476  * \param acred
2477  *
2478  * \note avc must be write locked on entry
2479  */
2480 void
2481 afs_ResetVCache(struct vcache *avc, afs_ucred_t *acred)
2482 {
2483     ObtainWriteLock(&afs_xcbhash, 456);
2484     afs_DequeueCallback(avc);
2485     avc->f.states &= ~(CStatd | CDirty);    /* next reference will re-stat */
2486     ReleaseWriteLock(&afs_xcbhash);
2487     /* now find the disk cache entries */
2488     afs_TryToSmush(avc, acred, 1);
2489     osi_dnlc_purgedp(avc);
2490     if (avc->linkData && !(avc->f.states & CCore)) {
2491         afs_osi_Free(avc->linkData, strlen(avc->linkData) + 1);
2492         avc->linkData = NULL;
2493     }
2494 }
2495
2496 /*!
2497  * Sleepa when searching for a vcache. Releases all the pending locks,
2498  * sleeps then obtains the previously released locks.
2499  *
2500  * \param vcache Enter sleep state.
2501  * \param flag Determines what locks to use.
2502  *
2503  * \return
2504  */
2505 static void
2506 findvc_sleep(struct vcache *avc, int flag)
2507 {
2508     int fstates = avc->f.states;
2509     if (flag & IS_SLOCK) {
2510             ReleaseSharedLock(&afs_xvcache);
2511     } else {
2512         if (flag & IS_WLOCK) {
2513             ReleaseWriteLock(&afs_xvcache);
2514         } else {
2515             ReleaseReadLock(&afs_xvcache);
2516         }
2517     }
2518     if (flag & FIND_CDEAD) {
2519         ObtainWriteLock(&afs_xvcache, 342);
2520         afs_FlushReclaimedVcaches();
2521         if (fstates == avc->f.states) {
2522             ReleaseWriteLock(&afs_xvcache);
2523             afs_osi_Sleep(&avc->f.states);
2524         } else
2525             ReleaseWriteLock(&afs_xvcache);
2526     } else
2527         afs_osi_Sleep(&avc->f.states);
2528     if (flag & IS_SLOCK) {
2529             ObtainSharedLock(&afs_xvcache, 341);
2530     } else {
2531         if (flag & IS_WLOCK) {
2532             ObtainWriteLock(&afs_xvcache, 343);
2533         } else {
2534             ObtainReadLock(&afs_xvcache);
2535         }
2536     }
2537 }
2538
2539 /*!
2540  * Add a reference on an existing vcache entry.
2541  *
2542  * \param tvc Pointer to the vcache.
2543  *
2544  * \note Environment: Must be called with at least one reference from
2545  * elsewhere on the vcache, even if that reference will be dropped.
2546  * The global lock is required.
2547  *
2548  * \return 0 on success, -1 on failure.
2549  */
2550
2551 int
2552 afs_RefVCache(struct vcache *tvc)
2553 {
2554 #ifdef AFS_DARWIN80_ENV
2555     vnode_t tvp;
2556 #endif
2557
2558     /* AFS_STATCNT(afs_RefVCache); */
2559
2560 #ifdef  AFS_DARWIN80_ENV
2561     tvp = AFSTOV(tvc);
2562     if (vnode_get(tvp))
2563         return -1;
2564     if (vnode_ref(tvp)) {
2565         AFS_GUNLOCK();
2566         /* AFSTOV(tvc) may be NULL */
2567         vnode_put(tvp);
2568         AFS_GLOCK();
2569         return -1;
2570     }
2571 #else
2572         osi_vnhold(tvc, 0);
2573 #endif
2574     return 0;
2575 }                               /*afs_RefVCache */
2576
2577 /*!
2578  * Find a vcache entry given a fid.
2579  *
2580  * \param afid Pointer to the fid whose cache entry we desire.
2581  * \param retry (SGI-specific) tell the caller to drop the lock on xvcache,
2582  *  unlock the vnode, and try again.
2583  * \param flag Bit 1 to specify whether to compute hit statistics.  Not
2584  *  set if FindVCache is called as part of internal bookkeeping.
2585  *
2586  * \note Environment: Must be called with the afs_xvcache lock at least held at
2587  * the read level.  In order to do the VLRU adjustment, the xvcache lock
2588  * must be shared-- we upgrade it here.
2589  */
2590
2591 struct vcache *
2592 afs_FindVCache(struct VenusFid *afid, afs_int32 * retry, afs_int32 flag)
2593 {
2594
2595     struct vcache *tvc;
2596     afs_int32 i;
2597 #ifdef AFS_DARWIN80_ENV
2598     vnode_t tvp;
2599 #endif
2600
2601     AFS_STATCNT(afs_FindVCache);
2602
2603  findloop:
2604     i = VCHash(afid);
2605     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2606         if (FidMatches(afid, tvc)) {
2607             if (tvc->f.states & CVInit) {
2608                 findvc_sleep(tvc, flag);
2609                 goto findloop;
2610             }
2611 #ifdef  AFS_DARWIN80_ENV
2612             if (tvc->f.states & CDeadVnode) {
2613                 if (!(flag & FIND_CDEAD)) {
2614                     findvc_sleep(tvc, flag);
2615                     goto findloop;
2616                 }
2617             }
2618             tvp = AFSTOV(tvc);
2619             if (vnode_get(tvp))
2620                 continue;
2621             if (vnode_ref(tvp)) {
2622                 AFS_GUNLOCK();
2623                 /* AFSTOV(tvc) may be NULL */
2624                 vnode_put(tvp);
2625                 AFS_GLOCK();
2626                 continue;
2627             }
2628             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2629                 AFS_GUNLOCK();
2630                 vnode_recycle(AFSTOV(tvc));
2631                 AFS_GLOCK();
2632             }
2633 #endif
2634             break;
2635         }
2636     }
2637
2638     /* should I have a read lock on the vnode here? */
2639     if (tvc) {
2640         if (retry)
2641             *retry = 0;
2642 #if !defined(AFS_DARWIN80_ENV)
2643         osi_vnhold(tvc, retry); /* already held, above */
2644         if (retry && *retry)
2645             return 0;
2646 #endif
2647 #if defined(AFS_DARWIN_ENV) && !defined(AFS_DARWIN80_ENV)
2648         tvc->f.states |= CUBCinit;
2649         AFS_GUNLOCK();
2650         if (UBCINFOMISSING(AFSTOV(tvc)) ||
2651             UBCINFORECLAIMED(AFSTOV(tvc))) {
2652           ubc_info_init(AFSTOV(tvc));
2653         }
2654         AFS_GLOCK();
2655         tvc->f.states &= ~CUBCinit;
2656 #endif
2657         /*
2658          * only move to front of vlru if we have proper vcache locking)
2659          */
2660         if (flag & DO_VLRU) {
2661             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2662                 refpanic("FindVC VLRU inconsistent1");
2663             }
2664             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2665                 refpanic("FindVC VLRU inconsistent1");
2666             }
2667             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2668                 refpanic("FindVC VLRU inconsistent2");
2669             }
2670             UpgradeSToWLock(&afs_xvcache, 26);
2671             QRemove(&tvc->vlruq);
2672             QAdd(&VLRU, &tvc->vlruq);
2673             ConvertWToSLock(&afs_xvcache);
2674             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2675                 refpanic("FindVC VLRU inconsistent1");
2676             }
2677             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2678                 refpanic("FindVC VLRU inconsistent2");
2679             }
2680             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2681                 refpanic("FindVC VLRU inconsistent3");
2682             }
2683         }
2684         vcachegen++;
2685     }
2686
2687     if (flag & DO_STATS) {
2688         if (tvc)
2689             afs_stats_cmperf.vcacheHits++;
2690         else
2691             afs_stats_cmperf.vcacheMisses++;
2692         if (afs_IsPrimaryCellNum(afid->Cell))
2693             afs_stats_cmperf.vlocalAccesses++;
2694         else
2695             afs_stats_cmperf.vremoteAccesses++;
2696     }
2697     return tvc;
2698 }                               /*afs_FindVCache */
2699
2700 /*!
2701  * Find a vcache entry given a fid. Does a wildcard match on what we
2702  * have for the fid. If more than one entry, don't return anything.
2703  *
2704  * \param avcp Fill in pointer if we found one and only one.
2705  * \param afid Pointer to the fid whose cache entry we desire.
2706  * \param retry (SGI-specific) tell the caller to drop the lock on xvcache,
2707  *             unlock the vnode, and try again.
2708  * \param flags bit 1 to specify whether to compute hit statistics.  Not
2709  *             set if FindVCache is called as part of internal bookkeeping.
2710  *
2711  * \note Environment: Must be called with the afs_xvcache lock at least held at
2712  *  the read level.  In order to do the VLRU adjustment, the xvcache lock
2713  *  must be shared-- we upgrade it here.
2714  *
2715  * \return Number of matches found.
2716  */
2717
2718 int afs_duplicate_nfs_fids = 0;
2719
2720 afs_int32
2721 afs_NFSFindVCache(struct vcache **avcp, struct VenusFid *afid)
2722 {
2723     struct vcache *tvc;
2724     afs_int32 i;
2725     afs_int32 count = 0;
2726     struct vcache *found_tvc = NULL;
2727 #ifdef AFS_DARWIN80_ENV
2728     vnode_t tvp;
2729 #endif
2730
2731     AFS_STATCNT(afs_FindVCache);
2732
2733   loop:
2734
2735     ObtainSharedLock(&afs_xvcache, 331);
2736
2737     i = VCHash(afid);
2738     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2739         /* Match only on what we have.... */
2740         if (((tvc->f.fid.Fid.Vnode & 0xffff) == afid->Fid.Vnode)
2741             && (tvc->f.fid.Fid.Volume == afid->Fid.Volume)
2742             && ((tvc->f.fid.Fid.Unique & 0xffffff) == afid->Fid.Unique)
2743             && (tvc->f.fid.Cell == afid->Cell)) {
2744             if (tvc->f.states & CVInit) {
2745                 ReleaseSharedLock(&afs_xvcache);
2746                 afs_osi_Sleep(&tvc->f.states);
2747                 goto loop;
2748             }
2749 #ifdef  AFS_DARWIN80_ENV
2750             if (tvc->f.states & CDeadVnode) {
2751                 if (!(tvc->f.states & CBulkFetching)) {
2752                     ReleaseSharedLock(&afs_xvcache);
2753                     afs_osi_Sleep(&tvc->f.states);
2754                     goto loop;
2755                 }
2756             }
2757             tvp = AFSTOV(tvc);
2758             if (vnode_get(tvp)) {
2759                 /* This vnode no longer exists. */
2760                 continue;
2761             }
2762             if (vnode_ref(tvp)) {
2763                 /* This vnode no longer exists. */
2764                 AFS_GUNLOCK();
2765                 /* AFSTOV(tvc) may be NULL */
2766                 vnode_put(tvp);
2767                 AFS_GLOCK();
2768                 continue;
2769             }
2770             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2771                 AFS_GUNLOCK();
2772                 vnode_recycle(AFSTOV(tvc));
2773                 AFS_GLOCK();
2774             }
2775 #endif /* AFS_DARWIN80_ENV */
2776             count++;
2777             if (found_tvc) {
2778                 /* Duplicates */
2779                 afs_duplicate_nfs_fids++;
2780                 ReleaseSharedLock(&afs_xvcache);
2781 #ifdef AFS_DARWIN80_ENV
2782                 /* Drop our reference counts. */
2783                 vnode_put(AFSTOV(tvc));
2784                 vnode_put(AFSTOV(found_tvc));
2785 #endif
2786                 return count;
2787             }
2788             found_tvc = tvc;
2789         }
2790     }
2791
2792     tvc = found_tvc;
2793     /* should I have a read lock on the vnode here? */
2794     if (tvc) {
2795 #ifndef AFS_DARWIN80_ENV
2796 #if defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2797         afs_int32 retry = 0;
2798         osi_vnhold(tvc, &retry);
2799         if (retry) {
2800             count = 0;
2801             found_tvc = (struct vcache *)0;
2802             ReleaseSharedLock(&afs_xvcache);
2803             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2804             goto loop;
2805         }
2806 #else
2807         osi_vnhold(tvc, (int *)0);      /* already held, above */
2808 #endif
2809 #endif
2810         /*
2811          * We obtained the xvcache lock above.
2812          */
2813         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2814             refpanic("FindVC VLRU inconsistent1");
2815         }
2816         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2817             refpanic("FindVC VLRU inconsistent1");
2818         }
2819         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2820             refpanic("FindVC VLRU inconsistent2");
2821         }
2822         UpgradeSToWLock(&afs_xvcache, 568);
2823         QRemove(&tvc->vlruq);
2824         QAdd(&VLRU, &tvc->vlruq);
2825         ConvertWToSLock(&afs_xvcache);
2826         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2827             refpanic("FindVC VLRU inconsistent1");
2828         }
2829         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2830             refpanic("FindVC VLRU inconsistent2");
2831         }
2832         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2833             refpanic("FindVC VLRU inconsistent3");
2834         }
2835     }
2836     vcachegen++;
2837
2838     if (tvc)
2839         afs_stats_cmperf.vcacheHits++;
2840     else
2841         afs_stats_cmperf.vcacheMisses++;
2842     if (afs_IsPrimaryCellNum(afid->Cell))
2843         afs_stats_cmperf.vlocalAccesses++;
2844     else
2845         afs_stats_cmperf.vremoteAccesses++;
2846
2847     *avcp = tvc;                /* May be null */
2848
2849     ReleaseSharedLock(&afs_xvcache);
2850     return (tvc ? 1 : 0);
2851
2852 }                               /*afs_NFSFindVCache */
2853
2854
2855
2856
2857 /*!
2858  * Initialize vcache related variables
2859  *
2860  * \param astatSize
2861  */
2862 void
2863 afs_vcacheInit(int astatSize)
2864 {
2865 #if !defined(AFS_LINUX22_ENV)
2866     struct vcache *tvp;
2867 #endif
2868     int i;
2869     if (!afs_maxvcount) {
2870         afs_maxvcount = astatSize;      /* no particular limit on linux? */
2871     }
2872 #if !defined(AFS_LINUX22_ENV)
2873     freeVCList = NULL;
2874 #endif
2875
2876     AFS_RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2877     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2878
2879 #if !defined(AFS_LINUX22_ENV)
2880     /* Allocate and thread the struct vcache entries */
2881     tvp = afs_osi_Alloc(astatSize * sizeof(struct vcache));
2882     osi_Assert(tvp != NULL);
2883     memset(tvp, 0, sizeof(struct vcache) * astatSize);
2884
2885     Initial_freeVCList = tvp;
2886     freeVCList = &(tvp[0]);
2887     for (i = 0; i < astatSize - 1; i++) {
2888         tvp[i].nextfree = &(tvp[i + 1]);
2889     }
2890     tvp[astatSize - 1].nextfree = NULL;
2891 # ifdef  KERNEL_HAVE_PIN
2892     pin((char *)tvp, astatSize * sizeof(struct vcache));        /* XXX */
2893 # endif
2894 #endif
2895
2896 #if defined(AFS_SGI_ENV)
2897     for (i = 0; i < astatSize; i++) {
2898         char name[METER_NAMSZ];
2899         struct vcache *tvc = &tvp[i];
2900
2901         tvc->v.v_number = ++afsvnumbers;
2902         tvc->vc_rwlockid = OSI_NO_LOCKID;
2903         initnsema(&tvc->vc_rwlock, 1,
2904                   makesname(name, "vrw", tvc->v.v_number));
2905 #ifndef AFS_SGI53_ENV
2906         initnsema(&tvc->v.v_sync, 0, makesname(name, "vsy", tvc->v.v_number));
2907 #endif
2908 #ifndef AFS_SGI62_ENV
2909         initnlock(&tvc->v.v_lock, makesname(name, "vlk", tvc->v.v_number));
2910 #endif /* AFS_SGI62_ENV */
2911     }
2912 #endif
2913     QInit(&VLRU);
2914     for(i = 0; i < VCSIZE; ++i)
2915         QInit(&afs_vhashTV[i]);
2916 }
2917
2918 /*!
2919  * Shutdown vcache.
2920  */
2921 void
2922 shutdown_vcache(void)
2923 {
2924     int i;
2925     struct afs_cbr *tsp;
2926     /*
2927      * XXX We may potentially miss some of the vcaches because if when
2928      * there are no free vcache entries and all the vcache entries are active
2929      * ones then we allocate an additional one - admittedly we almost never
2930      * had that occur.
2931      */
2932
2933     {
2934         struct afs_q *tq, *uq = NULL;
2935         struct vcache *tvc;
2936         for (tq = VLRU.prev; tq != &VLRU; tq = uq) {
2937             tvc = QTOV(tq);
2938             uq = QPrev(tq);
2939             if (tvc->mvid) {
2940                 osi_FreeSmallSpace(tvc->mvid);
2941                 tvc->mvid = (struct VenusFid *)0;
2942             }
2943 #ifdef  AFS_AIX_ENV
2944             aix_gnode_rele(AFSTOV(tvc));
2945 #endif
2946             if (tvc->linkData) {
2947                 afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2948                 tvc->linkData = 0;
2949             }
2950         }
2951         /*
2952          * Also free the remaining ones in the Cache
2953          */
2954         for (i = 0; i < VCSIZE; i++) {
2955             for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2956                 if (tvc->mvid) {
2957                     osi_FreeSmallSpace(tvc->mvid);
2958                     tvc->mvid = (struct VenusFid *)0;
2959                 }
2960 #ifdef  AFS_AIX_ENV
2961                 if (tvc->v.v_gnode)
2962                     afs_osi_Free(tvc->v.v_gnode, sizeof(struct gnode));
2963 #ifdef  AFS_AIX32_ENV
2964                 if (tvc->segid) {
2965                     AFS_GUNLOCK();
2966                     vms_delete(tvc->segid);
2967                     AFS_GLOCK();
2968                     tvc->segid = tvc->vmh = NULL;
2969                     if (VREFCOUNT_GT(tvc,0))
2970                         osi_Panic("flushVcache: vm race");
2971                 }
2972                 if (tvc->credp) {
2973                     crfree(tvc->credp);
2974                     tvc->credp = NULL;
2975                 }
2976 #endif
2977 #endif
2978 #if     defined(AFS_SUN5_ENV)
2979                 if (tvc->credp) {
2980                     crfree(tvc->credp);
2981                     tvc->credp = NULL;
2982                 }
2983 #endif
2984                 if (tvc->linkData) {
2985                     afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2986                     tvc->linkData = 0;
2987                 }
2988
2989                 if (tvc->Access)
2990                     afs_FreeAllAxs(&(tvc->Access));
2991             }
2992             afs_vhashT[i] = 0;
2993         }
2994     }
2995     /*
2996      * Free any leftover callback queue
2997      */
2998     for (i = 0; i < afs_stats_cmperf.CallBackAlloced; i++) {
2999         tsp = afs_cbrHeads[i];
3000         afs_cbrHeads[i] = 0;
3001         afs_osi_Free((char *)tsp, AFS_NCBRS * sizeof(struct afs_cbr));
3002     }
3003     afs_cbrSpace = 0;
3004
3005 #if !defined(AFS_LINUX22_ENV)
3006     afs_osi_Free(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
3007
3008 # ifdef  KERNEL_HAVE_PIN
3009     unpin(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
3010 # endif
3011
3012     freeVCList = Initial_freeVCList = 0;
3013 #endif
3014
3015     AFS_RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
3016     LOCK_INIT(&afs_xvcb, "afs_xvcb");
3017     QInit(&VLRU);
3018     for(i = 0; i < VCSIZE; ++i)
3019         QInit(&afs_vhashTV[i]);
3020 }
3021
3022 void
3023 afs_DisconGiveUpCallbacks(void)
3024 {
3025     int i;
3026     struct vcache *tvc;
3027     int nq=0;
3028
3029     ObtainWriteLock(&afs_xvcache, 1002); /* XXX - should be a unique number */
3030
3031     /* Somehow, walk the set of vcaches, with each one coming out as tvc */
3032     for (i = 0; i < VCSIZE; i++) {
3033         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
3034             if (afs_QueueVCB(tvc)) {
3035                 tvc->callback = NULL;
3036                 nq++;
3037             }
3038         }
3039     }
3040
3041     ReleaseWriteLock(&afs_xvcache);
3042
3043     afs_FlushVCBs(1);
3044 }
3045
3046 /*!
3047  *
3048  * Clear the Statd flag from all vcaches
3049  *
3050  * This function removes the Statd flag from all vcaches. It's used by
3051  * disconnected mode to tidy up during reconnection
3052  *
3053  */
3054 void
3055 afs_ClearAllStatdFlag(void)
3056 {
3057     int i;
3058     struct vcache *tvc;
3059
3060     ObtainWriteLock(&afs_xvcache, 715);
3061
3062     for (i = 0; i < VCSIZE; i++) {
3063         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
3064             tvc->f.states &= ~(CStatd|CUnique);
3065         }
3066     }
3067     ReleaseWriteLock(&afs_xvcache);
3068 }