f564d19148ad1c6b9b936e48d85f40008c56857b
[openafs.git] / src / afs / afs_vcache.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * Implements:
12  * afs_FlushVCache
13  * afs_AllocCBR
14  * afs_FreeCBR
15  * afs_FlushVCBs
16  * afs_QueueVCB
17  * afs_RemoveVCB
18  * afs_NewVCache
19  * afs_FlushActiveVcaches
20  * afs_VerifyVCache2
21  * afs_WriteVCache
22  * afs_WriteVCacheDiscon
23  * afs_SimpleVStat
24  * afs_ProcessFS
25  * TellALittleWhiteLie
26  * afs_RemoteLookup
27  * afs_GetVCache
28  * afs_LookupVCache
29  * afs_GetRootVCache
30  * afs_UpdateStatus
31  * afs_FetchStatus
32  * afs_StuffVcache
33  * afs_PutVCache
34  * afs_FindVCache
35  * afs_NFSFindVCache
36  * afs_vcacheInit
37  * shutdown_vcache
38  *
39  */
40 #include <afsconfig.h>
41 #include "afs/param.h"
42
43 #include "afs/sysincludes.h"   /*Standard vendor system headers */
44 #include "afsincludes.h"       /*AFS-based standard headers */
45 #include "afs/afs_stats.h"
46 #include "afs/afs_cbqueue.h"
47 #include "afs/afs_osidnlc.h"
48
49 afs_int32 afs_maxvcount = 0;    /* max number of vcache entries */
50 afs_int32 afs_vcount = 0;       /* number of vcache in use now */
51
52 #ifdef AFS_SGI_ENV
53 int afsvnumbers = 0;
54 #endif
55
56 #ifdef AFS_SGI64_ENV
57 char *makesname();
58 #endif /* AFS_SGI64_ENV */
59
60 /* Exported variables */
61 #ifdef AFS_DISCON_ENV
62 afs_rwlock_t afs_xvcdirty;      /*Lock: discon vcache dirty list mgmt */
63 #endif
64 afs_rwlock_t afs_xvcache;       /*Lock: alloc new stat cache entries */
65 afs_rwlock_t afs_xvreclaim;     /*Lock: entries reclaimed, not on free list */
66 afs_lock_t afs_xvcb;            /*Lock: fids on which there are callbacks */
67 #if !defined(AFS_LINUX22_ENV)
68 static struct vcache *freeVCList;       /*Free list for stat cache entries */
69 struct vcache *ReclaimedVCList; /*Reclaimed list for stat entries */
70 static struct vcache *Initial_freeVCList;       /*Initial list for above */
71 #endif
72 struct afs_q VLRU;              /*vcache LRU */
73 afs_int32 vcachegen = 0;
74 unsigned int afs_paniconwarn = 0;
75 struct vcache *afs_vhashT[VCSIZE];
76 struct afs_q afs_vhashTV[VCSIZE];
77 static struct afs_cbr *afs_cbrHashT[CBRSIZE];
78 afs_int32 afs_bulkStatsLost;
79 int afs_norefpanic = 0;
80
81
82 /* Disk backed vcache definitions 
83  * Both protected by xvcache */
84 #ifdef AFS_DISCON_ENV
85 static int afs_nextVcacheSlot = 0;
86 static struct afs_slotlist *afs_freeSlotList = NULL;
87 #endif
88
89 /* Forward declarations */
90 static afs_int32 afs_QueueVCB(struct vcache *avc);
91
92 /*!
93  * Generate an index into the hash table for a given Fid.
94  * \param fid 
95  * \return The hash value.
96  */
97 static int
98 afs_HashCBRFid(struct AFSFid *fid)
99 {
100     return (fid->Volume + fid->Vnode + fid->Unique) % CBRSIZE;
101 }
102
103 /*!
104  * Insert a CBR entry into the hash table.
105  * Must be called with afs_xvcb held.
106  * \param cbr
107  * \return
108  */
109 static void
110 afs_InsertHashCBR(struct afs_cbr *cbr)
111 {
112     int slot = afs_HashCBRFid(&cbr->fid);
113
114     cbr->hash_next = afs_cbrHashT[slot];
115     if (afs_cbrHashT[slot])
116         afs_cbrHashT[slot]->hash_pprev = &cbr->hash_next;
117
118     cbr->hash_pprev = &afs_cbrHashT[slot];
119     afs_cbrHashT[slot] = cbr;
120 }
121
122 /*!
123  *
124  * Flush the given vcache entry.
125  *
126  * Environment:
127  *      afs_xvcache lock must be held for writing upon entry to
128  *      prevent people from changing the vrefCount field, and to
129  *      protect the lruq and hnext fields.
130  * LOCK: afs_FlushVCache afs_xvcache W
131  * REFCNT: vcache ref count must be zero on entry except for osf1
132  * RACE: lock is dropped and reobtained, permitting race in caller
133  *
134  * \param avc Pointer to vcache entry to flush.
135  * \param slept Pointer to int to set 1 if we sleep/drop locks, 0 if we don't.
136  *
137  */
138 int
139 afs_FlushVCache(struct vcache *avc, int *slept)
140 {                               /*afs_FlushVCache */
141
142     afs_int32 i, code;
143     struct vcache **uvc, *wvc;
144
145     *slept = 0;
146     AFS_STATCNT(afs_FlushVCache);
147     afs_Trace2(afs_iclSetp, CM_TRACE_FLUSHV, ICL_TYPE_POINTER, avc,
148                ICL_TYPE_INT32, avc->f.states);
149
150     code = osi_VM_FlushVCache(avc, slept);
151     if (code)
152         goto bad;
153
154     if (avc->f.states & CVFlushed) {
155         code = EBUSY;
156         goto bad;
157     }
158 #if !defined(AFS_LINUX22_ENV)
159     if (avc->nextfree || !avc->vlruq.prev || !avc->vlruq.next) {        /* qv afs.h */
160         refpanic("LRU vs. Free inconsistency");
161     }
162 #endif
163     avc->f.states |= CVFlushed;
164     /* pull the entry out of the lruq and put it on the free list */
165     QRemove(&avc->vlruq);
166
167     /* keep track of # of files that we bulk stat'd, but never used
168      * before they got recycled.
169      */
170     if (avc->f.states & CBulkStat)
171         afs_bulkStatsLost++;
172     vcachegen++;
173     /* remove entry from the hash chain */
174     i = VCHash(&avc->f.fid);
175     uvc = &afs_vhashT[i];
176     for (wvc = *uvc; wvc; uvc = &wvc->hnext, wvc = *uvc) {
177         if (avc == wvc) {
178             *uvc = avc->hnext;
179             avc->hnext = (struct vcache *)NULL;
180             break;
181         }
182     }
183
184     /* remove entry from the volume hash table */
185     QRemove(&avc->vhashq);
186
187     if (avc->mvid)
188         osi_FreeSmallSpace(avc->mvid);
189     avc->mvid = (struct VenusFid *)0;
190     if (avc->linkData) {
191         afs_osi_Free(avc->linkData, strlen(avc->linkData) + 1);
192         avc->linkData = NULL;
193     }
194 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
195     /* OK, there are no internal vrefCounts, so there shouldn't
196      * be any more refs here. */
197     if (avc->v) {
198 #ifdef AFS_DARWIN80_ENV
199         vnode_clearfsnode(AFSTOV(avc));
200         vnode_removefsref(AFSTOV(avc));
201 #else
202         avc->v->v_data = NULL;  /* remove from vnode */
203 #endif
204         AFSTOV(avc) = NULL;             /* also drop the ptr to vnode */
205     }
206 #endif
207 #ifdef AFS_SUN510_ENV
208     /* As we use private vnodes, cleanup is up to us */
209     vn_reinit(AFSTOV(avc));
210 #endif
211     afs_FreeAllAxs(&(avc->Access));
212     afs_QueueVCB(avc);
213     ObtainWriteLock(&afs_xcbhash, 460);
214     afs_DequeueCallback(avc);   /* remove it from queued callbacks list */
215     avc->f.states &= ~(CStatd | CUnique);
216     ReleaseWriteLock(&afs_xcbhash);
217     if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
218         osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
219     else
220         osi_dnlc_purgevp(avc);
221
222     /*
223      * Next, keep track of which vnodes we've deleted for create's
224      * optimistic synchronization algorithm
225      */
226     afs_allZaps++;
227     if (avc->f.fid.Fid.Vnode & 1)
228         afs_oddZaps++;
229     else
230         afs_evenZaps++;
231
232     afs_vcount--;
233 #if !defined(AFS_LINUX22_ENV)
234     /* put the entry in the free list */
235     avc->nextfree = freeVCList;
236     freeVCList = avc;
237     if (avc->vlruq.prev || avc->vlruq.next) {
238         refpanic("LRU vs. Free inconsistency");
239     }
240     avc->f.states |= CVFlushed;
241 #else
242     /* This should put it back on the vnode free list since usecount is 1 */
243     vSetType(avc, VREG);
244     if (VREFCOUNT_GT(avc,0)) {
245         AFS_RELE(AFSTOV(avc));
246         afs_stats_cmperf.vcacheXAllocs--;
247     } else {
248         if (afs_norefpanic) {
249             afs_warn("flush vc refcnt < 1");
250             afs_norefpanic++;
251         } else
252             osi_Panic("flush vc refcnt < 1");
253     }
254 #endif /* AFS_LINUX22_ENV */
255     return 0;
256
257   bad:
258     return code;
259 }                               /*afs_FlushVCache */
260
261 #ifndef AFS_SGI_ENV
262 /*!
263  *  The core of the inactive vnode op for all but IRIX.
264  *
265  * \param avc 
266  * \param acred
267  */
268 void
269 afs_InactiveVCache(struct vcache *avc, afs_ucred_t *acred)
270 {
271     AFS_STATCNT(afs_inactive);
272     if (avc->f.states & CDirty) {
273         /* we can't keep trying to push back dirty data forever.  Give up. */
274         afs_InvalidateAllSegments(avc); /* turns off dirty bit */
275     }
276     avc->f.states &= ~CMAPPED;  /* mainly used by SunOS 4.0.x */
277     avc->f.states &= ~CDirty;   /* Turn it off */
278     if (avc->f.states & CUnlinked) {
279         if (CheckLock(&afs_xvcache) || CheckLock(&afs_xdcache)) {
280             avc->f.states |= CUnlinkedDel;
281             return;
282         }
283         afs_remunlink(avc, 1);  /* ignore any return code */
284     }
285
286 }
287 #endif
288
289 /*!
290  *   Allocate a callback return structure from the
291  * free list and return it.
292  *
293  * Environment: The alloc and free routines are both called with the afs_xvcb lock
294  * held, so we don't have to worry about blocking in osi_Alloc.
295  *
296  * \return The allocated afs_cbr.
297  */
298 static struct afs_cbr *afs_cbrSpace = 0;
299 /* if alloc limit below changes, fix me! */
300 static struct afs_cbr *afs_cbrHeads[2];
301 struct afs_cbr *
302 afs_AllocCBR(void)
303 {
304     register struct afs_cbr *tsp;
305     int i;
306
307     while (!afs_cbrSpace) {
308         if (afs_stats_cmperf.CallBackAlloced >= 2) {
309             /* don't allocate more than 2 * AFS_NCBRS for now */
310             afs_FlushVCBs(0);
311             afs_stats_cmperf.CallBackFlushes++;
312         } else {
313             /* try allocating */
314             tsp =
315                 (struct afs_cbr *)afs_osi_Alloc(AFS_NCBRS *
316                                                 sizeof(struct afs_cbr));
317             for (i = 0; i < AFS_NCBRS - 1; i++) {
318                 tsp[i].next = &tsp[i + 1];
319             }
320             tsp[AFS_NCBRS - 1].next = 0;
321             afs_cbrSpace = tsp;
322             afs_cbrHeads[afs_stats_cmperf.CallBackAlloced] = tsp;
323             afs_stats_cmperf.CallBackAlloced++;
324         }
325     }
326     tsp = afs_cbrSpace;
327     afs_cbrSpace = tsp->next;
328     return tsp;
329 }
330
331 /*!
332  * Free a callback return structure, removing it from all lists.
333  *
334  * Environment: the xvcb lock is held over these calls.
335  *
336  * \param asp The address of the structure to free.
337  *
338  * \rerurn 0
339  */
340 int
341 afs_FreeCBR(register struct afs_cbr *asp)
342 {
343     *(asp->pprev) = asp->next;
344     if (asp->next)
345         asp->next->pprev = asp->pprev;
346
347     *(asp->hash_pprev) = asp->hash_next;
348     if (asp->hash_next)
349         asp->hash_next->hash_pprev = asp->hash_pprev;
350
351     asp->next = afs_cbrSpace;
352     afs_cbrSpace = asp;
353     return 0;
354 }
355
356 /*!
357  *   Flush all queued callbacks to all servers.
358  *
359  * Environment: holds xvcb lock over RPC to guard against race conditions
360  *      when a new callback is granted for the same file later on.
361  *
362  * \return 0 for success.
363  */
364 afs_int32
365 afs_FlushVCBs(afs_int32 lockit)
366 {
367     struct AFSFid *tfids;
368     struct AFSCallBack callBacks[1];
369     struct AFSCBFids fidArray;
370     struct AFSCBs cbArray;
371     afs_int32 code;
372     struct afs_cbr *tcbrp;
373     int tcount;
374     struct server *tsp;
375     int i;
376     struct vrequest treq;
377     struct afs_conn *tc;
378     int safety1, safety2, safety3;
379     XSTATS_DECLS;
380     if ((code = afs_InitReq(&treq, afs_osi_credp)))
381         return code;
382     treq.flags |= O_NONBLOCK;
383     tfids = afs_osi_Alloc(sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
384
385     if (lockit)
386         ObtainWriteLock(&afs_xvcb, 273);
387     ObtainReadLock(&afs_xserver);
388     for (i = 0; i < NSERVERS; i++) {
389         for (safety1 = 0, tsp = afs_servers[i];
390              tsp && safety1 < afs_totalServers + 10;
391              tsp = tsp->next, safety1++) {
392             /* don't have any */
393             if (tsp->cbrs == (struct afs_cbr *)0)
394                 continue;
395
396             /* otherwise, grab a block of AFS_MAXCBRSCALL from the list
397              * and make an RPC, over and over again.
398              */
399             tcount = 0;         /* number found so far */
400             for (safety2 = 0; safety2 < afs_cacheStats; safety2++) {
401                 if (tcount >= AFS_MAXCBRSCALL || !tsp->cbrs) {
402                     /* if buffer is full, or we've queued all we're going
403                      * to from this server, we should flush out the
404                      * callbacks.
405                      */
406                     fidArray.AFSCBFids_len = tcount;
407                     fidArray.AFSCBFids_val = (struct AFSFid *)tfids;
408                     cbArray.AFSCBs_len = 1;
409                     cbArray.AFSCBs_val = callBacks;
410                     memset(&callBacks[0], 0, sizeof(callBacks[0]));
411                     callBacks[0].CallBackType = CB_EXCLUSIVE;
412                     for (safety3 = 0; safety3 < AFS_MAXHOSTS * 2; safety3++) {
413                         tc = afs_ConnByHost(tsp, tsp->cell->fsport,
414                                             tsp->cell->cellNum, &treq, 0,
415                                             SHARED_LOCK);
416                         if (tc) {
417                             XSTATS_START_TIME
418                                 (AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS);
419                             RX_AFS_GUNLOCK();
420                             code =
421                                 RXAFS_GiveUpCallBacks(tc->id, &fidArray,
422                                                       &cbArray);
423                             RX_AFS_GLOCK();
424                             XSTATS_END_TIME;
425                         } else
426                             code = -1;
427                         if (!afs_Analyze
428                             (tc, code, 0, &treq,
429                              AFS_STATS_FS_RPCIDX_GIVEUPCALLBACKS, SHARED_LOCK,
430                              tsp->cell)) {
431                             break;
432                         }
433                     }
434                     /* ignore return code, since callbacks may have
435                      * been returned anyway, we shouldn't leave them
436                      * around to be returned again.
437                      *
438                      * Next, see if we are done with this server, and if so,
439                      * break to deal with the next one.
440                      */
441                     if (!tsp->cbrs)
442                         break;
443                     tcount = 0;
444                 }
445                 /* if to flush full buffer */
446                 /* if we make it here, we have an entry at the head of cbrs,
447                  * which we should copy to the file ID array and then free.
448                  */
449                 tcbrp = tsp->cbrs;
450                 tfids[tcount++] = tcbrp->fid;
451
452                 /* Freeing the CBR will unlink it from the server's CBR list */
453                 afs_FreeCBR(tcbrp);
454             }                   /* while loop for this one server */
455             if (safety2 > afs_cacheStats) {
456                 afs_warn("possible internal error afs_flushVCBs (%d)\n",
457                          safety2);
458             }
459         }                       /* for loop for this hash chain */
460     }                           /* loop through all hash chains */
461     if (safety1 > afs_totalServers + 2) {
462         afs_warn
463             ("AFS internal error (afs_flushVCBs) (%d > %d), continuing...\n",
464              safety1, afs_totalServers + 2);
465         if (afs_paniconwarn)
466             osi_Panic("afs_flushVCBS safety1");
467     }
468
469     ReleaseReadLock(&afs_xserver);
470     if (lockit)
471         ReleaseWriteLock(&afs_xvcb);
472     afs_osi_Free(tfids, sizeof(struct AFSFid) * AFS_MAXCBRSCALL);
473     return 0;
474 }
475
476 /*!
477  *  Queue a callback on the given fid.
478  *
479  * Environment:
480  *      Locks the xvcb lock.
481  *      Called when the xvcache lock is already held.
482  *
483  * \param avc vcache entry
484  * \return 1 if queued, 0 otherwise
485  */
486
487 static afs_int32
488 afs_QueueVCB(struct vcache *avc)
489 {
490     int queued = 0;
491     struct server *tsp;
492     struct afs_cbr *tcbp;
493
494     AFS_STATCNT(afs_QueueVCB);
495
496     ObtainWriteLock(&afs_xvcb, 274);
497
498     /* we can't really give back callbacks on RO files, since the
499      * server only tracks them on a per-volume basis, and we don't
500      * know whether we still have some other files from the same
501      * volume. */
502     if (!((avc->f.states & CRO) == 0 && avc->callback)) {
503         goto done;
504     }
505
506     /* The callback is really just a struct server ptr. */
507     tsp = (struct server *)(avc->callback);
508
509     /* we now have a pointer to the server, so we just allocate
510      * a queue entry and queue it.
511      */
512     tcbp = afs_AllocCBR();
513     tcbp->fid = avc->f.fid.Fid;
514
515     tcbp->next = tsp->cbrs;
516     if (tsp->cbrs)
517         tsp->cbrs->pprev = &tcbp->next;
518
519     tsp->cbrs = tcbp;
520     tcbp->pprev = &tsp->cbrs;
521
522     afs_InsertHashCBR(tcbp);
523     queued = 1;
524
525  done:
526     /* now release locks and return */
527     ReleaseWriteLock(&afs_xvcb);
528     return queued;
529 }
530
531
532 /*!
533  *   Remove a queued callback for a given Fid.
534  *
535  * Environment:
536  *      Locks xvcb and xserver locks.
537  *      Typically called with xdcache, xvcache and/or individual vcache
538  *      entries locked.
539  *
540  * \param afid The fid we want cleansed of queued callbacks.
541  *
542  */
543
544 void
545 afs_RemoveVCB(struct VenusFid *afid)
546 {
547     int slot;
548     struct afs_cbr *cbr, *ncbr;
549
550     AFS_STATCNT(afs_RemoveVCB);
551     ObtainWriteLock(&afs_xvcb, 275);
552
553     slot = afs_HashCBRFid(&afid->Fid);
554     ncbr = afs_cbrHashT[slot];
555
556     while (ncbr) {
557         cbr = ncbr;
558         ncbr = cbr->hash_next;
559
560         if (afid->Fid.Volume == cbr->fid.Volume &&
561             afid->Fid.Vnode == cbr->fid.Vnode &&
562             afid->Fid.Unique == cbr->fid.Unique) {
563             afs_FreeCBR(cbr);
564         }
565     }
566
567     ReleaseWriteLock(&afs_xvcb);
568 }
569
570 void 
571 afs_FlushReclaimedVcaches(void)
572 {
573 #if !defined(AFS_LINUX22_ENV)
574     struct vcache *tvc;
575     int code, fv_slept;
576     struct vcache *tmpReclaimedVCList = NULL;   
577
578     ObtainWriteLock(&afs_xvreclaim, 76);
579     while (ReclaimedVCList) {
580         tvc = ReclaimedVCList;  /* take from free list */
581         ReclaimedVCList = tvc->nextfree;
582         tvc->nextfree = NULL;
583         code = afs_FlushVCache(tvc, &fv_slept);
584         if (code) {
585             /* Ok, so, if we got code != 0, uh, wtf do we do? */
586             /* Probably, build a temporary list and then put all back when we
587                get to the end of the list */
588             /* This is actually really crappy, but we need to not leak these.
589                We probably need a way to be smarter about this. */
590             tvc->nextfree = tmpReclaimedVCList;
591             tmpReclaimedVCList = tvc;
592             /* printf("Reclaim list flush %lx failed: %d\n", (unsigned long) tvc, code); */
593         }
594         if (tvc->f.states & (CVInit
595 #ifdef AFS_DARWIN80_ENV
596                           | CDeadVnode
597 #endif
598            )) {
599            tvc->f.states &= ~(CVInit
600 #ifdef AFS_DARWIN80_ENV
601                             | CDeadVnode
602 #endif
603            );
604            afs_osi_Wakeup(&tvc->f.states);
605         }
606     }
607     if (tmpReclaimedVCList) 
608         ReclaimedVCList = tmpReclaimedVCList;
609
610     ReleaseWriteLock(&afs_xvreclaim);
611 #endif
612 }
613
614 void
615 afs_PostPopulateVCache(struct vcache *avc, struct VenusFid *afid, int seq)
616 {
617     /*
618      * The proper value for mvstat (for root fids) is setup by the caller.
619      */
620     avc->mvstat = 0;
621     if (afid->Fid.Vnode == 1 && afid->Fid.Unique == 1)
622         avc->mvstat = 2;
623
624     if (afs_globalVFS == 0)
625         osi_Panic("afs globalvfs");
626
627     osi_PostPopulateVCache(avc);
628
629     avc->dchint = NULL;
630     osi_dnlc_purgedp(avc);      /* this may be overkill */
631     memset(&(avc->callsort), 0, sizeof(struct afs_q));
632     avc->slocks = NULL;
633     avc->f.states &=~ CVInit;
634     if (seq) {
635         avc->f.states |= CBulkFetching;
636         avc->f.m.Length = seq;
637     }
638     afs_osi_Wakeup(&avc->f.states);
639 }
640
641 int
642 afs_ShakeLooseVCaches(afs_int32 anumber)
643 {
644     afs_int32 i, loop;
645     struct vcache *tvc;
646     struct afs_q *tq, *uq;
647     int fv_slept;
648     afs_int32 target = anumber;
649
650     i = 0;
651     loop = 0;
652     for (tq = VLRU.prev; tq != &VLRU && anumber > 0; tq = uq) {
653         tvc = QTOV(tq);
654         uq = QPrev(tq);
655         if (tvc->f.states & CVFlushed) {
656             refpanic("CVFlushed on VLRU");
657             /* In the other path, this was 2 * afs_cacheStats */
658         } else if (!afsd_dynamic_vcaches && i++ > afs_maxvcount) {
659             refpanic("Exceeded pool of AFS vnodes(VLRU cycle?)");
660         } else if (QNext(uq) != tq) {
661             refpanic("VLRU inconsistent");
662         }
663
664         fv_slept = 0;
665         if (osi_TryEvictVCache(tvc, &fv_slept))
666             anumber--;
667
668         if (fv_slept) {
669             if (loop++ > 100)
670                 break;
671             uq = VLRU.prev;
672             i = 0;
673             continue;   /* start over - may have raced. */
674         }
675         if (tq == uq)
676             break;
677     }
678     if (!afsd_dynamic_vcaches && anumber == target) {
679         afs_warn("afs_ShakeLooseVCaches: warning none freed, using %d of %d\n",
680                afs_vcount, afs_maxvcount);
681     }
682
683     return 0;
684 }
685
686 /* Alloc new vnode. */
687
688 static struct vcache *
689 afs_AllocVCache(void) 
690 {
691     struct vcache *tvc;
692
693     tvc = osi_NewVnode();
694
695     afs_vcount++;
696
697     /* track the peak */
698     if (afsd_dynamic_vcaches && afs_maxvcount < afs_vcount) {
699         afs_maxvcount = afs_vcount;
700         /*printf("peak vnodes: %d\n", afs_maxvcount);*/
701     }
702
703     afs_stats_cmperf.vcacheXAllocs++;   /* count in case we have a leak */
704
705 #ifdef AFS_DISCON_ENV
706     /* If we create a new inode, we either give it a new slot number,
707      * or if one's available, use a slot number from the slot free list
708      */
709     if (afs_freeSlotList != NULL) {
710        struct afs_slotlist *tmp;
711    
712        tvc->diskSlot = afs_freeSlotList->slot;
713        tmp = afs_freeSlotList;
714        afs_freeSlotList = tmp->next;
715        afs_osi_Free(tmp, sizeof(struct afs_slotlist));
716     }  else {
717        tvc->diskSlot = afs_nextVcacheSlot++;
718     }
719 #endif
720
721     return tvc;
722 }
723
724 /* Pre populate a newly allocated vcache. On platforms where the actual
725  * vnode is attached to the vcache, this function is called before attachment,
726  * therefore it cannot perform any actions on the vnode itself */
727
728 static void
729 afs_PrePopulateVCache(struct vcache *avc, struct VenusFid *afid,
730                       struct server *serverp) {
731
732 #if defined(AFS_DISCON_ENV)
733     afs_uint32 slot;
734     slot = avc->diskSlot;
735 #endif
736
737     osi_PrePopulateVCache(avc);
738
739 #if defined(AFS_DISCON_ENV)
740     avc->diskSlot = slot;
741     QZero(&avc->metadirty);
742 #endif
743
744     AFS_RWLOCK_INIT(&avc->lock, "vcache lock");
745
746     avc->mvid = NULL;
747     avc->linkData = NULL;
748     avc->cbExpires = 0;
749     avc->opens = 0;
750     avc->execsOrWriters = 0;
751     avc->flockCount = 0;
752     avc->f.states = CVInit;
753     avc->last_looker = 0;
754     avc->f.fid = *afid;
755     avc->asynchrony = -1;
756     avc->vc_error = 0;
757
758     hzero(avc->mapDV);
759     avc->f.truncPos = AFS_NOTRUNC;   /* don't truncate until we need to */
760     hzero(avc->f.m.DataVersion);     /* in case we copy it into flushDV */
761     avc->Access = NULL;
762     avc->callback = serverp;         /* to minimize chance that clear
763                                       * request is lost */
764
765 #if defined(AFS_CACHE_BYPASS)
766     avc->cachingStates = 0;
767     avc->cachingTransitions = 0;
768 #endif
769 }
770
771 /*!
772  *   This routine is responsible for allocating a new cache entry
773  * from the free list.  It formats the cache entry and inserts it
774  * into the appropriate hash tables.  It must be called with
775  * afs_xvcache write-locked so as to prevent several processes from
776  * trying to create a new cache entry simultaneously.
777  *
778  * LOCK: afs_NewVCache  afs_xvcache W
779  *
780  * \param afid The file id of the file whose cache entry is being created.
781  *
782  * \return The new vcache struct.
783  */
784
785 static_inline struct vcache *
786 afs_NewVCache_int(struct VenusFid *afid, struct server *serverp, int seq)
787 {
788     struct vcache *tvc;
789     afs_int32 i, j;
790     afs_int32 anumber = VCACHE_FREE;
791
792     AFS_STATCNT(afs_NewVCache);
793
794     afs_FlushReclaimedVcaches();
795
796 #if defined(AFS_LINUX22_ENV)
797     if(!afsd_dynamic_vcaches) {
798         afs_ShakeLooseVCaches(anumber);
799         if (afs_vcount >= afs_maxvcount) {
800             afs_warn("afs_NewVCache - none freed\n");
801             return NULL;
802         }
803     }
804     tvc = afs_AllocVCache();
805 #else /* AFS_LINUX22_ENV */
806     /* pull out a free cache entry */
807     if (!freeVCList) {
808         afs_ShakeLooseVCaches(anumber);
809     }
810
811     if (!freeVCList) {
812         tvc = afs_AllocVCache();
813     } else {
814         tvc = freeVCList;       /* take from free list */
815         freeVCList = tvc->nextfree;
816         tvc->nextfree = NULL;
817     } /* end of if (!freeVCList) */
818
819 #endif /* AFS_LINUX22_ENV */
820
821 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
822     if (tvc->v)
823         panic("afs_NewVCache(): free vcache with vnode attached");
824 #endif
825
826     /* Populate the vcache with as much as we can. */
827     afs_PrePopulateVCache(tvc, afid, serverp);
828
829     /* Thread the vcache onto the VLRU */
830
831     i = VCHash(afid);
832     j = VCHashV(afid);
833
834     tvc->hnext = afs_vhashT[i];
835     afs_vhashT[i] = tvc;
836     QAdd(&afs_vhashTV[j], &tvc->vhashq);
837     
838     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
839         refpanic("NewVCache VLRU inconsistent");
840     }
841     QAdd(&VLRU, &tvc->vlruq);   /* put in lruq */
842     if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
843         refpanic("NewVCache VLRU inconsistent2");
844     }
845     if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
846         refpanic("NewVCache VLRU inconsistent3");
847     }
848     if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
849         refpanic("NewVCache VLRU inconsistent4");
850     }
851     vcachegen++;
852
853     /* it should now be safe to drop the xvcache lock - so attach an inode
854      * to this vcache, where necessary */
855     osi_AttachVnode(tvc, seq);
856
857     /* Get a reference count to hold this vcache for the VLRUQ. Note that
858      * we have to do this after attaching the vnode, because the reference
859      * count may be held in the vnode itself */
860
861 #if defined(AFS_LINUX22_ENV)
862     /* Hold it for the LRU (should make count 2) */
863     VN_HOLD(AFSTOV(tvc));
864 #elif !(defined (AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV))
865     VREFCOUNT_SET(tvc, 1);      /* us */
866 #endif
867
868 #if defined (AFS_FBSD_ENV)
869     if (tvc->f.states & CVInit)
870 #endif
871     afs_PostPopulateVCache(tvc, afid, seq);
872
873     return tvc;
874 }                               /*afs_NewVCache */
875
876
877 struct vcache *
878 afs_NewVCache(struct VenusFid *afid, struct server *serverp)
879 {
880     return afs_NewVCache_int(afid, serverp, 0);
881 }
882
883 struct vcache *
884 afs_NewBulkVCache(struct VenusFid *afid, struct server *serverp, int seq)
885 {
886     return afs_NewVCache_int(afid, serverp, seq);
887 }
888
889 /*!
890  * ???
891  *
892  * LOCK: afs_FlushActiveVcaches afs_xvcache N
893  *
894  * \param doflocks : Do we handle flocks?
895  */
896 void
897 afs_FlushActiveVcaches(register afs_int32 doflocks)
898 {
899     register struct vcache *tvc;
900     register int i;
901     register struct afs_conn *tc;
902     register afs_int32 code;
903     afs_ucred_t *cred = NULL;
904     struct vrequest treq, ureq;
905     struct AFSVolSync tsync;
906     int didCore;
907     XSTATS_DECLS;
908     AFS_STATCNT(afs_FlushActiveVcaches);
909     ObtainReadLock(&afs_xvcache);
910     for (i = 0; i < VCSIZE; i++) {
911         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
912             if (tvc->f.states & CVInit) continue;
913 #ifdef AFS_DARWIN80_ENV
914             if (tvc->f.states & CDeadVnode &&
915                 (tvc->f.states & (CCore|CUnlinkedDel) ||
916                  tvc->flockCount)) panic("Dead vnode has core/unlinkedel/flock");
917 #endif
918             if (doflocks && tvc->flockCount != 0) {
919                 /* if this entry has an flock, send a keep-alive call out */
920                 osi_vnhold(tvc, 0);
921                 ReleaseReadLock(&afs_xvcache);
922                 ObtainWriteLock(&tvc->lock, 51);
923                 do {
924                     afs_InitReq(&treq, afs_osi_credp);
925                     treq.flags |= O_NONBLOCK;
926
927                     tc = afs_Conn(&tvc->f.fid, &treq, SHARED_LOCK);
928                     if (tc) {
929                         XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_EXTENDLOCK);
930                         RX_AFS_GUNLOCK();
931                         code =
932                             RXAFS_ExtendLock(tc->id,
933                                              (struct AFSFid *)&tvc->f.fid.Fid,
934                                              &tsync);
935                         RX_AFS_GLOCK();
936                         XSTATS_END_TIME;
937                     } else
938                         code = -1;
939                 } while (afs_Analyze
940                          (tc, code, &tvc->f.fid, &treq,
941                           AFS_STATS_FS_RPCIDX_EXTENDLOCK, SHARED_LOCK, NULL));
942
943                 ReleaseWriteLock(&tvc->lock);
944 #ifdef AFS_DARWIN80_ENV
945                 AFS_FAST_RELE(tvc);
946                 ObtainReadLock(&afs_xvcache);
947 #else
948                 ObtainReadLock(&afs_xvcache);
949                 AFS_FAST_RELE(tvc);
950 #endif
951             }
952             didCore = 0;
953             if ((tvc->f.states & CCore) || (tvc->f.states & CUnlinkedDel)) {
954                 /*
955                  * Don't let it evaporate in case someone else is in
956                  * this code.  Also, drop the afs_xvcache lock while
957                  * getting vcache locks.
958                  */
959                 osi_vnhold(tvc, 0);
960                 ReleaseReadLock(&afs_xvcache);
961 #ifdef AFS_BOZONLOCK_ENV
962                 afs_BozonLock(&tvc->pvnLock, tvc);
963 #endif
964 #if defined(AFS_SGI_ENV)
965                 /*
966                  * That's because if we come in via the CUnlinkedDel bit state path we'll be have 0 refcnt
967                  */
968                 osi_Assert(VREFCOUNT_GT(tvc,0));
969                 AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
970 #endif
971                 ObtainWriteLock(&tvc->lock, 52);
972                 if (tvc->f.states & CCore) {
973                     tvc->f.states &= ~CCore;
974                     /* XXXX Find better place-holder for cred XXXX */
975                     cred = (afs_ucred_t *)tvc->linkData;
976                     tvc->linkData = NULL;       /* XXX */
977                     afs_InitReq(&ureq, cred);
978                     afs_Trace2(afs_iclSetp, CM_TRACE_ACTCCORE,
979                                ICL_TYPE_POINTER, tvc, ICL_TYPE_INT32,
980                                tvc->execsOrWriters);
981                     code = afs_StoreOnLastReference(tvc, &ureq);
982                     ReleaseWriteLock(&tvc->lock);
983 #ifdef AFS_BOZONLOCK_ENV
984                     afs_BozonUnlock(&tvc->pvnLock, tvc);
985 #endif
986                     hzero(tvc->flushDV);
987                     osi_FlushText(tvc);
988                     didCore = 1;
989                     if (code && code != VNOVNODE) {
990                         afs_StoreWarn(code, tvc->f.fid.Fid.Volume,
991                                       /* /dev/console */ 1);
992                     }
993                 } else if (tvc->f.states & CUnlinkedDel) {
994                     /*
995                      * Ignore errors
996                      */
997                     ReleaseWriteLock(&tvc->lock);
998 #ifdef AFS_BOZONLOCK_ENV
999                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1000 #endif
1001 #if defined(AFS_SGI_ENV)
1002                     AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1003 #endif
1004                     afs_remunlink(tvc, 0);
1005 #if defined(AFS_SGI_ENV)
1006                     AFS_RWLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1007 #endif
1008                 } else {
1009                     /* lost (or won, perhaps) the race condition */
1010                     ReleaseWriteLock(&tvc->lock);
1011 #ifdef AFS_BOZONLOCK_ENV
1012                     afs_BozonUnlock(&tvc->pvnLock, tvc);
1013 #endif
1014                 }
1015 #if defined(AFS_SGI_ENV)
1016                 AFS_RWUNLOCK((vnode_t *) tvc, VRWLOCK_WRITE);
1017 #endif
1018 #ifdef AFS_DARWIN80_ENV
1019                 AFS_FAST_RELE(tvc);
1020                 if (didCore) {
1021                     AFS_RELE(AFSTOV(tvc));
1022                     /* Matches write code setting CCore flag */
1023                     crfree(cred);
1024                 }
1025                 ObtainReadLock(&afs_xvcache);
1026 #else
1027                 ObtainReadLock(&afs_xvcache);
1028                 AFS_FAST_RELE(tvc);
1029                 if (didCore) {
1030                     AFS_RELE(AFSTOV(tvc));
1031                     /* Matches write code setting CCore flag */
1032                     crfree(cred);
1033                 }
1034 #endif
1035             }
1036         }
1037     }
1038     ReleaseReadLock(&afs_xvcache);
1039 }
1040
1041
1042
1043 /*!
1044  *   Make sure a cache entry is up-to-date status-wise.
1045  *
1046  * NOTE: everywhere that calls this can potentially be sped up
1047  *       by checking CStatd first, and avoiding doing the InitReq
1048  *       if this is up-to-date.
1049  *
1050  *  Anymore, the only places that call this KNOW already that the
1051  *  vcache is not up-to-date, so we don't screw around.
1052  *
1053  * \param avc  : Ptr to vcache entry to verify.
1054  * \param areq : ???
1055  */
1056
1057 /*!
1058  * 
1059  *   Make sure a cache entry is up-to-date status-wise.
1060  *   
1061  *   NOTE: everywhere that calls this can potentially be sped up
1062  *       by checking CStatd first, and avoiding doing the InitReq
1063  *       if this is up-to-date.
1064  *
1065  *   Anymore, the only places that call this KNOW already that the
1066  * vcache is not up-to-date, so we don't screw around.
1067  *
1068  * \param avc Pointer to vcache entry to verify.
1069  * \param areq
1070  *
1071  * \return 0 for success or other error codes.
1072  */
1073 int
1074 afs_VerifyVCache2(struct vcache *avc, struct vrequest *areq)
1075 {
1076     register struct vcache *tvc;
1077
1078     AFS_STATCNT(afs_VerifyVCache);
1079
1080     /* otherwise we must fetch the status info */
1081
1082     ObtainWriteLock(&avc->lock, 53);
1083     if (avc->f.states & CStatd) {
1084         ReleaseWriteLock(&avc->lock);
1085         return 0;
1086     }
1087     ObtainWriteLock(&afs_xcbhash, 461);
1088     avc->f.states &= ~(CStatd | CUnique);
1089     avc->callback = NULL;
1090     afs_DequeueCallback(avc);
1091     ReleaseWriteLock(&afs_xcbhash);
1092     ReleaseWriteLock(&avc->lock);
1093
1094     /* since we've been called back, or the callback has expired,
1095      * it's possible that the contents of this directory, or this
1096      * file's name have changed, thus invalidating the dnlc contents.
1097      */
1098     if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
1099         osi_dnlc_purgedp(avc);
1100     else
1101         osi_dnlc_purgevp(avc);
1102
1103     /* fetch the status info */
1104     tvc = afs_GetVCache(&avc->f.fid, areq, NULL, avc);
1105     if (!tvc)
1106         return ENOENT;
1107     /* Put it back; caller has already incremented vrefCount */
1108     afs_PutVCache(tvc);
1109     return 0;
1110
1111 }                               /*afs_VerifyVCache */
1112
1113
1114 /*!
1115  * Simple copy of stat info into cache.
1116  *
1117  * Callers:as of 1992-04-29, only called by WriteVCache
1118  *
1119  * \param avc   Ptr to vcache entry involved.
1120  * \param astat Ptr to stat info to copy.
1121  *
1122  */
1123 static void
1124 afs_SimpleVStat(register struct vcache *avc,
1125                 register struct AFSFetchStatus *astat, struct vrequest *areq)
1126 {
1127     afs_size_t length;
1128     AFS_STATCNT(afs_SimpleVStat);
1129
1130 #ifdef AFS_64BIT_CLIENT
1131         FillInt64(length, astat->Length_hi, astat->Length);
1132 #else /* AFS_64BIT_CLIENT */
1133         length = astat->Length;
1134 #endif /* AFS_64BIT_CLIENT */
1135
1136 #if defined(AFS_SGI_ENV)
1137     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1138         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1139         osi_Assert((valusema(&avc->vc_rwlock) <= 0)
1140                    && (OSI_GET_LOCKID() == avc->vc_rwlockid));
1141         if (length < avc->f.m.Length) {
1142             vnode_t *vp = (vnode_t *) avc;
1143
1144             osi_Assert(WriteLocked(&avc->lock));
1145             ReleaseWriteLock(&avc->lock);
1146             AFS_GUNLOCK();
1147             PTOSSVP(vp, (off_t) length, (off_t) MAXLONG);
1148             AFS_GLOCK();
1149             ObtainWriteLock(&avc->lock, 67);
1150         }
1151     }
1152 #endif
1153
1154     if (!afs_DirtyPages(avc)) {
1155         /* if actively writing the file, don't fetch over this value */
1156         afs_Trace3(afs_iclSetp, CM_TRACE_SIMPLEVSTAT, ICL_TYPE_POINTER, avc,
1157                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length),
1158                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1159         avc->f.m.Length = length;
1160         avc->f.m.Date = astat->ClientModTime;
1161     }
1162     avc->f.m.Owner = astat->Owner;
1163     avc->f.m.Group = astat->Group;
1164     avc->f.m.Mode = astat->UnixModeBits;
1165     if (vType(avc) == VREG) {
1166         avc->f.m.Mode |= S_IFREG;
1167     } else if (vType(avc) == VDIR) {
1168         avc->f.m.Mode |= S_IFDIR;
1169     } else if (vType(avc) == VLNK) {
1170         avc->f.m.Mode |= S_IFLNK;
1171         if ((avc->f.m.Mode & 0111) == 0)
1172             avc->mvstat = 1;
1173     }
1174     if (avc->f.states & CForeign) {
1175         struct axscache *ac;
1176         avc->f.anyAccess = astat->AnonymousAccess;
1177 #ifdef badidea
1178         if ((astat->CallerAccess & ~astat->AnonymousAccess))
1179             /*   USED TO SAY :
1180              * Caller has at least one bit not covered by anonymous, and
1181              * thus may have interesting rights.
1182              *
1183              * HOWEVER, this is a really bad idea, because any access query
1184              * for bits which aren't covered by anonymous, on behalf of a user
1185              * who doesn't have any special rights, will result in an answer of
1186              * the form "I don't know, lets make a FetchStatus RPC and find out!"
1187              * It's an especially bad idea under Ultrix, since (due to the lack of
1188              * a proper access() call) it must perform several afs_access() calls
1189              * in order to create magic mode bits that vary according to who makes
1190              * the call.  In other words, _every_ stat() generates a test for
1191              * writeability...
1192              */
1193 #endif /* badidea */
1194             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1195                 ac->axess = astat->CallerAccess;
1196             else                /* not found, add a new one if possible */
1197                 afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1198     }
1199
1200 }                               /*afs_SimpleVStat */
1201
1202
1203 /*!
1204  * Store the status info *only* back to the server for a
1205  * fid/vrequest.
1206  *
1207  * Environment: Must be called with a shared lock held on the vnode.
1208  *
1209  * \param avc Ptr to the vcache entry.
1210  * \param astatus Ptr to the status info to store.
1211  * \param areq Ptr to the associated vrequest.
1212  *
1213  * \return Operation status.
1214  */
1215
1216 int
1217 afs_WriteVCache(register struct vcache *avc,
1218                 register struct AFSStoreStatus *astatus,
1219                 struct vrequest *areq)
1220 {
1221     afs_int32 code;
1222     struct afs_conn *tc;
1223     struct AFSFetchStatus OutStatus;
1224     struct AFSVolSync tsync;
1225     XSTATS_DECLS;
1226     AFS_STATCNT(afs_WriteVCache);
1227     afs_Trace2(afs_iclSetp, CM_TRACE_WVCACHE, ICL_TYPE_POINTER, avc,
1228                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length));
1229     do {
1230         tc = afs_Conn(&avc->f.fid, areq, SHARED_LOCK);
1231         if (tc) {
1232             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STORESTATUS);
1233             RX_AFS_GUNLOCK();
1234             code =
1235                 RXAFS_StoreStatus(tc->id, (struct AFSFid *)&avc->f.fid.Fid,
1236                                   astatus, &OutStatus, &tsync);
1237             RX_AFS_GLOCK();
1238             XSTATS_END_TIME;
1239         } else
1240             code = -1;
1241     } while (afs_Analyze
1242              (tc, code, &avc->f.fid, areq, AFS_STATS_FS_RPCIDX_STORESTATUS,
1243               SHARED_LOCK, NULL));
1244
1245     UpgradeSToWLock(&avc->lock, 20);
1246     if (code == 0) {
1247         /* success, do the changes locally */
1248         afs_SimpleVStat(avc, &OutStatus, areq);
1249         /*
1250          * Update the date, too.  SimpleVStat didn't do this, since
1251          * it thought we were doing this after fetching new status
1252          * over a file being written.
1253          */
1254         avc->f.m.Date = OutStatus.ClientModTime;
1255     } else {
1256         /* failure, set up to check with server next time */
1257         ObtainWriteLock(&afs_xcbhash, 462);
1258         afs_DequeueCallback(avc);
1259         avc->f.states &= ~(CStatd | CUnique);   /* turn off stat valid flag */
1260         ReleaseWriteLock(&afs_xcbhash);
1261         if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
1262             osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
1263     }
1264     ConvertWToSLock(&avc->lock);
1265     return code;
1266
1267 }                               /*afs_WriteVCache */
1268 #if defined(AFS_DISCON_ENV)
1269
1270 /*!
1271  * Store status info only locally, set the proper disconnection flags
1272  * and add to dirty list.
1273  *
1274  * \param avc The vcache to be written locally.
1275  * \param astatus Get attr fields from local store.
1276  * \param attrs This one is only of the vs_size.
1277  *
1278  * \note Must be called with a shared lock on the vnode
1279  */
1280 int
1281 afs_WriteVCacheDiscon(register struct vcache *avc,
1282                       register struct AFSStoreStatus *astatus,
1283                       struct vattr *attrs)
1284 {
1285     afs_int32 code = 0;
1286     afs_int32 flags = 0;
1287
1288     UpgradeSToWLock(&avc->lock, 700);
1289
1290     if (!astatus->Mask) {
1291
1292         return code;
1293
1294     } else {
1295
1296         /* Set attributes. */
1297         if (astatus->Mask & AFS_SETMODTIME) {
1298                 avc->f.m.Date = astatus->ClientModTime;
1299                 flags |= VDisconSetTime;
1300         }
1301
1302         if (astatus->Mask & AFS_SETOWNER) {
1303             /* printf("Not allowed yet. \n"); */
1304             /*avc->f.m.Owner = astatus->Owner;*/
1305         }
1306
1307         if (astatus->Mask & AFS_SETGROUP) {
1308             /* printf("Not allowed yet. \n"); */
1309             /*avc->f.m.Group =  astatus->Group;*/
1310         }
1311
1312         if (astatus->Mask & AFS_SETMODE) {
1313                 avc->f.m.Mode = astatus->UnixModeBits;
1314
1315 #if 0   /* XXX: Leaving this out, so it doesn't mess up the file type flag.*/
1316
1317                 if (vType(avc) == VREG) {
1318                         avc->f.m.Mode |= S_IFREG;
1319                 } else if (vType(avc) == VDIR) {
1320                         avc->f.m.Mode |= S_IFDIR;
1321                 } else if (vType(avc) == VLNK) {
1322                         avc->f.m.Mode |= S_IFLNK;
1323                         if ((avc->f.m.Mode & 0111) == 0)
1324                                 avc->mvstat = 1;
1325                 }
1326 #endif
1327                 flags |= VDisconSetMode;
1328          }              /* if(astatus.Mask & AFS_SETMODE) */
1329
1330      }                  /* if (!astatus->Mask) */
1331
1332      if (attrs->va_size > 0) {
1333         /* XXX: Do I need more checks? */
1334         /* Truncation operation. */
1335         flags |= VDisconTrunc;
1336      }
1337
1338     if (flags)
1339         afs_DisconAddDirty(avc, flags, 1);
1340
1341     /* XXX: How about the rest of the fields? */
1342
1343     ConvertWToSLock(&avc->lock);
1344
1345     return code;
1346 }
1347
1348 #endif
1349
1350 /*!
1351  * Copy astat block into vcache info
1352  *
1353  * \note This code may get dataversion and length out of sync if the file has
1354  * been modified.  This is less than ideal.  I haven't thought about it sufficiently 
1355  * to be certain that it is adequate.
1356  *
1357  * \note Environment: Must be called under a write lock
1358  *
1359  * \param avc  Ptr to vcache entry.
1360  * \param astat Ptr to stat block to copy in.
1361  * \param areq Ptr to associated request.
1362  */
1363 void
1364 afs_ProcessFS(register struct vcache *avc,
1365               register struct AFSFetchStatus *astat, struct vrequest *areq)
1366 {
1367     afs_size_t length;
1368     AFS_STATCNT(afs_ProcessFS);
1369
1370 #ifdef AFS_64BIT_CLIENT
1371     FillInt64(length, astat->Length_hi, astat->Length);
1372 #else /* AFS_64BIT_CLIENT */
1373     length = astat->Length;
1374 #endif /* AFS_64BIT_CLIENT */
1375     /* WARNING: afs_DoBulkStat uses the Length field to store a sequence
1376      * number for each bulk status request. Under no circumstances
1377      * should afs_DoBulkStat store a sequence number if the new
1378      * length will be ignored when afs_ProcessFS is called with
1379      * new stats. If you change the following conditional then you
1380      * also need to change the conditional in afs_DoBulkStat.  */
1381 #ifdef AFS_SGI_ENV
1382     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)
1383         && !AFS_VN_MAPPED((vnode_t *) avc)) {
1384 #else
1385     if ((avc->execsOrWriters <= 0) && !afs_DirtyPages(avc)) {
1386 #endif
1387         /* if we're writing or mapping this file, don't fetch over these
1388          *  values.
1389          */
1390         afs_Trace3(afs_iclSetp, CM_TRACE_PROCESSFS, ICL_TYPE_POINTER, avc,
1391                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->f.m.Length),
1392                    ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(length));
1393         avc->f.m.Length = length;
1394         avc->f.m.Date = astat->ClientModTime;
1395     }
1396     hset64(avc->f.m.DataVersion, astat->dataVersionHigh, astat->DataVersion);
1397     avc->f.m.Owner = astat->Owner;
1398     avc->f.m.Mode = astat->UnixModeBits;
1399     avc->f.m.Group = astat->Group;
1400     avc->f.m.LinkCount = astat->LinkCount;
1401     if (astat->FileType == File) {
1402         vSetType(avc, VREG);
1403         avc->f.m.Mode |= S_IFREG;
1404     } else if (astat->FileType == Directory) {
1405         vSetType(avc, VDIR);
1406         avc->f.m.Mode |= S_IFDIR;
1407     } else if (astat->FileType == SymbolicLink) {
1408         if (afs_fakestat_enable && (avc->f.m.Mode & 0111) == 0) {
1409             vSetType(avc, VDIR);
1410             avc->f.m.Mode |= S_IFDIR;
1411         } else {
1412             vSetType(avc, VLNK);
1413             avc->f.m.Mode |= S_IFLNK;
1414         }
1415         if ((avc->f.m.Mode & 0111) == 0) {
1416             avc->mvstat = 1;
1417         }
1418     }
1419     avc->f.anyAccess = astat->AnonymousAccess;
1420 #ifdef badidea
1421     if ((astat->CallerAccess & ~astat->AnonymousAccess))
1422         /*   USED TO SAY :
1423          * Caller has at least one bit not covered by anonymous, and
1424          * thus may have interesting rights.
1425          *
1426          * HOWEVER, this is a really bad idea, because any access query
1427          * for bits which aren't covered by anonymous, on behalf of a user
1428          * who doesn't have any special rights, will result in an answer of
1429          * the form "I don't know, lets make a FetchStatus RPC and find out!"
1430          * It's an especially bad idea under Ultrix, since (due to the lack of
1431          * a proper access() call) it must perform several afs_access() calls
1432          * in order to create magic mode bits that vary according to who makes
1433          * the call.  In other words, _every_ stat() generates a test for
1434          * writeability...
1435          */
1436 #endif /* badidea */
1437     {
1438         struct axscache *ac;
1439         if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
1440             ac->axess = astat->CallerAccess;
1441         else                    /* not found, add a new one if possible */
1442             afs_AddAxs(avc->Access, areq->uid, astat->CallerAccess);
1443     }
1444 }                               /*afs_ProcessFS */
1445
1446
1447 /*!
1448  * Get fid from server.
1449  *
1450  * \param afid 
1451  * \param areq Request to be passed on.
1452  * \param name Name of ?? to lookup.
1453  * \param OutStatus Fetch status.
1454  * \param CallBackp 
1455  * \param serverp
1456  * \param tsyncp
1457  *
1458  * \return Success status of operation.
1459  */
1460 int
1461 afs_RemoteLookup(register struct VenusFid *afid, struct vrequest *areq,
1462                  char *name, struct VenusFid *nfid,
1463                  struct AFSFetchStatus *OutStatusp,
1464                  struct AFSCallBack *CallBackp, struct server **serverp,
1465                  struct AFSVolSync *tsyncp)
1466 {
1467     afs_int32 code;
1468     afs_uint32 start;
1469     register struct afs_conn *tc;
1470     struct AFSFetchStatus OutDirStatus;
1471     XSTATS_DECLS;
1472     if (!name)
1473         name = "";              /* XXX */    
1474     do {
1475         tc = afs_Conn(afid, areq, SHARED_LOCK);
1476         if (tc) {
1477             if (serverp)
1478                 *serverp = tc->srvr->server;
1479             start = osi_Time();
1480             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_XLOOKUP);
1481             RX_AFS_GUNLOCK();
1482             code =
1483                 RXAFS_Lookup(tc->id, (struct AFSFid *)&afid->Fid, name,
1484                              (struct AFSFid *)&nfid->Fid, OutStatusp,
1485                              &OutDirStatus, CallBackp, tsyncp);
1486             RX_AFS_GLOCK();
1487             XSTATS_END_TIME;
1488         } else
1489             code = -1;
1490     } while (afs_Analyze
1491              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_XLOOKUP, SHARED_LOCK,
1492               NULL));
1493
1494     return code;
1495 }
1496
1497
1498 /*!
1499  * afs_GetVCache
1500  *
1501  * Given a file id and a vrequest structure, fetch the status
1502  * information associated with the file.
1503  *
1504  * \param afid File ID.
1505  * \param areq Ptr to associated vrequest structure, specifying the
1506  *  user whose authentication tokens will be used.
1507  * \param avc Caller may already have a vcache for this file, which is
1508  *  already held.
1509  *
1510  * \note Environment:
1511  *      The cache entry is returned with an increased vrefCount field.
1512  *      The entry must be discarded by calling afs_PutVCache when you
1513  *      are through using the pointer to the cache entry.
1514  *
1515  *      You should not hold any locks when calling this function, except
1516  *      locks on other vcache entries.  If you lock more than one vcache
1517  *      entry simultaneously, you should lock them in this order:
1518  *
1519  *          1. Lock all files first, then directories.
1520  *          2.  Within a particular type, lock entries in Fid.Vnode order.
1521  *
1522  *      This locking hierarchy is convenient because it allows locking
1523  *      of a parent dir cache entry, given a file (to check its access
1524  *      control list).  It also allows renames to be handled easily by
1525  *      locking directories in a constant order.
1526  * 
1527  * \note NB.  NewVCache -> FlushVCache presently (4/10/95) drops the xvcache lock.
1528  *
1529  * \note Might have a vcache structure already, which must
1530  *  already be held by the caller 
1531  */
1532 struct vcache *
1533 afs_GetVCache(register struct VenusFid *afid, struct vrequest *areq,
1534               afs_int32 * cached, struct vcache *avc)
1535 {
1536
1537     afs_int32 code, newvcache = 0;
1538     register struct vcache *tvc;
1539     struct volume *tvp;
1540     afs_int32 retry;
1541
1542     AFS_STATCNT(afs_GetVCache);
1543
1544     if (cached)
1545         *cached = 0;            /* Init just in case */
1546
1547 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1548   loop:
1549 #endif
1550
1551     ObtainSharedLock(&afs_xvcache, 5);
1552
1553     tvc = afs_FindVCache(afid, &retry, DO_STATS | DO_VLRU | IS_SLOCK);
1554     if (tvc && retry) {
1555 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1556         ReleaseSharedLock(&afs_xvcache);
1557         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1558         goto loop;
1559 #endif
1560     }
1561     if (tvc) {
1562         if (cached)
1563             *cached = 1;
1564         osi_Assert((tvc->f.states & CVInit) == 0);
1565         /* If we are in readdir, return the vnode even if not statd */
1566         if ((tvc->f.states & CStatd) || afs_InReadDir(tvc)) {
1567             ReleaseSharedLock(&afs_xvcache);
1568             return tvc;
1569         }
1570     } else {
1571         UpgradeSToWLock(&afs_xvcache, 21);
1572
1573         /* no cache entry, better grab one */
1574         tvc = afs_NewVCache(afid, NULL);
1575         newvcache = 1;
1576
1577         ConvertWToSLock(&afs_xvcache);
1578         if (tvc == NULL)
1579         {
1580                 ReleaseSharedLock(&afs_xvcache);
1581                 return NULL;
1582         }
1583
1584         afs_stats_cmperf.vcacheMisses++;
1585     }
1586
1587     ReleaseSharedLock(&afs_xvcache);
1588
1589     ObtainWriteLock(&tvc->lock, 54);
1590
1591     if (tvc->f.states & CStatd) {
1592         ReleaseWriteLock(&tvc->lock);
1593         return tvc;
1594     }
1595 #ifdef AFS_DARWIN80_ENV
1596 /* Darwin 8.0 only has bufs in nfs, so we shouldn't have to worry about them.
1597    What about ubc? */
1598 #else
1599 #if defined(AFS_DARWIN_ENV) || defined(AFS_FBSD_ENV)
1600     /*
1601      * XXX - I really don't like this.  Should try to understand better.
1602      * It seems that sometimes, when we get called, we already hold the
1603      * lock on the vnode (e.g., from afs_getattr via afs_VerifyVCache).
1604      * We can't drop the vnode lock, because that could result in a race.
1605      * Sometimes, though, we get here and don't hold the vnode lock.
1606      * I hate code paths that sometimes hold locks and sometimes don't.
1607      * In any event, the dodge we use here is to check whether the vnode
1608      * is locked, and if it isn't, then we gain and drop it around the call
1609      * to vinvalbuf; otherwise, we leave it alone.
1610      */
1611     {
1612         struct vnode *vp = AFSTOV(tvc);
1613         int iheldthelock;
1614
1615 #if defined(AFS_DARWIN_ENV)
1616         iheldthelock = VOP_ISLOCKED(vp);
1617         if (!iheldthelock)
1618             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, current_proc());
1619         /* this is messy. we can call fsync which will try to reobtain this */
1620         if (VTOAFS(vp) == tvc) 
1621           ReleaseWriteLock(&tvc->lock);
1622         if (UBCINFOEXISTS(vp)) {
1623           vinvalbuf(vp, V_SAVE, &afs_osi_cred, current_proc(), PINOD, 0);
1624         }
1625         if (VTOAFS(vp) == tvc) 
1626           ObtainWriteLock(&tvc->lock, 954);
1627         if (!iheldthelock)
1628             VOP_UNLOCK(vp, LK_EXCLUSIVE, current_proc());
1629 #elif defined(AFS_FBSD80_ENV)
1630         iheldthelock = VOP_ISLOCKED(vp);
1631         if (!iheldthelock) {
1632             /* nosleep/sleep lock order reversal */
1633             int glocked = ISAFS_GLOCK();
1634             if (glocked)
1635                 AFS_GUNLOCK();
1636             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
1637             if (glocked)
1638                 AFS_GLOCK();
1639         }
1640         vinvalbuf(vp, V_SAVE, PINOD, 0); /* changed late in 8.0-CURRENT */
1641         if (!iheldthelock)
1642             VOP_UNLOCK(vp, 0);
1643 #elif defined(AFS_FBSD60_ENV)
1644         iheldthelock = VOP_ISLOCKED(vp, curthread);
1645         if (!iheldthelock)
1646             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1647         vinvalbuf(vp, V_SAVE, curthread, PINOD, 0);
1648         if (!iheldthelock)
1649             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1650 #elif defined(AFS_FBSD_ENV)
1651         iheldthelock = VOP_ISLOCKED(vp, curthread);
1652         if (!iheldthelock)
1653             vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, curthread);
1654         vinvalbuf(vp, V_SAVE, osi_curcred(), curthread, PINOD, 0);
1655         if (!iheldthelock)
1656             VOP_UNLOCK(vp, LK_EXCLUSIVE, curthread);
1657 #elif defined(AFS_OBSD_ENV)
1658         iheldthelock = VOP_ISLOCKED(vp, curproc);
1659         if (!iheldthelock)
1660             VOP_LOCK(vp, LK_EXCLUSIVE | LK_RETRY, curproc);
1661         uvm_vnp_uncache(vp);
1662         if (!iheldthelock)
1663             VOP_UNLOCK(vp, 0, curproc);
1664 #elif defined(AFS_NBSD40_ENV)
1665         iheldthelock = VOP_ISLOCKED(vp);
1666         if (!iheldthelock) {
1667             VOP_LOCK(vp, LK_EXCLUSIVE | LK_RETRY);
1668         }
1669         uvm_vnp_uncache(vp);
1670         if (!iheldthelock)
1671             VOP_UNLOCK(vp, 0);
1672 #endif
1673     }
1674 #endif
1675 #endif
1676
1677     ObtainWriteLock(&afs_xcbhash, 464);
1678     tvc->f.states &= ~CUnique;
1679     tvc->callback = 0;
1680     afs_DequeueCallback(tvc);
1681     ReleaseWriteLock(&afs_xcbhash);
1682
1683     /* It is always appropriate to throw away all the access rights? */
1684     afs_FreeAllAxs(&(tvc->Access));
1685     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-volume info */
1686     if (tvp) {
1687         if ((tvp->states & VForeign)) {
1688             if (newvcache)
1689                 tvc->f.states |= CForeign;
1690             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1691                 && (tvp->rootUnique == afid->Fid.Unique)) {
1692                 tvc->mvstat = 2;
1693             }
1694         }
1695         if (tvp->states & VRO)
1696             tvc->f.states |= CRO;
1697         if (tvp->states & VBackup)
1698             tvc->f.states |= CBackup;
1699         /* now copy ".." entry back out of volume structure, if necessary */
1700         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1701             if (!tvc->mvid)
1702                 tvc->mvid = (struct VenusFid *)
1703                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1704             *tvc->mvid = tvp->dotdot;
1705         }
1706         afs_PutVolume(tvp, READ_LOCK);
1707     }
1708
1709     /* stat the file */
1710     afs_RemoveVCB(afid);
1711     {
1712         struct AFSFetchStatus OutStatus;
1713
1714         if (afs_DynrootNewVnode(tvc, &OutStatus)) {
1715             afs_ProcessFS(tvc, &OutStatus, areq);
1716             tvc->f.states |= CStatd | CUnique;
1717             tvc->f.parent.vnode  = OutStatus.ParentVnode;
1718             tvc->f.parent.unique = OutStatus.ParentUnique;
1719             code = 0;
1720         } else {
1721
1722             if (AFS_IS_DISCONNECTED) {
1723                 /* Nothing to do otherwise...*/
1724                 code = ENETDOWN;
1725                 /* printf("Network is down in afs_GetCache"); */
1726             } else
1727                 code = afs_FetchStatus(tvc, afid, areq, &OutStatus);
1728
1729             /* For the NFS translator's benefit, make sure
1730              * non-directory vnodes always have their parent FID set
1731              * correctly, even when created as a result of decoding an
1732              * NFS filehandle.  It would be nice to also do this for
1733              * directories, but we can't because the fileserver fills
1734              * in the FID of the directory itself instead of that of
1735              * its parent.
1736              */
1737             if (!code && OutStatus.FileType != Directory &&
1738                 !tvc->f.parent.vnode) {
1739                 tvc->f.parent.vnode  = OutStatus.ParentVnode;
1740                 tvc->f.parent.unique = OutStatus.ParentUnique;
1741                 /* XXX - SXW - It's conceivable we should mark ourselves
1742                  *             as dirty again here, incase we've been raced
1743                  *             out of the FetchStatus call.
1744                  */
1745             }
1746         }
1747     }
1748
1749     if (code) {
1750         ReleaseWriteLock(&tvc->lock);
1751
1752         afs_PutVCache(tvc);
1753         return NULL;
1754     }
1755
1756     ReleaseWriteLock(&tvc->lock);
1757     return tvc;
1758
1759 }                               /*afs_GetVCache */
1760
1761
1762
1763 /*!
1764  * Lookup a vcache by fid. Look inside the cache first, if not
1765  * there, lookup the file on the server, and then get it's fresh
1766  * cache entry.
1767  * 
1768  * \param afid
1769  * \param areq 
1770  * \param cached Is element cached? If NULL, don't answer.
1771  * \param adp
1772  * \param aname
1773  *
1774  * \return The found element or NULL.
1775  */
1776 struct vcache *
1777 afs_LookupVCache(struct VenusFid *afid, struct vrequest *areq,
1778                  afs_int32 * cached, struct vcache *adp, char *aname)
1779 {
1780     afs_int32 code, now, newvcache = 0;
1781     struct VenusFid nfid;
1782     register struct vcache *tvc;
1783     struct volume *tvp;
1784     struct AFSFetchStatus OutStatus;
1785     struct AFSCallBack CallBack;
1786     struct AFSVolSync tsync;
1787     struct server *serverp = 0;
1788     afs_int32 origCBs;
1789     afs_int32 retry;
1790
1791     AFS_STATCNT(afs_GetVCache);
1792     if (cached)
1793         *cached = 0;            /* Init just in case */
1794
1795 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1796   loop1:
1797 #endif
1798
1799     ObtainReadLock(&afs_xvcache);
1800     tvc = afs_FindVCache(afid, &retry, DO_STATS /* no vlru */ );
1801
1802     if (tvc) {
1803         ReleaseReadLock(&afs_xvcache);
1804         if (retry) {
1805 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1806             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1807             goto loop1;
1808 #endif
1809         }
1810         ObtainReadLock(&tvc->lock);
1811
1812         if (tvc->f.states & CStatd) {
1813             if (cached) {
1814                 *cached = 1;
1815             }
1816             ReleaseReadLock(&tvc->lock);
1817             return tvc;
1818         }
1819         tvc->f.states &= ~CUnique;
1820
1821         ReleaseReadLock(&tvc->lock);
1822         afs_PutVCache(tvc);
1823         ObtainReadLock(&afs_xvcache);
1824     }
1825     /* if (tvc) */
1826     ReleaseReadLock(&afs_xvcache);
1827
1828     /* lookup the file */
1829     nfid = *afid;
1830     now = osi_Time();
1831     origCBs = afs_allCBs;       /* if anything changes, we don't have a cb */
1832     
1833     if (AFS_IS_DISCONNECTED) {
1834         /* printf("Network is down in afs_LookupVcache\n"); */
1835         code = ENETDOWN;
1836     } else 
1837         code =
1838             afs_RemoteLookup(&adp->f.fid, areq, aname, &nfid, &OutStatus, 
1839                              &CallBack, &serverp, &tsync);
1840
1841 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1842   loop2:
1843 #endif
1844
1845     ObtainSharedLock(&afs_xvcache, 6);
1846     tvc = afs_FindVCache(&nfid, &retry, DO_VLRU | IS_SLOCK/* no xstats now */ );
1847     if (tvc && retry) {
1848 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
1849         ReleaseSharedLock(&afs_xvcache);
1850         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
1851         goto loop2;
1852 #endif
1853     }
1854
1855     if (!tvc) {
1856         /* no cache entry, better grab one */
1857         UpgradeSToWLock(&afs_xvcache, 22);
1858         tvc = afs_NewVCache(&nfid, serverp);
1859         newvcache = 1;
1860         ConvertWToSLock(&afs_xvcache);
1861         if (!tvc)
1862         {
1863                 ReleaseSharedLock(&afs_xvcache);
1864                 return NULL;
1865         }
1866     }
1867
1868     ReleaseSharedLock(&afs_xvcache);
1869     ObtainWriteLock(&tvc->lock, 55);
1870
1871     /* It is always appropriate to throw away all the access rights? */
1872     afs_FreeAllAxs(&(tvc->Access));
1873     tvp = afs_GetVolume(afid, areq, READ_LOCK); /* copy useful per-vol info */
1874     if (tvp) {
1875         if ((tvp->states & VForeign)) {
1876             if (newvcache)
1877                 tvc->f.states |= CForeign;
1878             if (newvcache && (tvp->rootVnode == afid->Fid.Vnode)
1879                 && (tvp->rootUnique == afid->Fid.Unique))
1880                 tvc->mvstat = 2;
1881         }
1882         if (tvp->states & VRO)
1883             tvc->f.states |= CRO;
1884         if (tvp->states & VBackup)
1885             tvc->f.states |= CBackup;
1886         /* now copy ".." entry back out of volume structure, if necessary */
1887         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
1888             if (!tvc->mvid)
1889                 tvc->mvid = (struct VenusFid *)
1890                     osi_AllocSmallSpace(sizeof(struct VenusFid));
1891             *tvc->mvid = tvp->dotdot;
1892         }
1893     }
1894
1895     if (code) {
1896         ObtainWriteLock(&afs_xcbhash, 465);
1897         afs_DequeueCallback(tvc);
1898         tvc->f.states &= ~(CStatd | CUnique);
1899         ReleaseWriteLock(&afs_xcbhash);
1900         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1901             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1902         if (tvp)
1903             afs_PutVolume(tvp, READ_LOCK);
1904         ReleaseWriteLock(&tvc->lock);
1905         afs_PutVCache(tvc);
1906         return NULL;
1907     }
1908
1909     ObtainWriteLock(&afs_xcbhash, 466);
1910     if (origCBs == afs_allCBs) {
1911         if (CallBack.ExpirationTime) {
1912             tvc->callback = serverp;
1913             tvc->cbExpires = CallBack.ExpirationTime + now;
1914             tvc->f.states |= CStatd | CUnique;
1915             tvc->f.states &= ~CBulkFetching;
1916             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvp);
1917         } else if (tvc->f.states & CRO) {
1918             /* adapt gives us an hour. */
1919             tvc->cbExpires = 3600 + osi_Time();
1920              /*XXX*/ tvc->f.states |= CStatd | CUnique;
1921             tvc->f.states &= ~CBulkFetching;
1922             afs_QueueCallback(tvc, CBHash(3600), tvp);
1923         } else {
1924             tvc->callback = NULL;
1925             afs_DequeueCallback(tvc);
1926             tvc->f.states &= ~(CStatd | CUnique);
1927             if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1928                 osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
1929         }
1930     } else {
1931         afs_DequeueCallback(tvc);
1932         tvc->f.states &= ~CStatd;
1933         tvc->f.states &= ~CUnique;
1934         tvc->callback = NULL;
1935         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
1936             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
1937     }
1938     ReleaseWriteLock(&afs_xcbhash);
1939     if (tvp)
1940         afs_PutVolume(tvp, READ_LOCK);
1941     afs_ProcessFS(tvc, &OutStatus, areq);
1942
1943     ReleaseWriteLock(&tvc->lock);
1944     return tvc;
1945
1946 }
1947
1948 struct vcache *
1949 afs_GetRootVCache(struct VenusFid *afid, struct vrequest *areq,
1950                   afs_int32 * cached, struct volume *tvolp)
1951 {
1952     afs_int32 code = 0, i, newvcache = 0, haveStatus = 0;
1953     afs_int32 getNewFid = 0;
1954     afs_uint32 start;
1955     struct VenusFid nfid;
1956     register struct vcache *tvc;
1957     struct server *serverp = 0;
1958     struct AFSFetchStatus OutStatus;
1959     struct AFSCallBack CallBack;
1960     struct AFSVolSync tsync;
1961     int origCBs = 0;
1962 #ifdef AFS_DARWIN80_ENV
1963     vnode_t tvp;
1964 #endif
1965
1966     start = osi_Time();
1967
1968   newmtpt:
1969     if (!tvolp->rootVnode || getNewFid) {
1970         struct VenusFid tfid;
1971
1972         tfid = *afid;
1973         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
1974         origCBs = afs_allCBs;   /* ignore InitCallBackState */
1975         code =
1976             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
1977                              &serverp, &tsync);
1978         if (code) {
1979             return NULL;
1980         }
1981 /*      ReleaseReadLock(&tvolp->lock);           */
1982         ObtainWriteLock(&tvolp->lock, 56);
1983         tvolp->rootVnode = afid->Fid.Vnode = nfid.Fid.Vnode;
1984         tvolp->rootUnique = afid->Fid.Unique = nfid.Fid.Unique;
1985         ReleaseWriteLock(&tvolp->lock);
1986 /*      ObtainReadLock(&tvolp->lock);*/
1987         haveStatus = 1;
1988     } else {
1989         afid->Fid.Vnode = tvolp->rootVnode;
1990         afid->Fid.Unique = tvolp->rootUnique;
1991     }
1992
1993  rootvc_loop:
1994     ObtainSharedLock(&afs_xvcache, 7);
1995     i = VCHash(afid);
1996     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
1997         if (!FidCmp(&(tvc->f.fid), afid)) {
1998             if (tvc->f.states & CVInit) {
1999                 ReleaseSharedLock(&afs_xvcache);
2000                 afs_osi_Sleep(&tvc->f.states);
2001                 goto rootvc_loop;
2002             }
2003 #ifdef AFS_DARWIN80_ENV
2004             if (tvc->f.states & CDeadVnode) {
2005                 if (!(tvc->f.states & CBulkFetching)) {
2006                     ReleaseSharedLock(&afs_xvcache);
2007                     afs_osi_Sleep(&tvc->f.states);
2008                     goto rootvc_loop;
2009                 }
2010             }
2011             tvp = AFSTOV(tvc);
2012             if (vnode_get(tvp))       /* this bumps ref count */
2013                 continue;
2014             if (vnode_ref(tvp)) {
2015                 AFS_GUNLOCK();
2016                 /* AFSTOV(tvc) may be NULL */
2017                 vnode_put(tvp);
2018                 AFS_GLOCK();
2019                 continue;
2020             }
2021             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2022                 AFS_GUNLOCK();
2023                 vnode_recycle(AFSTOV(tvc));
2024                 AFS_GLOCK();
2025             }
2026 #endif
2027             break;
2028         }
2029     }
2030
2031     if (!haveStatus && (!tvc || !(tvc->f.states & CStatd))) {
2032         /* Mount point no longer stat'd or unknown. FID may have changed. */
2033         getNewFid = 1;
2034         ReleaseSharedLock(&afs_xvcache);
2035 #ifdef AFS_DARWIN80_ENV
2036         if (tvc) {
2037             AFS_GUNLOCK();
2038             vnode_put(AFSTOV(tvc));
2039             vnode_rele(AFSTOV(tvc));
2040             AFS_GLOCK();
2041         }
2042 #endif
2043         tvc = NULL;
2044         goto newmtpt;
2045     }
2046
2047     if (!tvc) {
2048         UpgradeSToWLock(&afs_xvcache, 23);
2049         /* no cache entry, better grab one */
2050         tvc = afs_NewVCache(afid, NULL);
2051         if (!tvc)
2052         {
2053                 ReleaseWriteLock(&afs_xvcache);
2054                 return NULL;
2055         }
2056         newvcache = 1;
2057         afs_stats_cmperf.vcacheMisses++;
2058     } else {
2059         if (cached)
2060             *cached = 1;
2061         afs_stats_cmperf.vcacheHits++;
2062 #if     defined(AFS_DARWIN80_ENV)
2063         /* we already bumped the ref count in the for loop above */
2064 #else /* AFS_DARWIN80_ENV */
2065         osi_vnhold(tvc, 0);
2066 #endif
2067         UpgradeSToWLock(&afs_xvcache, 24);
2068         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2069             refpanic("GRVC VLRU inconsistent0");
2070         }
2071         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2072             refpanic("GRVC VLRU inconsistent1");
2073         }
2074         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2075             refpanic("GRVC VLRU inconsistent2");
2076         }
2077         QRemove(&tvc->vlruq);   /* move to lruq head */
2078         QAdd(&VLRU, &tvc->vlruq);
2079         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2080             refpanic("GRVC VLRU inconsistent3");
2081         }
2082         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2083             refpanic("GRVC VLRU inconsistent4");
2084         }
2085         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2086             refpanic("GRVC VLRU inconsistent5");
2087         }
2088         vcachegen++;
2089     }
2090
2091     ReleaseWriteLock(&afs_xvcache);
2092
2093     if (tvc->f.states & CStatd) {
2094         return tvc;
2095     } else {
2096
2097         ObtainReadLock(&tvc->lock);
2098         tvc->f.states &= ~CUnique;
2099         tvc->callback = NULL;   /* redundant, perhaps */
2100         ReleaseReadLock(&tvc->lock);
2101     }
2102
2103     ObtainWriteLock(&tvc->lock, 57);
2104
2105     /* It is always appropriate to throw away all the access rights? */
2106     afs_FreeAllAxs(&(tvc->Access));
2107
2108     if (newvcache)
2109         tvc->f.states |= CForeign;
2110     if (tvolp->states & VRO)
2111         tvc->f.states |= CRO;
2112     if (tvolp->states & VBackup)
2113         tvc->f.states |= CBackup;
2114     /* now copy ".." entry back out of volume structure, if necessary */
2115     if (newvcache && (tvolp->rootVnode == afid->Fid.Vnode)
2116         && (tvolp->rootUnique == afid->Fid.Unique)) {
2117         tvc->mvstat = 2;
2118     }
2119     if (tvc->mvstat == 2 && tvolp->dotdot.Fid.Volume != 0) {
2120         if (!tvc->mvid)
2121             tvc->mvid = (struct VenusFid *)
2122                 osi_AllocSmallSpace(sizeof(struct VenusFid));
2123         *tvc->mvid = tvolp->dotdot;
2124     }
2125
2126     /* stat the file */
2127     afs_RemoveVCB(afid);
2128
2129     if (!haveStatus) {
2130         struct VenusFid tfid;
2131
2132         tfid = *afid;
2133         tfid.Fid.Vnode = 0;     /* Means get rootfid of volume */
2134         origCBs = afs_allCBs;   /* ignore InitCallBackState */
2135         code =
2136             afs_RemoteLookup(&tfid, areq, NULL, &nfid, &OutStatus, &CallBack,
2137                              &serverp, &tsync);
2138     }
2139
2140     if (code) {
2141         ObtainWriteLock(&afs_xcbhash, 467);
2142         afs_DequeueCallback(tvc);
2143         tvc->callback = NULL;
2144         tvc->f.states &= ~(CStatd | CUnique);
2145         ReleaseWriteLock(&afs_xcbhash);
2146         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2147             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2148         ReleaseWriteLock(&tvc->lock);
2149         afs_PutVCache(tvc);
2150         return NULL;
2151     }
2152
2153     ObtainWriteLock(&afs_xcbhash, 468);
2154     if (origCBs == afs_allCBs) {
2155         tvc->f.states |= CTruth;
2156         tvc->callback = serverp;
2157         if (CallBack.ExpirationTime != 0) {
2158             tvc->cbExpires = CallBack.ExpirationTime + start;
2159             tvc->f.states |= CStatd;
2160             tvc->f.states &= ~CBulkFetching;
2161             afs_QueueCallback(tvc, CBHash(CallBack.ExpirationTime), tvolp);
2162         } else if (tvc->f.states & CRO) {
2163             /* adapt gives us an hour. */
2164             tvc->cbExpires = 3600 + osi_Time();
2165              /*XXX*/ tvc->f.states |= CStatd;
2166             tvc->f.states &= ~CBulkFetching;
2167             afs_QueueCallback(tvc, CBHash(3600), tvolp);
2168         }
2169     } else {
2170         afs_DequeueCallback(tvc);
2171         tvc->callback = NULL;
2172         tvc->f.states &= ~(CStatd | CUnique);
2173         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2174             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2175     }
2176     ReleaseWriteLock(&afs_xcbhash);
2177     afs_ProcessFS(tvc, &OutStatus, areq);
2178
2179     ReleaseWriteLock(&tvc->lock);
2180     return tvc;
2181 }
2182
2183
2184 /*!
2185  * Update callback status and (sometimes) attributes of a vnode.
2186  * Called after doing a fetch status RPC. Whilst disconnected, attributes
2187  * shouldn't be written to the vcache here.
2188  *
2189  * \param avc
2190  * \param afid
2191  * \param areq
2192  * \param Outsp Server status after rpc call.
2193  * \param acb Callback for this vnode.
2194  *
2195  * \note The vcache must be write locked.
2196  */
2197 void
2198 afs_UpdateStatus(struct vcache *avc, struct VenusFid *afid,
2199                  struct vrequest *areq, struct AFSFetchStatus *Outsp,
2200                  struct AFSCallBack *acb, afs_uint32 start)
2201 {
2202     struct volume *volp;
2203
2204     if (!AFS_IN_SYNC)
2205         /* Dont write status in vcache if resyncing after a disconnection. */
2206         afs_ProcessFS(avc, Outsp, areq);
2207
2208     volp = afs_GetVolume(afid, areq, READ_LOCK);
2209     ObtainWriteLock(&afs_xcbhash, 469);
2210     avc->f.states |= CTruth;
2211     if (avc->callback /* check for race */ ) {
2212         if (acb->ExpirationTime != 0) {
2213             avc->cbExpires = acb->ExpirationTime + start;
2214             avc->f.states |= CStatd;
2215             avc->f.states &= ~CBulkFetching;
2216             afs_QueueCallback(avc, CBHash(acb->ExpirationTime), volp);
2217         } else if (avc->f.states & CRO) {
2218             /* ordinary callback on a read-only volume -- AFS 3.2 style */
2219             avc->cbExpires = 3600 + start;
2220             avc->f.states |= CStatd;
2221             avc->f.states &= ~CBulkFetching;
2222             afs_QueueCallback(avc, CBHash(3600), volp);
2223         } else {
2224             afs_DequeueCallback(avc);
2225             avc->callback = NULL;
2226             avc->f.states &= ~(CStatd | CUnique);
2227             if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
2228                 osi_dnlc_purgedp(avc);  /* if it (could be) a directory */
2229         }
2230     } else {
2231         afs_DequeueCallback(avc);
2232         avc->callback = NULL;
2233         avc->f.states &= ~(CStatd | CUnique);
2234         if ((avc->f.states & CForeign) || (avc->f.fid.Fid.Vnode & 1))
2235             osi_dnlc_purgedp(avc);      /* if it (could be) a directory */
2236     }
2237     ReleaseWriteLock(&afs_xcbhash);
2238     if (volp)
2239         afs_PutVolume(volp, READ_LOCK);
2240 }
2241
2242 /*!
2243  * Must be called with avc write-locked
2244  * don't absolutely have to invalidate the hint unless the dv has
2245  * changed, but be sure to get it right else there will be consistency bugs.
2246  */
2247 afs_int32
2248 afs_FetchStatus(struct vcache * avc, struct VenusFid * afid,
2249                 struct vrequest * areq, struct AFSFetchStatus * Outsp)
2250 {
2251     int code;
2252     afs_uint32 start = 0;
2253     register struct afs_conn *tc;
2254     struct AFSCallBack CallBack;
2255     struct AFSVolSync tsync;
2256     XSTATS_DECLS;
2257     do {
2258         tc = afs_Conn(afid, areq, SHARED_LOCK);
2259         avc->dchint = NULL;     /* invalidate hints */
2260         if (tc) {
2261             avc->callback = tc->srvr->server;
2262             start = osi_Time();
2263             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_FETCHSTATUS);
2264             RX_AFS_GUNLOCK();
2265             code =
2266                 RXAFS_FetchStatus(tc->id, (struct AFSFid *)&afid->Fid, Outsp,
2267                                   &CallBack, &tsync);
2268             RX_AFS_GLOCK();
2269
2270             XSTATS_END_TIME;
2271
2272         } else
2273             code = -1;
2274     } while (afs_Analyze
2275              (tc, code, afid, areq, AFS_STATS_FS_RPCIDX_FETCHSTATUS,
2276               SHARED_LOCK, NULL));
2277
2278     if (!code) {
2279         afs_UpdateStatus(avc, afid, areq, Outsp, &CallBack, start);
2280     } else {
2281         /* used to undo the local callback, but that's too extreme.
2282          * There are plenty of good reasons that fetchstatus might return
2283          * an error, such as EPERM.  If we have the vnode cached, statd,
2284          * with callback, might as well keep track of the fact that we
2285          * don't have access...
2286          */
2287         if (code == EPERM || code == EACCES) {
2288             struct axscache *ac;
2289             if (avc->Access && (ac = afs_FindAxs(avc->Access, areq->uid)))
2290                 ac->axess = 0;
2291             else                /* not found, add a new one if possible */
2292                 afs_AddAxs(avc->Access, areq->uid, 0);
2293         }
2294     }
2295     return code;
2296 }
2297
2298 #if 0
2299 /*
2300  * afs_StuffVcache
2301  *
2302  * Description:
2303  *      Stuff some information into the vcache for the given file.
2304  *
2305  * Parameters:
2306  *      afid      : File in question.
2307  *      OutStatus : Fetch status on the file.
2308  *      CallBack  : Callback info.
2309  *      tc        : RPC connection involved.
2310  *      areq      : vrequest involved.
2311  *
2312  * Environment:
2313  *      Nothing interesting.
2314  */
2315 void
2316 afs_StuffVcache(register struct VenusFid *afid,
2317                 struct AFSFetchStatus *OutStatus,
2318                 struct AFSCallBack *CallBack, register struct afs_conn *tc,
2319                 struct vrequest *areq)
2320 {
2321     register afs_int32 code, i, newvcache = 0;
2322     register struct vcache *tvc;
2323     struct AFSVolSync tsync;
2324     struct volume *tvp;
2325     struct axscache *ac;
2326     afs_int32 retry;
2327
2328     AFS_STATCNT(afs_StuffVcache);
2329 #ifdef IFS_VCACHECOUNT
2330     ifs_gvcachecall++;
2331 #endif
2332
2333   loop:
2334     ObtainSharedLock(&afs_xvcache, 8);
2335
2336     tvc = afs_FindVCache(afid, &retry, DO_VLRU| IS_SLOCK /* no stats */ );
2337     if (tvc && retry) {
2338 #if     defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2339         ReleaseSharedLock(&afs_xvcache);
2340         spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2341         goto loop;
2342 #endif
2343     }
2344
2345     if (!tvc) {
2346         /* no cache entry, better grab one */
2347         UpgradeSToWLock(&afs_xvcache, 25);
2348         tvc = afs_NewVCache(afid, NULL);
2349         newvcache = 1;
2350         ConvertWToSLock(&afs_xvcache);
2351         if (!tvc)
2352         {
2353                 ReleaseSharedLock(&afs_xvcache);
2354                 return NULL;
2355         }
2356     }
2357
2358     ReleaseSharedLock(&afs_xvcache);
2359     ObtainWriteLock(&tvc->lock, 58);
2360
2361     tvc->f.states &= ~CStatd;
2362     if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2363         osi_dnlc_purgedp(tvc);  /* if it (could be) a directory */
2364
2365     /* Is it always appropriate to throw away all the access rights? */
2366     afs_FreeAllAxs(&(tvc->Access));
2367
2368     /*Copy useful per-volume info */
2369     tvp = afs_GetVolume(afid, areq, READ_LOCK);
2370     if (tvp) {
2371         if (newvcache && (tvp->states & VForeign))
2372             tvc->f.states |= CForeign;
2373         if (tvp->states & VRO)
2374             tvc->f.states |= CRO;
2375         if (tvp->states & VBackup)
2376             tvc->f.states |= CBackup;
2377         /*
2378          * Now, copy ".." entry back out of volume structure, if
2379          * necessary
2380          */
2381         if (tvc->mvstat == 2 && tvp->dotdot.Fid.Volume != 0) {
2382             if (!tvc->mvid)
2383                 tvc->mvid = (struct VenusFid *)
2384                     osi_AllocSmallSpace(sizeof(struct VenusFid));
2385             *tvc->mvid = tvp->dotdot;
2386         }
2387     }
2388     /* store the stat on the file */
2389     afs_RemoveVCB(afid);
2390     afs_ProcessFS(tvc, OutStatus, areq);
2391     tvc->callback = tc->srvr->server;
2392
2393     /* we use osi_Time twice below.  Ideally, we would use the time at which
2394      * the FetchStatus call began, instead, but we don't have it here.  So we
2395      * make do with "now".  In the CRO case, it doesn't really matter. In
2396      * the other case, we hope that the difference between "now" and when the
2397      * call actually began execution on the server won't be larger than the
2398      * padding which the server keeps.  Subtract 1 second anyway, to be on
2399      * the safe side.  Can't subtract more because we don't know how big
2400      * ExpirationTime is.  Possible consistency problems may arise if the call
2401      * timeout period becomes longer than the server's expiration padding.  */
2402     ObtainWriteLock(&afs_xcbhash, 470);
2403     if (CallBack->ExpirationTime != 0) {
2404         tvc->cbExpires = CallBack->ExpirationTime + osi_Time() - 1;
2405         tvc->f.states |= CStatd;
2406         tvc->f.states &= ~CBulkFetching;
2407         afs_QueueCallback(tvc, CBHash(CallBack->ExpirationTime), tvp);
2408     } else if (tvc->f.states & CRO) {
2409         /* old-fashioned AFS 3.2 style */
2410         tvc->cbExpires = 3600 + osi_Time();
2411          /*XXX*/ tvc->f.states |= CStatd;
2412         tvc->f.states &= ~CBulkFetching;
2413         afs_QueueCallback(tvc, CBHash(3600), tvp);
2414     } else {
2415         afs_DequeueCallback(tvc);
2416         tvc->callback = NULL;
2417         tvc->f.states &= ~(CStatd | CUnique);
2418         if ((tvc->f.states & CForeign) || (tvc->f.fid.Fid.Vnode & 1))
2419             osi_dnlc_purgedp(tvc);      /* if it (could be) a directory */
2420     }
2421     ReleaseWriteLock(&afs_xcbhash);
2422     if (tvp)
2423         afs_PutVolume(tvp, READ_LOCK);
2424
2425     /* look in per-pag cache */
2426     if (tvc->Access && (ac = afs_FindAxs(tvc->Access, areq->uid)))
2427         ac->axess = OutStatus->CallerAccess;    /* substitute pags */
2428     else                        /* not found, add a new one if possible */
2429         afs_AddAxs(tvc->Access, areq->uid, OutStatus->CallerAccess);
2430
2431     ReleaseWriteLock(&tvc->lock);
2432     afs_Trace4(afs_iclSetp, CM_TRACE_STUFFVCACHE, ICL_TYPE_POINTER, tvc,
2433                ICL_TYPE_POINTER, tvc->callback, ICL_TYPE_INT32,
2434                tvc->cbExpires, ICL_TYPE_INT32, tvc->cbExpires - osi_Time());
2435     /*
2436      * Release ref count... hope this guy stays around...
2437      */
2438     afs_PutVCache(tvc);
2439 }                               /*afs_StuffVcache */
2440 #endif
2441
2442 /*!
2443  * Decrements the reference count on a cache entry.
2444  *
2445  * \param avc Pointer to the cache entry to decrement.
2446  *
2447  * \note Environment: Nothing interesting.
2448  */
2449 void
2450 afs_PutVCache(register struct vcache *avc)
2451 {
2452     AFS_STATCNT(afs_PutVCache);
2453 #ifdef AFS_DARWIN80_ENV
2454     vnode_put(AFSTOV(avc));
2455     AFS_FAST_RELE(avc);
2456 #else
2457     /*
2458      * Can we use a read lock here?
2459      */
2460     ObtainReadLock(&afs_xvcache);
2461     AFS_FAST_RELE(avc);
2462     ReleaseReadLock(&afs_xvcache);
2463 #endif
2464 }                               /*afs_PutVCache */
2465
2466
2467 /*!
2468  * Reset a vcache entry, so local contents are ignored, and the
2469  * server will be reconsulted next time the vcache is used
2470  * 
2471  * \param avc Pointer to the cache entry to reset
2472  * \param acred 
2473  *
2474  * \note avc must be write locked on entry
2475  */
2476 void
2477 afs_ResetVCache(struct vcache *avc, afs_ucred_t *acred)
2478 {
2479     ObtainWriteLock(&afs_xcbhash, 456);
2480     afs_DequeueCallback(avc);
2481     avc->f.states &= ~(CStatd | CDirty);    /* next reference will re-stat */
2482     ReleaseWriteLock(&afs_xcbhash);
2483     /* now find the disk cache entries */
2484     afs_TryToSmush(avc, acred, 1);
2485     osi_dnlc_purgedp(avc);
2486     if (avc->linkData && !(avc->f.states & CCore)) {
2487         afs_osi_Free(avc->linkData, strlen(avc->linkData) + 1);
2488         avc->linkData = NULL;
2489     }
2490 }
2491
2492 /*!
2493  * Sleepa when searching for a vcache. Releases all the pending locks,
2494  * sleeps then obtains the previously released locks.
2495  *
2496  * \param vcache Enter sleep state.
2497  * \param flag Determines what locks to use.
2498  *
2499  * \return 
2500  */
2501 static void
2502 findvc_sleep(struct vcache *avc, int flag)
2503 {
2504     int fstates = avc->f.states;
2505     if (flag & IS_SLOCK) {
2506             ReleaseSharedLock(&afs_xvcache);
2507     } else {
2508         if (flag & IS_WLOCK) {
2509             ReleaseWriteLock(&afs_xvcache);
2510         } else {
2511             ReleaseReadLock(&afs_xvcache);
2512         }
2513     }
2514     if (flag & FIND_CDEAD) {
2515         ObtainWriteLock(&afs_xvcache, 342);
2516         afs_FlushReclaimedVcaches();
2517         if (fstates == avc->f.states) {
2518             ReleaseWriteLock(&afs_xvcache);
2519             afs_osi_Sleep(&avc->f.states);
2520         } else
2521             ReleaseWriteLock(&afs_xvcache);
2522     } else
2523         afs_osi_Sleep(&avc->f.states);
2524     if (flag & IS_SLOCK) {
2525             ObtainSharedLock(&afs_xvcache, 341);
2526     } else {
2527         if (flag & IS_WLOCK) {
2528             ObtainWriteLock(&afs_xvcache, 343);
2529         } else {
2530             ObtainReadLock(&afs_xvcache);
2531         }
2532     }
2533 }
2534 /*!
2535  * Find a vcache entry given a fid.
2536  *
2537  * \param afid Pointer to the fid whose cache entry we desire.
2538  * \param retry (SGI-specific) tell the caller to drop the lock on xvcache,
2539  *  unlock the vnode, and try again.
2540  * \param flag Bit 1 to specify whether to compute hit statistics.  Not
2541  *  set if FindVCache is called as part of internal bookkeeping.
2542  *
2543  * \note Environment: Must be called with the afs_xvcache lock at least held at
2544  * the read level.  In order to do the VLRU adjustment, the xvcache lock
2545  * must be shared-- we upgrade it here.
2546  */
2547
2548 struct vcache *
2549 afs_FindVCache(struct VenusFid *afid, afs_int32 * retry, afs_int32 flag)
2550 {
2551
2552     register struct vcache *tvc;
2553     afs_int32 i;
2554 #ifdef AFS_DARWIN80_ENV
2555     vnode_t tvp;
2556 #endif
2557
2558     AFS_STATCNT(afs_FindVCache);
2559
2560  findloop:
2561     i = VCHash(afid);
2562     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2563         if (FidMatches(afid, tvc)) {
2564             if (tvc->f.states & CVInit) {
2565                 findvc_sleep(tvc, flag);
2566                 goto findloop;
2567             }
2568 #ifdef  AFS_DARWIN80_ENV
2569             if (tvc->f.states & CDeadVnode) {
2570                 if (!(flag & FIND_CDEAD)) {
2571                     findvc_sleep(tvc, flag);
2572                     goto findloop;
2573                 }
2574             }
2575             tvp = AFSTOV(tvc);
2576             if (vnode_get(tvp))
2577                 continue;
2578             if (vnode_ref(tvp)) {
2579                 AFS_GUNLOCK();
2580                 /* AFSTOV(tvc) may be NULL */
2581                 vnode_put(tvp);
2582                 AFS_GLOCK();
2583                 continue;
2584             }
2585             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2586                 AFS_GUNLOCK();
2587                 vnode_recycle(AFSTOV(tvc));
2588                 AFS_GLOCK();
2589             }
2590 #endif
2591             break;
2592         }
2593     }
2594
2595     /* should I have a read lock on the vnode here? */
2596     if (tvc) {
2597         if (retry)
2598             *retry = 0;
2599 #if !defined(AFS_DARWIN80_ENV)
2600         osi_vnhold(tvc, retry); /* already held, above */
2601         if (retry && *retry)
2602             return 0;
2603 #endif
2604 #if defined(AFS_DARWIN_ENV) && !defined(AFS_DARWIN80_ENV)
2605         tvc->f.states |= CUBCinit;
2606         AFS_GUNLOCK();
2607         if (UBCINFOMISSING(AFSTOV(tvc)) ||
2608             UBCINFORECLAIMED(AFSTOV(tvc))) {
2609           ubc_info_init(AFSTOV(tvc));
2610         }
2611         AFS_GLOCK();
2612         tvc->f.states &= ~CUBCinit;
2613 #endif
2614         /*
2615          * only move to front of vlru if we have proper vcache locking)
2616          */
2617         if (flag & DO_VLRU) {
2618             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2619                 refpanic("FindVC VLRU inconsistent1");
2620             }
2621             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2622                 refpanic("FindVC VLRU inconsistent1");
2623             }
2624             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2625                 refpanic("FindVC VLRU inconsistent2");
2626             }
2627             UpgradeSToWLock(&afs_xvcache, 26);
2628             QRemove(&tvc->vlruq);
2629             QAdd(&VLRU, &tvc->vlruq);
2630             ConvertWToSLock(&afs_xvcache);
2631             if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2632                 refpanic("FindVC VLRU inconsistent1");
2633             }
2634             if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2635                 refpanic("FindVC VLRU inconsistent2");
2636             }
2637             if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2638                 refpanic("FindVC VLRU inconsistent3");
2639             }
2640         }
2641         vcachegen++;
2642     }
2643
2644     if (flag & DO_STATS) {
2645         if (tvc)
2646             afs_stats_cmperf.vcacheHits++;
2647         else
2648             afs_stats_cmperf.vcacheMisses++;
2649         if (afs_IsPrimaryCellNum(afid->Cell))
2650             afs_stats_cmperf.vlocalAccesses++;
2651         else
2652             afs_stats_cmperf.vremoteAccesses++;
2653     }
2654     return tvc;
2655 }                               /*afs_FindVCache */
2656
2657 /*!
2658  * Find a vcache entry given a fid. Does a wildcard match on what we
2659  * have for the fid. If more than one entry, don't return anything.
2660  *
2661  * \param avcp Fill in pointer if we found one and only one.
2662  * \param afid Pointer to the fid whose cache entry we desire.
2663  * \param retry (SGI-specific) tell the caller to drop the lock on xvcache,
2664  *             unlock the vnode, and try again.
2665  * \param flags bit 1 to specify whether to compute hit statistics.  Not
2666  *             set if FindVCache is called as part of internal bookkeeping.
2667  *
2668  * \note Environment: Must be called with the afs_xvcache lock at least held at
2669  *  the read level.  In order to do the VLRU adjustment, the xvcache lock
2670  *  must be shared-- we upgrade it here.
2671  *
2672  * \return Number of matches found.
2673  */
2674
2675 int afs_duplicate_nfs_fids = 0;
2676
2677 afs_int32
2678 afs_NFSFindVCache(struct vcache **avcp, struct VenusFid *afid)
2679 {
2680     register struct vcache *tvc;
2681     afs_int32 i;
2682     afs_int32 count = 0;
2683     struct vcache *found_tvc = NULL;
2684 #ifdef AFS_DARWIN80_ENV
2685     vnode_t tvp;
2686 #endif
2687
2688     AFS_STATCNT(afs_FindVCache);
2689
2690   loop:
2691
2692     ObtainSharedLock(&afs_xvcache, 331);
2693
2694     i = VCHash(afid);
2695     for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2696         /* Match only on what we have.... */
2697         if (((tvc->f.fid.Fid.Vnode & 0xffff) == afid->Fid.Vnode)
2698             && (tvc->f.fid.Fid.Volume == afid->Fid.Volume)
2699             && ((tvc->f.fid.Fid.Unique & 0xffffff) == afid->Fid.Unique)
2700             && (tvc->f.fid.Cell == afid->Cell)) {
2701             if (tvc->f.states & CVInit) {
2702                 ReleaseSharedLock(&afs_xvcache);
2703                 afs_osi_Sleep(&tvc->f.states);
2704                 goto loop;
2705             }
2706 #ifdef  AFS_DARWIN80_ENV
2707             if (tvc->f.states & CDeadVnode) {
2708                 if (!(tvc->f.states & CBulkFetching)) {
2709                     ReleaseSharedLock(&afs_xvcache);
2710                     afs_osi_Sleep(&tvc->f.states);
2711                     goto loop;
2712                 }
2713             }
2714             tvp = AFSTOV(tvc);
2715             if (vnode_get(tvp)) {
2716                 /* This vnode no longer exists. */
2717                 continue;
2718             }
2719             if (vnode_ref(tvp)) {
2720                 /* This vnode no longer exists. */
2721                 AFS_GUNLOCK();
2722                 /* AFSTOV(tvc) may be NULL */
2723                 vnode_put(tvp);
2724                 AFS_GLOCK();
2725                 continue;
2726             }
2727             if (tvc->f.states & (CBulkFetching|CDeadVnode)) {
2728                 AFS_GUNLOCK();
2729                 vnode_recycle(AFSTOV(tvc));
2730                 AFS_GLOCK();
2731             }
2732 #endif /* AFS_DARWIN80_ENV */
2733             count++;
2734             if (found_tvc) {
2735                 /* Duplicates */
2736                 afs_duplicate_nfs_fids++;
2737                 ReleaseSharedLock(&afs_xvcache);
2738 #ifdef AFS_DARWIN80_ENV
2739                 /* Drop our reference counts. */
2740                 vnode_put(AFSTOV(tvc));
2741                 vnode_put(AFSTOV(found_tvc));
2742 #endif
2743                 return count;
2744             }
2745             found_tvc = tvc;
2746         }
2747     }
2748
2749     tvc = found_tvc;
2750     /* should I have a read lock on the vnode here? */
2751     if (tvc) {
2752 #if defined(AFS_SGI_ENV) && !defined(AFS_SGI53_ENV)
2753         afs_int32 retry = 0;
2754         osi_vnhold(tvc, &retry);
2755         if (retry) {
2756             count = 0;
2757             found_tvc = (struct vcache *)0;
2758             ReleaseSharedLock(&afs_xvcache);
2759             spunlock_psema(tvc->v.v_lock, retry, &tvc->v.v_sync, PINOD);
2760             goto loop;
2761         }
2762 #else
2763         osi_vnhold(tvc, (int *)0);      /* already held, above */
2764 #endif
2765         /*
2766          * We obtained the xvcache lock above.
2767          */
2768         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2769             refpanic("FindVC VLRU inconsistent1");
2770         }
2771         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2772             refpanic("FindVC VLRU inconsistent1");
2773         }
2774         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2775             refpanic("FindVC VLRU inconsistent2");
2776         }
2777         UpgradeSToWLock(&afs_xvcache, 568);
2778         QRemove(&tvc->vlruq);
2779         QAdd(&VLRU, &tvc->vlruq);
2780         ConvertWToSLock(&afs_xvcache);
2781         if ((VLRU.next->prev != &VLRU) || (VLRU.prev->next != &VLRU)) {
2782             refpanic("FindVC VLRU inconsistent1");
2783         }
2784         if (tvc->vlruq.next->prev != &(tvc->vlruq)) {
2785             refpanic("FindVC VLRU inconsistent2");
2786         }
2787         if (tvc->vlruq.prev->next != &(tvc->vlruq)) {
2788             refpanic("FindVC VLRU inconsistent3");
2789         }
2790     }
2791     vcachegen++;
2792
2793     if (tvc)
2794         afs_stats_cmperf.vcacheHits++;
2795     else
2796         afs_stats_cmperf.vcacheMisses++;
2797     if (afs_IsPrimaryCellNum(afid->Cell))
2798         afs_stats_cmperf.vlocalAccesses++;
2799     else
2800         afs_stats_cmperf.vremoteAccesses++;
2801
2802     *avcp = tvc;                /* May be null */
2803
2804     ReleaseSharedLock(&afs_xvcache);
2805     return (tvc ? 1 : 0);
2806
2807 }                               /*afs_NFSFindVCache */
2808
2809
2810
2811
2812 /*!
2813  * Initialize vcache related variables
2814  *
2815  * \param astatSize
2816  */
2817 void
2818 afs_vcacheInit(int astatSize)
2819 {
2820 #if !defined(AFS_LINUX22_ENV)
2821     register struct vcache *tvp;
2822 #endif
2823     int i;
2824     if (!afs_maxvcount) {
2825         afs_maxvcount = astatSize;      /* no particular limit on linux? */
2826     }
2827 #if !defined(AFS_LINUX22_ENV)
2828     freeVCList = NULL;
2829 #endif
2830
2831     AFS_RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2832     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2833
2834 #if !defined(AFS_LINUX22_ENV)
2835     /* Allocate and thread the struct vcache entries */
2836     tvp = (struct vcache *)afs_osi_Alloc(astatSize * sizeof(struct vcache));
2837     memset(tvp, 0, sizeof(struct vcache) * astatSize);
2838
2839     Initial_freeVCList = tvp;
2840     freeVCList = &(tvp[0]);
2841     for (i = 0; i < astatSize - 1; i++) {
2842         tvp[i].nextfree = &(tvp[i + 1]);
2843     }
2844     tvp[astatSize - 1].nextfree = NULL;
2845 # ifdef  KERNEL_HAVE_PIN
2846     pin((char *)tvp, astatSize * sizeof(struct vcache));        /* XXX */
2847 # endif
2848 #endif
2849
2850 #if defined(AFS_SGI_ENV)
2851     for (i = 0; i < astatSize; i++) {
2852         char name[METER_NAMSZ];
2853         struct vcache *tvc = &tvp[i];
2854
2855         tvc->v.v_number = ++afsvnumbers;
2856         tvc->vc_rwlockid = OSI_NO_LOCKID;
2857         initnsema(&tvc->vc_rwlock, 1,
2858                   makesname(name, "vrw", tvc->v.v_number));
2859 #ifndef AFS_SGI53_ENV
2860         initnsema(&tvc->v.v_sync, 0, makesname(name, "vsy", tvc->v.v_number));
2861 #endif
2862 #ifndef AFS_SGI62_ENV
2863         initnlock(&tvc->v.v_lock, makesname(name, "vlk", tvc->v.v_number));
2864 #endif /* AFS_SGI62_ENV */
2865     }
2866 #endif
2867     QInit(&VLRU);
2868     for(i = 0; i < VCSIZE; ++i)
2869         QInit(&afs_vhashTV[i]);
2870 }
2871
2872 /*!
2873  * Shutdown vcache.
2874  */
2875 void
2876 shutdown_vcache(void)
2877 {
2878     int i;
2879     struct afs_cbr *tsp;
2880     /*
2881      * XXX We may potentially miss some of the vcaches because if when
2882      * there are no free vcache entries and all the vcache entries are active
2883      * ones then we allocate an additional one - admittedly we almost never
2884      * had that occur.
2885      */
2886
2887     {
2888         register struct afs_q *tq, *uq = NULL;
2889         register struct vcache *tvc;
2890         for (tq = VLRU.prev; tq != &VLRU; tq = uq) {
2891             tvc = QTOV(tq);
2892             uq = QPrev(tq);
2893             if (tvc->mvid) {
2894                 osi_FreeSmallSpace(tvc->mvid);
2895                 tvc->mvid = (struct VenusFid *)0;
2896             }
2897 #ifdef  AFS_AIX_ENV
2898             aix_gnode_rele(AFSTOV(tvc));
2899 #endif
2900             if (tvc->linkData) {
2901                 afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2902                 tvc->linkData = 0;
2903             }
2904         }
2905         /*
2906          * Also free the remaining ones in the Cache
2907          */
2908         for (i = 0; i < VCSIZE; i++) {
2909             for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2910                 if (tvc->mvid) {
2911                     osi_FreeSmallSpace(tvc->mvid);
2912                     tvc->mvid = (struct VenusFid *)0;
2913                 }
2914 #ifdef  AFS_AIX_ENV
2915                 if (tvc->v.v_gnode)
2916                     afs_osi_Free(tvc->v.v_gnode, sizeof(struct gnode));
2917 #ifdef  AFS_AIX32_ENV
2918                 if (tvc->segid) {
2919                     AFS_GUNLOCK();
2920                     vms_delete(tvc->segid);
2921                     AFS_GLOCK();
2922                     tvc->segid = tvc->vmh = NULL;
2923                     if (VREFCOUNT_GT(tvc,0))
2924                         osi_Panic("flushVcache: vm race");
2925                 }
2926                 if (tvc->credp) {
2927                     crfree(tvc->credp);
2928                     tvc->credp = NULL;
2929                 }
2930 #endif
2931 #endif
2932 #if     defined(AFS_SUN5_ENV)
2933                 if (tvc->credp) {
2934                     crfree(tvc->credp);
2935                     tvc->credp = NULL;
2936                 }
2937 #endif
2938                 if (tvc->linkData) {
2939                     afs_osi_Free(tvc->linkData, strlen(tvc->linkData) + 1);
2940                     tvc->linkData = 0;
2941                 }
2942
2943                 if (tvc->Access)
2944                     afs_FreeAllAxs(&(tvc->Access));
2945             }
2946             afs_vhashT[i] = 0;
2947         }
2948     }
2949     /*
2950      * Free any leftover callback queue
2951      */
2952     for (i = 0; i < afs_stats_cmperf.CallBackAlloced; i++) {
2953         tsp = afs_cbrHeads[i];
2954         afs_cbrHeads[i] = 0;
2955         afs_osi_Free((char *)tsp, AFS_NCBRS * sizeof(struct afs_cbr));
2956     }
2957     afs_cbrSpace = 0;
2958
2959 #if !defined(AFS_LINUX22_ENV)
2960     afs_osi_Free(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2961
2962 # ifdef  KERNEL_HAVE_PIN
2963     unpin(Initial_freeVCList, afs_cacheStats * sizeof(struct vcache));
2964 # endif
2965
2966     freeVCList = Initial_freeVCList = 0;
2967 #endif
2968
2969     AFS_RWLOCK_INIT(&afs_xvcache, "afs_xvcache");
2970     LOCK_INIT(&afs_xvcb, "afs_xvcb");
2971     QInit(&VLRU);
2972     for(i = 0; i < VCSIZE; ++i)
2973         QInit(&afs_vhashTV[i]);
2974 }
2975
2976 void
2977 afs_DisconGiveUpCallbacks(void)
2978 {
2979     int i;
2980     struct vcache *tvc;
2981     int nq=0;
2982             
2983     ObtainWriteLock(&afs_xvcache, 1002); /* XXX - should be a unique number */
2984     
2985     /* Somehow, walk the set of vcaches, with each one coming out as tvc */
2986     for (i = 0; i < VCSIZE; i++) {
2987         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
2988             if (afs_QueueVCB(tvc)) {
2989                 tvc->callback = NULL;
2990                 nq++;
2991             }
2992         }
2993     }
2994
2995     ReleaseWriteLock(&afs_xvcache);
2996
2997     afs_FlushVCBs(1);
2998 }
2999
3000 /*!
3001  *
3002  * Clear the Statd flag from all vcaches
3003  *
3004  * This function removes the Statd flag from all vcaches. It's used by 
3005  * disconnected mode to tidy up during reconnection
3006  *
3007  */
3008 void
3009 afs_ClearAllStatdFlag(void)
3010 {
3011     int i;
3012     struct vcache *tvc;
3013    
3014     ObtainWriteLock(&afs_xvcache, 715);
3015
3016     for (i = 0; i < VCSIZE; i++) {
3017         for (tvc = afs_vhashT[i]; tvc; tvc = tvc->hnext) {
3018             tvc->f.states &= ~(CStatd|CUnique);
3019         }
3020     }
3021     ReleaseWriteLock(&afs_xvcache);
3022 }