81b403edaa542bbffb979c7a49d7088a61d9b68b
[openafs.git] / src / afs / afs_segments.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * --------------------- Required definitions ---------------------
12  */
13 #include <afsconfig.h>
14 #include "afs/param.h"
15
16 RCSID
17     ("$Header$");
18
19 #include "afs/sysincludes.h"    /*Standard vendor system headers */
20 #include "afsincludes.h"        /*AFS-based standard headers */
21 #include "afs/afs_stats.h"      /* statistics */
22 #include "afs/afs_cbqueue.h"
23 #include "afs/afs_osidnlc.h"
24
25 afs_uint32 afs_stampValue = 0;
26
27 /*
28  * afs_StoreMini
29  *
30  * Description:
31  *      Send a truncation request to a FileServer.
32  *
33  * Parameters:
34  *      xxx : description
35  *
36  * Environment:
37  *      We're write-locked upon entry.
38  */
39
40 int
41 afs_StoreMini(register struct vcache *avc, struct vrequest *areq)
42 {
43     register struct conn *tc;
44     struct AFSStoreStatus InStatus;
45     struct AFSFetchStatus OutStatus;
46     struct AFSVolSync tsync;
47     register afs_int32 code;
48     register struct rx_call *tcall;
49     afs_size_t tlen, xlen = 0;
50     XSTATS_DECLS;
51     AFS_STATCNT(afs_StoreMini);
52     afs_Trace2(afs_iclSetp, CM_TRACE_STOREMINI, ICL_TYPE_POINTER, avc,
53                ICL_TYPE_INT32, avc->m.Length);
54     tlen = avc->m.Length;
55     if (avc->truncPos < tlen)
56         tlen = avc->truncPos;
57     avc->truncPos = AFS_NOTRUNC;
58     avc->states &= ~CExtendedFile;
59
60     do {
61         tc = afs_Conn(&avc->fid, areq, SHARED_LOCK);
62         if (tc) {
63           retry:
64             RX_AFS_GUNLOCK();
65             tcall = rx_NewCall(tc->id);
66             RX_AFS_GLOCK();
67             /* Set the client mod time since we always want the file
68              * to have the client's mod time and not the server's one
69              * (to avoid problems with make, etc.) It almost always
70              * works fine with standard afs because them server/client
71              * times are in sync and more importantly this storemini
72              * it's a special call that would typically be followed by
73              * the proper store-data or store-status calls.
74              */
75             InStatus.Mask = AFS_SETMODTIME;
76             InStatus.ClientModTime = avc->m.Date;
77             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STOREDATA);
78             afs_Trace4(afs_iclSetp, CM_TRACE_STOREDATA64, ICL_TYPE_FID,
79                        &avc->fid.Fid, ICL_TYPE_OFFSET,
80                        ICL_HANDLE_OFFSET(avc->m.Length), ICL_TYPE_OFFSET,
81                        ICL_HANDLE_OFFSET(xlen), ICL_TYPE_OFFSET,
82                        ICL_HANDLE_OFFSET(tlen));
83             RX_AFS_GUNLOCK();
84 #ifdef AFS_64BIT_CLIENT
85             if (!afs_serverHasNo64Bit(tc)) {
86                 code =
87                     StartRXAFS_StoreData64(tcall,
88                                            (struct AFSFid *)&avc->fid.Fid,
89                                            &InStatus, avc->m.Length,
90                                            (afs_size_t) 0, tlen);
91             } else {
92                 afs_int32 l1, l2;
93                 l1 = avc->m.Length;
94                 l2 = tlen;
95                 if ((avc->m.Length > 0x7fffffff) ||
96                     (tlen > 0x7fffffff) ||
97                     ((0x7fffffff - tlen) < avc->m.Length))
98                     return EFBIG;
99                 code =
100                     StartRXAFS_StoreData(tcall,
101                                          (struct AFSFid *)&avc->fid.Fid,
102                                          &InStatus, l1, 0, l2);
103             }
104 #else /* AFS_64BIT_CLIENT */
105             code =
106                 StartRXAFS_StoreData(tcall, (struct AFSFid *)&avc->fid.Fid,
107                                      &InStatus, avc->m.Length, 0, tlen);
108 #endif /* AFS_64BIT_CLIENT */
109             if (code == 0) {
110                 code = EndRXAFS_StoreData(tcall, &OutStatus, &tsync);
111             }
112             code = rx_EndCall(tcall, code);
113             RX_AFS_GLOCK();
114             XSTATS_END_TIME;
115 #ifdef AFS_64BIT_CLIENT
116             if (code == RXGEN_OPCODE && !afs_serverHasNo64Bit(tc)) {
117                 afs_serverSetNo64Bit(tc);
118                 goto retry;
119             }
120 #endif /* AFS_64BIT_CLIENT */
121         } else
122             code = -1;
123     } while (afs_Analyze
124              (tc, code, &avc->fid, areq, AFS_STATS_FS_RPCIDX_STOREDATA,
125               SHARED_LOCK, NULL));
126
127     if (code == 0) {
128         afs_ProcessFS(avc, &OutStatus, areq);
129     } else {
130         /* blew it away */
131         afs_InvalidateAllSegments(avc);
132     }
133     return code;
134
135 }                               /*afs_StoreMini */
136
137 unsigned int storeallmissing = 0;
138 #define lmin(a,b) (((a) < (b)) ? (a) : (b))
139 /*
140  * afs_StoreAllSegments
141  *
142  * Description:
143  *      Stores all modified segments back to server
144  *
145  * Parameters:
146  *      avc  : Pointer to vcache entry.
147  *      areq : Pointer to request structure.
148  *
149  * Environment:
150  *      Called with avc write-locked.
151  */
152 #if defined (AFS_HPUX_ENV)
153 int NCHUNKSATONCE = 3;
154 #else
155 int NCHUNKSATONCE = 64;
156 #endif
157 int afs_dvhack = 0;
158
159
160 int
161 afs_StoreAllSegments(register struct vcache *avc, struct vrequest *areq,
162                      int sync)
163 {
164     register struct dcache *tdc;
165     register afs_int32 code = 0;
166     register afs_int32 index;
167     register afs_int32 origCBs, foreign = 0;
168     int hash, stored;
169     afs_hyper_t newDV, oldDV;   /* DV when we start, and finish, respectively */
170     struct dcache **dcList, **dclist;
171     unsigned int i, j, minj, moredata, high, off;
172     afs_size_t tlen;
173     afs_size_t maxStoredLength; /* highest offset we've written to server. */
174     int safety;
175 #ifndef AFS_NOSTATS
176     struct afs_stats_xferData *xferP;   /* Ptr to this op's xfer struct */
177     osi_timeval_t xferStartTime,        /*FS xfer start time */
178       xferStopTime;             /*FS xfer stop time */
179     afs_size_t bytesToXfer;     /* # bytes to xfer */
180     afs_size_t bytesXferred;    /* # bytes actually xferred */
181 #endif /* AFS_NOSTATS */
182
183
184     AFS_STATCNT(afs_StoreAllSegments);
185
186     hset(oldDV, avc->m.DataVersion);
187     hset(newDV, avc->m.DataVersion);
188     hash = DVHash(&avc->fid);
189     foreign = (avc->states & CForeign);
190     dcList = (struct dcache **)osi_AllocLargeSpace(AFS_LRALLOCSIZ);
191     afs_Trace2(afs_iclSetp, CM_TRACE_STOREALL, ICL_TYPE_POINTER, avc,
192                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length));
193 #if !defined(AFS_AIX32_ENV) && !defined(AFS_SGI65_ENV)
194     /* In the aix vm implementation we need to do the vm_writep even
195      * on the memcache case since that's we adjust the file's size
196      * and finish flushing partial vm pages.
197      */
198     if (cacheDiskType != AFS_FCACHE_TYPE_MEM)
199 #endif /* !AFS_AIX32_ENV && !AFS_SGI65_ENV */
200     {
201         /* If we're not diskless, reading a file may stress the VM
202          * system enough to cause a pageout, and this vnode would be
203          * locked when the pageout occurs.  We can prevent this problem
204          * by making sure all dirty pages are already flushed.  We don't
205          * do this when diskless because reading a diskless (i.e.
206          * memory-resident) chunk doesn't require using new VM, and we
207          * also don't want to dump more dirty data into a diskless cache,
208          * since they're smaller, and we might exceed its available
209          * space.
210          */
211 #if     defined(AFS_SUN5_ENV)
212         if (sync & AFS_VMSYNC_INVAL)    /* invalidate VM pages */
213             osi_VM_TryToSmush(avc, CRED(), 1);
214         else
215 #endif
216             osi_VM_StoreAllSegments(avc);
217     }
218     if (AFS_IS_DISCONNECTED) {
219         if (!AFS_IS_LOGGING) {
220             /* This will probably make someone sad ... */
221             /*printf("Net down in afs_StoreSegments\n");*/
222             return ENETDOWN;
223         }
224     }
225     ConvertWToSLock(&avc->lock);
226
227     /*
228      * Subsequent code expects a sorted list, and it expects all the
229      * chunks in the list to be contiguous, so we need a sort and a
230      * while loop in here, too - but this will work for a first pass...
231      * 92.10.05 - OK, there's a sort in here now.  It's kind of a modified
232      *            bin sort, I guess.  Chunk numbers start with 0
233      *
234      * - Have to get a write lock on xdcache because GetDSlot might need it (if
235      *   the chunk doesn't have a dcache struct).
236      *   This seems like overkill in most cases.
237      * - I'm not sure that it's safe to do "index = .hvNextp", then unlock 
238      *   xdcache, then relock xdcache and try to use index.  It is done
239      *   a lot elsewhere in the CM, but I'm not buying that argument.
240      * - should be able to check IFDataMod without doing the GetDSlot (just
241      *   hold afs_xdcache).  That way, it's easy to do this without the
242      *   writelock on afs_xdcache, and we save unneccessary disk
243      *   operations. I don't think that works, 'cuz the next pointers 
244      *   are still on disk.
245      */
246     origCBs = afs_allCBs;
247
248     maxStoredLength = 0;
249     tlen = avc->m.Length;
250     minj = 0;
251
252     do {
253         memset((char *)dcList, 0, NCHUNKSATONCE * sizeof(struct dcache *));
254         high = 0;
255         moredata = FALSE;
256
257         /* lock and start over from beginning of hash chain 
258          * in order to avoid a race condition. */
259         MObtainWriteLock(&afs_xdcache, 284);
260         index = afs_dvhashTbl[hash];
261
262         for (j = 0; index != NULLIDX;) {
263             if ((afs_indexFlags[index] & IFDataMod)
264                 && (afs_indexUnique[index] == avc->fid.Fid.Unique)) {
265                 tdc = afs_GetDSlot(index, 0);   /* refcount+1. */
266                 ReleaseReadLock(&tdc->tlock);
267                 if (!FidCmp(&tdc->f.fid, &avc->fid) && tdc->f.chunk >= minj) {
268                     off = tdc->f.chunk - minj;
269                     if (off < NCHUNKSATONCE) {
270                         if (dcList[off])
271                             osi_Panic("dclist slot already in use!");
272                         dcList[off] = tdc;
273                         if (off > high)
274                             high = off;
275                         j++;
276                         /* DCLOCKXXX: chunkBytes is protected by tdc->lock which we
277                          * can't grab here, due to lock ordering with afs_xdcache.
278                          * So, disable this shortcut for now.  -- kolya 2001-10-13
279                          */
280                         /* shortcut: big win for little files */
281                         /* tlen -= tdc->f.chunkBytes;
282                          * if (tlen <= 0)
283                          *    break;
284                          */
285                     } else {
286                         moredata = TRUE;
287                         afs_PutDCache(tdc);
288                         if (j == NCHUNKSATONCE)
289                             break;
290                     }
291                 } else {
292                     afs_PutDCache(tdc);
293                 }
294             }
295             index = afs_dvnextTbl[index];
296         }
297         MReleaseWriteLock(&afs_xdcache);
298
299         /* this guy writes chunks, puts back dcache structs, and bumps newDV */
300         /* "moredata" just says "there are more dirty chunks yet to come".
301          */
302         if (j) {
303 #ifdef AFS_NOSTATS
304             static afs_uint32 lp1 = 10000, lp2 = 10000;
305 #endif
306             struct AFSStoreStatus InStatus;
307             struct AFSFetchStatus OutStatus;
308             int doProcessFS = 0;
309             afs_size_t base, bytes;
310             afs_uint32 nchunks;
311             int nomore;
312             unsigned int first = 0;
313             int *shouldwake;
314             struct conn *tc;
315             struct osi_file *tfile;
316             struct rx_call *tcall;
317             XSTATS_DECLS;
318             for (bytes = 0, j = 0; !code && j <= high; j++) {
319                 if (dcList[j]) {
320                     ObtainSharedLock(&(dcList[j]->lock), 629);
321                     if (!bytes)
322                         first = j;
323                     bytes += dcList[j]->f.chunkBytes;
324                     if ((dcList[j]->f.chunkBytes < afs_OtherCSize)
325                         && (dcList[j]->f.chunk - minj < high)
326                         && dcList[j + 1]) {
327                         int sbytes = afs_OtherCSize - dcList[j]->f.chunkBytes;
328                         bytes += sbytes;
329                     }
330                 }
331                 if (bytes && (j == high || !dcList[j + 1])) {
332                     /* base = AFS_CHUNKTOBASE(dcList[first]->f.chunk); */
333                     base = AFS_CHUNKTOBASE(first + minj);
334                     /*
335                      * 
336                      * take a list of dcache structs and send them all off to the server
337                      * the list must be in order, and the chunks contiguous.
338                      * Note - there is no locking done by this code currently.  For
339                      * safety's sake, xdcache could be locked over the entire call.
340                      * However, that pretty well ties up all the threads.  Meantime, all
341                      * the chunks _MUST_ have their refcounts bumped.
342                      * The writes done before a store back will clear setuid-ness
343                      * in cache file.
344                      * We can permit CacheStoreProc to wake up the user process IFF we 
345                      * are doing the last RPC for this close, ie, storing back the last 
346                      * set of contiguous chunks of a file.
347                      */
348
349                     dclist = &dcList[first];
350                     nchunks = 1 + j - first;
351                     nomore = !(moredata || (j != high));
352                     InStatus.ClientModTime = avc->m.Date;
353                     InStatus.Mask = AFS_SETMODTIME;
354                     if (sync & AFS_SYNC) {
355                         InStatus.Mask |= AFS_FSYNC;
356                     }
357                     tlen = lmin(avc->m.Length, avc->truncPos);
358                     afs_Trace4(afs_iclSetp, CM_TRACE_STOREDATA64,
359                                ICL_TYPE_FID, &avc->fid.Fid, ICL_TYPE_OFFSET,
360                                ICL_HANDLE_OFFSET(base), ICL_TYPE_OFFSET,
361                                ICL_HANDLE_OFFSET(bytes), ICL_TYPE_OFFSET,
362                                ICL_HANDLE_OFFSET(tlen));
363
364                     do {
365                         stored = 0;
366                         tc = afs_Conn(&avc->fid, areq, 0);
367                         if (tc) {
368                           restart:
369                             RX_AFS_GUNLOCK();
370                             tcall = rx_NewCall(tc->id);
371 #ifdef AFS_64BIT_CLIENT
372                             if (!afs_serverHasNo64Bit(tc)) {
373                                 code =
374                                     StartRXAFS_StoreData64(tcall,
375                                                            (struct AFSFid *)
376                                                            &avc->fid.Fid,
377                                                            &InStatus, base,
378                                                            bytes, tlen);
379                             } else {
380                                 if (tlen > 0xFFFFFFFF) {
381                                     code = EFBIG;
382                                 } else {
383                                     afs_int32 t1, t2, t3;
384                                     t1 = base;
385                                     t2 = bytes;
386                                     t3 = tlen;
387                                     code =
388                                         StartRXAFS_StoreData(tcall,
389                                                              (struct AFSFid *)
390                                                              &avc->fid.Fid,
391                                                              &InStatus, t1,
392                                                              t2, t3);
393                                 }
394                             }
395 #else /* AFS_64BIT_CLIENT */
396                             code =
397                                 StartRXAFS_StoreData(tcall,
398                                                      (struct AFSFid *)&avc->
399                                                      fid.Fid, &InStatus, base,
400                                                      bytes, tlen);
401 #endif /* AFS_64BIT_CLIENT */
402                             RX_AFS_GLOCK();
403                         } else {
404                             code = -1;
405                             tcall = NULL;
406                         }
407                         if (!code) {
408                             XSTATS_START_TIME(AFS_STATS_FS_RPCIDX_STOREDATA);
409                             avc->truncPos = AFS_NOTRUNC;
410                         }
411                         for (i = 0; i < nchunks && !code; i++) {
412                             tdc = dclist[i];
413                             if (!tdc) {
414                                 afs_warn("afs: missing dcache!\n");
415                                 storeallmissing++;
416                                 continue;       /* panic? */
417                             }
418                             afs_Trace4(afs_iclSetp, CM_TRACE_STOREALL2,
419                                        ICL_TYPE_POINTER, avc, ICL_TYPE_INT32,
420                                        tdc->f.chunk, ICL_TYPE_INT32,
421                                        tdc->index, ICL_TYPE_INT32,
422                                        tdc->f.inode);
423                             shouldwake = 0;
424                             if (nomore) {
425                                 if (avc->asynchrony == -1) {
426                                     if (afs_defaultAsynchrony >
427                                         (bytes - stored)) {
428                                         shouldwake = &nomore;
429                                     }
430                                 } else if ((afs_uint32) avc->asynchrony >=
431                                            (bytes - stored)) {
432                                     shouldwake = &nomore;
433                                 }
434                             }
435                             tfile = afs_CFileOpen(tdc->f.inode);
436 #ifndef AFS_NOSTATS
437                             xferP =
438                                 &(afs_stats_cmfullperf.rpc.
439                                   fsXferTimes
440                                   [AFS_STATS_FS_XFERIDX_STOREDATA]);
441                             osi_GetuTime(&xferStartTime);
442
443                             code =
444                                 afs_CacheStoreProc(tcall, tfile,
445                                                    tdc->f.chunkBytes, avc,
446                                                    shouldwake, &bytesToXfer,
447                                                    &bytesXferred);
448
449                             osi_GetuTime(&xferStopTime);
450                             (xferP->numXfers)++;
451                             if (!code) {
452                                 (xferP->numSuccesses)++;
453                                 afs_stats_XferSumBytes
454                                     [AFS_STATS_FS_XFERIDX_STOREDATA] +=
455                                     bytesXferred;
456                                 (xferP->sumBytes) +=
457                                     (afs_stats_XferSumBytes
458                                      [AFS_STATS_FS_XFERIDX_STOREDATA] >> 10);
459                                 afs_stats_XferSumBytes
460                                     [AFS_STATS_FS_XFERIDX_STOREDATA] &= 0x3FF;
461                                 if (bytesXferred < xferP->minBytes)
462                                     xferP->minBytes = bytesXferred;
463                                 if (bytesXferred > xferP->maxBytes)
464                                     xferP->maxBytes = bytesXferred;
465
466                                 /*
467                                  * Tally the size of the object.  Note: we tally the actual size,
468                                  * NOT the number of bytes that made it out over the wire.
469                                  */
470                                 if (bytesToXfer <= AFS_STATS_MAXBYTES_BUCKET0)
471                                     (xferP->count[0])++;
472                                 else if (bytesToXfer <=
473                                          AFS_STATS_MAXBYTES_BUCKET1)
474                                     (xferP->count[1])++;
475                                 else if (bytesToXfer <=
476                                          AFS_STATS_MAXBYTES_BUCKET2)
477                                     (xferP->count[2])++;
478                                 else if (bytesToXfer <=
479                                          AFS_STATS_MAXBYTES_BUCKET3)
480                                     (xferP->count[3])++;
481                                 else if (bytesToXfer <=
482                                          AFS_STATS_MAXBYTES_BUCKET4)
483                                     (xferP->count[4])++;
484                                 else if (bytesToXfer <=
485                                          AFS_STATS_MAXBYTES_BUCKET5)
486                                     (xferP->count[5])++;
487                                 else if (bytesToXfer <=
488                                          AFS_STATS_MAXBYTES_BUCKET6)
489                                     (xferP->count[6])++;
490                                 else if (bytesToXfer <=
491                                          AFS_STATS_MAXBYTES_BUCKET7)
492                                     (xferP->count[7])++;
493                                 else
494                                     (xferP->count[8])++;
495
496                                 afs_stats_GetDiff(elapsedTime, xferStartTime,
497                                                   xferStopTime);
498                                 afs_stats_AddTo((xferP->sumTime),
499                                                 elapsedTime);
500                                 afs_stats_SquareAddTo((xferP->sqrTime),
501                                                       elapsedTime);
502                                 if (afs_stats_TimeLessThan
503                                     (elapsedTime, (xferP->minTime))) {
504                                     afs_stats_TimeAssign((xferP->minTime),
505                                                          elapsedTime);
506                                 }
507                                 if (afs_stats_TimeGreaterThan
508                                     (elapsedTime, (xferP->maxTime))) {
509                                     afs_stats_TimeAssign((xferP->maxTime),
510                                                          elapsedTime);
511                                 }
512                             }
513 #else
514                             code =
515                                 afs_CacheStoreProc(tcall, tfile,
516                                                    tdc->f.chunkBytes, avc,
517                                                    shouldwake, &lp1, &lp2);
518 #endif /* AFS_NOSTATS */
519                             afs_CFileClose(tfile);
520                             if ((tdc->f.chunkBytes < afs_OtherCSize)
521                                 && (i < (nchunks - 1)) && code == 0) {
522                                 int bsent, tlen, sbytes =
523                                     afs_OtherCSize - tdc->f.chunkBytes;
524                                 char *tbuffer =
525                                     osi_AllocLargeSpace(AFS_LRALLOCSIZ);
526
527                                 while (sbytes > 0) {
528                                     tlen =
529                                         (sbytes >
530                                          AFS_LRALLOCSIZ ? AFS_LRALLOCSIZ :
531                                          sbytes);
532                                     memset(tbuffer, 0, tlen);
533                                     RX_AFS_GUNLOCK();
534                                     bsent = rx_Write(tcall, tbuffer, tlen);
535                                     RX_AFS_GLOCK();
536
537                                     if (bsent != tlen) {
538                                         code = -33;     /* XXX */
539                                         break;
540                                     }
541                                     sbytes -= tlen;
542                                 }
543                                 osi_FreeLargeSpace(tbuffer);
544                             }
545                             stored += tdc->f.chunkBytes;
546
547                             /* ideally, I'd like to unlock the dcache and turn
548                              * off the writing bit here, but that would
549                              * require being able to retry StoreAllSegments in
550                              * the event of a failure. It only really matters
551                              * if user can't read from a 'locked' dcache or
552                              * one which has the writing bit turned on. */
553                         }
554                         if (!code) {
555                             struct AFSVolSync tsync;
556                             RX_AFS_GUNLOCK();
557                             code =
558                                 EndRXAFS_StoreData(tcall, &OutStatus, &tsync);
559                             RX_AFS_GLOCK();
560                             hadd32(newDV, 1);
561                             XSTATS_END_TIME;
562                             if (!code)
563                                 doProcessFS = 1;        /* Flag to run afs_ProcessFS() later on */
564                         }
565                         if (tcall) {
566                             afs_int32 code2;
567                             RX_AFS_GUNLOCK();
568                             code2 = rx_EndCall(tcall, code);
569                             RX_AFS_GLOCK();
570                             if (code2)
571                                 code = code2;
572                         }
573 #ifdef AFS_64BIT_CLIENT
574                         if (code == RXGEN_OPCODE && !afs_serverHasNo64Bit(tc)) {
575                             afs_serverSetNo64Bit(tc);
576                             goto restart;
577                         }
578 #endif /* AFS_64BIT_CLIENT */
579                     } while (afs_Analyze
580                              (tc, code, &avc->fid, areq,
581                               AFS_STATS_FS_RPCIDX_STOREDATA, SHARED_LOCK,
582                               NULL));
583
584                     /* put back all remaining locked dcache entries */
585                     for (i = 0; i < nchunks; i++) {
586                         tdc = dclist[i];
587                         if (!code) {
588                             if (afs_indexFlags[tdc->index] & IFDataMod) {
589                                 /*
590                                  * LOCKXXX -- should hold afs_xdcache(W) when
591                                  * modifying afs_indexFlags.
592                                  */
593                                 afs_indexFlags[tdc->index] &= ~IFDataMod;
594                                 afs_stats_cmperf.cacheCurrDirtyChunks--;
595                                 afs_indexFlags[tdc->index] &= ~IFDirtyPages;
596                                 if (sync & AFS_VMSYNC_INVAL) {
597                                     /* since we have invalidated all the pages of this
598                                      ** vnode by calling osi_VM_TryToSmush, we can
599                                      ** safely mark this dcache entry as not having
600                                      ** any pages. This vnode now becomes eligible for
601                                      ** reclamation by getDownD.
602                                      */
603                                     afs_indexFlags[tdc->index] &= ~IFAnyPages;
604                                 }
605                             }
606                         }
607                         UpgradeSToWLock(&tdc->lock, 628);
608                         tdc->f.states &= ~DWriting;     /* correct? */
609                         tdc->dflags |= DFEntryMod;
610                         ReleaseWriteLock(&tdc->lock);
611                         afs_PutDCache(tdc);
612                         /* Mark the entry as released */
613                         dclist[i] = NULL;
614                     }
615
616                     if (doProcessFS) {
617                         /* Now copy out return params */
618                         UpgradeSToWLock(&avc->lock, 28);        /* keep out others for a while */
619                         afs_ProcessFS(avc, &OutStatus, areq);
620                         /* Keep last (max) size of file on server to see if
621                          * we need to call afs_StoreMini to extend the file.
622                          */
623                         if (!moredata)
624                             maxStoredLength = OutStatus.Length;
625                         ConvertWToSLock(&avc->lock);
626                         doProcessFS = 0;
627                     }
628
629                     if (code) {
630                         for (j++; j <= high; j++) {
631                             if (dcList[j]) {
632                                 ReleaseSharedLock(&(dcList[j]->lock));
633                                 afs_PutDCache(dcList[j]);
634                                 /* Releasing entry */
635                                 dcList[j] = NULL;
636                             }
637                         }
638                     }
639
640                     afs_Trace2(afs_iclSetp, CM_TRACE_STOREALLDCDONE,
641                                ICL_TYPE_POINTER, avc, ICL_TYPE_INT32, code);
642                     bytes = 0;
643                 }
644             }
645
646             /* Release any zero-length dcache entries in our interval
647              * that we locked but didn't store back above.
648              */
649             for (j = 0; j <= high; j++) {
650                 tdc = dcList[j];
651                 if (tdc) {
652                     osi_Assert(tdc->f.chunkBytes == 0);
653                     ReleaseSharedLock(&tdc->lock);
654                     afs_PutDCache(tdc);
655                 }
656             }
657         }
658         /* if (j) */
659         minj += NCHUNKSATONCE;
660     } while (!code && moredata);
661
662     UpgradeSToWLock(&avc->lock, 29);
663
664     /* send a trivial truncation store if did nothing else */
665     if (code == 0) {
666         /*
667          * Call StoreMini if we haven't written enough data to extend the
668          * file at the fileserver to the client's notion of the file length.
669          */
670         if ((avc->truncPos != AFS_NOTRUNC) || ((avc->states & CExtendedFile)
671                                                && (maxStoredLength <
672                                                    avc->m.Length))) {
673             code = afs_StoreMini(avc, areq);
674             if (code == 0)
675                 hadd32(newDV, 1);       /* just bumped here, too */
676         }
677         avc->states &= ~CExtendedFile;
678     }
679
680     /*
681      * Finally, turn off DWriting, turn on DFEntryMod,
682      * update f.versionNo.
683      * A lot of this could be integrated into the loop above 
684      */
685     if (!code) {
686         afs_hyper_t h_unset;
687         hones(h_unset);
688
689         minj = 0;
690
691         do {
692             moredata = FALSE;
693             memset((char *)dcList, 0,
694                    NCHUNKSATONCE * sizeof(struct dcache *));
695
696             /* overkill, but it gets the lock in case GetDSlot needs it */
697             MObtainWriteLock(&afs_xdcache, 285);
698
699             for (j = 0, safety = 0, index = afs_dvhashTbl[hash];
700                  index != NULLIDX && safety < afs_cacheFiles + 2;) {
701
702                 if (afs_indexUnique[index] == avc->fid.Fid.Unique) {
703                     tdc = afs_GetDSlot(index, 0);
704                     ReleaseReadLock(&tdc->tlock);
705
706                     if (!FidCmp(&tdc->f.fid, &avc->fid)
707                         && tdc->f.chunk >= minj) {
708                         off = tdc->f.chunk - minj;
709                         if (off < NCHUNKSATONCE) {
710                             /* this is the file, and the correct chunk range */
711                             if (j >= NCHUNKSATONCE)
712                                 osi_Panic
713                                     ("Too many dcache entries in range\n");
714                             dcList[j++] = tdc;
715                         } else {
716                             moredata = TRUE;
717                             afs_PutDCache(tdc);
718                             if (j == NCHUNKSATONCE)
719                                 break;
720                         }
721                     } else {
722                         afs_PutDCache(tdc);
723                     }
724                 }
725
726                 index = afs_dvnextTbl[index];
727             }
728             MReleaseWriteLock(&afs_xdcache);
729
730             for (i = 0; i < j; i++) {
731                 /* Iterate over the dcache entries we collected above */
732                 tdc = dcList[i];
733                 ObtainSharedLock(&tdc->lock, 677);
734
735                 /* was code here to clear IFDataMod, but it should only be done
736                  * in storedcache and storealldcache.
737                  */
738                 /* Only increase DV if we had up-to-date data to start with.
739                  * Otherwise, we could be falsely upgrading an old chunk
740                  * (that we never read) into one labelled with the current
741                  * DV #.  Also note that we check that no intervening stores
742                  * occurred, otherwise we might mislabel cache information
743                  * for a chunk that we didn't store this time
744                  */
745                 /* Don't update the version number if it's not yet set. */
746                 if (!hsame(tdc->f.versionNo, h_unset)
747                     && hcmp(tdc->f.versionNo, oldDV) >= 0) {
748
749                     if ((!(afs_dvhack || foreign)
750                          && hsame(avc->m.DataVersion, newDV))
751                         || ((afs_dvhack || foreign)
752                             && (origCBs == afs_allCBs))) {
753                         /* no error, this is the DV */
754
755                         UpgradeSToWLock(&tdc->lock, 678);
756                         hset(tdc->f.versionNo, avc->m.DataVersion);
757                         tdc->dflags |= DFEntryMod;
758                         ConvertWToSLock(&tdc->lock);
759                     }
760                 }
761
762                 ReleaseSharedLock(&tdc->lock);
763                 afs_PutDCache(tdc);
764             }
765
766             minj += NCHUNKSATONCE;
767
768         } while (moredata);
769     }
770
771     if (code) {
772         /*
773          * Invalidate chunks after an error for ccores files since
774          * afs_inactive won't be called for these and they won't be
775          * invalidated. Also discard data if it's a permanent error from the
776          * fileserver.
777          */
778         if (areq->permWriteError || (avc->states & (CCore1 | CCore))) {
779             afs_InvalidateAllSegments(avc);
780         }
781     }
782     afs_Trace3(afs_iclSetp, CM_TRACE_STOREALLDONE, ICL_TYPE_POINTER, avc,
783                ICL_TYPE_INT32, avc->m.Length, ICL_TYPE_INT32, code);
784     /* would like a Trace5, but it doesn't exist... */
785     afs_Trace3(afs_iclSetp, CM_TRACE_AVCLOCKER, ICL_TYPE_POINTER, avc,
786                ICL_TYPE_INT32, avc->lock.wait_states, ICL_TYPE_INT32,
787                avc->lock.excl_locked);
788     afs_Trace4(afs_iclSetp, CM_TRACE_AVCLOCKEE, ICL_TYPE_POINTER, avc,
789                ICL_TYPE_INT32, avc->lock.wait_states, ICL_TYPE_INT32,
790                avc->lock.readers_reading, ICL_TYPE_INT32,
791                avc->lock.num_waiting);
792
793     /*
794      * Finally, if updated DataVersion matches newDV, we did all of the
795      * stores.  If mapDV indicates that the page cache was flushed up
796      * to when we started the store, then we can relabel them as flushed
797      * as recently as newDV.
798      * Turn off CDirty bit because the stored data is now in sync with server.
799      */
800     if (code == 0 && hcmp(avc->mapDV, oldDV) >= 0) {
801         if ((!(afs_dvhack || foreign) && hsame(avc->m.DataVersion, newDV))
802             || ((afs_dvhack || foreign) && (origCBs == afs_allCBs))) {
803             hset(avc->mapDV, newDV);
804             avc->states &= ~CDirty;
805         }
806     }
807     osi_FreeLargeSpace(dcList);
808
809     /* If not the final write a temporary error is ok. */
810     if (code && !areq->permWriteError && !(sync & AFS_LASTSTORE))
811         code = 0;
812
813     return code;
814
815 }                               /*afs_StoreAllSegments (new 03/02/94) */
816
817
818 /*
819  * afs_InvalidateAllSegments
820  *
821  * Description:
822  *      Invalidates all chunks for a given file
823  *
824  * Parameters:
825  *      avc      : Pointer to vcache entry.
826  *
827  * Environment:
828  *      For example, called after an error has been detected.  Called
829  *      with avc write-locked, and afs_xdcache unheld.
830  */
831
832 int
833 afs_InvalidateAllSegments(struct vcache *avc)
834 {
835     struct dcache *tdc;
836     afs_int32 hash;
837     afs_int32 index;
838     struct dcache **dcList;
839     int i, dcListMax, dcListCount;
840
841     AFS_STATCNT(afs_InvalidateAllSegments);
842     afs_Trace2(afs_iclSetp, CM_TRACE_INVALL, ICL_TYPE_POINTER, avc,
843                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length));
844     hash = DVHash(&avc->fid);
845     avc->truncPos = AFS_NOTRUNC;        /* don't truncate later */
846     avc->states &= ~CExtendedFile;      /* not any more */
847     ObtainWriteLock(&afs_xcbhash, 459);
848     afs_DequeueCallback(avc);
849     avc->states &= ~(CStatd | CDirty);  /* mark status information as bad, too */
850     ReleaseWriteLock(&afs_xcbhash);
851     if (avc->fid.Fid.Vnode & 1 || (vType(avc) == VDIR))
852         osi_dnlc_purgedp(avc);
853     /* Blow away pages; for now, only for Solaris */
854 #if     (defined(AFS_SUN5_ENV))
855     if (WriteLocked(&avc->lock))
856         osi_ReleaseVM(avc, (struct AFS_UCRED *)0);
857 #endif
858     /*
859      * Block out others from screwing with this table; is a read lock
860      * sufficient?
861      */
862     MObtainWriteLock(&afs_xdcache, 286);
863     dcListMax = 0;
864
865     for (index = afs_dvhashTbl[hash]; index != NULLIDX;) {
866         if (afs_indexUnique[index] == avc->fid.Fid.Unique) {
867             tdc = afs_GetDSlot(index, 0);
868             ReleaseReadLock(&tdc->tlock);
869             if (!FidCmp(&tdc->f.fid, &avc->fid))
870                 dcListMax++;
871             afs_PutDCache(tdc);
872         }
873         index = afs_dvnextTbl[index];
874     }
875
876     dcList = osi_Alloc(dcListMax * sizeof(struct dcache *));
877     dcListCount = 0;
878
879     for (index = afs_dvhashTbl[hash]; index != NULLIDX;) {
880         if (afs_indexUnique[index] == avc->fid.Fid.Unique) {
881             tdc = afs_GetDSlot(index, 0);
882             ReleaseReadLock(&tdc->tlock);
883             if (!FidCmp(&tdc->f.fid, &avc->fid)) {
884                 /* same file? we'll zap it */
885                 if (afs_indexFlags[index] & IFDataMod) {
886                     afs_stats_cmperf.cacheCurrDirtyChunks--;
887                     /* don't write it back */
888                     afs_indexFlags[index] &= ~IFDataMod;
889                 }
890                 afs_indexFlags[index] &= ~IFAnyPages;
891                 if (dcListCount < dcListMax)
892                     dcList[dcListCount++] = tdc;
893                 else
894                     afs_PutDCache(tdc);
895             } else {
896                 afs_PutDCache(tdc);
897             }
898         }
899         index = afs_dvnextTbl[index];
900     }
901     MReleaseWriteLock(&afs_xdcache);
902
903     for (i = 0; i < dcListCount; i++) {
904         tdc = dcList[i];
905
906         ObtainWriteLock(&tdc->lock, 679);
907         ZapDCE(tdc);
908         if (vType(avc) == VDIR)
909             DZap(tdc);
910         ReleaseWriteLock(&tdc->lock);
911         afs_PutDCache(tdc);
912     }
913
914     osi_Free(dcList, dcListMax * sizeof(struct dcache *));
915
916     return 0;
917 }
918
919
920 /*
921  * afs_TruncateAllSegments
922  *
923  * Description:
924  *      Truncate a cache file.
925  *
926  * Parameters:
927  *      avc  : Ptr to vcache entry to truncate.
928  *      alen : Number of bytes to make the file.
929  *      areq : Ptr to request structure.
930  *
931  * Environment:
932  *      Called with avc write-locked; in VFS40 systems, pvnLock is also
933  *      held.
934  */
935 int
936 afs_TruncateAllSegments(register struct vcache *avc, afs_size_t alen,
937                         struct vrequest *areq, struct AFS_UCRED *acred)
938 {
939     register struct dcache *tdc;
940     register afs_int32 code;
941     register afs_int32 index;
942     afs_int32 newSize;
943
944     int dcCount, dcPos;
945     struct dcache **tdcArray;
946
947     AFS_STATCNT(afs_TruncateAllSegments);
948     avc->m.Date = osi_Time();
949     afs_Trace3(afs_iclSetp, CM_TRACE_TRUNCALL, ICL_TYPE_POINTER, avc,
950                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(avc->m.Length),
951                ICL_TYPE_OFFSET, ICL_HANDLE_OFFSET(alen));
952     if (alen >= avc->m.Length) {
953         /*
954          * Special speedup since Sun's vm extends the file this way;
955          * we've never written to the file thus we can just set the new
956          * length and avoid the needless calls below.
957          * Also used for ftruncate calls which can extend the file.
958          * To completely minimize the possible extra StoreMini RPC, we really
959          * should keep the ExtendedPos as well and clear this flag if we
960          * truncate below that value before we store the file back.
961          */
962         avc->states |= CExtendedFile;
963         avc->m.Length = alen;
964         return 0;
965     }
966 #if     (defined(AFS_SUN5_ENV))
967
968     /* Zero unused portion of last page */
969     osi_VM_PreTruncate(avc, alen, acred);
970
971 #endif
972
973 #if     (defined(AFS_SUN5_ENV))
974     ObtainWriteLock(&avc->vlock, 546);
975     avc->activeV++;             /* Block new getpages */
976     ReleaseWriteLock(&avc->vlock);
977 #endif
978
979     ReleaseWriteLock(&avc->lock);
980     AFS_GUNLOCK();
981
982     /* Flush pages beyond end-of-file. */
983     osi_VM_Truncate(avc, alen, acred);
984
985     AFS_GLOCK();
986     ObtainWriteLock(&avc->lock, 79);
987
988     avc->m.Length = alen;
989
990     if (alen < avc->truncPos)
991         avc->truncPos = alen;
992     code = DVHash(&avc->fid);
993
994     /* block out others from screwing with this table */
995     MObtainWriteLock(&afs_xdcache, 287);
996
997     dcCount = 0;
998     for (index = afs_dvhashTbl[code]; index != NULLIDX;) {
999         if (afs_indexUnique[index] == avc->fid.Fid.Unique) {
1000             tdc = afs_GetDSlot(index, 0);
1001             ReleaseReadLock(&tdc->tlock);
1002             if (!FidCmp(&tdc->f.fid, &avc->fid))
1003                 dcCount++;
1004             afs_PutDCache(tdc);
1005         }
1006         index = afs_dvnextTbl[index];
1007     }
1008
1009     /* Now allocate space where we can save those dcache entries, and
1010      * do a second pass over them..  Since we're holding xdcache, it
1011      * shouldn't be changing.
1012      */
1013     tdcArray = osi_Alloc(dcCount * sizeof(struct dcache *));
1014     dcPos = 0;
1015
1016     for (index = afs_dvhashTbl[code]; index != NULLIDX;) {
1017         if (afs_indexUnique[index] == avc->fid.Fid.Unique) {
1018             tdc = afs_GetDSlot(index, 0);
1019             ReleaseReadLock(&tdc->tlock);
1020             if (!FidCmp(&tdc->f.fid, &avc->fid)) {
1021                 /* same file, and modified, we'll store it back */
1022                 if (dcPos < dcCount) {
1023                     tdcArray[dcPos++] = tdc;
1024                 } else {
1025                     afs_PutDCache(tdc);
1026                 }
1027             } else {
1028                 afs_PutDCache(tdc);
1029             }
1030         }
1031         index = afs_dvnextTbl[index];
1032     }
1033
1034     MReleaseWriteLock(&afs_xdcache);
1035
1036     /* Now we loop over the array of dcache entries and truncate them */
1037     for (index = 0; index < dcPos; index++) {
1038         struct osi_file *tfile;
1039
1040         tdc = tdcArray[index];
1041
1042         newSize = alen - AFS_CHUNKTOBASE(tdc->f.chunk);
1043         if (newSize < 0)
1044             newSize = 0;
1045         ObtainSharedLock(&tdc->lock, 672);
1046         if (newSize < tdc->f.chunkBytes) {
1047             UpgradeSToWLock(&tdc->lock, 673);
1048             tfile = afs_CFileOpen(tdc->f.inode);
1049             afs_CFileTruncate(tfile, newSize);
1050             afs_CFileClose(tfile);
1051             afs_AdjustSize(tdc, newSize);
1052             if (alen < tdc->validPos) {
1053                 if (alen < AFS_CHUNKTOBASE(tdc->f.chunk))
1054                     tdc->validPos = 0;
1055                 else
1056                     tdc->validPos = alen;
1057             }
1058             ConvertWToSLock(&tdc->lock);
1059         }
1060         ReleaseSharedLock(&tdc->lock);
1061         afs_PutDCache(tdc);
1062     }
1063
1064     osi_Free(tdcArray, dcCount * sizeof(struct dcache *));
1065
1066 #if     (defined(AFS_SUN5_ENV))
1067     ObtainWriteLock(&avc->vlock, 547);
1068     if (--avc->activeV == 0 && (avc->vstates & VRevokeWait)) {
1069         avc->vstates &= ~VRevokeWait;
1070         afs_osi_Wakeup((char *)&avc->vstates);
1071     }
1072     ReleaseWriteLock(&avc->vlock);
1073 #endif
1074     return 0;
1075 }