windows-vnovol-20080911
[openafs.git] / src / WINNT / afsd / cm_volume.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afs/param.h>
11 #include <afs/stds.h>
12
13 #include <windows.h>
14 #include <winsock2.h>
15 #include <nb30.h>
16 #include <string.h>
17 #include <malloc.h>
18 #include "afsd.h"
19 #include <osi.h>
20 #include <rx/rx.h>
21
22 osi_rwlock_t cm_volumeLock;
23
24 long 
25 cm_ValidateVolume(void)
26 {
27     cm_volume_t * volp;
28     afs_uint32 count;
29
30     for (volp = cm_data.allVolumesp, count = 0; volp; volp=volp->allNextp, count++) {
31         if ( volp->magic != CM_VOLUME_MAGIC ) {
32             afsi_log("cm_ValidateVolume failure: volp->magic != CM_VOLUME_MAGIC");
33             fprintf(stderr, "cm_ValidateVolume failure: volp->magic != CM_VOLUME_MAGIC\n");
34             return -1;
35         }
36         if ( volp->cellp && volp->cellp->magic != CM_CELL_MAGIC ) {
37             afsi_log("cm_ValidateVolume failure: volp->cellp->magic != CM_CELL_MAGIC");
38             fprintf(stderr, "cm_ValidateVolume failure: volp->cellp->magic != CM_CELL_MAGIC\n");
39             return -2;
40         }
41         if ( volp->allNextp && volp->allNextp->magic != CM_VOLUME_MAGIC ) {
42             afsi_log("cm_ValidateVolume failure: volp->allNextp->magic != CM_VOLUME_MAGIC");
43             fprintf(stderr, "cm_ValidateVolume failure: volp->allNextp->magic != CM_VOLUME_MAGIC\n");
44             return -3;
45         }
46         if ( count != 0 && volp == cm_data.allVolumesp || 
47              count > cm_data.maxVolumes ) {
48             afsi_log("cm_ValidateVolume failure: cm_data.allVolumep loop detected");
49             fprintf(stderr, "cm_ValidateVolume failure: cm_data.allVolumep loop detected\n");
50             return -4;
51         }
52     }
53
54     if ( count != cm_data.currentVolumes ) {
55         afsi_log("cm_ValidateVolume failure: count != cm_data.currentVolumes");
56         fprintf(stderr, "cm_ValidateVolume failure: count != cm_data.currentVolumes\n");
57         return -5;
58     }
59     
60     return 0;
61 }
62
63 long
64 cm_ShutdownVolume(void)
65 {
66     cm_volume_t * volp;
67
68     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
69         afs_uint32 volType;
70         for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
71             if (volp->vol[volType].ID)
72                 cm_VolumeStatusNotification(volp, volp->vol[volType].ID, volp->vol[volType].state, vl_alldown);
73         }
74         volp->cbExpiresRO = 0;
75         lock_FinalizeRWLock(&volp->rw);
76     }
77
78     return 0;
79 }
80
81 void cm_InitVolume(int newFile, long maxVols)
82 {
83     static osi_once_t once;
84
85     if (osi_Once(&once)) {
86         lock_InitializeRWLock(&cm_volumeLock, "cm global volume lock", LOCK_HIERARCHY_VOLUME_GLOBAL);
87
88         if ( newFile ) {
89             cm_data.allVolumesp = NULL;
90             cm_data.currentVolumes = 0;
91             cm_data.maxVolumes = maxVols;
92             memset(cm_data.volumeNameHashTablep, 0, sizeof(cm_volume_t *) * cm_data.volumeHashTableSize);
93             memset(cm_data.volumeRWIDHashTablep, 0, sizeof(cm_volume_t *) * cm_data.volumeHashTableSize);
94             memset(cm_data.volumeROIDHashTablep, 0, sizeof(cm_volume_t *) * cm_data.volumeHashTableSize);
95             memset(cm_data.volumeBKIDHashTablep, 0, sizeof(cm_volume_t *) * cm_data.volumeHashTableSize);
96             cm_data.volumeLRUFirstp = cm_data.volumeLRULastp = NULL;
97         } else {
98             cm_volume_t * volp;
99
100             for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
101                 afs_uint32 volType;
102
103                 lock_InitializeRWLock(&volp->rw, "cm_volume_t rwlock", LOCK_HIERARCHY_VOLUME);
104                 volp->flags |= CM_VOLUMEFLAG_RESET;
105                 volp->flags &= ~CM_VOLUMEFLAG_UPDATING_VL;
106                 for (volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
107                     volp->vol[volType].state = vl_unknown;
108                     volp->vol[volType].serversp = NULL;
109                     if (volp->vol[volType].ID)
110                         cm_VolumeStatusNotification(volp, volp->vol[volType].ID, vl_unknown, volp->vol[volType].state);
111                 }
112                 volp->cbExpiresRO = 0;
113             }
114         }
115         osi_EndOnce(&once);
116     }
117 }
118
119
120 /* returns true if the id is a decimal integer, in which case we interpret it
121  * as an id.  make the cache manager much simpler.  
122  * Stolen from src/volser/vlprocs.c */
123 int
124 cm_VolNameIsID(char *aname)
125 {
126     int tc;
127     while (tc = *aname++) {
128         if (tc > '9' || tc < '0')
129             return 0;
130     }
131     return 1;
132 }
133
134
135 /*
136  * Update a volume.  Caller holds a write lock on the volume (volp->rw).
137  *
138  *
139  *  shadow / openafs / jhutz@CS.CMU.EDU {ANDREW.CMU.EDU}  01:38    (JHutz)
140  *    Yes, we support multihomed fileservers.
141  *    Since before we got the code from IBM.
142  *    But to find out about multiple addresses on a multihomed server, you need
143  *    to use VL_GetEntryByNameU and VL_GetAddrsU.  If you use
144  *    VL_GetEntryByNameO or VL_GetEntryByNameN, the vlserver just gives you one
145  *    address per server.
146  *  shadow / openafs / jhutz@CS.CMU.EDU {ANDREW.CMU.EDU}  01:39    (JHutz)
147  *    see src/afs/afs_volume.c, paying particular attention to
148  *    afs_NewVolumeByName, afs_SetupVolume, and InstallUVolumeEntry
149  *  shadow / openafs / jaltman {ANDREW.CMU.EDU}  01:40    (Jeffrey Altman)
150  *    thanks.  The windows client calls the 0 versions.
151  *  shadow / openafs / jhutz@CS.CMU.EDU {ANDREW.CMU.EDU}  01:51    (JHutz)
152  *    Oh.  Ew.
153  *    By not using the N versions, you only get up to 8 sites instead of 13.
154  *    By not using the U versions, you don't get to know about multihomed serve
155  *  shadow / openafs / jhutz@CS.CMU.EDU {ANDREW.CMU.EDU}  01:52    (JHutz)
156  *    Of course, you probably want to support the older versions for backward
157  *    compatibility.  If you do that, you need to call the newest interface
158  *    first, and fall back to successively older versions if you get
159  *    RXGEN_OPCODE.
160  */
161 #define MULTIHOMED 1
162 long cm_UpdateVolumeLocation(struct cm_cell *cellp, cm_user_t *userp, cm_req_t *reqp,
163                      cm_volume_t *volp)
164 {
165     cm_conn_t *connp;
166     int i, j, k;
167     cm_serverRef_t *tsrp;
168     cm_server_t *tsp;
169     struct sockaddr_in tsockAddr;
170     long tflags;
171     u_long tempAddr;
172     struct vldbentry vldbEntry;
173     struct nvldbentry nvldbEntry;
174 #ifdef MULTIHOMED
175     struct uvldbentry uvldbEntry;
176 #endif
177     int method = -1;
178     int ROcount = 0;
179     long code;
180     enum volstatus rwNewstate = vl_online;
181     enum volstatus roNewstate = vl_online;
182     enum volstatus bkNewstate = vl_online;
183 #ifdef AFS_FREELANCE_CLIENT
184     int freelance = 0;
185 #endif
186     afs_uint32 volType;
187
188     lock_AssertWrite(&volp->rw);
189
190 #ifdef AFS_FREELANCE_CLIENT
191     if ( cellp->cellID == AFS_FAKE_ROOT_CELL_ID && volp->vol[RWVOL].ID == AFS_FAKE_ROOT_VOL_ID ) 
192     {
193         freelance = 1;
194         memset(&vldbEntry, 0, sizeof(vldbEntry));
195         vldbEntry.flags |= VLF_RWEXISTS;
196         vldbEntry.volumeId[0] = AFS_FAKE_ROOT_VOL_ID;
197         code = 0;
198         method = 0;
199     } else
200 #endif
201     {
202         while (volp->flags & CM_VOLUMEFLAG_UPDATING_VL) {
203             osi_Log3(afsd_logp, "cm_UpdateVolumeLocation sleeping name %s:%s flags 0x%x", 
204                      volp->cellp->name, volp->namep, volp->flags);
205             osi_SleepW((LONG_PTR) &volp->flags, &volp->rw);
206             lock_ObtainWrite(&volp->rw);
207             osi_Log3(afsd_logp, "cm_UpdateVolumeLocation awake name %s:%s flags 0x%x", 
208                      volp->cellp->name, volp->namep, volp->flags);
209             if (!(volp->flags & CM_VOLUMEFLAG_RESET)) {
210                 osi_Log3(afsd_logp, "cm_UpdateVolumeLocation nothing to do, waking others name %s:%s flags 0x%x", 
211                          volp->cellp->name, volp->namep, volp->flags);
212                 osi_Wakeup((LONG_PTR) &volp->flags);
213                 return 0;
214             }
215         }
216
217         /* clear out old bindings */
218         for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
219             if (volp->vol[volType].serversp)
220                 cm_FreeServerList(&volp->vol[volType].serversp, CM_FREESERVERLIST_DELETE);
221         }
222
223         volp->flags |= CM_VOLUMEFLAG_UPDATING_VL;
224         lock_ReleaseWrite(&volp->rw);
225
226         if (cellp->flags & CM_CELLFLAG_VLSERVER_INVALID)
227             cm_UpdateCell(cellp, 0);
228
229         /* now we have volume structure locked and held; make RPC to fill it */
230         osi_Log2(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s", volp->cellp->name, volp->namep);
231         do {
232             struct rx_connection * rxconnp;
233
234             code = cm_ConnByMServers(cellp->vlServersp, userp, reqp, &connp);
235             if (code) 
236                 continue;
237
238             rxconnp = cm_GetRxConn(connp);
239 #ifdef MULTIHOMED
240             code = VL_GetEntryByNameU(rxconnp, volp->namep, &uvldbEntry);
241             method = 2;
242             if ( code == RXGEN_OPCODE ) 
243 #endif
244             {
245                 code = VL_GetEntryByNameN(rxconnp, volp->namep, &nvldbEntry);
246                 method = 1;
247             }
248             if ( code == RXGEN_OPCODE ) {
249                 code = VL_GetEntryByNameO(rxconnp, volp->namep, &vldbEntry);
250                 method = 0;
251             }
252             rx_PutConnection(rxconnp);
253         } while (cm_Analyze(connp, userp, reqp, NULL, NULL, cellp->vlServersp, NULL, code));
254         code = cm_MapVLRPCError(code, reqp);
255         if ( code )
256             osi_Log3(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s FAILURE, code 0x%x", 
257                       volp->cellp->name, volp->namep, code);
258         else
259             osi_Log2(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s SUCCESS", 
260                       volp->cellp->name, volp->namep);
261     }
262
263     /* We can end up here with code == CM_ERROR_NOSUCHVOLUME if the base volume name
264      * does not exist but there might exist a .readonly volume.  If the base name 
265      * doesn't exist we will not care about the .backup that might be left behind
266      * since there should be no method to access it.  
267      */
268     if (code == CM_ERROR_NOSUCHVOLUME && volp->vol[RWVOL].ID == 0 && strlen(volp->namep) < (VL_MAXNAMELEN - 9)) {
269         char name[VL_MAXNAMELEN];
270
271         snprintf(name, VL_MAXNAMELEN, "%s.readonly", volp->namep);
272                 
273         /* now we have volume structure locked and held; make RPC to fill it */
274         osi_Log2(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s", volp->cellp->name, 
275                  osi_LogSaveString(afsd_logp,name));
276         do {
277             struct rx_connection * rxconnp;
278
279             code = cm_ConnByMServers(cellp->vlServersp, userp, reqp, &connp);
280             if (code) 
281                 continue;
282
283             rxconnp = cm_GetRxConn(connp);
284 #ifdef MULTIHOMED
285             code = VL_GetEntryByNameU(connp->rxconnp, name, &uvldbEntry);
286             method = 2;
287             if ( code == RXGEN_OPCODE ) 
288 #endif
289             {
290                 code = VL_GetEntryByNameN(connp->rxconnp, name, &nvldbEntry);
291                 method = 1;
292             }
293             if ( code == RXGEN_OPCODE ) {
294                 code = VL_GetEntryByNameO(connp->rxconnp, name, &vldbEntry);
295                 method = 0;
296             }
297             rx_PutConnection(rxconnp);
298         } while (cm_Analyze(connp, userp, reqp, NULL, NULL, cellp->vlServersp, NULL, code));
299         code = cm_MapVLRPCError(code, reqp);
300         if ( code )
301             osi_Log3(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s FAILURE, code 0x%x", 
302                       volp->cellp->name, osi_LogSaveString(afsd_logp,name), code);
303         else
304             osi_Log2(afsd_logp, "CALL VL_GetEntryByName{UNO} name %s:%s SUCCESS", 
305                       volp->cellp->name, osi_LogSaveString(afsd_logp,name));
306     }
307     
308     lock_ObtainWrite(&volp->rw);
309     if (code == 0) {
310         afs_int32 flags;
311         afs_int32 nServers;
312         afs_int32 rwID;
313         afs_int32 roID;
314         afs_int32 bkID;
315         afs_int32 serverNumber[NMAXNSERVERS];
316         afs_int32 serverFlags[NMAXNSERVERS];
317         afs_int32 rwServers_alldown = 1;
318         afs_int32 roServers_alldown = 1;
319         afs_int32 bkServers_alldown = 1;
320         char      name[VL_MAXNAMELEN];
321
322 #ifdef AFS_FREELANCE_CLIENT
323         if (freelance)
324             rwServers_alldown = 0;
325 #endif
326
327         switch ( method ) {
328         case 0:
329             flags = vldbEntry.flags;
330             nServers = vldbEntry.nServers;
331             rwID = vldbEntry.volumeId[0];
332             roID = vldbEntry.volumeId[1];
333             bkID = vldbEntry.volumeId[2];
334             for ( i=0; i<nServers; i++ ) {
335                 serverFlags[i] = vldbEntry.serverFlags[i];
336                 serverNumber[i] = vldbEntry.serverNumber[i];
337             }
338             strncpy(name, vldbEntry.name, VL_MAXNAMELEN);
339             name[VL_MAXNAMELEN - 1] = '\0';
340             break;
341         case 1:
342             flags = nvldbEntry.flags;
343             nServers = nvldbEntry.nServers;
344             rwID = nvldbEntry.volumeId[0];
345             roID = nvldbEntry.volumeId[1];
346             bkID = nvldbEntry.volumeId[2];
347             for ( i=0; i<nServers; i++ ) {
348                 serverFlags[i] = nvldbEntry.serverFlags[i];
349                 serverNumber[i] = nvldbEntry.serverNumber[i];
350             }
351             strncpy(name, nvldbEntry.name, VL_MAXNAMELEN);
352             name[VL_MAXNAMELEN - 1] = '\0';
353             break;
354 #ifdef MULTIHOMED
355         case 2:
356             flags = uvldbEntry.flags;
357             nServers = uvldbEntry.nServers;
358             rwID = uvldbEntry.volumeId[0];
359             roID = uvldbEntry.volumeId[1];
360             bkID = uvldbEntry.volumeId[2];
361             for ( i=0, j=0; code == 0 && i<nServers && j<NMAXNSERVERS; i++ ) {
362                 if ( !(uvldbEntry.serverFlags[i] & VLSERVER_FLAG_UUID) ) {
363                     serverFlags[j] = uvldbEntry.serverFlags[i];
364                     serverNumber[j] = uvldbEntry.serverNumber[i].time_low;
365                     j++;
366                 } else {
367                     afs_uint32 * addrp, nentries, code, unique;
368                     bulkaddrs  addrs;
369                     ListAddrByAttributes attrs;
370                     afsUUID uuid;
371
372                     memset((char *)&attrs, 0, sizeof(attrs));
373                     attrs.Mask = VLADDR_UUID;
374                     attrs.uuid = uvldbEntry.serverNumber[i];
375                     memset((char *)&uuid, 0, sizeof(uuid));
376                     memset((char *)&addrs, 0, sizeof(addrs));
377
378                     do {
379                         struct rx_connection *rxconnp;
380
381                         code = cm_ConnByMServers(cellp->vlServersp, userp, reqp, &connp);
382                         if (code) 
383                             continue;
384                    
385                         rxconnp = cm_GetRxConn(connp);
386                         code = VL_GetAddrsU(rxconnp, &attrs, &uuid, &unique, &nentries, &addrs);
387                         rx_PutConnection(rxconnp);
388                     } while (cm_Analyze(connp, userp, reqp, NULL, NULL, cellp->vlServersp, NULL, code));
389
390                     if ( code ) {
391                         code = cm_MapVLRPCError(code, reqp);
392                         osi_Log2(afsd_logp, "CALL VL_GetAddrsU serverNumber %u FAILURE, code 0x%x", 
393                                  i, code);
394                         continue;
395                     } 
396                     osi_Log1(afsd_logp, "CALL VL_GetAddrsU serverNumber %u SUCCESS", i);
397
398                     addrp = addrs.bulkaddrs_val;
399                     for (k = 0; k < nentries && j < NMAXNSERVERS; j++, k++) {
400                         serverFlags[j] = uvldbEntry.serverFlags[i];
401                         serverNumber[j] = addrp[k];
402                     }
403
404                     free(addrs.bulkaddrs_val);  /* This is wrong */
405
406                     if (nentries == 0)
407                         code = CM_ERROR_INVAL;
408                 }
409             }
410             nServers = j;                                       /* update the server count */
411             strncpy(name, uvldbEntry.name, VL_MAXNAMELEN);
412             name[VL_MAXNAMELEN - 1] = '\0';
413             break;
414 #endif
415         }
416
417         /* decode the response */
418         lock_ObtainWrite(&cm_volumeLock);
419         if (cm_VolNameIsID(volp->namep)) {
420             size_t    len;
421
422             len = strlen(name);
423
424             if (len >= 8 && strcmp(name + len - 7, ".backup") == 0) {
425                 name[len - 7] = '\0';
426             } else if (len >= 10 && strcmp(name + len - 9, ".readonly") == 0) {
427                 name[len - 9] = '\0';
428             }
429             
430             osi_Log2(afsd_logp, "cm_UpdateVolume name %s -> %s", volp->namep, name);
431
432             if (volp->flags & CM_VOLUMEFLAG_IN_HASH)
433                 cm_RemoveVolumeFromNameHashTable(volp);
434
435             strcpy(volp->namep, name);
436
437             cm_AddVolumeToNameHashTable(volp);
438         }
439
440         if (flags & VLF_RWEXISTS) {
441             if (volp->vol[RWVOL].ID != rwID) {
442                 if (volp->vol[RWVOL].flags & CM_VOLUMEFLAG_IN_HASH)
443                     cm_RemoveVolumeFromIDHashTable(volp, RWVOL);
444                 volp->vol[RWVOL].ID = rwID;
445                 cm_AddVolumeToIDHashTable(volp, RWVOL);
446             }
447         } else {
448             if (volp->vol[RWVOL].flags & CM_VOLUMEFLAG_IN_HASH)
449                 cm_RemoveVolumeFromIDHashTable(volp, RWVOL);
450             volp->vol[RWVOL].ID = 0;
451         }
452         if (flags & VLF_ROEXISTS) {
453             if (volp->vol[ROVOL].ID != roID) {
454                 if (volp->vol[ROVOL].flags & CM_VOLUMEFLAG_IN_HASH)
455                     cm_RemoveVolumeFromIDHashTable(volp, ROVOL);
456                 volp->vol[ROVOL].ID = roID;
457                 cm_AddVolumeToIDHashTable(volp, ROVOL);
458             }
459         } else {
460             if (volp->vol[ROVOL].flags & CM_VOLUMEFLAG_IN_HASH)
461                 cm_RemoveVolumeFromIDHashTable(volp, ROVOL);
462             volp->vol[ROVOL].ID = 0;
463         }
464         if (flags & VLF_BACKEXISTS) {
465             if (volp->vol[BACKVOL].ID != bkID) {
466                 if (volp->vol[BACKVOL].flags & CM_VOLUMEFLAG_IN_HASH)
467                     cm_RemoveVolumeFromIDHashTable(volp, BACKVOL);
468                 volp->vol[BACKVOL].ID = bkID;
469                 cm_AddVolumeToIDHashTable(volp, BACKVOL);
470             }
471         } else {
472             if (volp->vol[BACKVOL].flags & CM_VOLUMEFLAG_IN_HASH)
473                 cm_RemoveVolumeFromIDHashTable(volp, BACKVOL);
474             volp->vol[BACKVOL].ID = 0;
475         }
476         lock_ReleaseWrite(&cm_volumeLock);
477         for (i=0; i<nServers; i++) {
478             /* create a server entry */
479             tflags = serverFlags[i];
480             if (tflags & VLSF_DONTUSE) 
481                 continue;
482             tsockAddr.sin_family = AF_INET;
483             tempAddr = htonl(serverNumber[i]);
484             tsockAddr.sin_addr.s_addr = tempAddr;
485             tsp = cm_FindServer(&tsockAddr, CM_SERVER_FILE);
486             if (!tsp) {
487                 /* cm_NewServer will probe the server which in turn will
488                  * update the state on the volume group object */
489                 lock_ReleaseWrite(&volp->rw);
490                 tsp = cm_NewServer(&tsockAddr, CM_SERVER_FILE, cellp, 0);
491                 lock_ObtainWrite(&volp->rw);
492             }
493             /* if this server was created by fs setserverprefs */
494             if ( !tsp->cellp ) 
495                 tsp->cellp = cellp;
496
497             osi_assertx(tsp != NULL, "null cm_server_t");
498                         
499             /* and add it to the list(s). */
500             /*
501              * Each call to cm_NewServerRef() increments the
502              * ref count of tsp.  These reference will be dropped,
503              * if and when the volume is reset; see reset code
504              * earlier in this function.
505              */
506             if ((tflags & VLSF_RWVOL) && (flags & VLF_RWEXISTS)) {
507                 tsrp = cm_NewServerRef(tsp, rwID);
508                 cm_InsertServerList(&volp->vol[RWVOL].serversp, tsrp);
509
510                 lock_ObtainWrite(&cm_serverLock);
511                 tsrp->refCount--;       /* drop allocation reference */
512                 lock_ReleaseWrite(&cm_serverLock);
513
514                 if (!(tsp->flags & CM_SERVERFLAG_DOWN))
515                     rwServers_alldown = 0;
516             }
517             if ((tflags & VLSF_ROVOL) && (flags & VLF_ROEXISTS)) {
518                 tsrp = cm_NewServerRef(tsp, roID);
519                 cm_InsertServerList(&volp->vol[ROVOL].serversp, tsrp);
520                 lock_ObtainWrite(&cm_serverLock);
521                 tsrp->refCount--;       /* drop allocation reference */
522                 lock_ReleaseWrite(&cm_serverLock);
523                 ROcount++;
524
525                 if (!(tsp->flags & CM_SERVERFLAG_DOWN))
526                     roServers_alldown = 0;
527             }
528             /* We don't use VLSF_BACKVOL !?! */
529             /* Because only the backup on the server holding the RW 
530              * volume can be valid.  This check prevents errors if a
531              * RW is moved but the old backup is not removed.
532              */
533             if ((tflags & VLSF_RWVOL) && (flags & VLF_BACKEXISTS)) {
534                 tsrp = cm_NewServerRef(tsp, bkID);
535                 cm_InsertServerList(&volp->vol[BACKVOL].serversp, tsrp);
536                 lock_ObtainWrite(&cm_serverLock);
537                 tsrp->refCount--;       /* drop allocation reference */
538                 lock_ReleaseWrite(&cm_serverLock);
539
540                 if (!(tsp->flags & CM_SERVERFLAG_DOWN))
541                     bkServers_alldown = 0;
542             }
543             /* Drop the reference obtained by cm_FindServer() */
544             cm_PutServer(tsp);
545         }       
546
547         /*
548          * Randomize RO list
549          *
550          * If the first n servers have the same ipRank, then we 
551          * randomly pick one among them and move it to the beginning.
552          * We don't bother to re-order the whole list because
553          * the rest of the list is used only if the first server is
554          * down.  We only do this for the RO list; we assume the other
555          * lists are length 1.
556          */
557         if (ROcount > 1) {
558             cm_RandomizeServer(&volp->vol[ROVOL].serversp);
559         }
560
561         rwNewstate = rwServers_alldown ? vl_alldown : vl_online;
562         roNewstate = roServers_alldown ? vl_alldown : vl_online;
563         bkNewstate = bkServers_alldown ? vl_alldown : vl_online;
564     } else if (code == CM_ERROR_NOSUCHVOLUME || code == VL_NOENT || code == VL_BADNAME) {
565         /* this volume does not exist - we should discard it */
566         if (volp->flags & CM_VOLUMEFLAG_IN_HASH)
567             cm_RemoveVolumeFromNameHashTable(volp);
568         for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
569             if (volp->vol[volType].flags & CM_VOLUMEFLAG_IN_HASH)
570                 cm_RemoveVolumeFromIDHashTable(volp, volType);
571             if (volp->vol[volType].ID) {
572                 cm_VolumeStatusNotification(volp, volp->vol[volType].ID, volp->vol[volType].state, vl_alldown);
573                 volp->vol[volType].ID = 0;
574             }
575             cm_SetFid(&volp->vol[volType].dotdotFid, 0, 0, 0, 0);
576         }
577
578         /* Move to the end so it will be recycled first */
579         cm_MoveVolumeToLRULast(volp);
580
581         volp->namep[0] ='\0';
582     } else {
583         rwNewstate = roNewstate = bkNewstate = vl_alldown;
584     }
585
586     if (volp->vol[RWVOL].state != rwNewstate) {
587         if (volp->vol[RWVOL].ID)
588             cm_VolumeStatusNotification(volp, volp->vol[RWVOL].ID, volp->vol[RWVOL].state, rwNewstate);
589         volp->vol[RWVOL].state = rwNewstate;
590     }
591     if (volp->vol[ROVOL].state != roNewstate) {
592         if (volp->vol[ROVOL].ID)
593             cm_VolumeStatusNotification(volp, volp->vol[ROVOL].ID, volp->vol[ROVOL].state, roNewstate);
594         volp->vol[ROVOL].state = roNewstate;
595     }
596     if (volp->vol[BACKVOL].state != bkNewstate) {
597         if (volp->vol[BACKVOL].ID)
598             cm_VolumeStatusNotification(volp, volp->vol[BACKVOL].ID, volp->vol[BACKVOL].state, bkNewstate);
599         volp->vol[BACKVOL].state = bkNewstate;
600     }
601
602     if (code == 0)
603         volp->flags &= ~CM_VOLUMEFLAG_RESET;
604
605     volp->flags &= ~CM_VOLUMEFLAG_UPDATING_VL;
606     osi_Log4(afsd_logp, "cm_UpdateVolumeLocation done, waking others name %s:%s flags 0x%x code 0x%x", 
607              volp->cellp->name, volp->namep, volp->flags, code);
608     osi_Wakeup((LONG_PTR) &volp->flags);
609
610     return code;
611 }
612
613 /* Requires read or write lock on cm_volumeLock */
614 void cm_GetVolume(cm_volume_t *volp)
615 {
616     InterlockedIncrement(&volp->refCount);
617 }
618
619 cm_volume_t *cm_GetVolumeByFID(cm_fid_t *fidp)
620 {
621     cm_volume_t *volp;
622     afs_uint32 hash;
623
624     lock_ObtainRead(&cm_volumeLock);
625     hash = CM_VOLUME_ID_HASH(fidp->volume);
626     /* The volumeID can be any one of the three types.  So we must
627      * search the hash table for all three types until we find it.
628      * We will search in the order of RO, RW, BK.
629      */
630     for ( volp = cm_data.volumeROIDHashTablep[hash]; volp; volp = volp->vol[ROVOL].nextp) {
631         if ( fidp->cell == volp->cellp->cellID && fidp->volume == volp->vol[ROVOL].ID )
632             break;
633     }
634     if (!volp) {
635         /* try RW volumes */
636         for ( volp = cm_data.volumeRWIDHashTablep[hash]; volp; volp = volp->vol[RWVOL].nextp) {
637             if ( fidp->cell == volp->cellp->cellID && fidp->volume == volp->vol[RWVOL].ID )
638                 break;
639         }
640     }
641     if (!volp) {
642         /* try BK volumes */
643         for ( volp = cm_data.volumeBKIDHashTablep[hash]; volp; volp = volp->vol[BACKVOL].nextp) {
644             if ( fidp->cell == volp->cellp->cellID && fidp->volume == volp->vol[BACKVOL].ID )
645                 break;
646         }
647     }
648
649     /* hold the volume if we found it */
650     if (volp) 
651         cm_GetVolume(volp);
652         
653     lock_ReleaseRead(&cm_volumeLock);
654     return volp;
655 }
656
657 long cm_FindVolumeByID(cm_cell_t *cellp, afs_uint32 volumeID, cm_user_t *userp,
658                       cm_req_t *reqp, afs_uint32 flags, cm_volume_t **outVolpp)
659 {
660     cm_volume_t *volp;
661 #ifdef SEARCH_ALL_VOLUMES
662     cm_volume_t *volp2;
663 #endif
664     char volNameString[VL_MAXNAMELEN];
665     afs_uint32 hash;
666     long code = 0;
667
668     lock_ObtainRead(&cm_volumeLock);
669 #ifdef SEARCH_ALL_VOLUMES
670     for(volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
671         if (cellp == volp->cellp &&
672              ((unsigned) volumeID == volp->vol[RWVOL].ID ||
673                (unsigned) volumeID == volp->vol[ROVOL].ID ||
674                (unsigned) volumeID == volp->vol[BACKVOL].ID))
675             break;
676     }   
677
678     volp2 = volp;
679 #endif /* SEARCH_ALL_VOLUMES */
680
681     hash = CM_VOLUME_ID_HASH(volumeID);
682     /* The volumeID can be any one of the three types.  So we must
683      * search the hash table for all three types until we find it.
684      * We will search in the order of RO, RW, BK.
685      */
686     for ( volp = cm_data.volumeROIDHashTablep[hash]; volp; volp = volp->vol[ROVOL].nextp) {
687         if ( cellp == volp->cellp && volumeID == volp->vol[ROVOL].ID )
688             break;
689     }
690     if (!volp) {
691         /* try RW volumes */
692         for ( volp = cm_data.volumeRWIDHashTablep[hash]; volp; volp = volp->vol[RWVOL].nextp) {
693             if ( cellp == volp->cellp && volumeID == volp->vol[RWVOL].ID )
694                 break;
695         }
696     }
697     if (!volp) {
698         /* try BK volumes */
699         for ( volp = cm_data.volumeBKIDHashTablep[hash]; volp; volp = volp->vol[BACKVOL].nextp) {
700             if ( cellp == volp->cellp && volumeID == volp->vol[BACKVOL].ID )
701                 break;
702         }
703     }
704
705 #ifdef SEARCH_ALL_VOLUMES
706     osi_assertx(volp == volp2, "unexpected cm_vol_t");
707 #endif
708
709     /* hold the volume if we found it */
710     if (volp) 
711         cm_GetVolume(volp);
712         
713     lock_ReleaseRead(&cm_volumeLock);
714
715     /* return it held */
716     if (volp) {
717         lock_ObtainWrite(&volp->rw);
718         
719         code = 0;
720         if ((volp->flags & CM_VOLUMEFLAG_RESET) && !(flags & CM_GETVOL_FLAG_NO_RESET)) {
721             code = cm_UpdateVolumeLocation(cellp, userp, reqp, volp);
722         }
723         lock_ReleaseWrite(&volp->rw);
724         if (code == 0) {
725             *outVolpp = volp;
726
727             if (!(flags & CM_GETVOL_FLAG_NO_LRU_UPDATE)) {
728                 lock_ObtainWrite(&cm_volumeLock);
729                 cm_AdjustVolumeLRU(volp);
730                 lock_ReleaseWrite(&cm_volumeLock);
731             }
732         } else {
733             lock_ObtainRead(&cm_volumeLock);
734             cm_PutVolume(volp);
735             lock_ReleaseRead(&cm_volumeLock);
736         }
737         return code;
738     }
739         
740     /* otherwise, we didn't find it so consult the VLDB */
741     sprintf(volNameString, "%u", volumeID);
742     code = cm_FindVolumeByName(cellp, volNameString, userp, reqp,
743                               flags, outVolpp);
744     return code;
745 }
746
747
748 long cm_FindVolumeByName(struct cm_cell *cellp, char *volumeNamep,
749                         struct cm_user *userp, struct cm_req *reqp,
750                         afs_uint32 flags, cm_volume_t **outVolpp)
751 {
752     cm_volume_t *volp;
753 #ifdef SEARCH_ALL_VOLUMES
754     cm_volume_t *volp2;
755 #endif
756     long        code = 0;
757     char        name[VL_MAXNAMELEN];
758     size_t      len;
759     int         type;
760     afs_uint32  hash;
761
762     strncpy(name, volumeNamep, VL_MAXNAMELEN);
763     name[VL_MAXNAMELEN-1] = '\0';
764     len = strlen(name);
765
766     if (len >= 8 && strcmp(name + len - 7, ".backup") == 0) {
767         type = BACKVOL;
768         name[len - 7] = '\0';
769     } else if (len >= 10 && strcmp(name + len - 9, ".readonly") == 0) {
770         type = ROVOL;
771         name[len - 9] = '\0';
772     } else {
773         type = RWVOL;
774     }
775
776     lock_ObtainRead(&cm_volumeLock);
777 #ifdef SEARCH_ALL_VOLUMES
778     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
779         if (cellp == volp->cellp && strcmp(name, volp->namep) == 0) {
780             break;
781         }
782     }   
783     volp2 = volp;
784 #endif /* SEARCH_ALL_VOLUMES */
785
786     hash = CM_VOLUME_NAME_HASH(name);
787     for (volp = cm_data.volumeNameHashTablep[hash]; volp; volp = volp->nameNextp) {
788         if (cellp == volp->cellp && strcmp(name, volp->namep) == 0)
789             break;
790     }
791
792 #ifdef SEARCH_ALL_VOLUMES
793     osi_assertx(volp2 == volp, "unexpected cm_vol_t");
794 #endif
795
796     if (!volp && (flags & CM_GETVOL_FLAG_CREATE)) {
797         afs_uint32 volType;
798         /* otherwise, get from VLDB */
799
800         /* 
801          * Change to a write lock so that we have exclusive use of
802          * the first cm_volume_t with a refCount of 0 so that we 
803          * have time to increment it.
804          */
805         lock_ConvertRToW(&cm_volumeLock);
806
807         if ( cm_data.currentVolumes >= cm_data.maxVolumes ) {
808 #ifdef RECYCLE_FROM_ALL_VOLUMES_LIST
809             for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
810                 if ( volp->refCount == 0 ) {
811                     /* There is one we can re-use */
812                     break;
813                 }
814             }
815 #else
816             for ( volp = cm_data.volumeLRULastp;
817                   volp;
818                   volp = (cm_volume_t *) osi_QPrev(&volp->q)) 
819             {
820                 if ( volp->refCount == 0 ) {
821                     /* There is one we can re-use */
822                     break;
823                 }
824             }
825 #endif
826             if (!volp)
827                 osi_panic("Exceeded Max Volumes", __FILE__, __LINE__);
828
829             InterlockedIncrement(&volp->refCount);
830             lock_ReleaseWrite(&cm_volumeLock);
831             lock_ObtainWrite(&volp->rw);
832             lock_ObtainWrite(&cm_volumeLock);
833
834             osi_Log2(afsd_logp, "Recycling Volume %s:%s",
835                      volp->cellp->name, volp->namep);
836
837             if (volp->flags & CM_VOLUMEFLAG_IN_LRU_QUEUE)
838                 cm_RemoveVolumeFromLRU(volp);
839             if (volp->flags & CM_VOLUMEFLAG_IN_HASH)
840                 cm_RemoveVolumeFromNameHashTable(volp);
841
842             for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
843                 if (volp->vol[volType].flags & CM_VOLUMEFLAG_IN_HASH)
844                     cm_RemoveVolumeFromIDHashTable(volp, volType);
845                 if (volp->vol[volType].ID)
846                     cm_VolumeStatusNotification(volp, volp->vol[volType].ID, volp->vol[volType].state, vl_unknown);
847                 volp->vol[volType].ID = 0;
848                 cm_SetFid(&volp->vol[volType].dotdotFid, 0, 0, 0, 0);
849             }
850         } else {
851             volp = &cm_data.volumeBaseAddress[cm_data.currentVolumes++];
852             memset(volp, 0, sizeof(cm_volume_t));
853             volp->magic = CM_VOLUME_MAGIC;
854             volp->allNextp = cm_data.allVolumesp;
855             cm_data.allVolumesp = volp;
856             lock_InitializeRWLock(&volp->rw, "cm_volume_t rwlock", LOCK_HIERARCHY_VOLUME);
857             lock_ReleaseWrite(&cm_volumeLock);
858             lock_ObtainWrite(&volp->rw);
859             lock_ObtainWrite(&cm_volumeLock);
860             volp->refCount = 1; /* starts off held */
861         }
862         volp->cellp = cellp;
863         strncpy(volp->namep, name, VL_MAXNAMELEN);
864         volp->namep[VL_MAXNAMELEN-1] = '\0';
865         volp->flags = CM_VOLUMEFLAG_RESET;
866     
867         for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
868             volp->vol[volType].state = vl_unknown;
869             volp->vol[volType].nextp = NULL;
870             volp->vol[volType].flags = 0;
871         }
872         volp->cbExpiresRO = 0;
873         cm_AddVolumeToNameHashTable(volp);
874         lock_ReleaseWrite(&cm_volumeLock);
875     }
876     else {
877         if (volp)
878             cm_GetVolume(volp);
879         lock_ReleaseRead(&cm_volumeLock);
880         
881         if (!volp)
882             return CM_ERROR_NOSUCHVOLUME;
883
884         lock_ObtainWrite(&volp->rw);
885     }
886
887     /* if we get here we are holding the mutex */
888     if ((volp->flags & CM_VOLUMEFLAG_RESET) && !(flags & CM_GETVOL_FLAG_NO_RESET)) {
889         code = cm_UpdateVolumeLocation(cellp, userp, reqp, volp);
890     }   
891     lock_ReleaseWrite(&volp->rw);
892
893     if (code == 0 && (type == BACKVOL && volp->vol[BACKVOL].ID == 0 ||
894                       type == ROVOL && volp->vol[ROVOL].ID == 0))
895         code = CM_ERROR_NOSUCHVOLUME;
896
897     if (code == 0) {
898         *outVolpp = volp;
899                 
900         if (!(flags & CM_GETVOL_FLAG_NO_LRU_UPDATE)) {
901             lock_ObtainWrite(&cm_volumeLock);
902             cm_AdjustVolumeLRU(volp);
903             lock_ReleaseWrite(&cm_volumeLock);
904         }
905     } else {
906         lock_ObtainRead(&cm_volumeLock);
907         cm_PutVolume(volp);
908         lock_ReleaseRead(&cm_volumeLock);
909     }
910     return code;
911 }       
912
913 /* 
914  * Only call this function in response to a VNOVOL or VMOVED error
915  * from a file server.  Do not call it in response to CM_ERROR_NOSUCHVOLUME
916  * as that can lead to recursive calls.
917  */
918 long cm_ForceUpdateVolume(cm_fid_t *fidp, cm_user_t *userp, cm_req_t *reqp)
919 {
920     cm_cell_t *cellp;
921     cm_volume_t *volp;
922 #ifdef SEARCH_ALL_VOLUMES
923     cm_volume_t *volp2;
924 #endif
925     afs_uint32  hash;
926     long code;
927
928     if (!fidp) 
929         return CM_ERROR_INVAL;
930
931     cellp = cm_FindCellByID(fidp->cell, 0);
932     if (!cellp) 
933         return CM_ERROR_NOSUCHCELL;
934
935     /* search for the volume */
936     lock_ObtainRead(&cm_volumeLock);
937 #ifdef SEARCH_ALL_VOLUMES
938     for(volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
939         if (cellp == volp->cellp &&
940              (fidp->volume == volp->vol[RWVOL].ID ||
941                fidp->volume == volp->vol[ROVOL].ID ||
942                fidp->volume == volp->vol[BACKVOL].ID))
943             break;
944     }   
945 #endif /* SEARCH_ALL_VOLUMES */
946
947     hash = CM_VOLUME_ID_HASH(fidp->volume);
948     /* The volumeID can be any one of the three types.  So we must
949      * search the hash table for all three types until we find it.
950      * We will search in the order of RO, RW, BK.
951      */
952     for ( volp = cm_data.volumeROIDHashTablep[hash]; volp; volp = volp->vol[ROVOL].nextp) {
953         if ( cellp == volp->cellp && fidp->volume == volp->vol[ROVOL].ID )
954             break;
955     }
956     if (!volp) {
957         /* try RW volumes */
958         for ( volp = cm_data.volumeRWIDHashTablep[hash]; volp; volp = volp->vol[RWVOL].nextp) {
959             if ( cellp == volp->cellp && fidp->volume == volp->vol[RWVOL].ID )
960                 break;
961         }
962     }
963     if (!volp) {
964         /* try BK volumes */
965         for ( volp = cm_data.volumeBKIDHashTablep[hash]; volp; volp = volp->vol[BACKVOL].nextp) {
966             if ( cellp == volp->cellp && fidp->volume == volp->vol[BACKVOL].ID )
967                 break;
968         }
969     }
970
971 #ifdef SEARCH_ALL_VOLUMES
972     osi_assertx(volp == volp2, "unexpected cm_vol_t");
973 #endif
974     /* hold the volume if we found it */
975     if (volp) 
976         cm_GetVolume(volp);
977
978     lock_ReleaseRead(&cm_volumeLock);
979
980     if (!volp)
981         return CM_ERROR_NOSUCHVOLUME;
982
983     /* update it */
984     cm_data.mountRootGen = time(NULL);
985     lock_ObtainWrite(&volp->rw);
986     volp->flags |= CM_VOLUMEFLAG_RESET;
987
988     code = cm_UpdateVolumeLocation(cellp, userp, reqp, volp);
989     lock_ReleaseWrite(&volp->rw);
990
991     lock_ObtainRead(&cm_volumeLock);
992     cm_PutVolume(volp);
993     lock_ReleaseRead(&cm_volumeLock);
994
995     return code;
996 }
997
998 /* find the appropriate servers from a volume */
999 cm_serverRef_t **cm_GetVolServers(cm_volume_t *volp, afs_uint32 volume)
1000 {
1001     cm_serverRef_t **serverspp;
1002     cm_serverRef_t *current;;
1003
1004     lock_ObtainWrite(&cm_serverLock);
1005
1006     if (volume == volp->vol[RWVOL].ID)
1007         serverspp = &volp->vol[RWVOL].serversp;
1008     else if (volume == volp->vol[ROVOL].ID)
1009         serverspp = &volp->vol[ROVOL].serversp;
1010     else if (volume == volp->vol[BACKVOL].ID)
1011         serverspp = &volp->vol[BACKVOL].serversp;
1012     else 
1013         osi_panic("bad volume ID in cm_GetVolServers", __FILE__, __LINE__);
1014         
1015     for (current = *serverspp; current; current = current->next)
1016         current->refCount++;
1017
1018     lock_ReleaseWrite(&cm_serverLock);
1019
1020     return serverspp;
1021 }
1022
1023 void cm_PutVolume(cm_volume_t *volp)
1024 {
1025     afs_int32 refCount = InterlockedDecrement(&volp->refCount);
1026     osi_assertx(refCount >= 0, "cm_volume_t refCount underflow has occurred");
1027 }
1028
1029 /* return the read-only volume, if there is one, or the read-write volume if
1030  * not.
1031  */
1032 long cm_GetROVolumeID(cm_volume_t *volp)
1033 {
1034     long id;
1035
1036     lock_ObtainRead(&volp->rw);
1037     if (volp->vol[ROVOL].ID && volp->vol[ROVOL].serversp)
1038         id = volp->vol[ROVOL].ID;
1039     else
1040         id = volp->vol[RWVOL].ID;
1041     lock_ReleaseRead(&volp->rw);
1042
1043     return id;
1044 }
1045
1046 void cm_RefreshVolumes(void)
1047 {
1048     cm_volume_t *volp;
1049     cm_scache_t *scp;
1050     afs_int32 refCount;
1051
1052     cm_data.mountRootGen = time(NULL);
1053
1054     /* force a re-loading of volume data from the vldb */
1055     lock_ObtainRead(&cm_volumeLock);
1056     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
1057         InterlockedIncrement(&volp->refCount);
1058         lock_ReleaseRead(&cm_volumeLock);
1059
1060         lock_ObtainWrite(&volp->rw);
1061         volp->flags |= CM_VOLUMEFLAG_RESET;
1062         lock_ReleaseWrite(&volp->rw);
1063         
1064         lock_ObtainRead(&cm_volumeLock);
1065         refCount = InterlockedDecrement(&volp->refCount);
1066         osi_assertx(refCount >= 0, "cm_volume_t refCount underflow");
1067     }
1068     lock_ReleaseRead(&cm_volumeLock);
1069
1070     /* force mount points to be re-evaluated so that 
1071      * if the volume location has changed we will pick 
1072      * that up
1073      */
1074     for ( scp = cm_data.scacheLRUFirstp; 
1075           scp;
1076           scp = (cm_scache_t *) osi_QNext(&scp->q)) {
1077         if ( scp->fileType == CM_SCACHETYPE_MOUNTPOINT 
1078 #ifdef AFS_FREELANCE_CLIENT
1079              && !(scp->fid.cell == AFS_FAKE_ROOT_CELL_ID && scp->fid.volume == AFS_FAKE_ROOT_VOL_ID)
1080 #endif
1081              ) {
1082             lock_ObtainWrite(&scp->rw);
1083             scp->mountPointStringp[0] = '\0';
1084             lock_ReleaseWrite(&scp->rw);
1085         }
1086     }
1087
1088 }
1089
1090 void
1091 cm_CheckOfflineVolumeState(cm_volume_t *volp, cm_vol_state_t *statep, afs_uint32 volID,
1092                            afs_uint32 *onlinep, afs_uint32 *volumeUpdatedp)
1093 {
1094     cm_conn_t *connp;
1095     long code;
1096     AFSFetchVolumeStatus volStat;
1097     char *Name;
1098     char *OfflineMsg;
1099     char *MOTD;
1100     cm_req_t req;
1101     struct rx_connection * rxconnp;
1102     char volName[32];
1103     char offLineMsg[256];
1104     char motd[256];
1105     long alldown, alldeleted;
1106     cm_serverRef_t *serversp;
1107
1108     Name = volName;
1109     OfflineMsg = offLineMsg;
1110     MOTD = motd;
1111
1112     if (statep->ID != 0 && (!volID || volID == statep->ID)) {
1113         if (!statep->serversp && !(*volumeUpdatedp)) {
1114             cm_InitReq(&req);
1115             code = cm_UpdateVolumeLocation(volp->cellp, cm_rootUserp, &req, volp);
1116             *volumeUpdatedp = 1;
1117         }
1118
1119         if (statep->serversp) {
1120             alldown = 1;
1121             alldeleted = 1;
1122             for (serversp = statep->serversp; serversp; serversp = serversp->next) {
1123                 if (serversp->status != srv_deleted) {
1124                     alldeleted = 0;
1125                     *onlinep = 1;
1126                     alldown = 0;
1127                 }
1128                 if (serversp->status == srv_busy || serversp->status == srv_offline) 
1129                     serversp->status = srv_not_busy;
1130             }
1131
1132             if (alldeleted && !(*volumeUpdatedp)) {
1133                 cm_InitReq(&req);
1134                 code = cm_UpdateVolumeLocation(volp->cellp, cm_rootUserp, &req, volp);
1135                 *volumeUpdatedp = 1;
1136             }
1137
1138             if (statep->state == vl_busy || statep->state == vl_offline || statep->state == vl_unknown ||
1139                 (!alldown && statep->state == vl_alldown)) {
1140                 cm_InitReq(&req);
1141
1142                 lock_ReleaseWrite(&volp->rw);
1143                 do {
1144                     code = cm_ConnFromVolume(volp, statep->ID, cm_rootUserp, &req, &connp);
1145                     if (code) 
1146                         continue;
1147
1148                     rxconnp = cm_GetRxConn(connp);
1149                     code = RXAFS_GetVolumeStatus(rxconnp, statep->ID,
1150                                                  &volStat, &Name, &OfflineMsg, &MOTD);
1151                     rx_PutConnection(rxconnp);            
1152
1153                 } while (cm_Analyze(connp, cm_rootUserp, &req, NULL, NULL, NULL, NULL, code));
1154                 code = cm_MapRPCError(code, &req);
1155
1156                 lock_ObtainWrite(&volp->rw);
1157                 if (code == 0 && volStat.Online) {
1158                     cm_VolumeStatusNotification(volp, statep->ID, statep->state, vl_online);
1159                     statep->state = vl_online;
1160                     *onlinep = 1;
1161                 } else if (code == CM_ERROR_NOACCESS) {
1162                     cm_VolumeStatusNotification(volp, statep->ID, statep->state, vl_unknown);
1163                     statep->state = vl_unknown;
1164                     *onlinep = 1;
1165                 }
1166             } else if (alldown && statep->state != vl_alldown) {
1167                 cm_VolumeStatusNotification(volp, statep->ID, statep->state, vl_alldown);
1168                 statep->state = vl_alldown;
1169             }
1170         } else if (statep->state != vl_alldown) {
1171             cm_VolumeStatusNotification(volp, statep->ID, statep->state, vl_alldown);
1172             statep->state = vl_alldown;
1173         }
1174     }
1175 }
1176
1177 /* The return code is 0 if the volume is not online and 
1178  * 1 if the volume is online
1179  */
1180 long
1181 cm_CheckOfflineVolume(cm_volume_t *volp, afs_uint32 volID)
1182 {
1183     long code;
1184     cm_req_t req;
1185     afs_uint32 online = 0;
1186     afs_uint32 volumeUpdated = 0;
1187
1188     lock_ObtainWrite(&volp->rw);
1189
1190     if (volp->flags & CM_VOLUMEFLAG_RESET) {
1191         cm_InitReq(&req);
1192         code = cm_UpdateVolumeLocation(volp->cellp, cm_rootUserp, &req, volp);
1193         volumeUpdated = 1;
1194     }
1195
1196     cm_CheckOfflineVolumeState(volp, &volp->vol[RWVOL], volID, &online, &volumeUpdated);
1197     cm_CheckOfflineVolumeState(volp, &volp->vol[ROVOL], volID, &online, &volumeUpdated);
1198     cm_CheckOfflineVolumeState(volp, &volp->vol[BACKVOL], volID, &online, &volumeUpdated);
1199
1200     lock_ReleaseWrite(&volp->rw);
1201     return online;
1202 }
1203
1204
1205 /* called from the Daemon thread */
1206 void cm_CheckOfflineVolumes(void)
1207 {
1208     cm_volume_t *volp;
1209     afs_int32 refCount;
1210
1211     lock_ObtainRead(&cm_volumeLock);
1212     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
1213         if (volp->flags & CM_VOLUMEFLAG_IN_HASH) {
1214             InterlockedIncrement(&volp->refCount);
1215             lock_ReleaseRead(&cm_volumeLock);
1216             cm_CheckOfflineVolume(volp, 0);
1217             lock_ObtainRead(&cm_volumeLock);
1218             refCount = InterlockedDecrement(&volp->refCount);
1219             osi_assertx(refCount >= 0, "cm_volume_t refCount underflow");
1220         }
1221     }
1222     lock_ReleaseRead(&cm_volumeLock);
1223 }
1224
1225
1226 static void
1227 cm_UpdateVolumeStatusInt(cm_volume_t *volp, struct cm_vol_state *statep)
1228 {
1229     enum volstatus newStatus;
1230     cm_serverRef_t *tsrp;
1231     cm_server_t *tsp;
1232     int someBusy = 0, someOffline = 0, allOffline = 1, allBusy = 1, allDown = 1;
1233
1234     if (!volp || !statep) {
1235 #ifdef DEBUG
1236         DebugBreak();
1237 #endif
1238         return;
1239     }
1240
1241     lock_ObtainWrite(&cm_serverLock);
1242     for (tsrp = statep->serversp; tsrp; tsrp=tsrp->next) {
1243         tsp = tsrp->server;
1244         if (tsp) {
1245             cm_GetServerNoLock(tsp);
1246             if (!(tsp->flags & CM_SERVERFLAG_DOWN)) {
1247                 allDown = 0;
1248                 if (tsrp->status == srv_busy) {
1249                     allOffline = 0;
1250                     someBusy = 1;
1251                 } else if (tsrp->status == srv_offline) {
1252                     allBusy = 0;
1253                     someOffline = 1;
1254                 } else {
1255                     allOffline = 0;
1256                     allBusy = 0;
1257                 }
1258             }
1259             cm_PutServerNoLock(tsp);
1260         }
1261     }   
1262     lock_ReleaseWrite(&cm_serverLock);
1263
1264     if (allDown)
1265         newStatus = vl_alldown;
1266     else if (allBusy || (someBusy && someOffline)) 
1267         newStatus = vl_busy;
1268     else if (allOffline)
1269         newStatus = vl_offline;
1270     else
1271         newStatus = vl_online;
1272
1273     if (statep->ID && statep->state != newStatus)
1274         cm_VolumeStatusNotification(volp, statep->ID, statep->state, newStatus);
1275
1276     statep->state = newStatus;
1277 }
1278
1279 void
1280 cm_UpdateVolumeStatus(cm_volume_t *volp, afs_uint32 volID)
1281 {
1282
1283     if (volp->vol[RWVOL].ID == volID) {
1284         cm_UpdateVolumeStatusInt(volp, &volp->vol[RWVOL]);
1285     } else if (volp->vol[ROVOL].ID == volID) {
1286         cm_UpdateVolumeStatusInt(volp, &volp->vol[ROVOL]);
1287     } else if (volp->vol[BACKVOL].ID == volID) {
1288         cm_UpdateVolumeStatusInt(volp, &volp->vol[BACKVOL]);
1289     } else {
1290         /*
1291          * If we are called with volID == 0 then something has gone wrong.
1292          * Most likely a race occurred in the server volume list maintenance.
1293          * Since we don't know which volume's status should be updated, 
1294          * just update all of them that are known to exist.  Better to be 
1295          * correct than fast.
1296          */
1297         afs_uint32 volType;
1298         for ( volType = RWVOL; volType < NUM_VOL_TYPES; volType++) {
1299             if (volp->vol[volType].ID != 0)
1300                 cm_UpdateVolumeStatusInt(volp, &volp->vol[volType]);
1301         }
1302     }
1303 }
1304
1305 /*
1306 ** Finds all volumes that reside on this server and reorders their
1307 ** RO list according to the changed rank of server.
1308 */
1309 void cm_ChangeRankVolume(cm_server_t *tsp)
1310 {       
1311     int                 code;
1312     cm_volume_t*        volp;
1313     afs_int32 refCount;
1314
1315     /* find volumes which might have RO copy on server*/
1316     lock_ObtainRead(&cm_volumeLock);
1317     for(volp = cm_data.allVolumesp; volp; volp=volp->allNextp)
1318     {
1319         code = 1 ;      /* assume that list is unchanged */
1320         InterlockedIncrement(&volp->refCount);
1321         lock_ReleaseRead(&cm_volumeLock);
1322         lock_ObtainWrite(&volp->rw);
1323
1324         if ((tsp->cellp==volp->cellp) && (volp->vol[ROVOL].serversp))
1325             code =cm_ChangeRankServer(&volp->vol[ROVOL].serversp, tsp);
1326
1327         /* this volume list was changed */
1328         if ( !code )
1329             cm_RandomizeServer(&volp->vol[ROVOL].serversp);
1330
1331         lock_ReleaseWrite(&volp->rw);
1332         lock_ObtainRead(&cm_volumeLock);
1333         refCount = InterlockedDecrement(&volp->refCount);
1334         osi_assertx(refCount >= 0, "cm_volume_t refCount underflow");
1335     }
1336     lock_ReleaseRead(&cm_volumeLock);
1337 }       
1338
1339 /* dump all volumes that have reference count > 0 to a file. 
1340  * cookie is used to identify this batch for easy parsing, 
1341  * and it a string provided by a caller 
1342  */
1343 int cm_DumpVolumes(FILE *outputFile, char *cookie, int lock)
1344 {
1345     int zilch;
1346     cm_volume_t *volp;
1347     char output[1024];
1348   
1349     if (lock) {
1350         lock_ObtainRead(&cm_scacheLock);
1351         lock_ObtainRead(&cm_volumeLock);
1352     }
1353   
1354     sprintf(output, "%s - dumping volumes - cm_data.currentVolumes=%d, cm_data.maxVolumes=%d\r\n", cookie, cm_data.currentVolumes, cm_data.maxVolumes);
1355     WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
1356   
1357     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp)
1358     {
1359         sprintf(output, "%s - volp=0x%p cell=%s name=%s rwID=%u roID=%u bkID=%u flags=0x%x refCount=%u\r\n", 
1360                  cookie, volp, volp->cellp->name, volp->namep, volp->vol[RWVOL].ID, volp->vol[ROVOL].ID, volp->vol[BACKVOL].ID, volp->flags, 
1361                  volp->refCount);
1362         WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
1363     }
1364     sprintf(output, "%s - Done dumping volumes.\r\n", cookie);
1365     WriteFile(outputFile, output, (DWORD)strlen(output), &zilch, NULL);
1366   
1367     if (lock) {
1368         lock_ReleaseRead(&cm_volumeLock);
1369         lock_ReleaseRead(&cm_scacheLock);
1370     }
1371     return (0);     
1372 }
1373
1374
1375 /* 
1376  * String hash function used by SDBM project.
1377  * It was chosen because it is fast and provides
1378  * decent coverage.
1379  */
1380 afs_uint32 SDBMHash(const char * str)
1381 {
1382     afs_uint32 hash = 0;
1383     size_t i, len;
1384
1385     if (str == NULL)
1386         return 0;
1387
1388     for(i = 0, len = strlen(str); i < len; i++)
1389     {
1390         hash = str[i] + (hash << 6) + (hash << 16) - hash;
1391     }
1392
1393     return (hash & 0x7FFFFFFF);
1394 }
1395
1396 /* call with volume write-locked and mutex held */
1397 void cm_AddVolumeToNameHashTable(cm_volume_t *volp)
1398 {
1399     int i;
1400     
1401     if (volp->flags & CM_VOLUMEFLAG_IN_HASH)
1402         return;
1403
1404     i = CM_VOLUME_NAME_HASH(volp->namep);
1405
1406     volp->nameNextp = cm_data.volumeNameHashTablep[i];
1407     cm_data.volumeNameHashTablep[i] = volp;
1408     volp->flags |= CM_VOLUMEFLAG_IN_HASH;
1409 }
1410
1411 /* call with volume write-locked and mutex held */
1412 void cm_RemoveVolumeFromNameHashTable(cm_volume_t *volp)
1413 {
1414     cm_volume_t **lvolpp;
1415     cm_volume_t *tvolp;
1416     int i;
1417         
1418     if (volp->flags & CM_VOLUMEFLAG_IN_HASH) {
1419         /* hash it out first */
1420         i = CM_VOLUME_NAME_HASH(volp->namep);
1421         for (lvolpp = &cm_data.volumeNameHashTablep[i], tvolp = cm_data.volumeNameHashTablep[i];
1422              tvolp;
1423              lvolpp = &tvolp->nameNextp, tvolp = tvolp->nameNextp) {
1424             if (tvolp == volp) {
1425                 *lvolpp = volp->nameNextp;
1426                 volp->flags &= ~CM_VOLUMEFLAG_IN_HASH;
1427                 volp->nameNextp = NULL;
1428                 break;
1429             }
1430         }
1431     }
1432 }
1433
1434 /* call with volume write-locked and mutex held */
1435 void cm_AddVolumeToIDHashTable(cm_volume_t *volp, afs_uint32 volType)
1436 {
1437     int i;
1438     struct cm_vol_state * statep;
1439
1440     statep = cm_VolumeStateByType(volp, volType);
1441
1442     if (statep->flags & CM_VOLUMEFLAG_IN_HASH)
1443         return;
1444
1445     i = CM_VOLUME_ID_HASH(statep->ID);
1446
1447     switch (volType) {
1448     case RWVOL:
1449         statep->nextp = cm_data.volumeRWIDHashTablep[i];
1450         cm_data.volumeRWIDHashTablep[i] = volp;
1451         break;
1452     case ROVOL:                                
1453         statep->nextp = cm_data.volumeROIDHashTablep[i];
1454         cm_data.volumeROIDHashTablep[i] = volp;
1455         break;
1456     case BACKVOL:
1457         statep->nextp = cm_data.volumeBKIDHashTablep[i];
1458         cm_data.volumeBKIDHashTablep[i] = volp;
1459         break;
1460     }
1461     statep->flags |= CM_VOLUMEFLAG_IN_HASH;
1462 }
1463
1464
1465 /* call with volume write-locked and mutex held */
1466 void cm_RemoveVolumeFromIDHashTable(cm_volume_t *volp, afs_uint32 volType)
1467 {
1468     cm_volume_t **lvolpp;
1469     cm_volume_t *tvolp;
1470     struct cm_vol_state * statep;
1471     int i;
1472         
1473     statep = cm_VolumeStateByType(volp, volType);
1474
1475     if (statep->flags & CM_VOLUMEFLAG_IN_HASH) {
1476         /* hash it out first */
1477         i = CM_VOLUME_ID_HASH(statep->ID);
1478
1479         switch (volType) {
1480         case RWVOL:
1481             lvolpp = &cm_data.volumeRWIDHashTablep[i];
1482             tvolp = cm_data.volumeRWIDHashTablep[i];
1483             break;
1484         case ROVOL:
1485             lvolpp = &cm_data.volumeROIDHashTablep[i];
1486             tvolp = cm_data.volumeROIDHashTablep[i];
1487             break;
1488         case BACKVOL:
1489             lvolpp = &cm_data.volumeBKIDHashTablep[i];
1490             tvolp = cm_data.volumeBKIDHashTablep[i];
1491             break;
1492         default:
1493             osi_assertx(0, "invalid volume type");
1494         }
1495         do {
1496             if (tvolp == volp) {
1497                 *lvolpp = statep->nextp;
1498                 statep->flags &= ~CM_VOLUMEFLAG_IN_HASH;
1499                 statep->nextp = NULL;
1500                 break;
1501             }
1502
1503             lvolpp = &tvolp->vol[volType].nextp;
1504             tvolp = tvolp->vol[volType].nextp;
1505         } while(tvolp);
1506     }
1507 }
1508
1509 /* must be called with cm_volumeLock write-locked! */
1510 void cm_AdjustVolumeLRU(cm_volume_t *volp)
1511 {
1512     if (volp == cm_data.volumeLRULastp)
1513         cm_data.volumeLRULastp = (cm_volume_t *) osi_QPrev(&volp->q);
1514     if (volp->flags & CM_VOLUMEFLAG_IN_LRU_QUEUE)
1515         osi_QRemoveHT((osi_queue_t **) &cm_data.volumeLRUFirstp, (osi_queue_t **) &cm_data.volumeLRULastp, &volp->q);
1516     osi_QAdd((osi_queue_t **) &cm_data.volumeLRUFirstp, &volp->q);
1517     volp->flags |= CM_VOLUMEFLAG_IN_LRU_QUEUE;
1518     if (!cm_data.volumeLRULastp) 
1519         cm_data.volumeLRULastp = volp;
1520 }
1521
1522 /* must be called with cm_volumeLock write-locked! */
1523 void cm_MoveVolumeToLRULast(cm_volume_t *volp)
1524 {
1525     if (volp == cm_data.volumeLRULastp)
1526         return;
1527
1528     if (volp == cm_data.volumeLRUFirstp)
1529         cm_data.volumeLRUFirstp = (cm_volume_t *) osi_QNext(&volp->q);
1530     if (volp->flags & CM_VOLUMEFLAG_IN_LRU_QUEUE)
1531         osi_QRemoveHT((osi_queue_t **) &cm_data.volumeLRUFirstp, (osi_queue_t **) &cm_data.volumeLRULastp, &volp->q);
1532     osi_QAddT((osi_queue_t **) &cm_data.volumeLRUFirstp, (osi_queue_t **) &cm_data.volumeLRULastp, &volp->q);
1533     volp->flags |= CM_VOLUMEFLAG_IN_LRU_QUEUE;
1534     if (!cm_data.volumeLRULastp) 
1535         cm_data.volumeLRULastp = volp;
1536 }
1537
1538 /* must be called with cm_volumeLock write-locked! */
1539 void cm_RemoveVolumeFromLRU(cm_volume_t *volp)
1540 {
1541     if (volp->flags & CM_VOLUMEFLAG_IN_LRU_QUEUE) {
1542         if (volp == cm_data.volumeLRULastp)
1543             cm_data.volumeLRULastp = (cm_volume_t *) osi_QPrev(&volp->q);
1544         osi_QRemoveHT((osi_queue_t **) &cm_data.volumeLRUFirstp, (osi_queue_t **) &cm_data.volumeLRULastp, &volp->q);
1545         volp->flags &= ~CM_VOLUMEFLAG_IN_LRU_QUEUE;
1546     }
1547 }
1548
1549 static char * volstatus_str(enum volstatus vs)
1550 {
1551     switch (vs) {
1552     case vl_online:
1553         return "online";
1554     case vl_busy:
1555         return "busy";
1556     case vl_offline:
1557         return "offline";
1558     case vl_alldown:
1559         return "alldown";
1560     default:
1561         return "unknown";
1562     }
1563 }
1564
1565 void cm_VolumeStatusNotification(cm_volume_t * volp, afs_uint32 volID, enum volstatus old, enum volstatus new)
1566 {
1567     char volstr[CELL_MAXNAMELEN + VL_MAXNAMELEN]="";
1568     char *ext = "";
1569
1570     if (volID == volp->vol[RWVOL].ID)
1571         ext = "";
1572     else if (volID == volp->vol[ROVOL].ID)
1573         ext = ".readonly";
1574     else if (volID == volp->vol[BACKVOL].ID)
1575         ext = ".backup";
1576     else
1577         ext = ".nomatch";
1578     snprintf(volstr, sizeof(volstr), "%s:%s%s", volp->cellp->name, volp->namep, ext);
1579
1580     osi_Log4(afsd_logp, "VolumeStatusNotification: %-48s [%10u] (%s -> %s)",
1581              osi_LogSaveString(afsd_logp, volstr), volID, volstatus_str(old), volstatus_str(new));
1582
1583     cm_VolStatus_Change_Notification(volp->cellp->cellID, volID, new);
1584 }       
1585
1586 enum volstatus cm_GetVolumeStatus(cm_volume_t *volp, afs_uint32 volID)
1587 {
1588     cm_vol_state_t * statep = cm_VolumeStateByID(volp, volID);
1589     if (statep)
1590         return statep->state;
1591     else
1592         return vl_unknown;
1593 }
1594
1595 /* Renew .readonly volume callbacks that are more than
1596  * 30 minutes old.  (A volume callback is issued for 2 hours.)
1597  */
1598 void 
1599 cm_VolumeRenewROCallbacks(void)
1600 {
1601     cm_volume_t * volp;
1602     time_t minexp = time(NULL) + 90 * 60;
1603
1604     lock_ObtainRead(&cm_volumeLock);
1605     for (volp = cm_data.allVolumesp; volp; volp=volp->allNextp) {
1606         if ( volp->cbExpiresRO > 0 && volp->cbExpiresRO < minexp) {
1607             cm_req_t      req;
1608             cm_fid_t      fid;
1609             cm_scache_t * scp;
1610
1611             cm_SetFid(&fid, volp->cellp->cellID, volp->vol[ROVOL].ID, 1, 1);
1612
1613             cm_InitReq(&req);
1614
1615             lock_ReleaseRead(&cm_volumeLock);
1616             if (cm_GetSCache(&fid, &scp, cm_rootUserp, &req) == 0) {
1617                 lock_ObtainWrite(&scp->rw);
1618                 cm_GetCallback(scp, cm_rootUserp, &req, 1);
1619                 lock_ReleaseWrite(&scp->rw);
1620                 cm_ReleaseSCache(scp);
1621             }
1622             lock_ObtainRead(&cm_volumeLock);
1623         }
1624     }
1625     lock_ReleaseRead(&cm_volumeLock);
1626 }
1627
1628 cm_vol_state_t * 
1629 cm_VolumeStateByType(cm_volume_t *volp, afs_uint32 volType)
1630 {
1631     return &volp->vol[volType];
1632 }
1633
1634 cm_vol_state_t * 
1635 cm_VolumeStateByID(cm_volume_t *volp, afs_uint32 id)
1636 {
1637     cm_vol_state_t * statep = NULL;
1638
1639     if (id == volp->vol[RWVOL].ID)
1640         statep = &volp->vol[RWVOL];
1641     else if (id == volp->vol[ROVOL].ID)
1642         statep = &volp->vol[ROVOL];
1643     else if (id == volp->vol[BACKVOL].ID)
1644         statep = &volp->vol[BACKVOL];
1645
1646     return(statep);
1647 }
1648
1649 cm_vol_state_t * 
1650 cm_VolumeStateByName(cm_volume_t *volp, char *volname)
1651 {
1652     size_t len = strlen(volname);
1653     cm_vol_state_t *statep;
1654
1655     if (cm_stricmp_utf8N(".readonly", &volname[len-9]) == 0)
1656         statep = &volp->vol[ROVOL];
1657     else if (cm_stricmp_utf8N(".backup", &volname[len-7]) == 0)
1658         statep = &volp->vol[BACKVOL];
1659     else 
1660         statep = &volp->vol[RWVOL];
1661
1662     return statep;
1663 }
1664