vos: Do not try to remove backup volume id 0
[openafs.git] / src / volser / vsprocs.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13 #include <afs/procmgmt.h>       /* signal(), kill(), wait(), etc. */
14 #include <roken.h>
15
16 #ifdef  AFS_AIX_ENV
17 #include <sys/statfs.h>
18 #endif
19
20 #include <lock.h>
21 #include <afs/voldefs.h>
22 #include <rx/xdr.h>
23 #include <rx/rx.h>
24 #include <afs/vlserver.h>
25 #include <afs/nfs.h>
26 #include <afs/cellconfig.h>
27 #include <afs/keys.h>
28 #include <ubik.h>
29 #include <afs/afsint.h>
30 #include "volser.h"
31 #include "volint.h"
32 #include "lockdata.h"
33 #include <afs/com_err.h>
34 #include <rx/rxkad.h>
35 #include <afs/kautils.h>
36 #include <afs/cmd.h>
37 #include <afs/ihandle.h>
38 #ifdef AFS_NT40_ENV
39 #include <afs/ntops.h>
40 #endif
41 #include <afs/vnode.h>
42 #include <afs/volume.h>
43 #define ERRCODE_RANGE 8         /* from error_table.h */
44 #define CLOCKSKEW   2           /* not really skew, but resolution */
45 #define CLOCKADJ(x) (((x) < CLOCKSKEW) ? 0 : (x) - CLOCKSKEW)
46
47 /* for UV_MoveVolume() recovery */
48
49 #include <setjmp.h>
50
51 #include "volser_internal.h"
52 #include "volser_prototypes.h"
53 #include "vsutils_prototypes.h"
54 #include "lockprocs_prototypes.h"
55
56 extern struct ubik_client *cstruct;
57 int verbose = 0, noresolve = 0;
58
59 struct release {
60     afs_uint32 crtime;
61     afs_uint32 uptime;
62     afs_int32 vldbEntryIndex;
63 };
64
65 /* Utility macros used by rest of this source file */
66 #define EPRINT(ec, es) \
67 do { \
68         fprintf(STDERR, "\n"); \
69         fprintf(STDERR, (es)); \
70         PrintError("   ",ec); \
71 } while (0)
72
73 #define EPRINT1(ec, es, ep1) \
74 do { \
75         fprintf(STDERR, "\n"); \
76         fprintf(STDERR, (es), (ep1)); \
77         PrintError("   ",ec); \
78 } while (0)
79
80 #define EPRINT2(ec, es, ep1, ep2) \
81 do { \
82         fprintf(STDERR, "\n"); \
83         fprintf(STDERR, (es), (ep1), (ep2)); \
84         PrintError("   ",ec); \
85 } while (0)
86
87 #define EPRINT3(ec, es, ep1, ep2, ep3) \
88 do { \
89         fprintf(STDERR, "\n"); \
90         fprintf(STDERR, (es), (ep1), (ep2), (ep3)); \
91         PrintError("   ",ec); \
92 } while (0)
93
94 #define EGOTO(where, ec, es) \
95 do { \
96         if (ec) { \
97                 EPRINT((ec),(es)); \
98                 error = (ec); \
99                 goto where; \
100         } \
101 } while (0)
102
103 #define EGOTO1(where, ec, es, ep1) \
104 do { \
105         if (ec) { \
106                 EPRINT1((ec),(es),(ep1)); \
107                 error = (ec); \
108                 goto where; \
109         } \
110 } while (0)
111
112 #define EGOTO2(where, ec, es, ep1, ep2) \
113 do { \
114         if (ec) { \
115                 EPRINT2((ec),(es),(ep1),(ep2)); \
116                 error = (ec); \
117                 goto where; \
118         } \
119 } while (0)
120
121 #define EGOTO3(where, ec, es, ep1, ep2, ep3) \
122 do { \
123         if (ec) { \
124                 EPRINT3((ec),(es),(ep1),(ep2),(ep3)); \
125                 error = (ec); \
126                 goto where; \
127         } \
128 } while (0)
129
130 #define VPRINT(es) \
131         { if (verbose) { fprintf(STDOUT, (es)); fflush(STDOUT); } }
132 #define VPRINT1(es, p) \
133         { if (verbose) { fprintf(STDOUT, (es), (p)); fflush(STDOUT); } }
134 #define VPRINT2(es, p1, p2) \
135         { if (verbose) { fprintf(STDOUT, (es), (p1), (p2)); fflush(STDOUT); } }
136 #define VPRINT3(es, p1, p2, p3) \
137         { if (verbose) { fprintf(STDOUT, (es), (p1), (p2), (p3)); fflush(STDOUT); } }
138 #define VDONE \
139         { if (verbose) { fprintf(STDOUT, " done\n"); fflush(STDOUT); } }
140 #define VEPRINT(es) \
141         { if (verbose) { fprintf(STDERR, (es)); fflush(STDERR); } }
142 #define VEPRINT1(es, p) \
143         { if (verbose) { fprintf(STDERR, (es), (p)); fflush(STDERR); } }
144 #define VEPRINT2(es, p1, p2) \
145         { if (verbose) { fprintf(STDERR, (es), (p1), (p2)); fflush(STDERR); } }
146 #define VEPRINT3(es, p1, p2, p3) \
147         { if (verbose) { fprintf(STDERR, (es), (p1), (p2), (p3)); fflush(STDERR); } }
148 #define VEDONE \
149         { if (verbose) { fprintf(STDERR, " done\n"); fflush(STDERR); } }
150
151
152
153 /* getting rid of this */
154 #define ERROR_EXIT(code) do { \
155     error = (code); \
156     goto error_exit; \
157 } while (0)
158
159
160 /* Protos for static routines */
161 #if 0
162 static afs_int32 CheckAndDeleteVolume(struct rx_connection *aconn,
163                                       afs_int32 apart, afs_uint32 okvol,
164                                       afs_uint32 delvol);
165 #endif
166 static int GetTrans(struct nvldbentry *vldbEntryPtr, afs_int32 index,
167                     struct rx_connection **connPtr, afs_int32 * transPtr,
168                     afs_uint32 * crtimePtr, afs_uint32 * uptimePtr,
169                     afs_int32 *origflags, afs_uint32 tmpVolId);
170 static int SimulateForwardMultiple(struct rx_connection *fromconn,
171                                    afs_int32 fromtid, afs_int32 fromdate,
172                                    manyDests * tr, afs_int32 flags,
173                                    void *cookie, manyResults * results);
174 static int DoVolOnline(struct nvldbentry *vldbEntryPtr, afs_uint32 avolid,
175                        int index, char *vname, struct rx_connection *connPtr);
176 static int DoVolClone(struct rx_connection *aconn, afs_uint32 avolid,
177                       afs_int32 apart, int type, afs_uint32 cloneid,
178                       char *typestring, char *pname, char *vname, char *suffix,
179                       struct volser_status *volstatus, afs_int32 *transPtr);
180 static int DoVolDelete(struct rx_connection *aconn, afs_uint32 avolid,
181                        afs_int32 apart, char *typestring, afs_uint32 atoserver,
182                        struct volser_status *volstatus, char *pprefix);
183 static afs_int32 CheckVolume(volintInfo * volumeinfo, afs_uint32 aserver,
184                              afs_int32 apart, afs_int32 * modentry,
185                              afs_uint32 * maxvolid, struct nvldbentry *aentry);
186 static afs_int32 VolumeExists(afs_uint32 server, afs_int32 partition,
187                               afs_uint32 volumeid);
188 static afs_int32 CheckVldbRWBK(struct nvldbentry * entry,
189                                afs_int32 * modified);
190 static afs_int32 CheckVldbRO(struct nvldbentry *entry, afs_int32 * modified);
191 static afs_int32 CheckVldb(struct nvldbentry *entry, afs_int32 * modified,
192                            afs_int32 *deleted);
193 static void dump_sig_handler(int x);
194 static int sortVolumes(const void *a, const void *b);
195
196
197 /*map the partition <partId> into partition name <partName>*/
198 void
199 MapPartIdIntoName(afs_int32 partId, char *partName)
200 {
201     if (partId < 26) {          /* what if partId > = 26 ? */
202         strcpy(partName, "/vicep");
203         partName[6] = partId + 'a';
204         partName[7] = '\0';
205         return;
206     } else if (partId < VOLMAXPARTS) {
207         strcpy(partName, "/vicep");
208         partId -= 26;
209         partName[6] = 'a' + (partId / 26);
210         partName[7] = 'a' + (partId % 26);
211         partName[8] = '\0';
212         return;
213     }
214 }
215
216 int
217 PrintError(char *msg, afs_int32 errcode)
218 {
219     fprintf(STDERR, "%s", msg);
220     /*replace by a big switch statement */
221     switch (errcode) {
222     case 0:
223         break;
224     case -1:
225         fprintf(STDERR, "Possible communication failure\n");
226         break;
227     case VSALVAGE:
228         fprintf(STDERR, "Volume needs to be salvaged\n");
229         break;
230     case VNOVNODE:
231         fprintf(STDERR, "Bad vnode number quoted\n");
232         break;
233     case VNOVOL:
234         fprintf(STDERR,
235                 "Volume not attached, does not exist, or not on line\n");
236         break;
237     case VVOLEXISTS:
238         fprintf(STDERR, "Volume already exists\n");
239         break;
240     case VNOSERVICE:
241         fprintf(STDERR, "Volume is not in service\n");
242         break;
243     case VOFFLINE:
244         fprintf(STDERR, "Volume is off line\n");
245         break;
246     case VONLINE:
247         fprintf(STDERR, "Volume is already on line\n");
248         break;
249     case VDISKFULL:
250         fprintf(STDERR, "Partition is full\n");
251         break;
252     case VOVERQUOTA:
253         fprintf(STDERR, "Volume max quota exceeded\n");
254         break;
255     case VBUSY:
256         fprintf(STDERR, "Volume temporarily unavailable\n");
257         break;
258     case VMOVED:
259         fprintf(STDERR, "Volume has moved to another server\n");
260         break;
261     case VL_IDEXIST:
262         fprintf(STDERR, "VLDB: volume Id exists in the vldb\n");
263         break;
264     case VL_IO:
265         fprintf(STDERR, "VLDB: a read terminated too early\n");
266         break;
267     case VL_NAMEEXIST:
268         fprintf(STDERR, "VLDB: volume entry exists in the vldb\n");
269         break;
270     case VL_CREATEFAIL:
271         fprintf(STDERR, "VLDB: internal creation failure\n");
272         break;
273     case VL_NOENT:
274         fprintf(STDERR, "VLDB: no such entry\n");
275         break;
276     case VL_EMPTY:
277         fprintf(STDERR, "VLDB: vldb database is empty\n");
278         break;
279     case VL_ENTDELETED:
280         fprintf(STDERR, "VLDB: entry is deleted (soft delete)\n");
281         break;
282     case VL_BADNAME:
283         fprintf(STDERR, "VLDB: volume name is illegal\n");
284         break;
285     case VL_BADINDEX:
286         fprintf(STDERR, "VLDB: index was out of range\n");
287         break;
288     case VL_BADVOLTYPE:
289         fprintf(STDERR, "VLDB: bad volume type\n");
290         break;
291     case VL_BADSERVER:
292         fprintf(STDERR, "VLDB: illegal server number (not within limits)\n");
293         break;
294     case VL_BADPARTITION:
295         fprintf(STDERR, "VLDB: bad partition number\n");
296         break;
297     case VL_REPSFULL:
298         fprintf(STDERR, "VLDB: run out of space for replication sites\n");
299         break;
300     case VL_NOREPSERVER:
301         fprintf(STDERR, "VLDB: no such repsite server exists\n");
302         break;
303     case VL_DUPREPSERVER:
304         fprintf(STDERR, "VLDB: replication site server already exists\n");
305         break;
306     case VL_RWNOTFOUND:
307         fprintf(STDERR, "VLDB: parent r/w entry not found\n");
308         break;
309     case VL_BADREFCOUNT:
310         fprintf(STDERR, "VLDB: illegal reference count number\n");
311         break;
312     case VL_SIZEEXCEEDED:
313         fprintf(STDERR, "VLDB: vldb size for attributes exceeded\n");
314         break;
315     case VL_BADENTRY:
316         fprintf(STDERR, "VLDB: bad incoming vldb entry\n");
317         break;
318     case VL_BADVOLIDBUMP:
319         fprintf(STDERR, "VLDB: illegal max volid increment\n");
320         break;
321     case VL_IDALREADYHASHED:
322         fprintf(STDERR, "VLDB: (RO/BACK) Id already hashed\n");
323         break;
324     case VL_ENTRYLOCKED:
325         fprintf(STDERR, "VLDB: vldb entry is already locked\n");
326         break;
327     case VL_BADVOLOPER:
328         fprintf(STDERR, "VLDB: bad volume operation code\n");
329         break;
330     case VL_BADRELLOCKTYPE:
331         fprintf(STDERR, "VLDB: bad release lock type\n");
332         break;
333     case VL_RERELEASE:
334         fprintf(STDERR, "VLDB: status report: last release was aborted\n");
335         break;
336     case VL_BADSERVERFLAG:
337         fprintf(STDERR, "VLDB: invalid replication site server flag\n");
338         break;
339     case VL_PERM:
340         fprintf(STDERR, "VLDB: no permission access for call\n");
341         break;
342     case VOLSERREAD_DUMPERROR:
343         fprintf(STDERR,
344                 "VOLSER:  Problems encountered in reading the dump file !\n");
345         break;
346     case VOLSERDUMPERROR:
347         fprintf(STDERR, "VOLSER: Problems encountered in doing the dump !\n");
348         break;
349     case VOLSERATTACH_ERROR:
350         fprintf(STDERR, "VOLSER: Could not attach the volume\n");
351         break;
352     case VOLSERDETACH_ERROR:
353         fprintf(STDERR, "VOLSER: Could not detach the volume\n");
354         break;
355     case VOLSERILLEGAL_PARTITION:
356         fprintf(STDERR, "VOLSER: encountered illegal partition number\n");
357         break;
358     case VOLSERBAD_ACCESS:
359         fprintf(STDERR, "VOLSER: permission denied, not a super user\n");
360         break;
361     case VOLSERVLDB_ERROR:
362         fprintf(STDERR, "VOLSER: error detected in the VLDB\n");
363         break;
364     case VOLSERBADNAME:
365         fprintf(STDERR, "VOLSER: error in volume name\n");
366         break;
367     case VOLSERVOLMOVED:
368         fprintf(STDERR, "VOLSER: volume has moved\n");
369         break;
370     case VOLSERBADOP:
371         fprintf(STDERR, "VOLSER: illegal operation\n");
372         break;
373     case VOLSERBADRELEASE:
374         fprintf(STDERR, "VOLSER: release could not be completed\n");
375         break;
376     case VOLSERVOLBUSY:
377         fprintf(STDERR, "VOLSER: volume is busy\n");
378         break;
379     case VOLSERNO_MEMORY:
380         fprintf(STDERR, "VOLSER: volume server is out of memory\n");
381         break;
382     case VOLSERNOVOL:
383         fprintf(STDERR,
384                 "VOLSER: no such volume - location specified incorrectly or volume does not exist\n");
385         break;
386     case VOLSERMULTIRWVOL:
387         fprintf(STDERR,
388                 "VOLSER: multiple RW volumes with same ID, one of which should be deleted\n");
389         break;
390     case VOLSERFAILEDOP:
391         fprintf(STDERR,
392                 "VOLSER: not all entries were successfully processed\n");
393         break;
394     default:
395         {
396             initialize_RXK_error_table();
397             initialize_KTC_error_table();
398             initialize_ACFG_error_table();
399             initialize_VL_error_table();
400
401             fprintf(STDERR, "%s: %s\n", afs_error_table_name(errcode),
402                     afs_error_message(errcode));
403             break;
404         }
405     }
406     return 0;
407 }
408
409 void init_volintInfo(struct volintInfo *vinfo) {
410     memset(vinfo, 0, sizeof(struct volintInfo));
411
412     vinfo->maxquota = -1;
413     vinfo->dayUse = -1;
414     vinfo->creationDate = -1;
415     vinfo->updateDate = -1;
416     vinfo->flags = -1;
417     vinfo->spare0 = -1;
418     vinfo->spare1 = -1;
419     vinfo->spare2 = -1;
420     vinfo->spare3 = -1;
421 }
422
423 static struct rx_securityClass *uvclass = 0;
424 static int uvindex = -1;
425 /* called by VLDBClient_Init to set the security module to be used in the RPC */
426 int
427 UV_SetSecurity(struct rx_securityClass *as, afs_int32 aindex)
428 {
429     uvindex = aindex;
430     uvclass = as;
431     return 0;
432 }
433
434 /* bind to volser on <port> <aserver> */
435 /* takes server address in network order, port in host order.  dumb */
436 struct rx_connection *
437 UV_Bind(afs_uint32 aserver, afs_int32 port)
438 {
439     struct rx_connection *tc;
440
441     tc = rx_NewConnection(aserver, htons(port), VOLSERVICE_ID, uvclass,
442                           uvindex);
443     return tc;
444 }
445
446 static int
447 AFSVolCreateVolume_retry(struct rx_connection *z_conn,
448                        afs_int32 partition, char *name, afs_int32 type,
449                        afs_int32 parent, afs_uint32 *volid, afs_int32 *trans)
450 {
451     afs_int32 code;
452     int retries = 3;
453     while (retries) {
454         code = AFSVolCreateVolume(z_conn, partition, name, type, parent,
455                                   volid, trans);
456         if (code != VOLSERVOLBUSY)
457             break;
458         retries--;
459 #ifdef AFS_PTHREAD_ENV
460         sleep(3-retries);
461 #else
462         IOMGR_Sleep(3-retries);
463 #endif
464     }
465     return code;
466 }
467
468 static int
469 AFSVolTransCreate_retry(struct rx_connection *z_conn,
470                         afs_int32 volume, afs_int32 partition,
471                         afs_int32 flags, afs_int32 * trans)
472 {
473     afs_int32 code;
474     int retries = 3;
475     while (retries) {
476         code = AFSVolTransCreate(z_conn, volume, partition, flags, trans);
477         if (code != VOLSERVOLBUSY)
478             break;
479         retries--;
480 #ifdef AFS_PTHREAD_ENV
481         sleep(3-retries);
482 #else
483         IOMGR_Sleep(3-retries);
484 #endif
485     }
486     return code;
487 }
488
489 #if 0
490 /* if <okvol> is allright(indicated by beibg able to
491  * start a transaction, delete the <delvol> */
492 static afs_int32
493 CheckAndDeleteVolume(struct rx_connection *aconn, afs_int32 apart,
494                      afs_uint32 okvol, afs_uint32 delvol)
495 {
496     afs_int32 error, code, tid, rcode;
497     error = 0;
498     code = 0;
499
500     if (okvol == 0) {
501         code = AFSVolTransCreate_retry(aconn, delvol, apart, ITOffline, &tid);
502         if (!error && code)
503             error = code;
504         code = AFSVolDeleteVolume(aconn, tid);
505         if (!error && code)
506             error = code;
507         code = AFSVolEndTrans(aconn, tid, &rcode);
508         if (!code)
509             code = rcode;
510         if (!error && code)
511             error = code;
512         return error;
513     } else {
514         code = AFSVolTransCreate_retry(aconn, okvol, apart, ITOffline, &tid);
515         if (!code) {
516             code = AFSVolEndTrans(aconn, tid, &rcode);
517             if (!code)
518                 code = rcode;
519             if (!error && code)
520                 error = code;
521             code = AFSVolTransCreate_retry(aconn, delvol, apart, ITOffline, &tid);
522             if (!error && code)
523                 error = code;
524             code = AFSVolDeleteVolume(aconn, tid);
525             if (!error && code)
526                 error = code;
527             code = AFSVolEndTrans(aconn, tid, &rcode);
528             if (!code)
529                 code = rcode;
530             if (!error && code)
531                 error = code;
532         } else
533             error = code;
534         return error;
535     }
536 }
537
538 #endif
539
540 /* called by EmuerateEntry, show vldb entry in a reasonable format */
541 void
542 SubEnumerateEntry(struct nvldbentry *entry)
543 {
544     int i;
545     char pname[10];
546     int isMixed = 0;
547     char hoststr[16];
548
549 #ifdef notdef
550     fprintf(STDOUT, "   readWriteID %-10u ", entry->volumeId[RWVOL]);
551     if (entry->flags & RW_EXISTS)
552         fprintf(STDOUT, " valid \n");
553     else
554         fprintf(STDOUT, " invalid \n");
555     fprintf(STDOUT, "   readOnlyID  %-10u ", entry->volumeId[ROVOL]);
556     if (entry->flags & RO_EXISTS)
557         fprintf(STDOUT, " valid \n");
558     else
559         fprintf(STDOUT, " invalid \n");
560     fprintf(STDOUT, "   backUpID    %-10u ", entry->volumeId[BACKVOL]);
561     if (entry->flags & BACK_EXISTS)
562         fprintf(STDOUT, " valid \n");
563     else
564         fprintf(STDOUT, " invalid \n");
565     if ((entry->cloneId != 0) && (entry->flags & RO_EXISTS))
566         fprintf(STDOUT, "    releaseClone %-10u \n", entry->cloneId);
567 #else
568     if (entry->flags & RW_EXISTS)
569         fprintf(STDOUT, "    RWrite: %-10u", entry->volumeId[RWVOL]);
570     if (entry->flags & RO_EXISTS)
571         fprintf(STDOUT, "    ROnly: %-10u", entry->volumeId[ROVOL]);
572     if (entry->flags & BACK_EXISTS)
573         fprintf(STDOUT, "    Backup: %-10u", entry->volumeId[BACKVOL]);
574     if ((entry->cloneId != 0) && (entry->flags & RO_EXISTS))
575         fprintf(STDOUT, "    RClone: %-10lu", (unsigned long)entry->cloneId);
576     fprintf(STDOUT, "\n");
577 #endif
578     fprintf(STDOUT, "    number of sites -> %lu\n",
579             (unsigned long)entry->nServers);
580     for (i = 0; i < entry->nServers; i++) {
581         if (entry->serverFlags[i] & NEW_REPSITE)
582             isMixed = 1;
583     }
584     for (i = 0; i < entry->nServers; i++) {
585         MapPartIdIntoName(entry->serverPartition[i], pname);
586         fprintf(STDOUT, "       server %s partition %s ",
587                 noresolve ? afs_inet_ntoa_r(entry->serverNumber[i], hoststr) :
588                 hostutil_GetNameByINet(entry->serverNumber[i]), pname);
589         if (entry->serverFlags[i] & ITSRWVOL)
590             fprintf(STDOUT, "RW Site ");
591         else
592             fprintf(STDOUT, "RO Site ");
593         if (isMixed) {
594             if (entry->serverFlags[i] & NEW_REPSITE)
595                 fprintf(STDOUT," -- New release");
596             else
597                 if (!(entry->serverFlags[i] & ITSRWVOL))
598                     fprintf(STDOUT," -- Old release");
599         } else {
600             if (entry->serverFlags[i] & RO_DONTUSE)
601                 fprintf(STDOUT, " -- Not released");
602         }
603         fprintf(STDOUT, "\n");
604     }
605
606     return;
607
608 }
609
610 /*enumerate the vldb entry corresponding to <entry> */
611 void
612 EnumerateEntry(struct nvldbentry *entry)
613 {
614
615     fprintf(STDOUT, "\n");
616     fprintf(STDOUT, "%s \n", entry->name);
617     SubEnumerateEntry(entry);
618     return;
619 }
620
621 /* forcibly remove a volume.  Very dangerous call */
622 int
623 UV_NukeVolume(afs_uint32 server, afs_int32 partid, afs_uint32 volid)
624 {
625     struct rx_connection *tconn;
626     afs_int32 code;
627
628     tconn = UV_Bind(server, AFSCONF_VOLUMEPORT);
629     if (tconn) {
630         code = AFSVolNukeVolume(tconn, partid, volid);
631         rx_DestroyConnection(tconn);
632     } else
633         code = 0;
634     return code;
635 }
636
637 /* like df. Return usage of <pname> on <server> in <partition> */
638 int
639 UV_PartitionInfo64(afs_uint32 server, char *pname,
640                    struct diskPartition64 *partition)
641 {
642     struct rx_connection *aconn;
643     afs_int32 code = 0;
644
645     aconn = (struct rx_connection *)0;
646     aconn = UV_Bind(server, AFSCONF_VOLUMEPORT);
647     code = AFSVolPartitionInfo64(aconn, pname, partition);
648     if (code == RXGEN_OPCODE) {
649         struct diskPartition *dpp =
650             (struct diskPartition *)malloc(sizeof(struct diskPartition));
651         code = AFSVolPartitionInfo(aconn, pname, dpp);
652         if (!code) {
653             strncpy(partition->name, dpp->name, 32);
654             strncpy(partition->devName, dpp->devName, 32);
655             partition->lock_fd = dpp->lock_fd;
656             partition->free = dpp->free;
657             partition->minFree = dpp->minFree;
658         }
659         free(dpp);
660     }
661     if (code) {
662         fprintf(STDERR, "Could not get information on partition %s\n", pname);
663         PrintError("", code);
664     }
665     if (aconn)
666         rx_DestroyConnection(aconn);
667     return code;
668 }
669
670 /* old interface to create volumes */
671 int
672 UV_CreateVolume(afs_uint32 aserver, afs_int32 apart, char *aname,
673                 afs_uint32 * anewid)
674 {
675     afs_int32 code;
676     *anewid = 0;
677     code = UV_CreateVolume2(aserver, apart, aname, 5000, 0, 0, 0, 0, anewid);
678     return code;
679 }
680
681 /* less old interface to create volumes */
682 int
683 UV_CreateVolume2(afs_uint32 aserver, afs_int32 apart, char *aname,
684                  afs_int32 aquota, afs_int32 aspare1, afs_int32 aspare2,
685                  afs_int32 aspare3, afs_int32 aspare4, afs_uint32 * anewid)
686 {
687     afs_uint32 roid = 0, bkid = 0;
688     return UV_CreateVolume3(aserver, apart, aname, aquota, aspare1, aspare2,
689         aspare3, aspare4, anewid, &roid, &bkid);
690 }
691
692 /**
693  * Create a volume on the given server and partition
694  *
695  * @param aserver  server to create volume on
696  * @param spart  partition to create volume on
697  * @param aname  name of new volume
698  * @param aquota  quota for new volume
699  * @param anewid  contains the desired volume id for the new volume. If
700  *                *anewid == 0, a new id will be chosen, and will be placed
701  *                in *anewid when UV_CreateVolume3 returns.
702  * @param aroid  contains the desired RO volume id. If NULL, the RO id entry
703  *               will be unset. If *aroid == 0, an id will be chosen, and
704  *               will be placed in *anewid when UV_CreateVolume3 returns.
705  * @param abkid  same as aroid, except for the BK volume id instead of the
706  *               RO volume id.
707  * @return 0 on success, error code otherwise.
708  */
709 int
710 UV_CreateVolume3(afs_uint32 aserver, afs_int32 apart, char *aname,
711                  afs_int32 aquota, afs_int32 aspare1, afs_int32 aspare2,
712                  afs_int32 aspare3, afs_int32 aspare4, afs_uint32 * anewid,
713                  afs_uint32 * aroid, afs_uint32 * abkid)
714 {
715     struct rx_connection *aconn;
716     afs_int32 tid;
717     afs_int32 code;
718     afs_int32 error;
719     afs_int32 rcode, vcode;
720     afs_int32 lastid;
721     struct nvldbentry entry, storeEntry;        /*the new vldb entry */
722     struct volintInfo tstatus;
723
724     tid = 0;
725     aconn = (struct rx_connection *)0;
726     error = 0;
727
728     init_volintInfo(&tstatus);
729     tstatus.maxquota = aquota;
730
731     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
732
733     if (aroid && *aroid) {
734         VPRINT1("Using RO volume ID %d.\n", *aroid);
735     }
736     if (abkid && *abkid) {
737         VPRINT1("Using BK volume ID %d.\n", *abkid);
738     }
739
740     if (*anewid) {
741         vcode = VLDB_GetEntryByID(*anewid, -1, &entry);
742         if (!vcode) {
743             fprintf(STDERR, "Volume ID %d already exists\n", *anewid);
744             return VVOLEXISTS;
745         }
746         VPRINT1("Using volume ID %d.\n", *anewid);
747     } else {
748         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, anewid);
749         EGOTO1(cfail, vcode, "Could not get an Id for volume %s\n", aname);
750
751         if (aroid && *aroid == 0) {
752             vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, aroid);
753             EGOTO1(cfail, vcode, "Could not get an RO Id for volume %s\n", aname);
754         }
755
756         if (abkid && *abkid == 0) {
757             vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, abkid);
758             EGOTO1(cfail, vcode, "Could not get a BK Id for volume %s\n", aname);
759         }
760     }
761
762     /* rw,ro, bk id are related in the default case */
763     /* If caller specified RW id, but not RO/BK ids, have them be RW+1 and RW+2 */
764     lastid = *anewid;
765     if (aroid && *aroid == 0) {
766         *aroid = ++lastid;
767     }
768     if (abkid && *abkid == 0) {
769         *abkid = ++lastid;
770     }
771
772     code =
773         AFSVolCreateVolume_retry(aconn, apart, aname, volser_RW, 0, anewid, &tid);
774     EGOTO2(cfail, code, "Failed to create the volume %s %u \n", aname,
775            *anewid);
776
777     code = AFSVolSetInfo(aconn, tid, &tstatus);
778     if (code)
779         EPRINT(code, "Could not change quota, continuing...\n");
780
781     code = AFSVolSetFlags(aconn, tid, 0);       /* bring it online (mark it InService */
782     EGOTO2(cfail, code, "Could not bring the volume %s %u online \n", aname,
783            *anewid);
784
785     VPRINT2("Volume %s %u created and brought online\n", aname, *anewid);
786
787     /* set up the vldb entry for this volume */
788     strncpy(entry.name, aname, VOLSER_OLDMAXVOLNAME);
789     entry.nServers = 1;
790     entry.serverNumber[0] = aserver;    /* this should have another
791                                          * level of indirection later */
792     entry.serverPartition[0] = apart;   /* this should also have
793                                          * another indirection level */
794     entry.flags = RW_EXISTS;    /* this records that rw volume exists */
795     entry.serverFlags[0] = ITSRWVOL;    /*this rep site has rw  vol */
796     entry.volumeId[RWVOL] = *anewid;
797     entry.volumeId[ROVOL] = aroid ? *aroid : 0;
798     entry.volumeId[BACKVOL] = abkid ? *abkid : 0;
799     entry.cloneId = 0;
800     /*map into right byte order, before passing to xdr, the stuff has to be in host
801      * byte order. Xdr converts it into network order */
802     MapNetworkToHost(&entry, &storeEntry);
803     /* create the vldb entry */
804     vcode = VLDB_CreateEntry(&storeEntry);
805     if (vcode) {
806         fprintf(STDERR,
807                 "Could not create a VLDB entry for the volume %s %lu\n",
808                 aname, (unsigned long)*anewid);
809         /*destroy the created volume */
810         VPRINT1("Deleting the newly created volume %u\n", *anewid);
811         AFSVolDeleteVolume(aconn, tid);
812         error = vcode;
813         goto cfail;
814     }
815     VPRINT2("Created the VLDB entry for the volume %s %u\n", aname, *anewid);
816     /* volume created, now terminate the transaction and release the connection */
817     code = AFSVolEndTrans(aconn, tid, &rcode);  /*if it crashes before this
818                                                  * the volume will come online anyway when transaction timesout , so if
819                                                  * vldb entry exists then the volume is guaranteed to exist too wrt create */
820     tid = 0;
821     if (code) {
822         fprintf(STDERR,
823                 "Failed to end the transaction on the volume %s %lu\n", aname,
824                 (unsigned long)*anewid);
825         error = code;
826         goto cfail;
827     }
828
829   cfail:
830     if (tid) {
831         code = AFSVolEndTrans(aconn, tid, &rcode);
832         if (code)
833             fprintf(STDERR, "WARNING: could not end transaction\n");
834     }
835     if (aconn)
836         rx_DestroyConnection(aconn);
837     PrintError("", error);
838     return error;
839 }
840
841 /* create a volume, given a server, partition number, volume name --> sends
842 * back new vol id in <anewid>*/
843 int
844 UV_AddVLDBEntry(afs_uint32 aserver, afs_int32 apart, char *aname,
845                 afs_uint32 aid)
846 {
847     struct rx_connection *aconn;
848     afs_int32 error;
849     afs_int32 vcode;
850     struct nvldbentry entry, storeEntry;        /*the new vldb entry */
851
852     aconn = (struct rx_connection *)0;
853     error = 0;
854
855     /* set up the vldb entry for this volume */
856     strncpy(entry.name, aname, VOLSER_OLDMAXVOLNAME);
857     entry.nServers = 1;
858     entry.serverNumber[0] = aserver;    /* this should have another
859                                          * level of indirection later */
860     entry.serverPartition[0] = apart;   /* this should also have
861                                          * another indirection level */
862     entry.flags = RW_EXISTS;    /* this records that rw volume exists */
863     entry.serverFlags[0] = ITSRWVOL;    /*this rep site has rw  vol */
864     entry.volumeId[RWVOL] = aid;
865 #ifdef notdef
866     entry.volumeId[ROVOL] = anewid + 1; /* rw,ro, bk id are related in the default case */
867     entry.volumeId[BACKVOL] = *anewid + 2;
868 #else
869     entry.volumeId[ROVOL] = 0;
870     entry.volumeId[BACKVOL] = 0;
871 #endif
872     entry.cloneId = 0;
873     /*map into right byte order, before passing to xdr, the stuff has to be in host
874      * byte order. Xdr converts it into network order */
875     MapNetworkToHost(&entry, &storeEntry);
876     /* create the vldb entry */
877     vcode = VLDB_CreateEntry(&storeEntry);
878     if (vcode) {
879         fprintf(STDERR,
880                 "Could not create a VLDB entry for the  volume %s %lu\n",
881                 aname, (unsigned long)aid);
882         error = vcode;
883         goto cfail;
884     }
885     VPRINT2("Created the VLDB entry for the volume %s %u\n", aname, aid);
886
887   cfail:
888     if (aconn)
889         rx_DestroyConnection(aconn);
890     PrintError("", error);
891     return error;
892 }
893
894 /* Delete the volume <volid>on <aserver> <apart>
895  * the physical entry gets removed from the vldb only if the ref count
896  * becomes zero
897  */
898 int
899 UV_DeleteVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid)
900 {
901     struct rx_connection *aconn = (struct rx_connection *)0;
902     afs_int32 ttid = 0;
903     afs_int32 code, rcode;
904     afs_int32 error = 0;
905     struct nvldbentry entry, storeEntry;
906     int islocked = 0;
907     afs_int32 avoltype = -1, vtype;
908     int notondisk = 0, notinvldb = 0;
909
910     /* Find and read bhe VLDB entry for this volume */
911     code = ubik_VL_SetLock(cstruct, 0, avolid, avoltype, VLOP_DELETE);
912     if (code) {
913         if (code != VL_NOENT) {
914             EGOTO1(error_exit, code,
915                    "Could not lock VLDB entry for the volume %u\n", avolid);
916         }
917         notinvldb = 1;
918     } else {
919         islocked = 1;
920
921         code = VLDB_GetEntryByID(avolid, avoltype, &entry);
922         EGOTO1(error_exit, code, "Could not fetch VLDB entry for volume %u\n",
923                avolid);
924         MapHostToNetwork(&entry);
925
926         if (verbose)
927             EnumerateEntry(&entry);
928     }
929
930     /* Whether volume is in the VLDB or not. Delete the volume on disk */
931     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
932
933     code = DoVolDelete(aconn, avolid, apart, "the", 0, NULL, NULL);
934     if (code) {
935         if (code == VNOVOL)
936             notondisk = 1;
937         else {
938             error = code;
939             goto error_exit;
940         }
941     }
942
943     /* Now update the VLDB entry.
944      * But first, verify we have a VLDB entry.
945      * Whether volume is on disk or not. Delete the volume in VLDB.
946      */
947     if (notinvldb)
948         ERROR_EXIT(0);
949
950     if (avolid == entry.volumeId[BACKVOL]) {
951         /* Its a backup volume, modify the VLDB entry. Check that the
952          * backup volume is on the server/partition we asked to delete.
953          */
954         if (!(entry.flags & BACK_EXISTS) || !Lp_Match(aserver, apart, &entry)) {
955             notinvldb = 2;      /* Not on this server and partition */
956             ERROR_EXIT(0);
957         }
958
959         VPRINT1("Marking the backup volume %u deleted in the VLDB\n", avolid);
960
961         entry.flags &= ~BACK_EXISTS;
962         vtype = BACKVOL;
963     }
964
965     else if (avolid == entry.volumeId[ROVOL]) {
966         /* Its a read-only volume, modify the VLDB entry. Check that the
967          * readonly volume is on the server/partition we asked to delete.
968          * If flags does not have RO_EIXSTS set, then this may mean the RO
969          * hasn't been released (and could exist in VLDB).
970          */
971         if (!Lp_ROMatch(aserver, apart, &entry)) {
972             notinvldb = 2;      /* Not found on this server and partition */
973             ERROR_EXIT(0);
974         }
975
976         if (verbose)
977             fprintf(STDOUT,
978                     "Marking the readonly volume %lu deleted in the VLDB\n",
979                     (unsigned long)avolid);
980
981         Lp_SetROValue(&entry, aserver, apart, 0, 0);    /* delete the site */
982         entry.nServers--;
983         if (!Lp_ROMatch(0, 0, &entry))
984             entry.flags &= ~RO_EXISTS;  /* This was the last ro volume */
985         vtype = ROVOL;
986     }
987
988     else if (avolid == entry.volumeId[RWVOL]) {
989         /* It's a rw volume, delete the backup volume, modify the VLDB entry.
990          * Check that the readwrite volumes is on the server/partition we
991          * asked to delete.
992          */
993         if (!(entry.flags & RW_EXISTS) || !Lp_Match(aserver, apart, &entry)) {
994             notinvldb = 2;      /* Not found on this server and partition */
995             ERROR_EXIT(0);
996         }
997
998         if (entry.volumeId[BACKVOL]) {
999             /* Delete backup if it exists */
1000             code = DoVolDelete(aconn, entry.volumeId[BACKVOL], apart,
1001                                "the backup", 0, NULL, NULL);
1002             if (code && code != VNOVOL) {
1003                 error = code;
1004                 goto error_exit;
1005             }
1006         }
1007
1008         if (verbose)
1009             fprintf(STDOUT,
1010                     "Marking the readwrite volume %lu%s deleted in the VLDB\n",
1011                     (unsigned long)avolid,
1012                     ((entry.
1013                       flags & BACK_EXISTS) ? ", and its backup volume," :
1014                      ""));
1015
1016         Lp_SetRWValue(&entry, aserver, apart, 0L, 0L);
1017         entry.nServers--;
1018         entry.flags &= ~(BACK_EXISTS | RW_EXISTS);
1019         vtype = RWVOL;
1020
1021         if (entry.flags & RO_EXISTS)
1022             fprintf(STDERR, "WARNING: ReadOnly copy(s) may still exist\n");
1023     }
1024
1025     else {
1026         notinvldb = 2;          /* Not found on this server and partition */
1027         ERROR_EXIT(0);
1028     }
1029
1030     /* Either delete or replace the VLDB entry */
1031     if ((entry.nServers <= 0) || !(entry.flags & (RO_EXISTS | RW_EXISTS))) {
1032         if (verbose)
1033             fprintf(STDOUT,
1034                     "Last reference to the VLDB entry for %lu - deleting entry\n",
1035                     (unsigned long)avolid);
1036         code = ubik_VL_DeleteEntry(cstruct, 0, avolid, vtype);
1037         EGOTO1(error_exit, code,
1038                "Could not delete the VLDB entry for the volume %u \n",
1039                avolid);
1040     } else {
1041         MapNetworkToHost(&entry, &storeEntry);
1042         code =
1043             VLDB_ReplaceEntry(avolid, vtype, &storeEntry,
1044                               (LOCKREL_OPCODE | LOCKREL_AFSID |
1045                                LOCKREL_TIMESTAMP));
1046         EGOTO1(error_exit, code,
1047                "Could not update the VLDB entry for the volume %u \n",
1048                avolid);
1049     }
1050     islocked = 0;
1051
1052   error_exit:
1053     if (error)
1054         EPRINT(error, "\n");
1055
1056     if (notondisk && notinvldb) {
1057         EPRINT2(VOLSERNOVOL, "Volume %u does not exist %s\n", avolid,
1058                 ((notinvldb == 2) ? "on server and partition" : ""));
1059         if (!error)
1060             error = VOLSERNOVOL;
1061     } else if (notondisk) {
1062         fprintf(STDERR,
1063                 "WARNING: Volume %lu did not exist on the partition\n",
1064                 (unsigned long)avolid);
1065     } else if (notinvldb) {
1066         fprintf(STDERR, "WARNING: Volume %lu does not exist in VLDB %s\n",
1067                 (unsigned long)avolid,
1068                 ((notinvldb == 2) ? "on server and partition" : ""));
1069     }
1070
1071     if (ttid) {
1072         code = AFSVolEndTrans(aconn, ttid, &rcode);
1073         code = (code ? code : rcode);
1074         if (code) {
1075             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
1076                     (unsigned long)avolid);
1077             PrintError("", code);
1078             if (!error)
1079                 error = code;
1080         }
1081     }
1082
1083     if (islocked) {
1084         code =
1085             ubik_VL_ReleaseLock(cstruct, 0, avolid, -1,
1086                                 (LOCKREL_OPCODE | LOCKREL_AFSID |
1087                                  LOCKREL_TIMESTAMP));
1088         if (code) {
1089             EPRINT1(code,
1090                     "Could not release the lock on the VLDB entry for the volume %u \n",
1091                     avolid);
1092             if (!error)
1093                 error = code;
1094         }
1095     }
1096
1097     if (aconn)
1098         rx_DestroyConnection(aconn);
1099     return error;
1100 }
1101
1102 /* add recovery to UV_MoveVolume */
1103
1104 #define TESTC   0               /* set to test recovery code, clear for production */
1105
1106 jmp_buf env;
1107 int interrupt = 0;
1108
1109 static void *
1110 do_interrupt(void * unused)
1111 {
1112     if (interrupt) {
1113 #if !defined(AFS_PTHREAD_ENV) && !defined(AFS_NT40_ENV)
1114         /* Avoid UNIX LWP from getting confused that our stack has suddenly
1115          * changed. This will avoid some sanity checks, but until a better way
1116          * is found, the only alternative is always crashing and burning on at
1117          * least the stack-overflow check. */
1118         lwp_cpptr->stack = NULL;
1119 #endif
1120         longjmp(env, 0);
1121     }
1122
1123     fprintf(STDOUT, "\nSIGINT handler: vos move operation in progress\n");
1124     fprintf(STDOUT,
1125             "WARNING: may leave AFS storage and metadata in indeterminate state\n");
1126     fprintf(STDOUT, "enter second control-c to exit\n");
1127     fflush(STDOUT);
1128
1129     interrupt = 1;
1130     return NULL;
1131 }
1132
1133 static void
1134 sigint_handler(int x)
1135 {
1136 #ifdef AFS_PTHREAD_ENV
1137     do_interrupt(NULL);
1138 #else
1139     IOMGR_SoftSig(do_interrupt, 0);
1140 #endif
1141     (void)signal(SIGINT, sigint_handler);
1142 }
1143
1144 static int
1145 DoVolDelete(struct rx_connection *aconn, afs_uint32 avolid,
1146             afs_int32 apart, char *ptypestring, afs_uint32 atoserver,
1147             struct volser_status *volstatus, char *pprefix)
1148 {
1149     afs_int32 ttid = 0, code, rcode, error = 0;
1150     char *prefix, *typestring;
1151     int beverbose = 0;
1152
1153     if (pprefix)
1154         prefix = pprefix;
1155     else
1156         prefix = "";
1157
1158     if (ptypestring) {
1159         typestring = ptypestring;
1160         beverbose = 1;
1161     } else
1162         typestring = "the";
1163
1164     if (beverbose)
1165         VPRINT3("%sDeleting %s volume %u ...", prefix, typestring, avolid);
1166
1167     code =
1168         AFSVolTransCreate_retry(aconn, avolid, apart, ITOffline, &ttid);
1169
1170     EGOTO2(dfail, code, "%sFailed to start transaction on %u\n",
1171            prefix, avolid);
1172
1173     if (volstatus) {
1174         code = AFSVolGetStatus(aconn, ttid, volstatus);
1175         EGOTO2(dfail, code, "%sCould not get timestamp from volume %u\n",
1176                prefix, avolid);
1177     }
1178
1179     code =
1180         AFSVolSetFlags(aconn, ttid,
1181                        VTDeleteOnSalvage | VTOutOfService);
1182
1183     EGOTO2(dfail, code, "%sCould not set flags on volume %u \n",
1184            prefix, avolid);
1185
1186     if (atoserver) {
1187         VPRINT1("%sSetting volume forwarding pointer ...", prefix);
1188         AFSVolSetForwarding(aconn, ttid, atoserver);
1189         VDONE;
1190     }
1191
1192     code = AFSVolDeleteVolume(aconn, ttid);
1193     EGOTO2(dfail, code, "%sCould not delete volume %u\n", prefix, avolid);
1194
1195 dfail:
1196     if (ttid) {
1197         code = AFSVolEndTrans(aconn, ttid, &rcode);
1198         ttid = 0;
1199         if (!code)
1200             code = rcode;
1201         if (code) {
1202             fprintf(STDERR, "%sCould not end transaction on %s volume %lu \n",
1203                     prefix, typestring, (unsigned long)avolid);
1204             if (!error)
1205                 error = code;
1206         }
1207     }
1208
1209     if (beverbose && !error)
1210         VDONE;
1211     return error;
1212 }
1213
1214 static int
1215 DoVolClone(struct rx_connection *aconn, afs_uint32 avolid,
1216            afs_int32 apart, int type, afs_uint32 cloneid,
1217            char *typestring, char *pname, char *vname, char *suffix,
1218            struct volser_status *volstatus, afs_int32 *transPtr)
1219 {
1220     char cname[64];
1221     afs_int32 ttid = 0, btid = 0;
1222     afs_int32 code = 0, rcode = 0;
1223     afs_int32 error = 0;
1224     int cloneexists = 1;
1225
1226     /* Test to see if the clone volume exists by trying to create
1227      * a transaction on the clone volume. We've assumed the clone exists.
1228      */
1229     code = AFSVolTransCreate_retry(aconn, cloneid, apart, ITOffline, &btid);
1230     if (code) {
1231         if (code != VNOVOL) {
1232             EPRINT2(code, "Could not reach the %s volume %lu\n",
1233                     typestring, (unsigned long)cloneid);
1234             error = code;
1235             goto cfail;
1236         }
1237         cloneexists = 0;         /* clone volume does not exist */
1238     }
1239     if (btid) {
1240         code = AFSVolEndTrans(aconn, btid, &rcode);
1241         btid = 0;
1242         if (code || rcode) {
1243             fprintf(STDERR,
1244                     "Could not end transaction on the previous %s volume %lu\n",
1245                     typestring, (unsigned long)cloneid);
1246             error = (code ? code : rcode);
1247             goto cfail;
1248         }
1249     }
1250
1251     /* Now go ahead and try to clone the RW volume.
1252      * First start a transaction on the RW volume
1253      */
1254     code = AFSVolTransCreate_retry(aconn, avolid, apart, ITBusy, &ttid);
1255     if (code) {
1256         fprintf(STDERR, "Could not start a transaction on the volume %lu\n",
1257                 (unsigned long)avolid);
1258         error = code;
1259         goto cfail;
1260     }
1261
1262     /* Clone or reclone the volume, depending on whether the clone
1263      * volume exists or not
1264      */
1265     if (cloneexists) {
1266         VPRINT2("Re-cloning %s volume %u ...", typestring, cloneid);
1267
1268         code = AFSVolReClone(aconn, ttid, cloneid);
1269         if (code) {
1270             EPRINT2(code, "Could not re-clone %s volume %lu\n",
1271                     typestring, (unsigned long)cloneid);
1272             error = code;
1273             goto cfail;
1274         }
1275     } else {
1276         VPRINT2("Creating a new %s clone %u ...", typestring, cloneid);
1277
1278         if (!vname) {
1279             strcpy(cname, pname);
1280             strcat(cname, suffix);
1281         }
1282
1283         code = AFSVolClone(aconn, ttid, 0, type, vname?vname:cname,
1284                            &cloneid);
1285         if (code) {
1286             fprintf(STDERR, "Failed to clone the volume %lu\n",
1287                     (unsigned long)avolid);
1288             error = code;
1289             goto cfail;
1290         }
1291     }
1292
1293     VDONE;
1294
1295     if (volstatus) {
1296         VPRINT1("Getting status of parent volume %u...", avolid);
1297         code = AFSVolGetStatus(aconn, ttid, volstatus);
1298         if (code) {
1299             fprintf(STDERR, "Failed to get the status of the parent volume %lu\n",
1300                     (unsigned long)avolid);
1301             error = code;
1302             goto cfail;
1303         }
1304         VDONE;
1305     }
1306
1307 cfail:
1308     if (ttid) {
1309         code = AFSVolEndTrans(aconn, ttid, &rcode);
1310         if (code || rcode) {
1311             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
1312                     (unsigned long)avolid);
1313             if (!error)
1314                 error = (code ? code : rcode);
1315         }
1316     }
1317
1318     if (btid) {
1319         code = AFSVolEndTrans(aconn, btid, &rcode);
1320         if (code || rcode) {
1321             fprintf(STDERR,
1322                     "Could not end transaction on the %s volume %lu\n",
1323                     typestring, (unsigned long)cloneid);
1324             if (!error)
1325                 error = (code ? code : rcode);
1326         }
1327     }
1328     return error;
1329 }
1330
1331 /* Move volume <afromvol> on <afromserver> <afrompart> to <atoserver>
1332  * <atopart>.  The operation is almost idempotent.  The following
1333  * flags are recognized:
1334  *
1335  *     RV_NOCLONE - don't use a copy clone
1336  */
1337
1338 int
1339 UV_MoveVolume2(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
1340                afs_uint32 atoserver, afs_int32 atopart, int flags)
1341 {
1342     /* declare stuff 'volatile' that may be used from setjmp/longjmp and may
1343      * be changing during the move */
1344     struct rx_connection * volatile toconn;
1345     struct rx_connection * volatile fromconn;
1346     afs_int32 volatile fromtid;
1347     afs_int32 volatile totid;
1348     afs_int32 volatile clonetid;
1349     afs_uint32 volatile newVol;
1350     afs_uint32 volatile volid;
1351     afs_uint32 volatile backupId;
1352     int volatile islocked;
1353     int volatile pntg;
1354
1355     char vname[64];
1356     char *volName = 0;
1357     char tmpName[VOLSER_MAXVOLNAME + 1];
1358     afs_int32 rcode;
1359     afs_int32 fromDate;
1360     afs_int32 tmp;
1361     afs_uint32 tmpVol;
1362     struct restoreCookie cookie;
1363     afs_int32 vcode, code;
1364     struct volser_status tstatus;
1365     struct destServer destination;
1366
1367     struct nvldbentry entry, storeEntry;
1368     int i;
1369     afs_int32 error;
1370     char in, lf;                /* for test code */
1371     int same;
1372     char hoststr[16];
1373
1374 #ifdef  ENABLE_BUGFIX_1165
1375     volEntries volumeInfo;
1376     struct volintInfo *infop = 0;
1377 #endif
1378
1379     islocked = 0;
1380     fromconn = (struct rx_connection *)0;
1381     toconn = (struct rx_connection *)0;
1382     fromtid = 0;
1383     totid = 0;
1384     clonetid = 0;
1385     error = 0;
1386     volid = 0;
1387     pntg = 0;
1388     backupId = 0;
1389     newVol = 0;
1390
1391     /* support control-c processing */
1392     if (setjmp(env))
1393         goto mfail;
1394     (void)signal(SIGINT, sigint_handler);
1395
1396     if (TESTC) {
1397         fprintf(STDOUT,
1398                 "\nThere are three tests points - verifies all code paths through recovery.\n");
1399         fprintf(STDOUT, "First test point - operation not started.\n");
1400         fprintf(STDOUT, "...test here (y, n)? ");
1401         fflush(STDOUT);
1402         fscanf(stdin, "%c", &in);
1403         fscanf(stdin, "%c", &lf);       /* toss away */
1404         if (in == 'y') {
1405             fprintf(STDOUT, "type control-c\n");
1406             while (1) {
1407                 fprintf(stdout, ".");
1408                 fflush(stdout);
1409                 sleep(1);
1410             }
1411         }
1412         /* or drop through */
1413     }
1414
1415     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
1416     EGOTO1(mfail, vcode,
1417            "Could not fetch the entry for the volume  %u from the VLDB \n",
1418            afromvol);
1419
1420     if (entry.volumeId[RWVOL] != afromvol) {
1421         fprintf(STDERR, "Only RW volume can be moved\n");
1422         exit(1);
1423     }
1424
1425     vcode = ubik_VL_SetLock(cstruct, 0, afromvol, RWVOL, VLOP_MOVE);
1426     EGOTO1(mfail, vcode, "Could not lock entry for volume %u \n", afromvol);
1427     islocked = 1;
1428
1429     vcode = VLDB_GetEntryByID(afromvol, RWVOL, &entry);
1430     EGOTO1(mfail, vcode,
1431            "Could not fetch the entry for the volume  %u from the VLDB \n",
1432            afromvol);
1433
1434     backupId = entry.volumeId[BACKVOL];
1435     MapHostToNetwork(&entry);
1436
1437     if (!Lp_Match(afromserver, afrompart, &entry)) {
1438         /* the from server and partition do not exist in the vldb entry corresponding to volid */
1439         if (!Lp_Match(atoserver, atopart, &entry)) {
1440             /* the to server and partition do not exist in the vldb entry corresponding to volid */
1441             fprintf(STDERR, "The volume %lu is not on the specified site. \n",
1442                     (unsigned long)afromvol);
1443             fprintf(STDERR, "The current site is :");
1444             for (i = 0; i < entry.nServers; i++) {
1445                 if (entry.serverFlags[i] == ITSRWVOL) {
1446                     char pname[10];
1447                     MapPartIdIntoName(entry.serverPartition[i], pname);
1448                     fprintf(STDERR, " server %s partition %s \n",
1449                             noresolve ? afs_inet_ntoa_r(entry.serverNumber[i], hoststr) :
1450                             hostutil_GetNameByINet(entry.serverNumber[i]),
1451                             pname);
1452                 }
1453             }
1454             vcode =
1455                 ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
1456                           (LOCKREL_OPCODE | LOCKREL_AFSID |
1457                            LOCKREL_TIMESTAMP));
1458             EGOTO1(mfail, vcode,
1459                    " Could not release lock on the VLDB entry for the volume %u \n",
1460                    afromvol);
1461
1462             return VOLSERVOLMOVED;
1463         }
1464
1465         /* delete the volume afromvol on src_server */
1466         /* from-info does not exist but to-info does =>
1467          * we have already done the move, but the volume
1468          * may still be existing physically on from fileserver
1469          */
1470         fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
1471         pntg = 1;
1472
1473         code = DoVolDelete(fromconn, afromvol, afrompart,
1474                            "leftover", 0, NULL, NULL);
1475         if (code && code != VNOVOL) {
1476             error = code;
1477             goto mfail;
1478         }
1479
1480         code = DoVolDelete(fromconn, backupId, afrompart,
1481                            "leftover backup", 0, NULL, NULL);
1482         if (code && code != VNOVOL) {
1483             error = code;
1484             goto mfail;
1485         }
1486
1487         fromtid = 0;
1488         error = 0;
1489         goto mfail;
1490     }
1491
1492     /* From-info matches the vldb info about volid,
1493      * its ok start the move operation, the backup volume
1494      * on the old site is deleted in the process
1495      */
1496     if (afrompart == atopart) {
1497         same = VLDB_IsSameAddrs(afromserver, atoserver, &error);
1498         EGOTO2(mfail, error,
1499                "Failed to get info about server's %d address(es) from vlserver (err=%d); aborting call!\n",
1500                afromserver, error);
1501
1502         if (same) {
1503             EGOTO1(mfail, VOLSERVOLMOVED,
1504                    "Warning: Moving volume %u to its home partition ignored!\n",
1505                    afromvol);
1506         }
1507     }
1508
1509     pntg = 1;
1510     toconn = UV_Bind(atoserver, AFSCONF_VOLUMEPORT);    /* get connections to the servers */
1511     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
1512     fromtid = totid = 0;        /* initialize to uncreated */
1513
1514     /* ***
1515      * clone the read/write volume locally.
1516      * ***/
1517
1518     VPRINT1("Starting transaction on source volume %u ...", afromvol);
1519     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
1520     fromtid = tmp;
1521     EGOTO1(mfail, code, "Failed to create transaction on the volume %u\n",
1522            afromvol);
1523     VDONE;
1524
1525     if (!(flags & RV_NOCLONE)) {
1526         /* Get a clone id */
1527         VPRINT1("Allocating new volume id for clone of volume %u ...",
1528                 afromvol);
1529         newVol = tmpVol = 0;
1530         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &tmpVol);
1531         newVol = tmpVol;
1532         EGOTO1(mfail, vcode,
1533                "Could not get an ID for the clone of volume %u from the VLDB\n",
1534                afromvol);
1535         VDONE;
1536
1537         /* Do the clone. Default flags on clone are set to delete on salvage and out of service */
1538         VPRINT1("Cloning source volume %u ...", afromvol);
1539         strcpy(vname, "move-clone-temp");
1540         code =
1541             AFSVolClone(fromconn, fromtid, 0, readonlyVolume, vname, &tmpVol);
1542         newVol = tmpVol;
1543         EGOTO1(mfail, code, "Failed to clone the source volume %u\n",
1544                afromvol);
1545         VDONE;
1546     }
1547
1548     /* lookup the name of the volume we just cloned */
1549     volid = afromvol;
1550     code = AFSVolGetName(fromconn, fromtid, &volName);
1551     EGOTO1(mfail, code, "Failed to get the name of the volume %u\n",
1552            afromvol);
1553
1554     VPRINT1("Ending the transaction on the source volume %u ...", afromvol);
1555     rcode = 0;
1556     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
1557     fromtid = 0;
1558     if (!code)
1559         code = rcode;
1560     EGOTO1(mfail, code,
1561            "Failed to end the transaction on the source volume %u\n",
1562            afromvol);
1563     VDONE;
1564
1565     /* ***
1566      * Create the destination volume
1567      * ***/
1568
1569     if (!(flags & RV_NOCLONE)) {
1570         /* All of this is to get the fromDate */
1571         VPRINT1("Starting transaction on the cloned volume %u ...", newVol);
1572         tmp = clonetid;
1573         code =
1574             AFSVolTransCreate_retry(fromconn, newVol, afrompart, ITOffline,
1575                               &tmp);
1576         clonetid = tmp;
1577         EGOTO1(mfail, code,
1578                "Failed to start a transaction on the cloned volume%u\n",
1579                newVol);
1580         VDONE;
1581
1582         VPRINT1("Setting flags on cloned volume %u ...", newVol);
1583         code =
1584             AFSVolSetFlags(fromconn, clonetid,
1585                            VTDeleteOnSalvage | VTOutOfService); /*redundant */
1586         EGOTO1(mfail, code, "Could not set flags on the cloned volume %u\n",
1587                newVol);
1588         VDONE;
1589
1590         /* remember time from which we've dumped the volume */
1591         VPRINT1("Getting status of cloned volume %u ...", newVol);
1592         code = AFSVolGetStatus(fromconn, clonetid, &tstatus);
1593         EGOTO1(mfail, code,
1594                "Failed to get the status of the cloned volume %u\n",
1595                newVol);
1596         VDONE;
1597
1598         fromDate = CLOCKADJ(tstatus.creationDate);
1599     } else {
1600         /* With RV_NOCLONE, just do a full copy from the source */
1601         fromDate = 0;
1602     }
1603
1604
1605 #ifdef  ENABLE_BUGFIX_1165
1606     /*
1607      * Get the internal volume state from the source volume. We'll use such info (i.e. dayUse)
1608      * to copy it to the new volume (via AFSSetInfo later on) so that when we move volumes we
1609      * don't use this information...
1610      */
1611     volumeInfo.volEntries_val = (volintInfo *) 0;       /*this hints the stub to allocate space */
1612     volumeInfo.volEntries_len = 0;
1613     code = AFSVolListOneVolume(fromconn, afrompart, afromvol, &volumeInfo);
1614     EGOTO1(mfail, code,
1615            "Failed to get the volint Info of the cloned volume %u\n",
1616            afromvol);
1617
1618     infop = (volintInfo *) volumeInfo.volEntries_val;
1619     infop->maxquota = -1;       /* Else it will replace the default quota */
1620     infop->creationDate = -1;   /* Else it will use the source creation date */
1621     infop->updateDate = -1;     /* Else it will use the source update date */
1622 #endif
1623
1624     /* create a volume on the target machine */
1625     volid = afromvol;
1626     code = DoVolDelete(toconn, volid, atopart,
1627                        "pre-existing destination", 0, NULL, NULL);
1628     if (code && code != VNOVOL) {
1629         error = code;
1630         goto mfail;
1631     }
1632
1633     VPRINT1("Creating the destination volume %u ...", volid);
1634     tmp = totid;
1635     tmpVol = volid;
1636     code =
1637         AFSVolCreateVolume(toconn, atopart, volName, volser_RW, volid, &tmpVol,
1638                            &tmp);
1639     totid = tmp;
1640     volid = tmpVol;
1641     EGOTO1(mfail, code, "Failed to create the destination volume %u\n",
1642            volid);
1643     VDONE;
1644
1645     strncpy(tmpName, volName, VOLSER_OLDMAXVOLNAME);
1646     free(volName);
1647     volName = NULL;
1648
1649     VPRINT1("Setting volume flags on destination volume %u ...", volid);
1650     code =
1651         AFSVolSetFlags(toconn, totid, (VTDeleteOnSalvage | VTOutOfService));
1652     EGOTO1(mfail, code,
1653            "Failed to set the flags on the destination volume %u\n", volid);
1654     VDONE;
1655
1656     /***
1657      * Now dump the clone to the new volume
1658      ***/
1659
1660     destination.destHost = ntohl(atoserver);
1661     destination.destPort = AFSCONF_VOLUMEPORT;
1662     destination.destSSID = 1;
1663
1664     strncpy(cookie.name, tmpName, VOLSER_OLDMAXVOLNAME);
1665     cookie.type = RWVOL;
1666     cookie.parent = entry.volumeId[RWVOL];
1667     cookie.clone = 0;
1668
1669     if (!(flags & RV_NOCLONE)) {
1670         /* Copy the clone to the new volume */
1671         VPRINT2("Dumping from clone %u on source to volume %u on destination ...",
1672                 newVol, afromvol);
1673         code =
1674             AFSVolForward(fromconn, clonetid, 0, &destination, totid,
1675                           &cookie);
1676         EGOTO1(mfail, code, "Failed to move data for the volume %u\n", volid);
1677         VDONE;
1678
1679         VPRINT1("Ending transaction on cloned volume %u ...", newVol);
1680         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
1681         if (!code)
1682             code = rcode;
1683         clonetid = 0;
1684         EGOTO1(mfail, code,
1685                "Failed to end the transaction on the cloned volume %u\n",
1686                newVol);
1687         VDONE;
1688     }
1689
1690     /* ***
1691      * reattach to the main-line volume, and incrementally dump it.
1692      * ***/
1693
1694     VPRINT1("Starting transaction on source volume %u ...", afromvol);
1695     tmp = fromtid;
1696     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
1697     fromtid = tmp;
1698     EGOTO1(mfail, code,
1699            "Failed to create a transaction on the source volume %u\n",
1700            afromvol);
1701     VDONE;
1702
1703     /* now do the incremental */
1704     VPRINT2
1705         ("Doing the%s dump from source to destination for volume %u ... ",
1706          (flags & RV_NOCLONE) ? "" : " incremental",
1707          afromvol);
1708     code =
1709         AFSVolForward(fromconn, fromtid, fromDate, &destination, totid,
1710                       &cookie);
1711     EGOTO1(mfail, code,
1712            "Failed to do the%s dump from rw volume on old site to rw volume on newsite\n",
1713           (flags & RV_NOCLONE) ? "" : " incremental");
1714     VDONE;
1715
1716     /* now adjust the flags so that the new volume becomes official */
1717     VPRINT1("Setting volume flags on old source volume %u ...", afromvol);
1718     code = AFSVolSetFlags(fromconn, fromtid, VTOutOfService);
1719     EGOTO(mfail, code,
1720           "Failed to set the flags to make old source volume offline\n");
1721     VDONE;
1722
1723     VPRINT1("Setting volume flags on new source volume %u ...", afromvol);
1724     code = AFSVolSetFlags(toconn, totid, 0);
1725     EGOTO(mfail, code,
1726           "Failed to set the flags to make new source volume online\n");
1727     VDONE;
1728
1729 #ifdef  ENABLE_BUGFIX_1165
1730     VPRINT1("Setting volume status on destination volume %u ...", volid);
1731     code = AFSVolSetInfo(toconn, totid, infop);
1732     EGOTO1(mfail, code,
1733            "Failed to set volume status on the destination volume %u\n",
1734            volid);
1735     VDONE;
1736 #endif
1737
1738     /* put new volume online */
1739     VPRINT1("Ending transaction on destination volume %u ...", afromvol);
1740     code = AFSVolEndTrans(toconn, totid, &rcode);
1741     totid = 0;
1742     if (!code)
1743         code = rcode;
1744     EGOTO1(mfail, code,
1745            "Failed to end the transaction on the volume %u on the new site\n",
1746            afromvol);
1747     VDONE;
1748
1749     Lp_SetRWValue(&entry, afromserver, afrompart, atoserver, atopart);
1750     MapNetworkToHost(&entry, &storeEntry);
1751     storeEntry.flags &= ~BACK_EXISTS;
1752
1753     if (TESTC) {
1754         fprintf(STDOUT,
1755                 "Second test point - operation in progress but not complete.\n");
1756         fprintf(STDOUT, "...test here (y, n)? ");
1757         fflush(STDOUT);
1758         fscanf(stdin, "%c", &in);
1759         fscanf(stdin, "%c", &lf);       /* toss away */
1760         if (in == 'y') {
1761             fprintf(STDOUT, "type control-c\n");
1762             while (1) {
1763                 fprintf(stdout, ".");
1764                 fflush(stdout);
1765                 sleep(1);
1766             }
1767         }
1768         /* or drop through */
1769     }
1770
1771     VPRINT1("Releasing lock on VLDB entry for volume %u ...", afromvol);
1772     vcode =
1773         VLDB_ReplaceEntry(afromvol, -1, &storeEntry,
1774                           (LOCKREL_OPCODE | LOCKREL_AFSID |
1775                            LOCKREL_TIMESTAMP));
1776     if (vcode) {
1777         fprintf(STDERR,
1778                 " Could not release the lock on the VLDB entry for the volume %s %lu \n",
1779                 storeEntry.name, (unsigned long)afromvol);
1780         error = vcode;
1781         goto mfail;
1782     }
1783     islocked = 0;
1784     VDONE;
1785
1786     if (TESTC) {
1787         fprintf(STDOUT,
1788                 "Third test point - operation complete but no cleanup.\n");
1789         fprintf(STDOUT, "...test here (y, n)? ");
1790         fflush(STDOUT);
1791         fscanf(stdin, "%c", &in);
1792         fscanf(stdin, "%c", &lf);       /* toss away */
1793         if (in == 'y') {
1794             fprintf(STDOUT, "type control-c\n");
1795             while (1) {
1796                 fprintf(stdout, ".");
1797                 fflush(stdout);
1798                 sleep(1);
1799             }
1800         }
1801         /* or drop through */
1802     }
1803 #ifdef notdef
1804     /* This is tricky.  File server is very stupid, and if you mark the volume
1805      * as VTOutOfService, it may mark the *good* instance (if you're moving
1806      * between partitions on the same machine) as out of service.  Since
1807      * we're cleaning this code up in DEcorum, we're just going to kludge around
1808      * it for now by removing this call. */
1809     /* already out of service, just zap it now */
1810     code =
1811         AFSVolSetFlags(fromconn, fromtid, VTDeleteOnSalvage | VTOutOfService);
1812     if (code) {
1813         fprintf(STDERR,
1814                 "Failed to set the flags to make the old source volume offline\n");
1815         goto mfail;
1816     }
1817 #endif
1818     if (atoserver != afromserver) {
1819         /* set forwarding pointer for moved volumes */
1820         VPRINT1("Setting forwarding pointer for volume %u ...", afromvol);
1821         code = AFSVolSetForwarding(fromconn, fromtid, atoserver);
1822         EGOTO1(mfail, code,
1823                "Failed to set the forwarding pointer for the volume %u\n",
1824                afromvol);
1825         VDONE;
1826     }
1827
1828     VPRINT1("Deleting old volume %u on source ...", afromvol);
1829     code = AFSVolDeleteVolume(fromconn, fromtid);       /* zap original volume */
1830     EGOTO1(mfail, code, "Failed to delete the old volume %u on source\n",
1831            afromvol);
1832     VDONE;
1833
1834     VPRINT1("Ending transaction on old volume %u on the source ...",
1835             afromvol);
1836     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
1837     fromtid = 0;
1838     if (!code)
1839         code = rcode;
1840     EGOTO1(mfail, code,
1841            "Failed to end the transaction on the old volume %u on the source\n",
1842            afromvol);
1843     VDONE;
1844
1845     code = DoVolDelete(fromconn, backupId, afrompart,
1846                        "source backup", 0, NULL, NULL);
1847     if (code && code != VNOVOL) {
1848         error = code;
1849         goto mfail;
1850     }
1851
1852     code = 0;           /* no backup volume? that's okay */
1853
1854     fromtid = 0;
1855     if (!(flags & RV_NOCLONE)) {
1856         code = DoVolDelete(fromconn, newVol, afrompart,
1857                            "cloned", 0, NULL, NULL);
1858         if (code) {
1859             error = code;
1860             goto mfail;
1861         }
1862     }
1863
1864     /* fall through */
1865     /* END OF MOVE */
1866
1867     if (TESTC) {
1868         fprintf(STDOUT, "Fourth test point - operation complete.\n");
1869         fprintf(STDOUT, "...test here (y, n)? ");
1870         fflush(STDOUT);
1871         fscanf(stdin, "%c", &in);
1872         fscanf(stdin, "%c", &lf);       /* toss away */
1873         if (in == 'y') {
1874             fprintf(STDOUT, "type control-c\n");
1875             while (1) {
1876                 fprintf(stdout, ".");
1877                 fflush(stdout);
1878                 sleep(1);
1879             }
1880         }
1881         /* or drop through */
1882     }
1883
1884     /* normal cleanup code */
1885
1886     if (entry.flags & RO_EXISTS)
1887         fprintf(STDERR, "WARNING : readOnly copies still exist \n");
1888
1889     if (islocked) {
1890         VPRINT1("Cleanup: Releasing VLDB lock on volume %u ...", afromvol);
1891         vcode =
1892             ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
1893                       (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
1894         if (vcode) {
1895             VPRINT("\n");
1896             fprintf(STDERR,
1897                     " Could not release the lock on the VLDB entry for the volume %lu \n",
1898                     (unsigned long)afromvol);
1899             if (!error)
1900                 error = vcode;
1901         }
1902         VDONE;
1903     }
1904
1905     if (fromtid) {
1906         VPRINT1("Cleanup: Ending transaction on source volume %u ...",
1907                 afromvol);
1908         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
1909         if (code || rcode) {
1910             VPRINT("\n");
1911             fprintf(STDERR,
1912                     "Could not end transaction on the source volume %lu\n",
1913                     (unsigned long)afromvol);
1914             if (!error)
1915                 error = (code ? code : rcode);
1916         }
1917         VDONE;
1918     }
1919
1920     if (clonetid) {
1921         VPRINT1("Cleanup: Ending transaction on clone volume %u ...", newVol);
1922         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
1923         if (code || rcode) {
1924             VPRINT("\n");
1925             fprintf(STDERR,
1926                     "Could not end transaction on the source's clone volume %lu\n",
1927                     (unsigned long)newVol);
1928             if (!error)
1929                 error = (code ? code : rcode);
1930         }
1931         VDONE;
1932     }
1933
1934     if (totid) {
1935         VPRINT1("Cleanup: Ending transaction on destination volume %u ...",
1936                 afromvol);
1937         code = AFSVolEndTrans(toconn, totid, &rcode);
1938         if (code) {
1939             VPRINT("\n");
1940             fprintf(STDERR,
1941                     "Could not end transaction on destination volume %lu\n",
1942                     (unsigned long)afromvol);
1943             if (!error)
1944                 error = (code ? code : rcode);
1945         }
1946         VDONE;
1947     }
1948     if (volName)
1949         free(volName);
1950 #ifdef  ENABLE_BUGFIX_1165
1951     if (infop)
1952         free(infop);
1953 #endif
1954     if (fromconn)
1955         rx_DestroyConnection(fromconn);
1956     if (toconn)
1957         rx_DestroyConnection(toconn);
1958     PrintError("", error);
1959     return error;
1960
1961     /* come here only when the sky falls */
1962   mfail:
1963
1964     if (pntg) {
1965         fprintf(STDOUT,
1966                 "vos move: operation interrupted, cleanup in progress...\n");
1967         fprintf(STDOUT, "clear transaction contexts\n");
1968         fflush(STDOUT);
1969     }
1970
1971     /* unlock VLDB entry */
1972     if (islocked) {
1973         VPRINT1("Recovery: Releasing VLDB lock on volume %u ...", afromvol);
1974         ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
1975                   (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
1976         VDONE;
1977         islocked = 0;
1978     }
1979
1980     if (clonetid) {
1981         VPRINT("Recovery: Ending transaction on clone volume ...");
1982         AFSVolEndTrans(fromconn, clonetid, &rcode);
1983         VDONE;
1984     }
1985     if (totid) {
1986         VPRINT("Recovery: Ending transaction on destination volume ...");
1987         AFSVolEndTrans(toconn, totid, &rcode);
1988         VDONE;
1989     }
1990     if (fromtid) {              /* put it on-line */
1991         VPRINT("Recovery: Setting volume flags on source volume ...");
1992         AFSVolSetFlags(fromconn, fromtid, 0);
1993         VDONE;
1994
1995         VPRINT("Recovery: Ending transaction on source volume ...");
1996         AFSVolEndTrans(fromconn, fromtid, &rcode);
1997         VDONE;
1998     }
1999
2000     VPRINT("Recovery: Accessing VLDB.\n");
2001     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2002     if (vcode) {
2003         fprintf(STDOUT, "FATAL: VLDB access error: abort cleanup\n");
2004         fflush(STDOUT);
2005         goto done;
2006     }
2007     MapHostToNetwork(&entry);
2008
2009     /* Delete either the volume on the source location or the target location.
2010      * If the vldb entry still points to the source location, then we know the
2011      * volume move didn't finish so we remove the volume from the target
2012      * location. Otherwise, we remove the volume from the source location.
2013      */
2014     if (Lp_Match(afromserver, afrompart, &entry)) {     /* didn't move - delete target volume */
2015         if (pntg) {
2016             fprintf(STDOUT,
2017                     "move incomplete - attempt cleanup of target partition - no guarantee\n");
2018             fflush(STDOUT);
2019         }
2020
2021         if (volid && toconn)
2022             code = DoVolDelete(toconn, volid, atopart,
2023                                "destination", 0, NULL, "Recovery:");
2024
2025         /* put source volume on-line */
2026         if (fromconn) {
2027             VPRINT1("Recovery: Creating transaction on source volume %u ...",
2028                     afromvol);
2029             tmp = fromtid;
2030             code =
2031                 AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy,
2032                                   &tmp);
2033             fromtid = tmp;
2034             if (!code) {
2035                 VDONE;
2036
2037                 VPRINT1("Recovery: Setting flags on source volume %u ...",
2038                         afromvol);
2039                 AFSVolSetFlags(fromconn, fromtid, 0);
2040                 VDONE;
2041
2042                 VPRINT1
2043                     ("Recovery: Ending transaction on source volume %u ...",
2044                      afromvol);
2045                 AFSVolEndTrans(fromconn, fromtid, &rcode);
2046                 VDONE;
2047             } else {
2048                 VPRINT1
2049                     ("\nRecovery: Unable to start transaction on source volume %u.\n",
2050                      afromvol);
2051             }
2052         }
2053     } else {                    /* yep, move complete */
2054         if (pntg) {
2055             fprintf(STDOUT,
2056                     "move complete - attempt cleanup of source partition - no guarantee\n");
2057             fflush(STDOUT);
2058         }
2059
2060         /* delete backup volume */
2061         if (fromconn) {
2062             code = DoVolDelete(fromconn, backupId, afrompart,
2063                                "backup", 0, NULL, "Recovery:");
2064
2065             code = DoVolDelete(fromconn, afromvol, afrompart, "source",
2066                                (atoserver != afromserver)?atoserver:0,
2067                                NULL, NULL);
2068         }
2069     }
2070
2071     /* common cleanup - delete local clone */
2072     if (newVol) {
2073         code = DoVolDelete(fromconn, newVol, afrompart,
2074                            "clone", 0, NULL, "Recovery:");
2075     }
2076
2077     /* unlock VLDB entry */
2078     if (islocked) {
2079         VPRINT1("Recovery: Releasing lock on VLDB entry for volume %u ...",
2080                 afromvol);
2081         ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
2082                             (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
2083         VDONE;
2084         islocked = 0;
2085     }
2086   done:                 /* routine cleanup */
2087     if (volName)
2088         free(volName);
2089 #ifdef  ENABLE_BUGFIX_1165
2090     if (infop)
2091         free(infop);
2092 #endif
2093     if (fromconn)
2094         rx_DestroyConnection(fromconn);
2095     if (toconn)
2096         rx_DestroyConnection(toconn);
2097
2098     if (pntg) {
2099         fprintf(STDOUT, "cleanup complete - user verify desired result\n");
2100         fflush(STDOUT);
2101     }
2102     exit(1);
2103 }
2104
2105
2106 int
2107 UV_MoveVolume(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2108               afs_uint32 atoserver, afs_int32 atopart)
2109 {
2110     return UV_MoveVolume2(afromvol, afromserver, afrompart,
2111                           atoserver, atopart, 0);
2112 }
2113
2114
2115 /* Copy volume <afromvol> from <afromserver> <afrompart> to <atoserver>
2116  * <atopart>.  The new volume is named by <atovolname>.  The new volume
2117  * has ID <atovolid> if that is nonzero; otherwise a new ID is allocated
2118  * from the VLDB.  the following flags are supported:
2119  *
2120  *     RV_RDONLY  - target volume is RO
2121  *     RV_OFFLINE - leave target volume offline
2122  *     RV_CPINCR  - do incremental dump if target exists
2123  *     RV_NOVLDB  - don't create/update VLDB entry
2124  *     RV_NOCLONE - don't use a copy clone
2125  */
2126 int
2127 UV_CopyVolume2(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2128                char *atovolname, afs_uint32 atoserver, afs_int32 atopart,
2129                afs_uint32 atovolid, int flags)
2130 {
2131     /* declare stuff 'volatile' that may be used from setjmp/longjmp and may
2132      * be changing during the copy */
2133     int volatile pntg;
2134     afs_int32 volatile clonetid;
2135     afs_int32 volatile totid;
2136     afs_int32 volatile fromtid;
2137     struct rx_connection * volatile fromconn;
2138     struct rx_connection * volatile toconn;
2139     afs_uint32 volatile cloneVol;
2140
2141     char vname[64];
2142     afs_int32 rcode;
2143     afs_int32 fromDate, cloneFromDate;
2144     struct restoreCookie cookie;
2145     afs_int32 vcode, code;
2146     afs_uint32 newVol;
2147     afs_int32 volflag;
2148     struct volser_status tstatus;
2149     struct destServer destination;
2150     struct nvldbentry entry, newentry, storeEntry;
2151     afs_int32 error;
2152     afs_int32 tmp;
2153     afs_uint32 tmpVol;
2154
2155     fromconn = (struct rx_connection *)0;
2156     toconn = (struct rx_connection *)0;
2157     fromtid = 0;
2158     totid = 0;
2159     clonetid = 0;
2160     error = 0;
2161     pntg = 0;
2162     newVol = 0;
2163
2164     /* support control-c processing */
2165     if (setjmp(env))
2166         goto mfail;
2167     (void)signal(SIGINT, sigint_handler);
2168
2169     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2170     EGOTO1(mfail, vcode,
2171            "Could not fetch the entry for the volume  %u from the VLDB \n",
2172            afromvol);
2173     MapHostToNetwork(&entry);
2174
2175     pntg = 1;
2176     toconn = UV_Bind(atoserver, AFSCONF_VOLUMEPORT);    /* get connections to the servers */
2177     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
2178     fromtid = totid = 0;        /* initialize to uncreated */
2179
2180     /* ***
2181      * clone the read/write volume locally.
2182      * ***/
2183
2184     cloneVol = 0;
2185     if (!(flags & RV_NOCLONE)) {
2186         VPRINT1("Starting transaction on source volume %u ...", afromvol);
2187         tmp = fromtid;
2188         code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy,
2189                                  &tmp);
2190         fromtid = tmp;
2191         EGOTO1(mfail, code, "Failed to create transaction on the volume %u\n",
2192                afromvol);
2193         VDONE;
2194
2195         /* Get a clone id */
2196         VPRINT1("Allocating new volume id for clone of volume %u ...",
2197                 afromvol);
2198         cloneVol = 0;
2199         tmpVol = cloneVol;
2200         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &tmpVol);
2201         cloneVol = tmpVol;
2202         EGOTO1(mfail, vcode,
2203            "Could not get an ID for the clone of volume %u from the VLDB\n",
2204            afromvol);
2205         VDONE;
2206     }
2207
2208     if (atovolid) {
2209         newVol = atovolid;
2210     } else {
2211         /* Get a new volume id */
2212         VPRINT1("Allocating new volume id for copy of volume %u ...", afromvol);
2213         newVol = 0;
2214         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &newVol);
2215         EGOTO1(mfail, vcode,
2216                "Could not get an ID for the copy of volume %u from the VLDB\n",
2217                afromvol);
2218         VDONE;
2219     }
2220
2221     if (!(flags & RV_NOCLONE)) {
2222         /* Do the clone. Default flags on clone are set to delete on salvage and out of service */
2223         VPRINT1("Cloning source volume %u ...", afromvol);
2224         strcpy(vname, "copy-clone-temp");
2225         tmpVol = cloneVol;
2226         code =
2227             AFSVolClone(fromconn, fromtid, 0, readonlyVolume, vname,
2228                         &tmpVol);
2229         cloneVol = tmpVol;
2230         EGOTO1(mfail, code, "Failed to clone the source volume %u\n",
2231                afromvol);
2232         VDONE;
2233
2234         VPRINT1("Ending the transaction on the source volume %u ...", afromvol);
2235         rcode = 0;
2236         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2237         fromtid = 0;
2238         if (!code)
2239             code = rcode;
2240         EGOTO1(mfail, code,
2241                "Failed to end the transaction on the source volume %u\n",
2242                afromvol);
2243         VDONE;
2244     }
2245
2246     /* ***
2247      * Create the destination volume
2248      * ***/
2249
2250     if (!(flags & RV_NOCLONE)) {
2251         VPRINT1("Starting transaction on the cloned volume %u ...", cloneVol);
2252         tmp = clonetid;
2253         code =
2254             AFSVolTransCreate_retry(fromconn, cloneVol, afrompart, ITOffline,
2255                           &tmp);
2256         clonetid = tmp;
2257         EGOTO1(mfail, code,
2258                "Failed to start a transaction on the cloned volume%u\n",
2259                cloneVol);
2260         VDONE;
2261
2262         VPRINT1("Setting flags on cloned volume %u ...", cloneVol);
2263         code =
2264             AFSVolSetFlags(fromconn, clonetid,
2265                            VTDeleteOnSalvage | VTOutOfService); /*redundant */
2266         EGOTO1(mfail, code, "Could not set flags on the cloned volume %u\n",
2267                cloneVol);
2268         VDONE;
2269
2270         /* remember time from which we've dumped the volume */
2271         VPRINT1("Getting status of cloned volume %u ...", cloneVol);
2272         code = AFSVolGetStatus(fromconn, clonetid, &tstatus);
2273         EGOTO1(mfail, code,
2274                "Failed to get the status of the cloned volume %u\n",
2275                cloneVol);
2276         VDONE;
2277
2278         fromDate = CLOCKADJ(tstatus.creationDate);
2279     } else {
2280         fromDate = 0;
2281     }
2282
2283     /* create a volume on the target machine */
2284     cloneFromDate = 0;
2285     tmp = totid;
2286     code = AFSVolTransCreate_retry(toconn, newVol, atopart, ITOffline, &tmp);
2287     totid = tmp;
2288     if (!code) {
2289         if ((flags & RV_CPINCR)) {
2290             VPRINT1("Getting status of pre-existing volume %u ...", newVol);
2291             code = AFSVolGetStatus(toconn, totid, &tstatus);
2292             EGOTO1(mfail, code,
2293                    "Failed to get the status of the pre-existing volume %u\n",
2294                    newVol);
2295             VDONE;
2296
2297             /* Using the update date should be OK here, but add some fudge */
2298             cloneFromDate = CLOCKADJ(tstatus.updateDate);
2299             if ((flags & RV_NOCLONE))
2300                 fromDate = cloneFromDate;
2301
2302             /* XXX We should check that the source volume's creationDate is
2303              * XXX not newer than the existing target volume, and if not,
2304              * XXX throw away the existing target and do a full dump. */
2305
2306             goto cpincr;
2307         }
2308
2309         /* Delete the existing volume.
2310          * While we are deleting the volume in these steps, the transaction
2311          * we started against the cloned volume (clonetid above) will be
2312          * sitting idle. It will get cleaned up after 600 seconds
2313          */
2314         VPRINT1("Deleting pre-existing volume %u on destination ...", newVol);
2315         code = AFSVolDeleteVolume(toconn, totid);
2316         EGOTO1(mfail, code,
2317                "Could not delete the pre-existing volume %u on destination\n",
2318                newVol);
2319         VDONE;
2320
2321         VPRINT1
2322             ("Ending transaction on pre-existing volume %u on destination ...",
2323              newVol);
2324         code = AFSVolEndTrans(toconn, totid, &rcode);
2325         totid = 0;
2326         if (!code)
2327             code = rcode;
2328         EGOTO1(mfail, code,
2329                "Could not end the transaction on pre-existing volume %u on destination\n",
2330                newVol);
2331         VDONE;
2332     }
2333
2334     VPRINT1("Creating the destination volume %u ...", newVol);
2335     tmp = totid;
2336     code =
2337         AFSVolCreateVolume(toconn, atopart, atovolname,
2338                            (flags & RV_RDONLY) ? volser_RO : volser_RW,
2339                            newVol, &newVol, &tmp);
2340     totid = tmp;
2341     EGOTO1(mfail, code, "Failed to create the destination volume %u\n",
2342            newVol);
2343     VDONE;
2344
2345     VPRINT1("Setting volume flags on destination volume %u ...", newVol);
2346     code =
2347         AFSVolSetFlags(toconn, totid, (VTDeleteOnSalvage | VTOutOfService));
2348     EGOTO1(mfail, code,
2349            "Failed to set the flags on the destination volume %u\n", newVol);
2350     VDONE;
2351
2352 cpincr:
2353
2354     destination.destHost = ntohl(atoserver);
2355     destination.destPort = AFSCONF_VOLUMEPORT;
2356     destination.destSSID = 1;
2357
2358     strncpy(cookie.name, atovolname, VOLSER_OLDMAXVOLNAME);
2359     cookie.type = (flags & RV_RDONLY) ? ROVOL : RWVOL;
2360     cookie.parent = 0;
2361     cookie.clone = 0;
2362
2363     /***
2364      * Now dump the clone to the new volume
2365      ***/
2366
2367     if (!(flags & RV_NOCLONE)) {
2368         /* XXX probably should have some code here that checks to see if
2369          * XXX we are copying to same server and partition - if so, just
2370          * XXX use a clone to save disk space */
2371
2372         /* Copy the clone to the new volume */
2373         VPRINT2("Dumping from clone %u on source to volume %u on destination ...",
2374             cloneVol, newVol);
2375         code =
2376             AFSVolForward(fromconn, clonetid, cloneFromDate, &destination,
2377                           totid, &cookie);
2378         EGOTO1(mfail, code, "Failed to move data for the volume %u\n",
2379                newVol);
2380         VDONE;
2381
2382         VPRINT1("Ending transaction on cloned volume %u ...", cloneVol);
2383         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
2384         if (!code)
2385             code = rcode;
2386         clonetid = 0;
2387         EGOTO1(mfail, code,
2388                "Failed to end the transaction on the cloned volume %u\n",
2389                cloneVol);
2390         VDONE;
2391     }
2392
2393     /* ***
2394      * reattach to the main-line volume, and incrementally dump it.
2395      * ***/
2396
2397     VPRINT1("Starting transaction on source volume %u ...", afromvol);
2398     tmp = fromtid;
2399     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
2400     fromtid = tmp;
2401     EGOTO1(mfail, code,
2402            "Failed to create a transaction on the source volume %u\n",
2403            afromvol);
2404     VDONE;
2405
2406     /* now do the incremental */
2407     VPRINT2
2408         ("Doing the%s dump from source to destination for volume %u ... ",
2409          (flags & RV_NOCLONE) ? "" : " incremental",
2410          afromvol);
2411     code =
2412         AFSVolForward(fromconn, fromtid, fromDate, &destination, totid,
2413                       &cookie);
2414     EGOTO1(mfail, code,
2415            "Failed to do the%s dump from old site to new site\n",
2416            (flags & RV_NOCLONE) ? "" : " incremental");
2417     VDONE;
2418
2419     VPRINT1("Setting volume flags on destination volume %u ...", newVol);
2420     volflag = ((flags & RV_OFFLINE) ? VTOutOfService : 0);      /* off or on-line */
2421     code = AFSVolSetFlags(toconn, totid, volflag);
2422     EGOTO(mfail, code,
2423           "Failed to set the flags to make destination volume online\n");
2424     VDONE;
2425
2426     /* put new volume online */
2427     VPRINT1("Ending transaction on destination volume %u ...", newVol);
2428     code = AFSVolEndTrans(toconn, totid, &rcode);
2429     totid = 0;
2430     if (!code)
2431         code = rcode;
2432     EGOTO1(mfail, code,
2433            "Failed to end the transaction on the destination volume %u\n",
2434            newVol);
2435     VDONE;
2436
2437     VPRINT1("Ending transaction on source volume %u ...", afromvol);
2438     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2439     fromtid = 0;
2440     if (!code)
2441         code = rcode;
2442     EGOTO1(mfail, code,
2443            "Failed to end the transaction on the source volume %u\n",
2444            afromvol);
2445     VDONE;
2446
2447     fromtid = 0;
2448
2449     if (!(flags & RV_NOCLONE)) {
2450         code = DoVolDelete(fromconn, cloneVol, afrompart,
2451                            "cloned", 0, NULL, NULL);
2452         if (code) {
2453             error = code;
2454             goto mfail;
2455         }
2456     }
2457
2458     if (!(flags & RV_NOVLDB)) {
2459         /* create the vldb entry for the copied volume */
2460         strncpy(newentry.name, atovolname, VOLSER_OLDMAXVOLNAME);
2461         newentry.nServers = 1;
2462         newentry.serverNumber[0] = atoserver;
2463         newentry.serverPartition[0] = atopart;
2464         newentry.flags = (flags & RV_RDONLY) ? RO_EXISTS : RW_EXISTS;
2465         newentry.serverFlags[0] = (flags & RV_RDONLY) ? ITSROVOL : ITSRWVOL;
2466         newentry.volumeId[RWVOL] = newVol;
2467         newentry.volumeId[ROVOL] = (flags & RV_RDONLY) ? newVol : 0;
2468         newentry.volumeId[BACKVOL] = 0;
2469         newentry.cloneId = 0;
2470         /*map into right byte order, before passing to xdr, the stuff has to be in host
2471          * byte order. Xdr converts it into network order */
2472         MapNetworkToHost(&newentry, &storeEntry);
2473         /* create the vldb entry */
2474         vcode = VLDB_CreateEntry(&storeEntry);
2475         if (vcode) {
2476             fprintf(STDERR,
2477                     "Could not create a VLDB entry for the volume %s %lu\n",
2478                     atovolname, (unsigned long)newVol);
2479             /*destroy the created volume */
2480             VPRINT1("Deleting the newly created volume %u\n", newVol);
2481             AFSVolDeleteVolume(toconn, totid);
2482             error = vcode;
2483             goto mfail;
2484         }
2485         VPRINT2("Created the VLDB entry for the volume %s %u\n", atovolname,
2486                 newVol);
2487     }
2488
2489     /* normal cleanup code */
2490
2491     if (fromtid) {
2492         VPRINT1("Cleanup: Ending transaction on source volume %u ...",
2493                 afromvol);
2494         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2495         if (code || rcode) {
2496             VPRINT("\n");
2497             fprintf(STDERR,
2498                     "Could not end transaction on the source volume %lu\n",
2499                     (unsigned long)afromvol);
2500             if (!error)
2501                 error = (code ? code : rcode);
2502         }
2503         VDONE;
2504     }
2505
2506     if (clonetid) {
2507         VPRINT1("Cleanup: Ending transaction on clone volume %u ...",
2508                 cloneVol);
2509         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
2510         if (code || rcode) {
2511             VPRINT("\n");
2512             fprintf(STDERR,
2513                     "Could not end transaction on the source's clone volume %lu\n",
2514                     (unsigned long)cloneVol);
2515             if (!error)
2516                 error = (code ? code : rcode);
2517         }
2518         VDONE;
2519     }
2520
2521     if (totid) {
2522         VPRINT1("Cleanup: Ending transaction on destination volume %u ...",
2523                 newVol);
2524         code = AFSVolEndTrans(toconn, totid, &rcode);
2525         if (code) {
2526             VPRINT("\n");
2527             fprintf(STDERR,
2528                     "Could not end transaction on destination volume %lu\n",
2529                     (unsigned long)newVol);
2530             if (!error)
2531                 error = (code ? code : rcode);
2532         }
2533         VDONE;
2534     }
2535     if (fromconn)
2536         rx_DestroyConnection(fromconn);
2537     if (toconn)
2538         rx_DestroyConnection(toconn);
2539     PrintError("", error);
2540     return error;
2541
2542     /* come here only when the sky falls */
2543   mfail:
2544
2545     if (pntg) {
2546         fprintf(STDOUT,
2547                 "vos copy: operation interrupted, cleanup in progress...\n");
2548         fprintf(STDOUT, "clear transaction contexts\n");
2549         fflush(STDOUT);
2550     }
2551
2552     if (clonetid) {
2553         VPRINT("Recovery: Ending transaction on clone volume ...");
2554         AFSVolEndTrans(fromconn, clonetid, &rcode);
2555         VDONE;
2556     }
2557     if (totid) {
2558         VPRINT("Recovery: Ending transaction on destination volume ...");
2559         AFSVolEndTrans(toconn, totid, &rcode);
2560         VDONE;
2561     }
2562     if (fromtid) {              /* put it on-line */
2563         VPRINT("Recovery: Ending transaction on source volume ...");
2564         AFSVolEndTrans(fromconn, fromtid, &rcode);
2565         VDONE;
2566     }
2567
2568     VPRINT("Recovery: Accessing VLDB.\n");
2569     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2570     if (vcode) {
2571         fprintf(STDOUT, "FATAL: VLDB access error: abort cleanup\n");
2572         fflush(STDOUT);
2573         goto done;
2574     }
2575     MapHostToNetwork(&entry);
2576
2577     /* common cleanup - delete local clone */
2578     if (cloneVol)
2579         code = DoVolDelete(fromconn, cloneVol, afrompart,
2580                            "clone", 0, NULL, "Recovery:");
2581
2582   done:                 /* routine cleanup */
2583     if (fromconn)
2584         rx_DestroyConnection(fromconn);
2585     if (toconn)
2586         rx_DestroyConnection(toconn);
2587
2588     if (pntg) {
2589         fprintf(STDOUT, "cleanup complete - user verify desired result\n");
2590         fflush(STDOUT);
2591     }
2592     exit(1);
2593 }
2594
2595
2596 int
2597 UV_CopyVolume(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2598               char *atovolname, afs_uint32 atoserver, afs_int32 atopart)
2599 {
2600     return UV_CopyVolume2(afromvol, afromserver, afrompart,
2601                           atovolname, atoserver, atopart, 0, 0);
2602 }
2603
2604
2605
2606 /* Make a new backup of volume <avolid> on <aserver> and <apart>
2607  * if one already exists, update it
2608  */
2609
2610 int
2611 UV_BackupVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid)
2612 {
2613     struct rx_connection *aconn = (struct rx_connection *)0;
2614     afs_int32 ttid = 0, btid = 0;
2615     afs_uint32 backupID;
2616     afs_int32 code = 0, rcode = 0;
2617     struct nvldbentry entry, storeEntry;
2618     afs_int32 error = 0;
2619     int vldblocked = 0, vldbmod = 0;
2620
2621     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
2622
2623     /* the calls to VLDB will succeed only if avolid is a RW volume,
2624      * since we are following the RW hash chain for searching */
2625     code = VLDB_GetEntryByID(avolid, RWVOL, &entry);
2626     if (code) {
2627         fprintf(STDERR,
2628                 "Could not fetch the entry for the volume %lu from the VLDB \n",
2629                 (unsigned long)avolid);
2630         error = code;
2631         goto bfail;
2632     }
2633     MapHostToNetwork(&entry);
2634
2635     /* These operations require the VLDB be locked since it means the VLDB
2636      * will change or the vldb is already locked.
2637      */
2638     if (!(entry.flags & BACK_EXISTS) || /* backup volume doesnt exist */
2639         (entry.flags & VLOP_ALLOPERS) ||        /* vldb lock already held */
2640         (entry.volumeId[BACKVOL] == INVALID_BID)) {     /* no assigned backup volume id */
2641
2642         code = ubik_VL_SetLock(cstruct, 0, avolid, RWVOL, VLOP_BACKUP);
2643         if (code) {
2644             fprintf(STDERR,
2645                     "Could not lock the VLDB entry for the volume %lu\n",
2646                     (unsigned long)avolid);
2647             error = code;
2648             goto bfail;
2649         }
2650         vldblocked = 1;
2651
2652         /* Reread the vldb entry */
2653         code = VLDB_GetEntryByID(avolid, RWVOL, &entry);
2654         if (code) {
2655             fprintf(STDERR,
2656                     "Could not fetch the entry for the volume %lu from the VLDB \n",
2657                     (unsigned long)avolid);
2658             error = code;
2659             goto bfail;
2660         }
2661         MapHostToNetwork(&entry);
2662     }
2663
2664     if (!ISNAMEVALID(entry.name)) {
2665         fprintf(STDERR, "Name of the volume %s exceeds the size limit\n",
2666                 entry.name);
2667         error = VOLSERBADNAME;
2668         goto bfail;
2669     }
2670
2671     backupID = entry.volumeId[BACKVOL];
2672     if (backupID == INVALID_BID) {
2673         /* Get a backup volume id from the VLDB and update the vldb
2674          * entry with it.
2675          */
2676         code = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &backupID);
2677         if (code) {
2678             fprintf(STDERR,
2679                     "Could not allocate ID for the backup volume of  %lu from the VLDB\n",
2680                     (unsigned long)avolid);
2681             error = code;
2682             goto bfail;
2683         }
2684         entry.volumeId[BACKVOL] = backupID;
2685         vldbmod = 1;
2686     }
2687
2688     code = DoVolClone(aconn, avolid, apart, backupVolume, backupID, "backup",
2689                       entry.name, NULL, ".backup", NULL, NULL);
2690     if (code) {
2691         error = code;
2692         goto bfail;
2693     }
2694
2695     /* Mark vldb as backup exists */
2696     if (!(entry.flags & BACK_EXISTS)) {
2697         entry.flags |= BACK_EXISTS;
2698         vldbmod = 1;
2699     }
2700
2701     /* Now go back to the backup volume and bring it on line */
2702     code = AFSVolTransCreate_retry(aconn, backupID, apart, ITOffline, &btid);
2703     if (code) {
2704         fprintf(STDERR,
2705                 "Failed to start a transaction on the backup volume %lu\n",
2706                 (unsigned long)backupID);
2707         error = code;
2708         goto bfail;
2709     }
2710
2711     code = AFSVolSetFlags(aconn, btid, 0);
2712     if (code) {
2713         fprintf(STDERR, "Could not mark the backup volume %lu on line \n",
2714                 (unsigned long)backupID);
2715         error = code;
2716         goto bfail;
2717     }
2718
2719     code = AFSVolEndTrans(aconn, btid, &rcode);
2720     btid = 0;
2721     if (code || rcode) {
2722         fprintf(STDERR,
2723                 "Failed to end the transaction on the backup volume %lu\n",
2724                 (unsigned long)backupID);
2725         error = (code ? code : rcode);
2726         goto bfail;
2727     }
2728
2729     VDONE;
2730
2731     /* Will update the vldb below */
2732
2733   bfail:
2734     if (ttid) {
2735         code = AFSVolEndTrans(aconn, ttid, &rcode);
2736         if (code || rcode) {
2737             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
2738                     (unsigned long)avolid);
2739             if (!error)
2740                 error = (code ? code : rcode);
2741         }
2742     }
2743
2744     if (btid) {
2745         code = AFSVolEndTrans(aconn, btid, &rcode);
2746         if (code || rcode) {
2747             fprintf(STDERR,
2748                     "Could not end transaction the backup volume %lu\n",
2749                     (unsigned long)backupID);
2750             if (!error)
2751                 error = (code ? code : rcode);
2752         }
2753     }
2754
2755     /* Now update the vldb - if modified */
2756     if (vldblocked) {
2757         if (vldbmod) {
2758             MapNetworkToHost(&entry, &storeEntry);
2759             code =
2760                 VLDB_ReplaceEntry(avolid, RWVOL, &storeEntry,
2761                                   (LOCKREL_OPCODE | LOCKREL_AFSID |
2762                                    LOCKREL_TIMESTAMP));
2763             if (code) {
2764                 fprintf(STDERR,
2765                         "Could not update the VLDB entry for the volume %lu \n",
2766                         (unsigned long)avolid);
2767                 if (!error)
2768                     error = code;
2769             }
2770         } else {
2771             code =
2772                 ubik_VL_ReleaseLock(cstruct, 0, avolid, RWVOL,
2773                           (LOCKREL_OPCODE | LOCKREL_AFSID |
2774                            LOCKREL_TIMESTAMP));
2775             if (code) {
2776                 fprintf(STDERR,
2777                         "Could not unlock the VLDB entry for the volume %lu \n",
2778                         (unsigned long)avolid);
2779                 if (!error)
2780                     error = code;
2781             }
2782         }
2783     }
2784
2785     if (aconn)
2786         rx_DestroyConnection(aconn);
2787
2788     PrintError("", error);
2789     return error;
2790 }
2791
2792 /* Make a new clone of volume <avolid> on <aserver> and <apart>
2793  * using volume ID <acloneid>, or a new ID allocated from the VLDB.
2794  * The new volume is named by <aname>, or by appending ".clone" to
2795  * the existing name if <aname> is NULL.  The following flags are
2796  * supported:
2797  *
2798  *     RV_RDONLY  - target volume is RO
2799  *     RV_OFFLINE - leave target volume offline
2800  */
2801
2802 int
2803 UV_CloneVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid,
2804                afs_uint32 acloneid, char *aname, int flags)
2805 {
2806     struct rx_connection *aconn = (struct rx_connection *)0;
2807     afs_int32 ttid = 0, btid = 0;
2808     afs_int32 code = 0, rcode = 0;
2809     char vname[VOLSER_MAXVOLNAME + 1];
2810     afs_int32 error = 0;
2811     volEntries volumeInfo;
2812     int type = 0;
2813
2814     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
2815
2816     if (!aname) {
2817         volumeInfo.volEntries_val = (volintInfo *) 0;
2818         volumeInfo.volEntries_len = 0;
2819         code = AFSVolListOneVolume(aconn, apart, avolid, &volumeInfo);
2820         if (code) {
2821             fprintf(stderr, "Could not get info for volume %lu\n",
2822                     (unsigned long)avolid);
2823             error = code;
2824             goto bfail;
2825         }
2826         strncpy(vname, volumeInfo.volEntries_val[0].name,
2827                 VOLSER_OLDMAXVOLNAME - 7);
2828         vname[VOLSER_OLDMAXVOLNAME - 7] = 0;
2829         strcat(vname, ".clone");
2830         aname = vname;
2831         if (volumeInfo.volEntries_val)
2832             free(volumeInfo.volEntries_val);
2833     }
2834
2835     if (!acloneid) {
2836         /* Get a clone id */
2837         VPRINT1("Allocating new volume id for clone of volume %u ...",
2838                 avolid);
2839         code = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &acloneid);
2840         EGOTO1(bfail, code,
2841            "Could not get an ID for the clone of volume %u from the VLDB\n",
2842            avolid);
2843         VDONE;
2844     }
2845
2846     if (flags & RV_RWONLY)
2847         type = readwriteVolume;
2848     else if (flags & RV_RDONLY)
2849         type = readonlyVolume;
2850     else
2851         type = backupVolume;
2852
2853     code = DoVolClone(aconn, avolid, apart, type, acloneid, "clone",
2854                       NULL, ".clone", NULL, NULL, NULL);
2855     if (code) {
2856         error = code;
2857         goto bfail;
2858     }
2859
2860     /* Now go back to the backup volume and bring it on line */
2861     if (!(flags & RV_OFFLINE)) {
2862         code = AFSVolTransCreate_retry(aconn, acloneid, apart, ITOffline, &btid);
2863         if (code) {
2864             fprintf(STDERR,
2865                     "Failed to start a transaction on the clone volume %lu\n",
2866                     (unsigned long)acloneid);
2867             error = code;
2868             goto bfail;
2869         }
2870
2871         code = AFSVolSetFlags(aconn, btid, 0);
2872         if (code) {
2873             fprintf(STDERR, "Could not mark the clone volume %lu on line \n",
2874                     (unsigned long)acloneid);
2875             error = code;
2876             goto bfail;
2877         }
2878
2879         code = AFSVolEndTrans(aconn, btid, &rcode);
2880         btid = 0;
2881         if (code || rcode) {
2882             fprintf(STDERR,
2883                     "Failed to end the transaction on the clone volume %lu\n",
2884                     (unsigned long)acloneid);
2885             error = (code ? code : rcode);
2886             goto bfail;
2887         }
2888     }
2889
2890     VDONE;
2891
2892   bfail:
2893     if (ttid) {
2894         code = AFSVolEndTrans(aconn, ttid, &rcode);
2895         if (code || rcode) {
2896             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
2897                     (unsigned long)avolid);
2898             if (!error)
2899                 error = (code ? code : rcode);
2900         }
2901     }
2902
2903     if (btid) {
2904         code = AFSVolEndTrans(aconn, btid, &rcode);
2905         if (code || rcode) {
2906             fprintf(STDERR,
2907                     "Could not end transaction on the clone volume %lu\n",
2908                     (unsigned long)acloneid);
2909             if (!error)
2910                 error = (code ? code : rcode);
2911         }
2912     }
2913
2914     if (aconn)
2915         rx_DestroyConnection(aconn);
2916
2917     PrintError("", error);
2918     return error;
2919 }
2920
2921 #define ONERROR(ec, ep, es) do { \
2922     if (ec) { \
2923         fprintf(STDERR, (es), (ep)); \
2924         error = (ec); \
2925         goto rfail; \
2926     } \
2927 } while (0)
2928 #define ONERROR0(ec, es) do { \
2929     if (ec) { \
2930         fprintf(STDERR, (es)); \
2931         error = (ec); \
2932         goto rfail; \
2933     } \
2934 } while (0)
2935 #define ERROREXIT(ec) do { \
2936     error = (ec); \
2937     goto rfail; \
2938 } while (0)
2939
2940 /* Get a "transaction" on this replica.  Create the volume
2941  * if necessary.  Return the time from which a dump should
2942  * be made (0 if it's a new volume)
2943  */
2944 static int
2945 GetTrans(struct nvldbentry *vldbEntryPtr, afs_int32 index,
2946          struct rx_connection **connPtr, afs_int32 * transPtr,
2947          afs_uint32 * crtimePtr, afs_uint32 * uptimePtr,
2948          afs_int32 *origflags, afs_uint32 tmpVolId)
2949 {
2950     afs_uint32 volid;
2951     struct volser_status tstatus;
2952     int code = 0;
2953     int rcode, tcode;
2954     char hoststr[16];
2955
2956     *connPtr = (struct rx_connection *)0;
2957     *transPtr = 0;
2958     *crtimePtr = 0;
2959     *uptimePtr = 0;
2960
2961     /* get connection to the replication site */
2962     *connPtr = UV_Bind(vldbEntryPtr->serverNumber[index], AFSCONF_VOLUMEPORT);
2963     if (!*connPtr)
2964         goto fail;              /* server is down */
2965
2966     volid = vldbEntryPtr->volumeId[ROVOL];
2967
2968     if (volid) {
2969         code =
2970             AFSVolTransCreate_retry(*connPtr, volid,
2971                               vldbEntryPtr->serverPartition[index], ITOffline,
2972                               transPtr);
2973
2974         if (!code && (origflags[index] & RO_DONTUSE)) {
2975             /* If RO_DONTUSE is set, this is supposed to be an entirely new
2976              * site. Don't trust any data on it, since it is possible we
2977              * have encountered some temporary volume from some other
2978              * incomplete volume operation. It is difficult to detect if
2979              * that has happened vs if this is a legit volume, so just
2980              * delete it to be safe. */
2981
2982             VPRINT1("Deleting extant RO_DONTUSE site on %s...",
2983                     noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
2984                                                 serverNumber[index], hoststr) :
2985                     hostutil_GetNameByINet(vldbEntryPtr->
2986                                            serverNumber[index]));
2987
2988             code = AFSVolDeleteVolume(*connPtr, *transPtr);
2989             if (code) {
2990                 PrintError("Failed to delete RO_DONTUSE site: ", code);
2991                 goto fail;
2992             }
2993
2994             tcode = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
2995             *transPtr = 0;
2996             if (!tcode) {
2997                 tcode = rcode;
2998             }
2999             if (tcode) {
3000                 PrintError("Failed to end transaction on RO_DONTUSE site: ",
3001                            tcode);
3002                 goto fail;
3003             }
3004
3005             VDONE;
3006
3007             /* emulate what TransCreate would have returned, so we try to
3008              * create the volume below */
3009             code = VNOVOL;
3010         }
3011     }
3012
3013     /* If the volume does not exist, create it */
3014     if (!volid || code) {
3015         char volname[64];
3016         char hoststr[16];
3017
3018         if (volid && (code != VNOVOL)) {
3019             PrintError("Failed to start a transaction on the RO volume.\n",
3020                        code);
3021             goto fail;
3022         }
3023
3024         strcpy(volname, vldbEntryPtr->name);
3025         if (tmpVolId)
3026             strcat(volname, ".roclone");
3027         else
3028             strcat(volname, ".readonly");
3029
3030         if (verbose) {
3031             fprintf(STDOUT,
3032                     "Creating new volume %lu on replication site %s: ",
3033                     tmpVolId?(unsigned long)tmpVolId:(unsigned long)volid,
3034                     noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
3035                                                 serverNumber[index], hoststr) :
3036                     hostutil_GetNameByINet(vldbEntryPtr->
3037                                            serverNumber[index]));
3038             fflush(STDOUT);
3039         }
3040
3041         code =
3042           AFSVolCreateVolume(*connPtr, vldbEntryPtr->serverPartition[index],
3043                              volname, volser_RO,
3044                              vldbEntryPtr->volumeId[RWVOL],
3045                              tmpVolId?&tmpVolId:&volid,
3046                              transPtr);
3047         if (code) {
3048             PrintError("Failed to create the ro volume: ", code);
3049             goto fail;
3050         }
3051         vldbEntryPtr->volumeId[ROVOL] = volid;
3052
3053         VDONE;
3054
3055         /* The following is a bit redundant, since create sets these flags by default */
3056         code =
3057             AFSVolSetFlags(*connPtr, *transPtr,
3058                            VTDeleteOnSalvage | VTOutOfService);
3059         if (code) {
3060             PrintError("Failed to set flags on the ro volume: ", code);
3061             goto fail;
3062         }
3063     }
3064
3065     /* Otherwise, the transaction did succeed, so get the creation date of the
3066      * latest RO volume on the replication site
3067      */
3068     else {
3069         VPRINT2("Updating existing ro volume %u on %s ...\n", volid,
3070                 noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
3071                                             serverNumber[index], hoststr) :
3072                 hostutil_GetNameByINet(vldbEntryPtr->serverNumber[index]));
3073
3074         code = AFSVolGetStatus(*connPtr, *transPtr, &tstatus);
3075         if (code) {
3076             PrintError("Failed to get status of volume on destination: ",
3077                        code);
3078             goto fail;
3079         }
3080         if (tmpVolId) {
3081             code = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
3082             *transPtr = 0;
3083             if (!code)
3084                 code = rcode;
3085             if (!code)
3086                 code = DoVolClone(*connPtr, volid,
3087                                   vldbEntryPtr->serverPartition[index],
3088                                   readonlyVolume, tmpVolId, "temporary",
3089                                   vldbEntryPtr->name, NULL, ".roclone", NULL,
3090                                   transPtr);
3091             if (code)
3092                 goto fail;
3093         }
3094         *crtimePtr = CLOCKADJ(tstatus.creationDate);
3095         *uptimePtr = CLOCKADJ(tstatus.updateDate);
3096     }
3097
3098     return 0;
3099
3100   fail:
3101     if (*transPtr) {
3102         tcode = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
3103         *transPtr = 0;
3104         if (!tcode)
3105             tcode = rcode;
3106         if (tcode && tcode != ENOENT)
3107             PrintError("Could not end transaction on a ro volume: ", tcode);
3108     }
3109
3110     return code;
3111 }
3112
3113 static int
3114 SimulateForwardMultiple(struct rx_connection *fromconn, afs_int32 fromtid,
3115                         afs_int32 fromdate, manyDests * tr, afs_int32 flags,
3116                         void *cookie, manyResults * results)
3117 {
3118     unsigned int i;
3119
3120     for (i = 0; i < tr->manyDests_len; i++) {
3121         results->manyResults_val[i] =
3122             AFSVolForward(fromconn, fromtid, fromdate,
3123                           &(tr->manyDests_val[i].server),
3124                           tr->manyDests_val[i].trans, cookie);
3125     }
3126     return 0;
3127 }
3128
3129 /**
3130  * Check if a trans has timed out, and recreate it if necessary.
3131  *
3132  * @param[in] aconn  RX connection to the relevant server
3133  * @param[inout] atid  Transaction ID to check; if we recreated the trans,
3134  *                     contains the new trans ID on success
3135  * @param[in] apart  Partition for the transaction
3136  * @param[in] astat  The status of the original transaction
3137  *
3138  * @return operation status
3139  *  @retval 0 existing transaction is still valid, or we managed to recreate
3140  *            the trans successfully
3141  *  @retval nonzero Fatal error; bail out
3142  */
3143 static int
3144 CheckTrans(struct rx_connection *aconn, afs_int32 *atid, afs_int32 apart,
3145            struct volser_status *astat)
3146 {
3147     struct volser_status new_status;
3148     afs_int32 code;
3149
3150     memset(&new_status, 0, sizeof(new_status));
3151     code = AFSVolGetStatus(aconn, *atid, &new_status);
3152     if (code) {
3153         if (code == ENOENT) {
3154             *atid = 0;
3155             VPRINT1("Old transaction on cloned volume %lu timed out, "
3156                     "restarting transaction\n", (long unsigned) astat->volID);
3157             code = AFSVolTransCreate_retry(aconn, astat->volID, apart,
3158                                            ITBusy, atid);
3159             if (code) {
3160                 PrintError("Failed to recreate cloned RO volume transaction\n",
3161                            code);
3162                 return 1;
3163             }
3164
3165             memset(&new_status, 0, sizeof(new_status));
3166             code = AFSVolGetStatus(aconn, *atid, &new_status);
3167             if (code) {
3168                 PrintError("Failed to get status on recreated transaction\n",
3169                            code);
3170                 return 1;
3171             }
3172
3173             if (memcmp(&new_status, astat, sizeof(new_status)) != 0) {
3174                 PrintError("Recreated transaction on cloned RO volume, but "
3175                            "the volume has changed!\n", 0);
3176                 return 1;
3177             }
3178         } else {
3179             PrintError("Unable to get status of current cloned RO transaction\n",
3180                        code);
3181             return 1;
3182         }
3183     } else {
3184         if (memcmp(&new_status, astat, sizeof(new_status)) != 0) {
3185             /* sanity check */
3186             PrintError("Internal error: current GetStatus does not match "
3187                        "original GetStatus?\n", 0);
3188             return 1;
3189         }
3190     }
3191
3192     return 0;
3193 }
3194
3195 static void
3196 PutTrans(afs_int32 *vldbindex, struct replica *replicas,
3197          struct rx_connection **toconns, struct release *times,
3198          afs_int32 volcount)
3199 {
3200     afs_int32 s, code = 0, rcode = 0;
3201     /* End the transactions and destroy the connections */
3202     for (s = 0; s < volcount; s++) {
3203         if (replicas[s].trans) {
3204             code = AFSVolEndTrans(toconns[s], replicas[s].trans, &rcode);
3205
3206             replicas[s].trans = 0;
3207             if (!code)
3208                 code = rcode;
3209             if (code) {
3210                 if ((s == 0) || (code != ENOENT)) {
3211                     PrintError("Could not end transaction on a ro volume: ",
3212                                code);
3213                 } else {
3214                     PrintError
3215                         ("Transaction timed out on a ro volume. Will retry.\n",
3216                          0);
3217                     if (times[s].vldbEntryIndex < *vldbindex)
3218                         *vldbindex = times[s].vldbEntryIndex;
3219                 }
3220             }
3221         }
3222         if (toconns[s])
3223             rx_DestroyConnection(toconns[s]);
3224         toconns[s] = 0;
3225     }
3226 }
3227
3228 static int
3229 DoVolOnline(struct nvldbentry *vldbEntryPtr, afs_uint32 avolid, int index,
3230             char *vname, struct rx_connection *connPtr)
3231 {
3232     afs_int32 code = 0, rcode = 0, onlinetid = 0;
3233
3234     code =
3235         AFSVolTransCreate_retry(connPtr, avolid,
3236                                 vldbEntryPtr->serverPartition[index],
3237                                 ITOffline,
3238                                 &onlinetid);
3239     if (code)
3240       EPRINT(code, "Could not create transaction on readonly...\n");
3241
3242     else {
3243         code = AFSVolSetFlags(connPtr, onlinetid, 0);
3244         if (code)
3245             EPRINT(code, "Could not set flags on readonly...\n");
3246     }
3247
3248     if (!code) {
3249         code =
3250             AFSVolSetIdsTypes(connPtr, onlinetid, vname,
3251                               ROVOL, vldbEntryPtr->volumeId[RWVOL],
3252                               0, 0);
3253         if (code)
3254             EPRINT(code, "Could not set ids on readonly...\n");
3255     }
3256     if (!code)
3257         code = AFSVolEndTrans(connPtr, onlinetid, &rcode);
3258     if (!code)
3259         code = rcode;
3260     return code;
3261 }
3262
3263 /* UV_ReleaseVolume()
3264  *    Release volume <afromvol> on <afromserver> <afrompart> to all
3265  *    its RO sites (full release). Unless the previous release was
3266  *    incomplete: in which case we bring the remaining incomplete
3267  *    volumes up to date with the volumes that were released
3268  *    successfully.
3269  *    forceflag: Performs a full release.
3270  *
3271  *    Will create a clone from the RW, then dump the clone out to
3272  *    the remaining replicas. If there is more than 1 RO sites,
3273  *    ensure that the VLDB says at least one RO is available all
3274  *    the time: Influences when we write back the VLDB entry.
3275  */
3276
3277 int
3278 UV_ReleaseVolume(afs_uint32 afromvol, afs_uint32 afromserver,
3279                  afs_int32 afrompart, int forceflag, int stayUp)
3280 {
3281     char vname[64];
3282     afs_int32 code = 0;
3283     afs_int32 vcode, rcode, tcode;
3284     afs_uint32 cloneVolId = 0, roVolId;
3285     struct replica *replicas = 0;
3286     struct nvldbentry entry, storeEntry;
3287     int i, volcount = 0, m, fullrelease, vldbindex;
3288     int failure;
3289     struct restoreCookie cookie;
3290     struct rx_connection **toconns = 0;
3291     struct release *times = 0;
3292     int nservers = 0;
3293     struct rx_connection *fromconn = (struct rx_connection *)0;
3294     afs_int32 error = 0;
3295     int islocked = 0;
3296     afs_int32 clonetid = 0, onlinetid;
3297     afs_int32 fromtid = 0;
3298     afs_uint32 fromdate = 0;
3299     afs_uint32 thisdate;
3300     time_t tmv;
3301     int s;
3302     manyDests tr;
3303     manyResults results;
3304     int rwindex, roindex, roclone, roexists;
3305     afs_uint32 rwcrdate = 0;
3306     afs_uint32 clcrdate;
3307     struct rtime {
3308         int validtime;
3309         afs_uint32 uptime;
3310     } remembertime[NMAXNSERVERS];
3311     int releasecount = 0;
3312     struct volser_status volstatus;
3313     char hoststr[16];
3314     afs_int32 origflags[NMAXNSERVERS];
3315     struct volser_status orig_status;
3316
3317     memset(remembertime, 0, sizeof(remembertime));
3318     memset(&results, 0, sizeof(results));
3319     memset(origflags, 0, sizeof(origflags));
3320
3321     vcode = ubik_VL_SetLock(cstruct, 0, afromvol, RWVOL, VLOP_RELEASE);
3322     if (vcode != VL_RERELEASE)
3323         ONERROR(vcode, afromvol,
3324                 "Could not lock the VLDB entry for the volume %u.\n");
3325     islocked = 1;
3326
3327     /* Get the vldb entry in readable format */
3328     vcode = VLDB_GetEntryByID(afromvol, RWVOL, &entry);
3329     ONERROR(vcode, afromvol,
3330             "Could not fetch the entry for the volume %u from the VLDB.\n");
3331     MapHostToNetwork(&entry);
3332
3333     if (verbose)
3334         EnumerateEntry(&entry);
3335
3336     if (!ISNAMEVALID(entry.name))
3337         ONERROR(VOLSERBADOP, entry.name,
3338                 "Volume name %s is too long, rename before releasing.\n");
3339     if (entry.volumeId[RWVOL] != afromvol)
3340         ONERROR(VOLSERBADOP, afromvol,
3341                 "The volume %u being released is not a read-write volume.\n");
3342     if (entry.nServers <= 1)
3343         ONERROR(VOLSERBADOP, afromvol,
3344                 "Volume %u has no replicas - release operation is meaningless!\n");
3345     if (strlen(entry.name) > (VOLSER_OLDMAXVOLNAME - 10))
3346         ONERROR(VOLSERBADOP, entry.name,
3347                 "RO volume name %s exceeds (VOLSER_OLDMAXVOLNAME - 10) character limit\n");
3348
3349     /* roclone is true if one of the RO volumes is on the same
3350      * partition as the RW volume. In this case, we make the RO volume
3351      * on the same partition a clone instead of a complete copy.
3352      */
3353
3354     roindex = Lp_ROMatch(afromserver, afrompart, &entry) - 1;
3355     roclone = ((roindex == -1) ? 0 : 1);
3356     rwindex = Lp_GetRwIndex(&entry);
3357     if (rwindex < 0)
3358         ONERROR0(VOLSERNOVOL, "There is no RW volume \n");
3359
3360     /* Make sure we have a RO volume id to work with */
3361     if (entry.volumeId[ROVOL] == INVALID_BID) {
3362         /* need to get a new RO volume id */
3363         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &roVolId);
3364         ONERROR(vcode, entry.name, "Cant allocate ID for RO volume of %s\n");
3365
3366         entry.volumeId[ROVOL] = roVolId;
3367         MapNetworkToHost(&entry, &storeEntry);
3368         vcode = VLDB_ReplaceEntry(afromvol, RWVOL, &storeEntry, 0);
3369         ONERROR(vcode, entry.name, "Could not update vldb entry for %s.\n");
3370     }
3371
3372     /* Will we be completing a previously unfinished release. -force overrides */
3373     for (s = 0, m = 0, fullrelease=0, i=0; (i<entry.nServers); i++) {
3374         if (entry.serverFlags[i] & ITSROVOL) {
3375             m++;
3376             if (entry.serverFlags[i] & NEW_REPSITE) s++;
3377         }
3378         origflags[i] = entry.serverFlags[i];
3379     }
3380     if ((forceflag && !fullrelease) || (s == m) || (s == 0))
3381         fullrelease = 1;
3382
3383     /* Determine which volume id to use and see if it exists */
3384     cloneVolId =
3385         ((fullrelease
3386           || (entry.cloneId == 0)) ? entry.volumeId[ROVOL] : entry.cloneId);
3387     code = VolumeExists(afromserver, afrompart, cloneVolId);
3388     roexists = ((code == ENODEV) ? 0 : 1);
3389
3390     /* For stayUp case, if roclone is the only site, bypass special handling */
3391     if (stayUp && roclone) {
3392         int e;
3393         error = 0;
3394
3395         for (e = 0; (e < entry.nServers) && !error; e++) {
3396             if ((entry.serverFlags[e] & ITSROVOL)) {
3397                 if (!(VLDB_IsSameAddrs(entry.serverNumber[e], afromserver,
3398                                        &error)))
3399                     break;
3400             }
3401         }
3402         if (e >= entry.nServers)
3403             stayUp = 0;
3404     }
3405
3406     /* If we had a previous release to complete, do so, else: */
3407     if (stayUp && (cloneVolId == entry.volumeId[ROVOL])) {
3408         code = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &cloneVolId);
3409         ONERROR(code, afromvol,
3410                 "Cannot get temporary clone id for volume %u\n");
3411     }
3412
3413     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
3414     if (!fromconn)
3415         ONERROR(-1, afromserver,
3416                 "Cannot establish connection with server 0x%x\n");
3417
3418     if (!fullrelease) {
3419         if (!roexists)
3420             fullrelease = 1;    /* Do a full release if RO clone does not exist */
3421         else {
3422             /* Begin transaction on RW and mark it busy while we query it */
3423             code = AFSVolTransCreate_retry(
3424                         fromconn, afromvol, afrompart, ITBusy, &fromtid
3425                    );
3426             ONERROR(code, afromvol,
3427                     "Failed to start transaction on RW volume %u\n");
3428
3429             /* Query the creation date for the RW */
3430             code = AFSVolGetStatus(fromconn, fromtid, &volstatus);
3431             ONERROR(code, afromvol,
3432                     "Failed to get the status of RW volume %u\n");
3433             rwcrdate = volstatus.creationDate;
3434
3435             /* End transaction on RW */
3436             code = AFSVolEndTrans(fromconn, fromtid, &rcode);
3437             fromtid = 0;
3438             ONERROR((code ? code : rcode), afromvol,
3439                     "Failed to end transaction on RW volume %u\n");
3440
3441             /* Begin transaction on clone and mark it busy while we query it */
3442             code = AFSVolTransCreate_retry(
3443                         fromconn, cloneVolId, afrompart, ITBusy, &clonetid
3444                    );
3445             ONERROR(code, cloneVolId,
3446                     "Failed to start transaction on RW clone %u\n");
3447
3448             /* Query the creation date for the clone */
3449             code = AFSVolGetStatus(fromconn, clonetid, &volstatus);
3450             ONERROR(code, cloneVolId,
3451                     "Failed to get the status of RW clone %u\n");
3452             clcrdate = volstatus.creationDate;
3453
3454             /* End transaction on clone */
3455             code = AFSVolEndTrans(fromconn, clonetid, &rcode);
3456             clonetid = 0;
3457             ONERROR((code ? code : rcode), cloneVolId,
3458                     "Failed to end transaction on RW clone %u\n");
3459
3460             if (rwcrdate > clcrdate)
3461                 fullrelease = 2;/* Do a full release if RO clone older than RW */
3462         }
3463     }
3464
3465     if (verbose) {
3466         switch (fullrelease) {
3467             case 2:
3468                 fprintf(STDOUT, "RW %lu changed, doing a complete release\n",
3469                         (unsigned long)afromvol);
3470                 break;
3471             case 1:
3472                 fprintf(STDOUT, "This is a complete release of volume %lu\n",
3473                         (unsigned long)afromvol);
3474                 break;
3475             case 0:
3476                 fprintf(STDOUT, "This is a completion of a previous release\n");
3477                 break;
3478         }
3479     }
3480
3481     if (fullrelease) {
3482         /* If the RO clone exists, then if the clone is a temporary
3483          * clone, delete it. Or if the RO clone is marked RO_DONTUSE
3484          * (it was recently added), then also delete it. We do not
3485          * want to "reclone" a temporary RO clone.
3486          */
3487         if (stayUp) {
3488             code = VolumeExists(afromserver, afrompart, cloneVolId);
3489             if (!code) {
3490                 code = DoVolDelete(fromconn, cloneVolId, afrompart, "previous clone", 0,
3491                                    NULL, NULL);
3492                 if (code && (code != VNOVOL))
3493                     ERROREXIT(code);
3494                 VDONE;
3495             }
3496         }
3497         /* clean up any previous tmp clone before starting if staying up */
3498         if (roexists
3499             && (!roclone || (entry.serverFlags[roindex] & RO_DONTUSE))) {
3500             code = DoVolDelete(fromconn,
3501                                stayUp ? entry.volumeId[ROVOL] : cloneVolId,
3502                                afrompart, "the", 0, NULL, NULL);
3503             if (code && (code != VNOVOL))
3504                 ERROREXIT(code);
3505             roexists = 0;
3506         }
3507
3508         /* Mark all the ROs in the VLDB entry as RO_DONTUSE. We don't
3509          * write this entry out to the vlserver until after the first
3510          * RO volume is released (temp RO clones don't count).
3511          */
3512         for (i = 0; i < entry.nServers; i++) {
3513             entry.serverFlags[i] &= ~NEW_REPSITE;
3514             entry.serverFlags[i] |= RO_DONTUSE;
3515         }
3516         entry.serverFlags[rwindex] |= NEW_REPSITE;
3517         entry.serverFlags[rwindex] &= ~RO_DONTUSE;
3518
3519         if (roclone) {
3520             strcpy(vname, entry.name);
3521             if (stayUp)
3522                 strcat(vname, ".roclone");
3523             else
3524                 strcat(vname, ".readonly");
3525         } else {
3526             strcpy(vname, "readonly-clone-temp");
3527         }
3528
3529         code = DoVolClone(fromconn, afromvol, afrompart, readonlyVolume,
3530                           cloneVolId, (roclone && !stayUp)?"permanent RO":
3531                           "temporary RO", NULL, vname, NULL, &volstatus, NULL);
3532         if (code) {
3533             error = code;
3534             goto rfail;
3535         }
3536
3537         rwcrdate = volstatus.creationDate;
3538
3539         /* Remember clone volume ID in case we fail or are interrupted */
3540         entry.cloneId = cloneVolId;
3541
3542         if (roclone && !stayUp) {
3543             /* Bring the RO clone online - though not if it's a temporary clone */
3544             VPRINT1("Starting transaction on RO clone volume %u...",
3545                     cloneVolId);
3546             code =
3547                 AFSVolTransCreate_retry(fromconn, cloneVolId, afrompart, ITOffline,
3548                                   &onlinetid);
3549             ONERROR(code, cloneVolId,
3550                     "Failed to start transaction on volume %u\n");
3551             VDONE;
3552
3553             VPRINT1("Setting volume flags for volume %u...", cloneVolId);
3554             tcode = AFSVolSetFlags(fromconn, onlinetid, 0);
3555             VDONE;
3556
3557             VPRINT1("Ending transaction on volume %u...", cloneVolId);
3558             code = AFSVolEndTrans(fromconn, onlinetid, &rcode);
3559             ONERROR((code ? code : rcode), cloneVolId,
3560                     "Failed to end transaction on RO clone %u\n");
3561             VDONE;
3562
3563             ONERROR(tcode, cloneVolId, "Could not bring volume %u on line\n");
3564
3565             /* Sleep so that a client searching for an online volume won't
3566              * find the clone offline and then the next RO offline while the
3567              * release brings the clone online and the next RO offline (race).
3568              * There is a fix in the 3.4 client that does not need this sleep
3569              * anymore, but we don't know what clients w