vos: take RO volume offline during convertROtoRW
[openafs.git] / src / volser / vsprocs.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13 #include <afs/procmgmt.h>       /* signal(), kill(), wait(), etc. */
14 #include <roken.h>
15
16 #ifdef  AFS_AIX_ENV
17 #include <sys/statfs.h>
18 #endif
19
20 #include <lock.h>
21 #include <afs/voldefs.h>
22 #include <rx/xdr.h>
23 #include <rx/rx.h>
24 #include <rx/rx_queue.h>
25 #include <afs/vlserver.h>
26 #include <afs/nfs.h>
27 #include <afs/cellconfig.h>
28 #include <afs/keys.h>
29 #include <ubik.h>
30 #include <afs/afsint.h>
31 #include "volser.h"
32 #include "volint.h"
33 #include "lockdata.h"
34 #include <afs/com_err.h>
35 #include <rx/rxkad.h>
36 #include <afs/kautils.h>
37 #include <afs/cmd.h>
38 #include <afs/ihandle.h>
39 #ifdef AFS_NT40_ENV
40 #include <afs/ntops.h>
41 #endif
42 #include <afs/vnode.h>
43 #include <afs/volume.h>
44 #define ERRCODE_RANGE 8         /* from error_table.h */
45 #define CLOCKSKEW   2           /* not really skew, but resolution */
46 #define CLOCKADJ(x) (((x) < CLOCKSKEW) ? 0 : (x) - CLOCKSKEW)
47
48 /* for UV_MoveVolume() recovery */
49
50 #include <setjmp.h>
51
52 #include "volser_internal.h"
53 #include "volser_prototypes.h"
54 #include "vsutils_prototypes.h"
55 #include "lockprocs_prototypes.h"
56
57 extern struct ubik_client *cstruct;
58 int verbose = 0, noresolve = 0;
59
60 struct release {
61     afs_uint32 crtime;
62     afs_uint32 uptime;
63     afs_int32 vldbEntryIndex;
64 };
65
66 /* Utility macros used by rest of this source file */
67 #define EPRINT(ec, es) \
68 do { \
69         fprintf(STDERR, "\n"); \
70         fprintf(STDERR, (es)); \
71         PrintError("   ",ec); \
72 } while (0)
73
74 #define EPRINT1(ec, es, ep1) \
75 do { \
76         fprintf(STDERR, "\n"); \
77         fprintf(STDERR, (es), (ep1)); \
78         PrintError("   ",ec); \
79 } while (0)
80
81 #define EPRINT2(ec, es, ep1, ep2) \
82 do { \
83         fprintf(STDERR, "\n"); \
84         fprintf(STDERR, (es), (ep1), (ep2)); \
85         PrintError("   ",ec); \
86 } while (0)
87
88 #define EPRINT3(ec, es, ep1, ep2, ep3) \
89 do { \
90         fprintf(STDERR, "\n"); \
91         fprintf(STDERR, (es), (ep1), (ep2), (ep3)); \
92         PrintError("   ",ec); \
93 } while (0)
94
95 #define EGOTO(where, ec, es) \
96 do { \
97         if (ec) { \
98                 EPRINT((ec),(es)); \
99                 error = (ec); \
100                 goto where; \
101         } \
102 } while (0)
103
104 #define EGOTO1(where, ec, es, ep1) \
105 do { \
106         if (ec) { \
107                 EPRINT1((ec),(es),(ep1)); \
108                 error = (ec); \
109                 goto where; \
110         } \
111 } while (0)
112
113 #define EGOTO2(where, ec, es, ep1, ep2) \
114 do { \
115         if (ec) { \
116                 EPRINT2((ec),(es),(ep1),(ep2)); \
117                 error = (ec); \
118                 goto where; \
119         } \
120 } while (0)
121
122 #define EGOTO3(where, ec, es, ep1, ep2, ep3) \
123 do { \
124         if (ec) { \
125                 EPRINT3((ec),(es),(ep1),(ep2),(ep3)); \
126                 error = (ec); \
127                 goto where; \
128         } \
129 } while (0)
130
131 #define VPRINT(es) \
132         { if (verbose) { fprintf(STDOUT, (es)); fflush(STDOUT); } }
133 #define VPRINT1(es, p) \
134         { if (verbose) { fprintf(STDOUT, (es), (p)); fflush(STDOUT); } }
135 #define VPRINT2(es, p1, p2) \
136         { if (verbose) { fprintf(STDOUT, (es), (p1), (p2)); fflush(STDOUT); } }
137 #define VPRINT3(es, p1, p2, p3) \
138         { if (verbose) { fprintf(STDOUT, (es), (p1), (p2), (p3)); fflush(STDOUT); } }
139 #define VDONE \
140         { if (verbose) { fprintf(STDOUT, " done\n"); fflush(STDOUT); } }
141 #define VEPRINT(es) \
142         { if (verbose) { fprintf(STDERR, (es)); fflush(STDERR); } }
143 #define VEPRINT1(es, p) \
144         { if (verbose) { fprintf(STDERR, (es), (p)); fflush(STDERR); } }
145 #define VEPRINT2(es, p1, p2) \
146         { if (verbose) { fprintf(STDERR, (es), (p1), (p2)); fflush(STDERR); } }
147 #define VEPRINT3(es, p1, p2, p3) \
148         { if (verbose) { fprintf(STDERR, (es), (p1), (p2), (p3)); fflush(STDERR); } }
149 #define VEDONE \
150         { if (verbose) { fprintf(STDERR, " done\n"); fflush(STDERR); } }
151
152
153
154 /* getting rid of this */
155 #define ERROR_EXIT(code) do { \
156     error = (code); \
157     goto error_exit; \
158 } while (0)
159
160
161 /* Protos for static routines */
162 static int GetTrans(struct nvldbentry *vldbEntryPtr, afs_int32 index,
163                     struct rx_connection **connPtr, afs_int32 * transPtr,
164                     afs_uint32 * crtimePtr, afs_uint32 * uptimePtr,
165                     afs_int32 *origflags, afs_uint32 tmpVolId);
166 static int SimulateForwardMultiple(struct rx_connection *fromconn,
167                                    afs_int32 fromtid, afs_int32 fromdate,
168                                    manyDests * tr, afs_int32 flags,
169                                    void *cookie, manyResults * results);
170 static int DoVolClone(struct rx_connection *aconn, afs_uint32 avolid,
171                       afs_int32 apart, int type, afs_uint32 cloneid,
172                       char *typestring, char *pname, char *vname, char *suffix,
173                       struct volser_status *volstatus, afs_int32 *transPtr);
174 static int DoVolDelete(struct rx_connection *aconn, afs_uint32 avolid,
175                        afs_int32 apart, char *typestring, afs_uint32 atoserver,
176                        struct volser_status *volstatus, char *pprefix);
177 static afs_int32 CheckVolume(volintInfo * volumeinfo, afs_uint32 aserver,
178                              afs_int32 apart, afs_int32 * modentry,
179                              afs_uint32 * maxvolid, struct nvldbentry *aentry);
180 static afs_int32 VolumeExists(afs_uint32 server, afs_int32 partition,
181                               afs_uint32 volumeid);
182 static afs_int32 CheckVldbRWBK(struct nvldbentry * entry,
183                                afs_int32 * modified);
184 static afs_int32 CheckVldbRO(struct nvldbentry *entry, afs_int32 * modified);
185 static afs_int32 CheckVldb(struct nvldbentry *entry, afs_int32 * modified,
186                            afs_int32 *deleted);
187 static void dump_sig_handler(int x);
188 static int sortVolumes(const void *a, const void *b);
189
190
191 /*map the partition <partId> into partition name <partName>*/
192 void
193 MapPartIdIntoName(afs_int32 partId, char *partName)
194 {
195     if (partId < 26) {          /* what if partId > = 26 ? */
196         strcpy(partName, "/vicep");
197         partName[6] = partId + 'a';
198         partName[7] = '\0';
199         return;
200     } else if (partId < VOLMAXPARTS) {
201         strcpy(partName, "/vicep");
202         partId -= 26;
203         partName[6] = 'a' + (partId / 26);
204         partName[7] = 'a' + (partId % 26);
205         partName[8] = '\0';
206         return;
207     }
208 }
209
210 int
211 PrintError(char *msg, afs_int32 errcode)
212 {
213     fprintf(STDERR, "%s", msg);
214     /*replace by a big switch statement */
215     switch (errcode) {
216     case 0:
217         break;
218     case -1:
219         fprintf(STDERR, "Possible communication failure\n");
220         break;
221     case VSALVAGE:
222         fprintf(STDERR, "Volume needs to be salvaged\n");
223         break;
224     case VNOVNODE:
225         fprintf(STDERR, "Bad vnode number quoted\n");
226         break;
227     case VNOVOL:
228         fprintf(STDERR,
229                 "Volume not attached, does not exist, or not on line\n");
230         break;
231     case VVOLEXISTS:
232         fprintf(STDERR, "Volume already exists\n");
233         break;
234     case VNOSERVICE:
235         fprintf(STDERR, "Volume is not in service\n");
236         break;
237     case VOFFLINE:
238         fprintf(STDERR, "Volume is off line\n");
239         break;
240     case VONLINE:
241         fprintf(STDERR, "Volume is already on line\n");
242         break;
243     case VDISKFULL:
244         fprintf(STDERR, "Partition is full\n");
245         break;
246     case VOVERQUOTA:
247         fprintf(STDERR, "Volume max quota exceeded\n");
248         break;
249     case VBUSY:
250         fprintf(STDERR, "Volume temporarily unavailable\n");
251         break;
252     case VMOVED:
253         fprintf(STDERR, "Volume has moved to another server\n");
254         break;
255     case VL_IDEXIST:
256         fprintf(STDERR, "VLDB: volume Id exists in the vldb\n");
257         break;
258     case VL_IO:
259         fprintf(STDERR, "VLDB: a read terminated too early\n");
260         break;
261     case VL_NAMEEXIST:
262         fprintf(STDERR, "VLDB: volume entry exists in the vldb\n");
263         break;
264     case VL_CREATEFAIL:
265         fprintf(STDERR, "VLDB: internal creation failure\n");
266         break;
267     case VL_NOENT:
268         fprintf(STDERR, "VLDB: no such entry\n");
269         break;
270     case VL_EMPTY:
271         fprintf(STDERR, "VLDB: vldb database is empty\n");
272         break;
273     case VL_ENTDELETED:
274         fprintf(STDERR, "VLDB: entry is deleted (soft delete)\n");
275         break;
276     case VL_BADNAME:
277         fprintf(STDERR, "VLDB: volume name is illegal\n");
278         break;
279     case VL_BADINDEX:
280         fprintf(STDERR, "VLDB: index was out of range\n");
281         break;
282     case VL_BADVOLTYPE:
283         fprintf(STDERR, "VLDB: bad volume type\n");
284         break;
285     case VL_BADSERVER:
286         fprintf(STDERR, "VLDB: illegal server number (not within limits)\n");
287         break;
288     case VL_BADPARTITION:
289         fprintf(STDERR, "VLDB: bad partition number\n");
290         break;
291     case VL_REPSFULL:
292         fprintf(STDERR, "VLDB: run out of space for replication sites\n");
293         break;
294     case VL_NOREPSERVER:
295         fprintf(STDERR, "VLDB: no such repsite server exists\n");
296         break;
297     case VL_DUPREPSERVER:
298         fprintf(STDERR, "VLDB: replication site server already exists\n");
299         break;
300     case VL_RWNOTFOUND:
301         fprintf(STDERR, "VLDB: parent r/w entry not found\n");
302         break;
303     case VL_BADREFCOUNT:
304         fprintf(STDERR, "VLDB: illegal reference count number\n");
305         break;
306     case VL_SIZEEXCEEDED:
307         fprintf(STDERR, "VLDB: vldb size for attributes exceeded\n");
308         break;
309     case VL_BADENTRY:
310         fprintf(STDERR, "VLDB: bad incoming vldb entry\n");
311         break;
312     case VL_BADVOLIDBUMP:
313         fprintf(STDERR, "VLDB: illegal max volid increment\n");
314         break;
315     case VL_IDALREADYHASHED:
316         fprintf(STDERR, "VLDB: (RO/BACK) Id already hashed\n");
317         break;
318     case VL_ENTRYLOCKED:
319         fprintf(STDERR, "VLDB: vldb entry is already locked\n");
320         break;
321     case VL_BADVOLOPER:
322         fprintf(STDERR, "VLDB: bad volume operation code\n");
323         break;
324     case VL_BADRELLOCKTYPE:
325         fprintf(STDERR, "VLDB: bad release lock type\n");
326         break;
327     case VL_RERELEASE:
328         fprintf(STDERR, "VLDB: status report: last release was aborted\n");
329         break;
330     case VL_BADSERVERFLAG:
331         fprintf(STDERR, "VLDB: invalid replication site server flag\n");
332         break;
333     case VL_PERM:
334         fprintf(STDERR, "VLDB: no permission access for call\n");
335         break;
336     case VOLSERREAD_DUMPERROR:
337         fprintf(STDERR,
338                 "VOLSER:  Problems encountered in reading the dump file !\n");
339         break;
340     case VOLSERDUMPERROR:
341         fprintf(STDERR, "VOLSER: Problems encountered in doing the dump !\n");
342         break;
343     case VOLSERATTACH_ERROR:
344         fprintf(STDERR, "VOLSER: Could not attach the volume\n");
345         break;
346     case VOLSERDETACH_ERROR:
347         fprintf(STDERR, "VOLSER: Could not detach the volume\n");
348         break;
349     case VOLSERILLEGAL_PARTITION:
350         fprintf(STDERR, "VOLSER: encountered illegal partition number\n");
351         break;
352     case VOLSERBAD_ACCESS:
353         fprintf(STDERR, "VOLSER: permission denied, not a super user\n");
354         break;
355     case VOLSERVLDB_ERROR:
356         fprintf(STDERR, "VOLSER: error detected in the VLDB\n");
357         break;
358     case VOLSERBADNAME:
359         fprintf(STDERR, "VOLSER: error in volume name\n");
360         break;
361     case VOLSERVOLMOVED:
362         fprintf(STDERR, "VOLSER: volume has moved\n");
363         break;
364     case VOLSERBADOP:
365         fprintf(STDERR, "VOLSER: illegal operation\n");
366         break;
367     case VOLSERBADRELEASE:
368         fprintf(STDERR, "VOLSER: release could not be completed\n");
369         break;
370     case VOLSERVOLBUSY:
371         fprintf(STDERR, "VOLSER: volume is busy\n");
372         break;
373     case VOLSERNO_MEMORY:
374         fprintf(STDERR, "VOLSER: volume server is out of memory\n");
375         break;
376     case VOLSERNOVOL:
377         fprintf(STDERR,
378                 "VOLSER: no such volume - location specified incorrectly or volume does not exist\n");
379         break;
380     case VOLSERMULTIRWVOL:
381         fprintf(STDERR,
382                 "VOLSER: multiple RW volumes with same ID, one of which should be deleted\n");
383         break;
384     case VOLSERFAILEDOP:
385         fprintf(STDERR,
386                 "VOLSER: not all entries were successfully processed\n");
387         break;
388     default:
389         {
390             initialize_RXK_error_table();
391             initialize_KTC_error_table();
392             initialize_ACFG_error_table();
393             initialize_VL_error_table();
394
395             fprintf(STDERR, "%s: %s\n", afs_error_table_name(errcode),
396                     afs_error_message(errcode));
397             break;
398         }
399     }
400     return 0;
401 }
402
403 void init_volintInfo(struct volintInfo *vinfo) {
404     memset(vinfo, 0, sizeof(struct volintInfo));
405
406     vinfo->maxquota = -1;
407     vinfo->dayUse = -1;
408     vinfo->creationDate = -1;
409     vinfo->updateDate = -1;
410     vinfo->flags = -1;
411     vinfo->spare0 = -1;
412     vinfo->spare1 = -1;
413     vinfo->spare2 = -1;
414     vinfo->spare3 = -1;
415 }
416
417 static struct rx_securityClass *uvclass = 0;
418 static int uvindex = -1;
419 /* called by VLDBClient_Init to set the security module to be used in the RPC */
420 int
421 UV_SetSecurity(struct rx_securityClass *as, afs_int32 aindex)
422 {
423     uvindex = aindex;
424     uvclass = as;
425     return 0;
426 }
427
428 /* bind to volser on <port> <aserver> */
429 /* takes server address in network order, port in host order.  dumb */
430 struct rx_connection *
431 UV_Bind(afs_uint32 aserver, afs_int32 port)
432 {
433     struct rx_connection *tc;
434
435     tc = rx_NewConnection(aserver, htons(port), VOLSERVICE_ID, uvclass,
436                           uvindex);
437     return tc;
438 }
439
440 static int
441 AFSVolCreateVolume_retry(struct rx_connection *z_conn,
442                        afs_int32 partition, char *name, afs_int32 type,
443                        afs_int32 parent, afs_uint32 *volid, afs_int32 *trans)
444 {
445     afs_int32 code;
446     int retries = 3;
447     while (retries) {
448         code = AFSVolCreateVolume(z_conn, partition, name, type, parent,
449                                   volid, trans);
450         if (code != VOLSERVOLBUSY)
451             break;
452         retries--;
453 #ifdef AFS_PTHREAD_ENV
454         sleep(3-retries);
455 #else
456         IOMGR_Sleep(3-retries);
457 #endif
458     }
459     return code;
460 }
461
462 static int
463 AFSVolTransCreate_retry(struct rx_connection *z_conn,
464                         afs_int32 volume, afs_int32 partition,
465                         afs_int32 flags, afs_int32 * trans)
466 {
467     afs_int32 code;
468     int retries = 3;
469     while (retries) {
470         code = AFSVolTransCreate(z_conn, volume, partition, flags, trans);
471         if (code != VOLSERVOLBUSY)
472             break;
473         retries--;
474 #ifdef AFS_PTHREAD_ENV
475         sleep(3-retries);
476 #else
477         IOMGR_Sleep(3-retries);
478 #endif
479     }
480     return code;
481 }
482
483 /* called by EmuerateEntry, show vldb entry in a reasonable format */
484 void
485 SubEnumerateEntry(struct nvldbentry *entry)
486 {
487     int i;
488     char pname[10];
489     int isMixed = 0;
490     char hoststr[16];
491
492     if (entry->flags & VLF_RWEXISTS)
493         fprintf(STDOUT, "    RWrite: %-10u", entry->volumeId[RWVOL]);
494     if (entry->flags & VLF_ROEXISTS)
495         fprintf(STDOUT, "    ROnly: %-10u", entry->volumeId[ROVOL]);
496     if (entry->flags & VLF_BACKEXISTS)
497         fprintf(STDOUT, "    Backup: %-10u", entry->volumeId[BACKVOL]);
498     if ((entry->cloneId != 0) && (entry->flags & VLF_ROEXISTS))
499         fprintf(STDOUT, "    RClone: %-10lu", (unsigned long)entry->cloneId);
500     fprintf(STDOUT, "\n");
501     fprintf(STDOUT, "    number of sites -> %lu\n",
502             (unsigned long)entry->nServers);
503     for (i = 0; i < entry->nServers; i++) {
504         if (entry->serverFlags[i] & VLSF_NEWREPSITE)
505             isMixed = 1;
506     }
507     for (i = 0; i < entry->nServers; i++) {
508         MapPartIdIntoName(entry->serverPartition[i], pname);
509         fprintf(STDOUT, "       server %s partition %s ",
510                 noresolve ? afs_inet_ntoa_r(entry->serverNumber[i], hoststr) :
511                 hostutil_GetNameByINet(entry->serverNumber[i]), pname);
512         if (entry->serverFlags[i] & VLSF_RWVOL)
513             fprintf(STDOUT, "RW Site ");
514         else
515             fprintf(STDOUT, "RO Site ");
516         if (isMixed) {
517             if (entry->serverFlags[i] & VLSF_NEWREPSITE)
518                 fprintf(STDOUT," -- New release");
519             else
520                 if (!(entry->serverFlags[i] & VLSF_RWVOL))
521                     fprintf(STDOUT," -- Old release");
522         } else {
523             if (entry->serverFlags[i] & VLSF_DONTUSE)
524                 fprintf(STDOUT, " -- Not released");
525         }
526         fprintf(STDOUT, "\n");
527     }
528
529     return;
530
531 }
532
533 /*enumerate the vldb entry corresponding to <entry> */
534 void
535 EnumerateEntry(struct nvldbentry *entry)
536 {
537
538     fprintf(STDOUT, "\n");
539     fprintf(STDOUT, "%s \n", entry->name);
540     SubEnumerateEntry(entry);
541     return;
542 }
543
544 /* forcibly remove a volume.  Very dangerous call */
545 int
546 UV_NukeVolume(afs_uint32 server, afs_int32 partid, afs_uint32 volid)
547 {
548     struct rx_connection *tconn;
549     afs_int32 code;
550
551     tconn = UV_Bind(server, AFSCONF_VOLUMEPORT);
552     if (tconn) {
553         code = AFSVolNukeVolume(tconn, partid, volid);
554         rx_DestroyConnection(tconn);
555     } else
556         code = 0;
557     return code;
558 }
559
560 /* like df. Return usage of <pname> on <server> in <partition> */
561 int
562 UV_PartitionInfo64(afs_uint32 server, char *pname,
563                    struct diskPartition64 *partition)
564 {
565     struct rx_connection *aconn;
566     afs_int32 code = 0;
567
568     aconn = UV_Bind(server, AFSCONF_VOLUMEPORT);
569     code = AFSVolPartitionInfo64(aconn, pname, partition);
570     if (code == RXGEN_OPCODE) {
571         struct diskPartition *dpp = malloc(sizeof(struct diskPartition));
572         code = AFSVolPartitionInfo(aconn, pname, dpp);
573         if (!code) {
574             strncpy(partition->name, dpp->name, 32);
575             strncpy(partition->devName, dpp->devName, 32);
576             partition->lock_fd = dpp->lock_fd;
577             partition->free = dpp->free;
578             partition->minFree = dpp->minFree;
579         }
580         free(dpp);
581     }
582     if (code) {
583         fprintf(STDERR, "Could not get information on partition %s\n", pname);
584         PrintError("", code);
585     }
586     if (aconn)
587         rx_DestroyConnection(aconn);
588     return code;
589 }
590
591 /* old interface to create volumes */
592 int
593 UV_CreateVolume(afs_uint32 aserver, afs_int32 apart, char *aname,
594                 afs_uint32 * anewid)
595 {
596     afs_int32 code;
597     *anewid = 0;
598     code = UV_CreateVolume2(aserver, apart, aname, 5000, 0, 0, 0, 0, anewid);
599     return code;
600 }
601
602 /* less old interface to create volumes */
603 int
604 UV_CreateVolume2(afs_uint32 aserver, afs_int32 apart, char *aname,
605                  afs_int32 aquota, afs_int32 aspare1, afs_int32 aspare2,
606                  afs_int32 aspare3, afs_int32 aspare4, afs_uint32 * anewid)
607 {
608     afs_uint32 roid = 0, bkid = 0;
609     return UV_CreateVolume3(aserver, apart, aname, aquota, aspare1, aspare2,
610         aspare3, aspare4, anewid, &roid, &bkid);
611 }
612
613 /**
614  * Create a volume on the given server and partition
615  *
616  * @param aserver  server to create volume on
617  * @param spart  partition to create volume on
618  * @param aname  name of new volume
619  * @param aquota  quota for new volume
620  * @param anewid  contains the desired volume id for the new volume. If
621  *                *anewid == 0, a new id will be chosen, and will be placed
622  *                in *anewid when UV_CreateVolume3 returns.
623  * @param aroid  contains the desired RO volume id. If NULL, the RO id entry
624  *               will be unset. If *aroid == 0, an id will be chosen, and
625  *               will be placed in *anewid when UV_CreateVolume3 returns.
626  * @param abkid  same as aroid, except for the BK volume id instead of the
627  *               RO volume id.
628  * @return 0 on success, error code otherwise.
629  */
630 int
631 UV_CreateVolume3(afs_uint32 aserver, afs_int32 apart, char *aname,
632                  afs_int32 aquota, afs_int32 aspare1, afs_int32 aspare2,
633                  afs_int32 aspare3, afs_int32 aspare4, afs_uint32 * anewid,
634                  afs_uint32 * aroid, afs_uint32 * abkid)
635 {
636     struct rx_connection *aconn;
637     afs_int32 tid;
638     afs_int32 code;
639     afs_int32 error;
640     afs_int32 rcode, vcode;
641     afs_int32 lastid;
642     struct nvldbentry entry, storeEntry;        /*the new vldb entry */
643     struct volintInfo tstatus;
644
645     tid = 0;
646     error = 0;
647
648     memset(&storeEntry, 0, sizeof(struct nvldbentry));
649
650     init_volintInfo(&tstatus);
651     tstatus.maxquota = aquota;
652
653     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
654
655     if (aroid && *aroid) {
656         VPRINT1("Using RO volume ID %d.\n", *aroid);
657     }
658     if (abkid && *abkid) {
659         VPRINT1("Using BK volume ID %d.\n", *abkid);
660     }
661
662     if (*anewid) {
663         vcode = VLDB_GetEntryByID(*anewid, -1, &entry);
664         if (!vcode) {
665             fprintf(STDERR, "Volume ID %d already exists\n", *anewid);
666             return VVOLEXISTS;
667         }
668         VPRINT1("Using volume ID %d.\n", *anewid);
669     } else {
670         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, anewid);
671         EGOTO1(cfail, vcode, "Could not get an Id for volume %s\n", aname);
672
673         if (aroid && *aroid == 0) {
674             vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, aroid);
675             EGOTO1(cfail, vcode, "Could not get an RO Id for volume %s\n", aname);
676         }
677
678         if (abkid && *abkid == 0) {
679             vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, abkid);
680             EGOTO1(cfail, vcode, "Could not get a BK Id for volume %s\n", aname);
681         }
682     }
683
684     /* rw,ro, bk id are related in the default case */
685     /* If caller specified RW id, but not RO/BK ids, have them be RW+1 and RW+2 */
686     lastid = *anewid;
687     if (aroid && *aroid != 0) {
688         lastid = max(lastid, *aroid);
689     }
690     if (abkid && *abkid != 0) {
691         lastid = max(lastid, *abkid);
692     }
693     if (aroid && *aroid == 0) {
694         *aroid = ++lastid;
695     }
696     if (abkid && *abkid == 0) {
697         *abkid = ++lastid;
698     }
699
700     code =
701         AFSVolCreateVolume_retry(aconn, apart, aname, volser_RW, 0, anewid, &tid);
702     EGOTO2(cfail, code, "Failed to create the volume %s %u \n", aname,
703            *anewid);
704
705     code = AFSVolSetInfo(aconn, tid, &tstatus);
706     if (code)
707         EPRINT(code, "Could not change quota, continuing...\n");
708
709     code = AFSVolSetFlags(aconn, tid, 0);       /* bring it online (mark it InService */
710     EGOTO2(cfail, code, "Could not bring the volume %s %u online \n", aname,
711            *anewid);
712
713     VPRINT2("Volume %s %u created and brought online\n", aname, *anewid);
714
715     /* set up the vldb entry for this volume */
716     strncpy(entry.name, aname, VOLSER_OLDMAXVOLNAME);
717     entry.nServers = 1;
718     entry.serverNumber[0] = aserver;    /* this should have another
719                                          * level of indirection later */
720     entry.serverPartition[0] = apart;   /* this should also have
721                                          * another indirection level */
722     entry.flags = VLF_RWEXISTS; /* this records that rw volume exists */
723     entry.serverFlags[0] = VLSF_RWVOL;  /*this rep site has rw  vol */
724     entry.volumeId[RWVOL] = *anewid;
725     entry.volumeId[ROVOL] = aroid ? *aroid : 0;
726     entry.volumeId[BACKVOL] = abkid ? *abkid : 0;
727     entry.cloneId = 0;
728     /*map into right byte order, before passing to xdr, the stuff has to be in host
729      * byte order. Xdr converts it into network order */
730     MapNetworkToHost(&entry, &storeEntry);
731     /* create the vldb entry */
732     vcode = VLDB_CreateEntry(&storeEntry);
733     if (vcode) {
734         fprintf(STDERR,
735                 "Could not create a VLDB entry for the volume %s %lu\n",
736                 aname, (unsigned long)*anewid);
737         /*destroy the created volume */
738         VPRINT1("Deleting the newly created volume %u\n", *anewid);
739         AFSVolDeleteVolume(aconn, tid);
740         error = vcode;
741         goto cfail;
742     }
743     VPRINT2("Created the VLDB entry for the volume %s %u\n", aname, *anewid);
744     /* volume created, now terminate the transaction and release the connection */
745     code = AFSVolEndTrans(aconn, tid, &rcode);  /*if it crashes before this
746                                                  * the volume will come online anyway when transaction timesout , so if
747                                                  * vldb entry exists then the volume is guaranteed to exist too wrt create */
748     tid = 0;
749     if (code) {
750         fprintf(STDERR,
751                 "Failed to end the transaction on the volume %s %lu\n", aname,
752                 (unsigned long)*anewid);
753         error = code;
754         goto cfail;
755     }
756
757   cfail:
758     if (tid) {
759         code = AFSVolEndTrans(aconn, tid, &rcode);
760         if (code)
761             fprintf(STDERR, "WARNING: could not end transaction\n");
762     }
763     if (aconn)
764         rx_DestroyConnection(aconn);
765     PrintError("", error);
766     return error;
767 }
768
769 /* create a volume, given a server, partition number, volume name --> sends
770 * back new vol id in <anewid>*/
771 int
772 UV_AddVLDBEntry(afs_uint32 aserver, afs_int32 apart, char *aname,
773                 afs_uint32 aid)
774 {
775     struct rx_connection *aconn;
776     afs_int32 error;
777     afs_int32 vcode;
778     struct nvldbentry entry, storeEntry;        /*the new vldb entry */
779
780     memset(&storeEntry, 0, sizeof(struct nvldbentry));
781
782     aconn = (struct rx_connection *)0;
783     error = 0;
784
785     /* set up the vldb entry for this volume */
786     strncpy(entry.name, aname, VOLSER_OLDMAXVOLNAME);
787     entry.nServers = 1;
788     entry.serverNumber[0] = aserver;    /* this should have another
789                                          * level of indirection later */
790     entry.serverPartition[0] = apart;   /* this should also have
791                                          * another indirection level */
792     entry.flags = VLF_RWEXISTS; /* this records that rw volume exists */
793     entry.serverFlags[0] = VLSF_RWVOL;  /*this rep site has rw  vol */
794     entry.volumeId[RWVOL] = aid;
795     entry.volumeId[ROVOL] = 0;
796     entry.volumeId[BACKVOL] = 0;
797     entry.cloneId = 0;
798     /*map into right byte order, before passing to xdr, the stuff has to be in host
799      * byte order. Xdr converts it into network order */
800     MapNetworkToHost(&entry, &storeEntry);
801     /* create the vldb entry */
802     vcode = VLDB_CreateEntry(&storeEntry);
803     if (vcode) {
804         fprintf(STDERR,
805                 "Could not create a VLDB entry for the  volume %s %lu\n",
806                 aname, (unsigned long)aid);
807         error = vcode;
808         goto cfail;
809     }
810     VPRINT2("Created the VLDB entry for the volume %s %u\n", aname, aid);
811
812   cfail:
813     if (aconn)
814         rx_DestroyConnection(aconn);
815     PrintError("", error);
816     return error;
817 }
818
819 /* Delete the volume <volid>on <aserver> <apart>
820  * the physical entry gets removed from the vldb only if the ref count
821  * becomes zero
822  */
823 int
824 UV_DeleteVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid)
825 {
826     struct rx_connection *aconn = (struct rx_connection *)0;
827     afs_int32 ttid = 0;
828     afs_int32 code, rcode;
829     afs_int32 error = 0;
830     struct nvldbentry entry, storeEntry;
831     int islocked = 0;
832     afs_int32 avoltype = -1, vtype;
833     int notondisk = 0, notinvldb = 0;
834
835     memset(&storeEntry, 0, sizeof(struct nvldbentry));
836
837     /* Find and read bhe VLDB entry for this volume */
838     code = ubik_VL_SetLock(cstruct, 0, avolid, avoltype, VLOP_DELETE);
839     if (code) {
840         if (code != VL_NOENT) {
841             EGOTO1(error_exit, code,
842                    "Could not lock VLDB entry for the volume %u\n", avolid);
843         }
844         notinvldb = 1;
845     } else {
846         islocked = 1;
847
848         code = VLDB_GetEntryByID(avolid, avoltype, &entry);
849         EGOTO1(error_exit, code, "Could not fetch VLDB entry for volume %u\n",
850                avolid);
851         MapHostToNetwork(&entry);
852
853         if (verbose)
854             EnumerateEntry(&entry);
855     }
856
857     /* Whether volume is in the VLDB or not. Delete the volume on disk */
858     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
859
860     code = DoVolDelete(aconn, avolid, apart, "the", 0, NULL, NULL);
861     if (code) {
862         if (code == VNOVOL)
863             notondisk = 1;
864         else {
865             error = code;
866             goto error_exit;
867         }
868     }
869
870     /* Now update the VLDB entry.
871      * But first, verify we have a VLDB entry.
872      * Whether volume is on disk or not. Delete the volume in VLDB.
873      */
874     if (notinvldb)
875         ERROR_EXIT(0);
876
877     if (avolid == entry.volumeId[BACKVOL]) {
878         /* Its a backup volume, modify the VLDB entry. Check that the
879          * backup volume is on the server/partition we asked to delete.
880          */
881         if (!(entry.flags & VLF_BACKEXISTS) || !Lp_Match(aserver, apart, &entry)) {
882             notinvldb = 2;      /* Not on this server and partition */
883             ERROR_EXIT(0);
884         }
885
886         VPRINT1("Marking the backup volume %u deleted in the VLDB\n", avolid);
887
888         entry.flags &= ~VLF_BACKEXISTS;
889         vtype = BACKVOL;
890     }
891
892     else if (avolid == entry.volumeId[ROVOL]) {
893         /* Its a read-only volume, modify the VLDB entry. Check that the
894          * readonly volume is on the server/partition we asked to delete.
895          * If flags does not have RO_EIXSTS set, then this may mean the RO
896          * hasn't been released (and could exist in VLDB).
897          */
898         if (!Lp_ROMatch(aserver, apart, &entry)) {
899             notinvldb = 2;      /* Not found on this server and partition */
900             ERROR_EXIT(0);
901         }
902
903         if (verbose)
904             fprintf(STDOUT,
905                     "Marking the readonly volume %lu deleted in the VLDB\n",
906                     (unsigned long)avolid);
907
908         Lp_SetROValue(&entry, aserver, apart, 0, 0);    /* delete the site */
909         entry.nServers--;
910         if (!Lp_ROMatch(0, 0, &entry))
911             entry.flags &= ~VLF_ROEXISTS;       /* This was the last ro volume */
912         vtype = ROVOL;
913     }
914
915     else if (avolid == entry.volumeId[RWVOL]) {
916         /* It's a rw volume, delete the backup volume, modify the VLDB entry.
917          * Check that the readwrite volumes is on the server/partition we
918          * asked to delete.
919          */
920         if (!(entry.flags & VLF_RWEXISTS) || !Lp_Match(aserver, apart, &entry)) {
921             notinvldb = 2;      /* Not found on this server and partition */
922             ERROR_EXIT(0);
923         }
924
925         if (entry.volumeId[BACKVOL]) {
926             /* Delete backup if it exists */
927             code = DoVolDelete(aconn, entry.volumeId[BACKVOL], apart,
928                                "the backup", 0, NULL, NULL);
929             if (code && code != VNOVOL) {
930                 error = code;
931                 goto error_exit;
932             }
933         }
934
935         if (verbose)
936             fprintf(STDOUT,
937                     "Marking the readwrite volume %lu%s deleted in the VLDB\n",
938                     (unsigned long)avolid,
939                     ((entry.
940                       flags & VLF_BACKEXISTS) ? ", and its backup volume," :
941                      ""));
942
943         Lp_SetRWValue(&entry, aserver, apart, 0L, 0L);
944         entry.nServers--;
945         entry.flags &= ~(VLF_BACKEXISTS | VLF_RWEXISTS);
946         vtype = RWVOL;
947
948         if (entry.flags & VLF_ROEXISTS)
949             fprintf(STDERR, "WARNING: ReadOnly copy(s) may still exist\n");
950     }
951
952     else {
953         notinvldb = 2;          /* Not found on this server and partition */
954         ERROR_EXIT(0);
955     }
956
957     /* Either delete or replace the VLDB entry */
958     if ((entry.nServers <= 0) || !(entry.flags & (VLF_ROEXISTS | VLF_RWEXISTS))) {
959         if (verbose)
960             fprintf(STDOUT,
961                     "Last reference to the VLDB entry for %lu - deleting entry\n",
962                     (unsigned long)avolid);
963         code = ubik_VL_DeleteEntry(cstruct, 0, avolid, vtype);
964         EGOTO1(error_exit, code,
965                "Could not delete the VLDB entry for the volume %u \n",
966                avolid);
967     } else {
968         MapNetworkToHost(&entry, &storeEntry);
969         code =
970             VLDB_ReplaceEntry(avolid, vtype, &storeEntry,
971                               (LOCKREL_OPCODE | LOCKREL_AFSID |
972                                LOCKREL_TIMESTAMP));
973         EGOTO1(error_exit, code,
974                "Could not update the VLDB entry for the volume %u \n",
975                avolid);
976     }
977     islocked = 0;
978
979   error_exit:
980     if (error)
981         EPRINT(error, "\n");
982
983     if (notondisk && notinvldb) {
984         EPRINT2(VOLSERNOVOL, "Volume %u does not exist %s\n", avolid,
985                 ((notinvldb == 2) ? "on server and partition" : ""));
986         if (!error)
987             error = VOLSERNOVOL;
988     } else if (notondisk) {
989         fprintf(STDERR,
990                 "WARNING: Volume %lu did not exist on the partition\n",
991                 (unsigned long)avolid);
992     } else if (notinvldb) {
993         fprintf(STDERR, "WARNING: Volume %lu does not exist in VLDB %s\n",
994                 (unsigned long)avolid,
995                 ((notinvldb == 2) ? "on server and partition" : ""));
996     }
997
998     if (ttid) {
999         code = AFSVolEndTrans(aconn, ttid, &rcode);
1000         code = (code ? code : rcode);
1001         if (code) {
1002             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
1003                     (unsigned long)avolid);
1004             PrintError("", code);
1005             if (!error)
1006                 error = code;
1007         }
1008     }
1009
1010     if (islocked) {
1011         code =
1012             ubik_VL_ReleaseLock(cstruct, 0, avolid, -1,
1013                                 (LOCKREL_OPCODE | LOCKREL_AFSID |
1014                                  LOCKREL_TIMESTAMP));
1015         if (code) {
1016             EPRINT1(code,
1017                     "Could not release the lock on the VLDB entry for the volume %u \n",
1018                     avolid);
1019             if (!error)
1020                 error = code;
1021         }
1022     }
1023
1024     if (aconn)
1025         rx_DestroyConnection(aconn);
1026     return error;
1027 }
1028
1029 /* add recovery to UV_MoveVolume */
1030
1031 #define TESTC   0               /* set to test recovery code, clear for production */
1032
1033 jmp_buf env;
1034 int interrupt = 0;
1035
1036 static void *
1037 do_interrupt(void * unused)
1038 {
1039     if (interrupt) {
1040 #if !defined(AFS_PTHREAD_ENV) && !defined(AFS_NT40_ENV)
1041         /* Avoid UNIX LWP from getting confused that our stack has suddenly
1042          * changed. This will avoid some sanity checks, but until a better way
1043          * is found, the only alternative is always crashing and burning on at
1044          * least the stack-overflow check. */
1045         lwp_cpptr->stack = NULL;
1046 #endif
1047         longjmp(env, 0);
1048     }
1049
1050     fprintf(STDOUT, "\nSIGINT handler: vos move operation in progress\n");
1051     fprintf(STDOUT,
1052             "WARNING: may leave AFS storage and metadata in indeterminate state\n");
1053     fprintf(STDOUT, "enter second control-c to exit\n");
1054     fflush(STDOUT);
1055
1056     interrupt = 1;
1057     return NULL;
1058 }
1059
1060 static void
1061 sigint_handler(int x)
1062 {
1063 #ifdef AFS_PTHREAD_ENV
1064     do_interrupt(NULL);
1065 #else
1066     IOMGR_SoftSig(do_interrupt, 0);
1067 #endif
1068     (void)signal(SIGINT, sigint_handler);
1069 }
1070
1071 static int
1072 DoVolDelete(struct rx_connection *aconn, afs_uint32 avolid,
1073             afs_int32 apart, char *ptypestring, afs_uint32 atoserver,
1074             struct volser_status *volstatus, char *pprefix)
1075 {
1076     afs_int32 ttid = 0, code, rcode, error = 0;
1077     char *prefix, *typestring;
1078     int beverbose = 0;
1079
1080     if (pprefix)
1081         prefix = pprefix;
1082     else
1083         prefix = "";
1084
1085     if (ptypestring) {
1086         typestring = ptypestring;
1087         beverbose = 1;
1088     } else
1089         typestring = "the";
1090
1091     if (beverbose)
1092         VPRINT3("%sDeleting %s volume %u ...", prefix, typestring, avolid);
1093
1094     code =
1095         AFSVolTransCreate_retry(aconn, avolid, apart, ITOffline, &ttid);
1096
1097     /* return early and quietly for VNOVOL; don't continue the attempt to delete. */
1098     if (code == VNOVOL) {
1099         error = code;
1100         goto dfail;
1101     }
1102
1103     EGOTO2(dfail, code, "%sFailed to start transaction on %u\n",
1104            prefix, avolid);
1105
1106     if (volstatus) {
1107         code = AFSVolGetStatus(aconn, ttid, volstatus);
1108         EGOTO2(dfail, code, "%sCould not get timestamp from volume %u\n",
1109                prefix, avolid);
1110     }
1111
1112     code =
1113         AFSVolSetFlags(aconn, ttid,
1114                        VTDeleteOnSalvage | VTOutOfService);
1115
1116     EGOTO2(dfail, code, "%sCould not set flags on volume %u \n",
1117            prefix, avolid);
1118
1119     if (atoserver) {
1120         VPRINT1("%sSetting volume forwarding pointer ...", prefix);
1121         AFSVolSetForwarding(aconn, ttid, atoserver);
1122         VDONE;
1123     }
1124
1125     code = AFSVolDeleteVolume(aconn, ttid);
1126     EGOTO2(dfail, code, "%sCould not delete volume %u\n", prefix, avolid);
1127
1128 dfail:
1129     if (ttid) {
1130         code = AFSVolEndTrans(aconn, ttid, &rcode);
1131         ttid = 0;
1132         if (!code)
1133             code = rcode;
1134         if (code) {
1135             fprintf(STDERR, "%sCould not end transaction on %s volume %lu \n",
1136                     prefix, typestring, (unsigned long)avolid);
1137             if (!error)
1138                 error = code;
1139         }
1140     }
1141
1142     if (beverbose && !error)
1143         VDONE;
1144     return error;
1145 }
1146
1147 static int
1148 DoVolClone(struct rx_connection *aconn, afs_uint32 avolid,
1149            afs_int32 apart, int type, afs_uint32 cloneid,
1150            char *typestring, char *pname, char *vname, char *suffix,
1151            struct volser_status *volstatus, afs_int32 *transPtr)
1152 {
1153     char cname[64];
1154     afs_int32 ttid = 0, btid = 0;
1155     afs_int32 code = 0, rcode = 0;
1156     afs_int32 error = 0;
1157     int cloneexists = 1;
1158
1159     /* Test to see if the clone volume exists by trying to create
1160      * a transaction on the clone volume. We've assumed the clone exists.
1161      */
1162     code = AFSVolTransCreate_retry(aconn, cloneid, apart, ITOffline, &btid);
1163     if (code) {
1164         if (code != VNOVOL) {
1165             EPRINT2(code, "Could not reach the %s volume %lu\n",
1166                     typestring, (unsigned long)cloneid);
1167             error = code;
1168             goto cfail;
1169         }
1170         cloneexists = 0;         /* clone volume does not exist */
1171     }
1172     if (btid) {
1173         code = AFSVolEndTrans(aconn, btid, &rcode);
1174         btid = 0;
1175         if (code || rcode) {
1176             fprintf(STDERR,
1177                     "Could not end transaction on the previous %s volume %lu\n",
1178                     typestring, (unsigned long)cloneid);
1179             error = (code ? code : rcode);
1180             goto cfail;
1181         }
1182     }
1183
1184     /* Now go ahead and try to clone the RW volume.
1185      * First start a transaction on the RW volume
1186      */
1187     code = AFSVolTransCreate_retry(aconn, avolid, apart, ITBusy, &ttid);
1188     if (code) {
1189         fprintf(STDERR, "Could not start a transaction on the volume %lu\n",
1190                 (unsigned long)avolid);
1191         error = code;
1192         goto cfail;
1193     }
1194
1195     /* Clone or reclone the volume, depending on whether the clone
1196      * volume exists or not
1197      */
1198     if (cloneexists) {
1199         VPRINT2("Re-cloning %s volume %u ...", typestring, cloneid);
1200
1201         code = AFSVolReClone(aconn, ttid, cloneid);
1202         if (code) {
1203             EPRINT2(code, "Could not re-clone %s volume %lu\n",
1204                     typestring, (unsigned long)cloneid);
1205             error = code;
1206             goto cfail;
1207         }
1208     } else {
1209         VPRINT2("Creating a new %s clone %u ...", typestring, cloneid);
1210
1211         if (!vname) {
1212             strcpy(cname, pname);
1213             strcat(cname, suffix);
1214         }
1215
1216         code = AFSVolClone(aconn, ttid, 0, type, vname?vname:cname,
1217                            &cloneid);
1218         if (code) {
1219             fprintf(STDERR, "Failed to clone the volume %lu\n",
1220                     (unsigned long)avolid);
1221             error = code;
1222             goto cfail;
1223         }
1224     }
1225
1226     VDONE;
1227
1228     if (volstatus) {
1229         VPRINT1("Getting status of parent volume %u...", avolid);
1230         code = AFSVolGetStatus(aconn, ttid, volstatus);
1231         if (code) {
1232             fprintf(STDERR, "Failed to get the status of the parent volume %lu\n",
1233                     (unsigned long)avolid);
1234             error = code;
1235             goto cfail;
1236         }
1237         VDONE;
1238     }
1239
1240 cfail:
1241     if (ttid) {
1242         code = AFSVolEndTrans(aconn, ttid, &rcode);
1243         if (code || rcode) {
1244             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
1245                     (unsigned long)avolid);
1246             if (!error)
1247                 error = (code ? code : rcode);
1248         }
1249     }
1250
1251     if (btid) {
1252         code = AFSVolEndTrans(aconn, btid, &rcode);
1253         if (code || rcode) {
1254             fprintf(STDERR,
1255                     "Could not end transaction on the %s volume %lu\n",
1256                     typestring, (unsigned long)cloneid);
1257             if (!error)
1258                 error = (code ? code : rcode);
1259         }
1260     }
1261     return error;
1262 }
1263
1264 /* Convert volume from RO to RW; adjust the VLDB entry to match.
1265  * The nvldbentry passed to us has already been MapHostToNetwork'd
1266  * by the caller.
1267  */
1268
1269 int
1270 UV_ConvertRO(afs_uint32 server, afs_uint32 partition, afs_uint32 volid,
1271                 struct nvldbentry *entry)
1272 {
1273     afs_int32 code, i, same;
1274     struct nvldbentry checkEntry, storeEntry;
1275     afs_int32 vcode;
1276     afs_int32 rwindex = 0;
1277     afs_uint32 rwserver = 0;
1278     afs_int32 roindex = 0;
1279     afs_uint32 roserver = 0;
1280     struct rx_connection *aconn;
1281
1282     memset(&storeEntry, 0, sizeof(struct nvldbentry));
1283
1284     vcode =
1285         ubik_VL_SetLock(cstruct, 0, entry->volumeId[RWVOL], RWVOL,
1286                   VLOP_MOVE);
1287     if (vcode) {
1288         fprintf(STDERR,
1289                 "Unable to lock volume %lu, code %d\n",
1290                 (unsigned long)entry->volumeId[RWVOL],vcode);
1291         PrintError("", vcode);
1292         return -1;
1293     }
1294
1295     /* make sure the VLDB entry hasn't changed since we started */
1296     memset(&checkEntry, 0, sizeof(checkEntry));
1297     vcode = VLDB_GetEntryByID(volid, -1, &checkEntry);
1298     if (vcode) {
1299         fprintf(STDERR,
1300                 "Could not fetch the entry for volume %lu from VLDB\n",
1301                 (unsigned long)volid);
1302         PrintError("convertROtoRW ", vcode);
1303         code = vcode;
1304         goto error_exit;
1305     }
1306
1307     MapHostToNetwork(&checkEntry);
1308     entry->flags &= ~VLOP_ALLOPERS;  /* clear any stale lock operation flags */
1309     entry->flags |= VLOP_MOVE;        /* set to match SetLock operation above */
1310     if (memcmp(entry, &checkEntry, sizeof(*entry)) != 0) {
1311         fprintf(STDERR,
1312                 "VLDB entry for volume %lu has changed; please reissue the command.\n",
1313                 (unsigned long)volid);
1314         code = -1;
1315         goto error_exit;
1316     }
1317
1318     /* extract information from the original entry */
1319     for (i = 0; i < entry->nServers; i++) {
1320         if (entry->serverFlags[i] & VLSF_RWVOL) {
1321             rwindex = i;
1322             rwserver = entry->serverNumber[i];
1323         /*  rwpartition = entry->serverPartition[i]; */
1324             if (roserver)
1325                 break;
1326         } else if ((entry->serverFlags[i] & VLSF_ROVOL) && !roserver) {
1327             same = VLDB_IsSameAddrs(server, entry->serverNumber[i], &code);
1328             if (code) {
1329                 fprintf(STDERR,
1330                         "Failed to get info about server's %d address(es) from vlserver (err=%d); aborting call!\n",
1331                         server, code);
1332                 code = ENOENT;
1333                 goto error_exit;
1334             }
1335             if (same) {
1336                 roindex = i;
1337                 roserver = entry->serverNumber[i];
1338         /*      ropartition = entry->serverPartition[i]; */
1339                 if (rwserver)
1340                      break;
1341             }
1342         }
1343     }
1344
1345     /* volume must be inaccessible during this process */
1346     code = UV_SetVolume(server, partition, volid, ITOffline, VTOutOfService, 0);
1347     if (code != 0) {
1348         fprintf(STDERR, "Taking RO volume %u offline failed with code %d.\n",
1349                 volid, code);
1350         goto error_exit;
1351     }
1352
1353     aconn = UV_Bind(server, AFSCONF_VOLUMEPORT);
1354     code = AFSVolConvertROtoRWvolume(aconn, partition, volid);
1355     if (code) {
1356         fprintf(STDERR,
1357                 "Converting RO volume %lu to RW volume failed with code %d\n",
1358                 (unsigned long)volid, code);
1359         PrintError("convertROtoRW ", code);
1360         goto error_exit;
1361     }
1362
1363     /*
1364      * Since the inService flag is copied from the RO volume, the new RW copy is
1365      * offline. Change the status of this RW volume to online.
1366      */
1367     code = UV_SetVolume(server, partition, entry->volumeId[RWVOL], ITOffline,
1368                         0 /* online */, 0);
1369     if (code != 0) {
1370         fprintf(STDERR, "Warning: Attempt to set RW volume %u as online failed "
1371                         "with code %d.\n", entry->volumeId[RWVOL], code);
1372     }
1373
1374     /* Update the VLDB to match what we did on disk as much as possible.  */
1375     /* If the converted RO was in the VLDB, make it look like the new RW. */
1376     if (roserver) {
1377         entry->serverFlags[roindex] = VLSF_RWVOL;
1378     } else {
1379         /* Add a new site entry for the newly created RW.  It's possible
1380          * (but unlikely) that we are already at MAXNSERVERS and that this
1381          * new site will invalidate the whole VLDB entry;  however,
1382          * VLDB_ReplaceEntry will detect this and return VL_BADSERVER,
1383          * so we need no extra guard logic here.
1384          */
1385         afs_int32 newrwindex = entry->nServers;
1386         (entry->nServers)++;
1387         entry->serverNumber[newrwindex] = server;
1388         entry->serverPartition[newrwindex] = partition;
1389         entry->serverFlags[newrwindex] = VLSF_RWVOL;
1390     }
1391     entry->flags |= VLF_RWEXISTS;
1392     entry->flags &= ~VLF_BACKEXISTS;
1393
1394     /* if the old RW was in the VLDB, remove it by decrementing the number */
1395     /* of servers, replacing the RW entry with the last entry, and zeroing */
1396     /* out the last entry. */
1397     if (rwserver) {
1398         (entry->nServers)--;
1399         if (rwindex != entry->nServers) {
1400             entry->serverNumber[rwindex] = entry->serverNumber[entry->nServers];
1401             entry->serverPartition[rwindex] =
1402                 entry->serverPartition[entry->nServers];
1403             entry->serverFlags[rwindex] = entry->serverFlags[entry->nServers];
1404             entry->serverNumber[entry->nServers] = 0;
1405             entry->serverPartition[entry->nServers] = 0;
1406             entry->serverFlags[entry->nServers] = 0;
1407         }
1408     }
1409     entry->flags &= ~VLF_ROEXISTS;
1410     for (i = 0; i < entry->nServers; i++) {
1411         if (entry->serverFlags[i] & VLSF_ROVOL) {
1412             if (!(entry->serverFlags[i] & (VLSF_DONTUSE | VLSF_NEWREPSITE)))
1413                 entry->flags |= VLF_ROEXISTS;
1414         }
1415     }
1416     MapNetworkToHost(entry, &storeEntry);
1417     code =
1418         VLDB_ReplaceEntry(entry->volumeId[RWVOL], RWVOL, &storeEntry,
1419                           (LOCKREL_OPCODE | LOCKREL_AFSID |
1420                            LOCKREL_TIMESTAMP));
1421     if (code) {
1422         fprintf(STDERR,
1423                 "Warning: volume converted, but vldb update failed with code %d!\n",
1424                 code);
1425     }
1426
1427   error_exit:
1428     vcode = UV_LockRelease(entry->volumeId[RWVOL]);
1429     if (vcode) {
1430         fprintf(STDERR,
1431                 "Unable to unlock volume %lu, code %d\n",
1432                 (unsigned long)entry->volumeId[RWVOL],vcode);
1433         PrintError("", vcode);
1434     }
1435     return code;
1436 }
1437
1438
1439 /* Move volume <afromvol> on <afromserver> <afrompart> to <atoserver>
1440  * <atopart>.  The operation is almost idempotent.  The following
1441  * flags are recognized:
1442  *
1443  *     RV_NOCLONE - don't use a copy clone
1444  */
1445
1446 int
1447 UV_MoveVolume2(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
1448                afs_uint32 atoserver, afs_int32 atopart, int flags)
1449 {
1450     /* declare stuff 'volatile' that may be used from setjmp/longjmp and may
1451      * be changing during the move */
1452     struct rx_connection * volatile toconn;
1453     struct rx_connection * volatile fromconn;
1454     afs_int32 volatile fromtid;
1455     afs_int32 volatile totid;
1456     afs_int32 volatile clonetid;
1457     afs_uint32 volatile newVol;
1458     afs_uint32 volatile volid;
1459     afs_uint32 volatile backupId;
1460     int volatile islocked;
1461     int volatile pntg;
1462
1463     char vname[64];
1464     char *volName = 0;
1465     char tmpName[VOLSER_MAXVOLNAME + 1];
1466     afs_int32 rcode;
1467     afs_int32 fromDate;
1468     afs_int32 tmp;
1469     afs_uint32 tmpVol;
1470     struct restoreCookie cookie;
1471     afs_int32 vcode, code;
1472     struct volser_status tstatus;
1473     struct destServer destination;
1474
1475     struct nvldbentry entry, storeEntry;
1476     int i;
1477     afs_int32 error;
1478     char in, lf;                /* for test code */
1479     int same;
1480     char hoststr[16];
1481
1482 #ifdef  ENABLE_BUGFIX_1165
1483     volEntries volumeInfo;
1484     struct volintInfo *infop = 0;
1485 #endif
1486
1487     islocked = 0;
1488     fromconn = (struct rx_connection *)0;
1489     toconn = (struct rx_connection *)0;
1490     fromtid = 0;
1491     totid = 0;
1492     clonetid = 0;
1493     error = 0;
1494     volid = 0;
1495     pntg = 0;
1496     backupId = 0;
1497     newVol = 0;
1498
1499     /* support control-c processing */
1500     if (setjmp(env))
1501         goto mfail;
1502     (void)signal(SIGINT, sigint_handler);
1503
1504     if (TESTC) {
1505         fprintf(STDOUT,
1506                 "\nThere are three tests points - verifies all code paths through recovery.\n");
1507         fprintf(STDOUT, "First test point - operation not started.\n");
1508         fprintf(STDOUT, "...test here (y, n)? ");
1509         fflush(STDOUT);
1510         if (fscanf(stdin, "%c", &in) < 1)
1511             in = 0;
1512         if (fscanf(stdin, "%c", &lf) < 0) {
1513             /* toss away; don't care */
1514         }
1515         if (in == 'y') {
1516             fprintf(STDOUT, "type control-c\n");
1517             while (1) {
1518                 fprintf(stdout, ".");
1519                 fflush(stdout);
1520                 sleep(1);
1521             }
1522         }
1523         /* or drop through */
1524     }
1525
1526     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
1527     EGOTO1(mfail, vcode,
1528            "Could not fetch the entry for the volume  %u from the VLDB \n",
1529            afromvol);
1530
1531     if (entry.volumeId[RWVOL] != afromvol) {
1532         fprintf(STDERR, "Only RW volume can be moved\n");
1533         exit(1);
1534     }
1535
1536     vcode = ubik_VL_SetLock(cstruct, 0, afromvol, RWVOL, VLOP_MOVE);
1537     EGOTO1(mfail, vcode, "Could not lock entry for volume %u \n", afromvol);
1538     islocked = 1;
1539
1540     vcode = VLDB_GetEntryByID(afromvol, RWVOL, &entry);
1541     EGOTO1(mfail, vcode,
1542            "Could not fetch the entry for the volume  %u from the VLDB \n",
1543            afromvol);
1544
1545     backupId = entry.volumeId[BACKVOL];
1546     MapHostToNetwork(&entry);
1547
1548     if (!Lp_Match(afromserver, afrompart, &entry)) {
1549         /* the from server and partition do not exist in the vldb entry corresponding to volid */
1550         if (!Lp_Match(atoserver, atopart, &entry)) {
1551             /* the to server and partition do not exist in the vldb entry corresponding to volid */
1552             fprintf(STDERR, "The volume %lu is not on the specified site. \n",
1553                     (unsigned long)afromvol);
1554             fprintf(STDERR, "The current site is :");
1555             for (i = 0; i < entry.nServers; i++) {
1556                 if (entry.serverFlags[i] == VLSF_RWVOL) {
1557                     char pname[10];
1558                     MapPartIdIntoName(entry.serverPartition[i], pname);
1559                     fprintf(STDERR, " server %s partition %s \n",
1560                             noresolve ? afs_inet_ntoa_r(entry.serverNumber[i], hoststr) :
1561                             hostutil_GetNameByINet(entry.serverNumber[i]),
1562                             pname);
1563                 }
1564             }
1565             vcode =
1566                 ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
1567                           (LOCKREL_OPCODE | LOCKREL_AFSID |
1568                            LOCKREL_TIMESTAMP));
1569             EGOTO1(mfail, vcode,
1570                    " Could not release lock on the VLDB entry for the volume %u \n",
1571                    afromvol);
1572
1573             return VOLSERVOLMOVED;
1574         }
1575
1576         /* delete the volume afromvol on src_server */
1577         /* from-info does not exist but to-info does =>
1578          * we have already done the move, but the volume
1579          * may still be existing physically on from fileserver
1580          */
1581         fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
1582         pntg = 1;
1583
1584         code = DoVolDelete(fromconn, afromvol, afrompart,
1585                            "leftover", 0, NULL, NULL);
1586         if (code && code != VNOVOL) {
1587             error = code;
1588             goto mfail;
1589         }
1590
1591         code = DoVolDelete(fromconn, backupId, afrompart,
1592                            "leftover backup", 0, NULL, NULL);
1593         if (code && code != VNOVOL) {
1594             error = code;
1595             goto mfail;
1596         }
1597
1598         fromtid = 0;
1599         error = 0;
1600         goto mfail;
1601     }
1602
1603     /* From-info matches the vldb info about volid,
1604      * its ok start the move operation, the backup volume
1605      * on the old site is deleted in the process
1606      */
1607     if (afrompart == atopart) {
1608         same = VLDB_IsSameAddrs(afromserver, atoserver, &error);
1609         EGOTO2(mfail, error,
1610                "Failed to get info about server's %d address(es) from vlserver (err=%d); aborting call!\n",
1611                afromserver, error);
1612
1613         if (same) {
1614             EGOTO1(mfail, VOLSERVOLMOVED,
1615                    "Warning: Moving volume %u to its home partition ignored!\n",
1616                    afromvol);
1617         }
1618     }
1619
1620     pntg = 1;
1621     toconn = UV_Bind(atoserver, AFSCONF_VOLUMEPORT);    /* get connections to the servers */
1622     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
1623     totid = 0;  /* initialize to uncreated */
1624
1625     /* ***
1626      * clone the read/write volume locally.
1627      * ***/
1628
1629     VPRINT1("Starting transaction on source volume %u ...", afromvol);
1630     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
1631     fromtid = tmp;
1632     EGOTO1(mfail, code, "Failed to create transaction on the volume %u\n",
1633            afromvol);
1634     VDONE;
1635
1636     if (!(flags & RV_NOCLONE)) {
1637         /* Get a clone id */
1638         VPRINT1("Allocating new volume id for clone of volume %u ...",
1639                 afromvol);
1640         tmpVol = 0;
1641         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &tmpVol);
1642         newVol = tmpVol;
1643         EGOTO1(mfail, vcode,
1644                "Could not get an ID for the clone of volume %u from the VLDB\n",
1645                afromvol);
1646         VDONE;
1647
1648         /* Do the clone. Default flags on clone are set to delete on salvage and out of service */
1649         VPRINT1("Cloning source volume %u ...", afromvol);
1650         strcpy(vname, "move-clone-temp");
1651         code =
1652             AFSVolClone(fromconn, fromtid, 0, readonlyVolume, vname, &tmpVol);
1653         newVol = tmpVol;
1654         EGOTO1(mfail, code, "Failed to clone the source volume %u\n",
1655                afromvol);
1656         VDONE;
1657     }
1658
1659     /* lookup the name of the volume we just cloned */
1660     volid = afromvol;
1661     code = AFSVolGetName(fromconn, fromtid, &volName);
1662     EGOTO1(mfail, code, "Failed to get the name of the volume %u\n",
1663            afromvol);
1664
1665     VPRINT1("Ending the transaction on the source volume %u ...", afromvol);
1666     rcode = 0;
1667     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
1668     fromtid = 0;
1669     if (!code)
1670         code = rcode;
1671     EGOTO1(mfail, code,
1672            "Failed to end the transaction on the source volume %u\n",
1673            afromvol);
1674     VDONE;
1675
1676     /* ***
1677      * Create the destination volume
1678      * ***/
1679
1680     if (!(flags & RV_NOCLONE)) {
1681         /* All of this is to get the fromDate */
1682         VPRINT1("Starting transaction on the cloned volume %u ...", newVol);
1683         tmp = clonetid;
1684         code =
1685             AFSVolTransCreate_retry(fromconn, newVol, afrompart, ITOffline,
1686                               &tmp);
1687         clonetid = tmp;
1688         EGOTO1(mfail, code,
1689                "Failed to start a transaction on the cloned volume%u\n",
1690                newVol);
1691         VDONE;
1692
1693         VPRINT1("Setting flags on cloned volume %u ...", newVol);
1694         code =
1695             AFSVolSetFlags(fromconn, clonetid,
1696                            VTDeleteOnSalvage | VTOutOfService); /*redundant */
1697         EGOTO1(mfail, code, "Could not set flags on the cloned volume %u\n",
1698                newVol);
1699         VDONE;
1700
1701         /* remember time from which we've dumped the volume */
1702         VPRINT1("Getting status of cloned volume %u ...", newVol);
1703         code = AFSVolGetStatus(fromconn, clonetid, &tstatus);
1704         EGOTO1(mfail, code,
1705                "Failed to get the status of the cloned volume %u\n",
1706                newVol);
1707         VDONE;
1708
1709         fromDate = CLOCKADJ(tstatus.creationDate);
1710     } else {
1711         /* With RV_NOCLONE, just do a full copy from the source */
1712         fromDate = 0;
1713     }
1714
1715
1716 #ifdef  ENABLE_BUGFIX_1165
1717     /*
1718      * Get the internal volume state from the source volume. We'll use such info (i.e. dayUse)
1719      * to copy it to the new volume (via AFSSetInfo later on) so that when we move volumes we
1720      * don't use this information...
1721      */
1722     volumeInfo.volEntries_val = (volintInfo *) 0;       /*this hints the stub to allocate space */
1723     volumeInfo.volEntries_len = 0;
1724     code = AFSVolListOneVolume(fromconn, afrompart, afromvol, &volumeInfo);
1725     EGOTO1(mfail, code,
1726            "Failed to get the volint Info of the cloned volume %u\n",
1727            afromvol);
1728
1729     infop = (volintInfo *) volumeInfo.volEntries_val;
1730     infop->maxquota = -1;       /* Else it will replace the default quota */
1731     infop->creationDate = -1;   /* Else it will use the source creation date */
1732     infop->updateDate = -1;     /* Else it will use the source update date */
1733 #endif
1734
1735     /* create a volume on the target machine */
1736     volid = afromvol;
1737     code = DoVolDelete(toconn, volid, atopart,
1738                        "pre-existing destination", 0, NULL, NULL);
1739     if (code && code != VNOVOL) {
1740         error = code;
1741         goto mfail;
1742     }
1743
1744     VPRINT1("Creating the destination volume %u ...", volid);
1745     tmp = totid;
1746     tmpVol = volid;
1747     code =
1748         AFSVolCreateVolume(toconn, atopart, volName, volser_RW, volid, &tmpVol,
1749                            &tmp);
1750     totid = tmp;
1751     volid = tmpVol;
1752     EGOTO1(mfail, code, "Failed to create the destination volume %u\n",
1753            volid);
1754     VDONE;
1755
1756     strncpy(tmpName, volName, VOLSER_OLDMAXVOLNAME);
1757     free(volName);
1758     volName = NULL;
1759
1760     VPRINT1("Setting volume flags on destination volume %u ...", volid);
1761     code =
1762         AFSVolSetFlags(toconn, totid, (VTDeleteOnSalvage | VTOutOfService));
1763     EGOTO1(mfail, code,
1764            "Failed to set the flags on the destination volume %u\n", volid);
1765     VDONE;
1766
1767     /***
1768      * Now dump the clone to the new volume
1769      ***/
1770
1771     destination.destHost = ntohl(atoserver);
1772     destination.destPort = AFSCONF_VOLUMEPORT;
1773     destination.destSSID = 1;
1774
1775     strncpy(cookie.name, tmpName, VOLSER_OLDMAXVOLNAME);
1776     cookie.type = RWVOL;
1777     cookie.parent = entry.volumeId[RWVOL];
1778     cookie.clone = 0;
1779
1780     if (!(flags & RV_NOCLONE)) {
1781         /* Copy the clone to the new volume */
1782         VPRINT2("Dumping from clone %u on source to volume %u on destination ...",
1783                 newVol, afromvol);
1784         code =
1785             AFSVolForward(fromconn, clonetid, 0, &destination, totid,
1786                           &cookie);
1787         EGOTO1(mfail, code, "Failed to move data for the volume %u\n", volid);
1788         VDONE;
1789
1790         VPRINT1("Ending transaction on cloned volume %u ...", newVol);
1791         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
1792         if (!code)
1793             code = rcode;
1794         clonetid = 0;
1795         EGOTO1(mfail, code,
1796                "Failed to end the transaction on the cloned volume %u\n",
1797                newVol);
1798         VDONE;
1799     }
1800
1801     /* ***
1802      * reattach to the main-line volume, and incrementally dump it.
1803      * ***/
1804
1805     VPRINT1("Starting transaction on source volume %u ...", afromvol);
1806     tmp = fromtid;
1807     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
1808     fromtid = tmp;
1809     EGOTO1(mfail, code,
1810            "Failed to create a transaction on the source volume %u\n",
1811            afromvol);
1812     VDONE;
1813
1814     /* now do the incremental */
1815     VPRINT2
1816         ("Doing the%s dump from source to destination for volume %u ... ",
1817          (flags & RV_NOCLONE) ? "" : " incremental",
1818          afromvol);
1819     code =
1820         AFSVolForward(fromconn, fromtid, fromDate, &destination, totid,
1821                       &cookie);
1822     EGOTO1(mfail, code,
1823            "Failed to do the%s dump from rw volume on old site to rw volume on newsite\n",
1824           (flags & RV_NOCLONE) ? "" : " incremental");
1825     VDONE;
1826
1827     /* now adjust the flags so that the new volume becomes official */
1828     VPRINT1("Setting volume flags on old source volume %u ...", afromvol);
1829     code = AFSVolSetFlags(fromconn, fromtid, VTOutOfService);
1830     EGOTO(mfail, code,
1831           "Failed to set the flags to make old source volume offline\n");
1832     VDONE;
1833
1834     VPRINT1("Setting volume flags on new source volume %u ...", afromvol);
1835     code = AFSVolSetFlags(toconn, totid, 0);
1836     EGOTO(mfail, code,
1837           "Failed to set the flags to make new source volume online\n");
1838     VDONE;
1839
1840 #ifdef  ENABLE_BUGFIX_1165
1841     VPRINT1("Setting volume status on destination volume %u ...", volid);
1842     code = AFSVolSetInfo(toconn, totid, infop);
1843     EGOTO1(mfail, code,
1844            "Failed to set volume status on the destination volume %u\n",
1845            volid);
1846     VDONE;
1847 #endif
1848
1849     /* put new volume online */
1850     VPRINT1("Ending transaction on destination volume %u ...", afromvol);
1851     code = AFSVolEndTrans(toconn, totid, &rcode);
1852     totid = 0;
1853     if (!code)
1854         code = rcode;
1855     EGOTO1(mfail, code,
1856            "Failed to end the transaction on the volume %u on the new site\n",
1857            afromvol);
1858     VDONE;
1859
1860     Lp_SetRWValue(&entry, afromserver, afrompart, atoserver, atopart);
1861     MapNetworkToHost(&entry, &storeEntry);
1862     storeEntry.flags &= ~VLF_BACKEXISTS;
1863
1864     if (TESTC) {
1865         fprintf(STDOUT,
1866                 "Second test point - operation in progress but not complete.\n");
1867         fprintf(STDOUT, "...test here (y, n)? ");
1868         fflush(STDOUT);
1869         if (fscanf(stdin, "%c", &in) < 1)
1870             in = 0;
1871         if (fscanf(stdin, "%c", &lf) < 0) {
1872             /* toss away, don't care */
1873         }
1874         if (in == 'y') {
1875             fprintf(STDOUT, "type control-c\n");
1876             while (1) {
1877                 fprintf(stdout, ".");
1878                 fflush(stdout);
1879                 sleep(1);
1880             }
1881         }
1882         /* or drop through */
1883     }
1884
1885     VPRINT1("Releasing lock on VLDB entry for volume %u ...", afromvol);
1886     vcode =
1887         VLDB_ReplaceEntry(afromvol, -1, &storeEntry,
1888                           (LOCKREL_OPCODE | LOCKREL_AFSID |
1889                            LOCKREL_TIMESTAMP));
1890     if (vcode) {
1891         fprintf(STDERR,
1892                 " Could not release the lock on the VLDB entry for the volume %s %lu \n",
1893                 storeEntry.name, (unsigned long)afromvol);
1894         error = vcode;
1895         goto mfail;
1896     }
1897     islocked = 0;
1898     VDONE;
1899
1900     if (TESTC) {
1901         fprintf(STDOUT,
1902                 "Third test point - operation complete but no cleanup.\n");
1903         fprintf(STDOUT, "...test here (y, n)? ");
1904         fflush(STDOUT);
1905         if (fscanf(stdin, "%c", &in) < 1)
1906             in = 0;
1907         if (fscanf(stdin, "%c", &lf) < 0) {
1908             /* toss away; don't care */
1909         }
1910         if (in == 'y') {
1911             fprintf(STDOUT, "type control-c\n");
1912             while (1) {
1913                 fprintf(stdout, ".");
1914                 fflush(stdout);
1915                 sleep(1);
1916             }
1917         }
1918         /* or drop through */
1919     }
1920     if (atoserver != afromserver) {
1921         /* set forwarding pointer for moved volumes */
1922         VPRINT1("Setting forwarding pointer for volume %u ...", afromvol);
1923         code = AFSVolSetForwarding(fromconn, fromtid, atoserver);
1924         EGOTO1(mfail, code,
1925                "Failed to set the forwarding pointer for the volume %u\n",
1926                afromvol);
1927         VDONE;
1928     }
1929
1930     VPRINT1("Deleting old volume %u on source ...", afromvol);
1931     code = AFSVolDeleteVolume(fromconn, fromtid);       /* zap original volume */
1932     EGOTO1(mfail, code, "Failed to delete the old volume %u on source\n",
1933            afromvol);
1934     VDONE;
1935
1936     VPRINT1("Ending transaction on old volume %u on the source ...",
1937             afromvol);
1938     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
1939     fromtid = 0;
1940     if (!code)
1941         code = rcode;
1942     EGOTO1(mfail, code,
1943            "Failed to end the transaction on the old volume %u on the source\n",
1944            afromvol);
1945     VDONE;
1946
1947     code = DoVolDelete(fromconn, backupId, afrompart,
1948                        "source backup", 0, NULL, NULL);
1949     if (code && code != VNOVOL) {
1950         error = code;
1951         goto mfail;
1952     }
1953
1954     code = 0;           /* no backup volume? that's okay */
1955
1956     fromtid = 0;
1957     if (!(flags & RV_NOCLONE)) {
1958         code = DoVolDelete(fromconn, newVol, afrompart,
1959                            "cloned", 0, NULL, NULL);
1960         if (code && code != VNOVOL) {
1961             error = code;
1962             goto mfail;
1963         }
1964
1965         code = 0;       /* clone missing? that's okay */
1966     }
1967
1968     /* fall through */
1969     /* END OF MOVE */
1970
1971     if (TESTC) {
1972         fprintf(STDOUT, "Fourth test point - operation complete.\n");
1973         fprintf(STDOUT, "...test here (y, n)? ");
1974         fflush(STDOUT);
1975         if (fscanf(stdin, "%c", &in) < 1)
1976             in = 0;
1977         if (fscanf(stdin, "%c", &lf) < 0) {     /* toss away */
1978             /* don't care */
1979         }
1980         if (in == 'y') {
1981             fprintf(STDOUT, "type control-c\n");
1982             while (1) {
1983                 fprintf(stdout, ".");
1984                 fflush(stdout);
1985                 sleep(1);
1986             }
1987         }
1988         /* or drop through */
1989     }
1990
1991     /* normal cleanup code */
1992
1993     if (entry.flags & VLF_ROEXISTS)
1994         fprintf(STDERR, "WARNING : readOnly copies still exist \n");
1995
1996     if (islocked) {
1997         VPRINT1("Cleanup: Releasing VLDB lock on volume %u ...", afromvol);
1998         vcode =
1999             ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
2000                       (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
2001         if (vcode) {
2002             VPRINT("\n");
2003             fprintf(STDERR,
2004                     " Could not release the lock on the VLDB entry for the volume %lu \n",
2005                     (unsigned long)afromvol);
2006             if (!error)
2007                 error = vcode;
2008         }
2009         VDONE;
2010     }
2011
2012     if (fromtid) {
2013         VPRINT1("Cleanup: Ending transaction on source volume %u ...",
2014                 afromvol);
2015         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2016         if (code || rcode) {
2017             VPRINT("\n");
2018             fprintf(STDERR,
2019                     "Could not end transaction on the source volume %lu\n",
2020                     (unsigned long)afromvol);
2021             if (!error)
2022                 error = (code ? code : rcode);
2023         }
2024         VDONE;
2025     }
2026
2027     if (clonetid) {
2028         VPRINT1("Cleanup: Ending transaction on clone volume %u ...", newVol);
2029         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
2030         if (code || rcode) {
2031             VPRINT("\n");
2032             fprintf(STDERR,
2033                     "Could not end transaction on the source's clone volume %lu\n",
2034                     (unsigned long)newVol);
2035             if (!error)
2036                 error = (code ? code : rcode);
2037         }
2038         VDONE;
2039     }
2040
2041     if (totid) {
2042         VPRINT1("Cleanup: Ending transaction on destination volume %u ...",
2043                 afromvol);
2044         code = AFSVolEndTrans(toconn, totid, &rcode);
2045         if (code) {
2046             VPRINT("\n");
2047             fprintf(STDERR,
2048                     "Could not end transaction on destination volume %lu\n",
2049                     (unsigned long)afromvol);
2050             if (!error)
2051                 error = (code ? code : rcode);
2052         }
2053         VDONE;
2054     }
2055     if (volName)
2056         free(volName);
2057 #ifdef  ENABLE_BUGFIX_1165
2058     if (infop)
2059         free(infop);
2060 #endif
2061     if (fromconn)
2062         rx_DestroyConnection(fromconn);
2063     if (toconn)
2064         rx_DestroyConnection(toconn);
2065     PrintError("", error);
2066     return error;
2067
2068     /* come here only when the sky falls */
2069   mfail:
2070
2071     if (pntg) {
2072         fprintf(STDOUT,
2073                 "vos move: operation interrupted, cleanup in progress...\n");
2074         fprintf(STDOUT, "clear transaction contexts\n");
2075         fflush(STDOUT);
2076     }
2077
2078     /* unlock VLDB entry */
2079     if (islocked) {
2080         VPRINT1("Recovery: Releasing VLDB lock on volume %u ...", afromvol);
2081         ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
2082                   (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
2083         VDONE;
2084         islocked = 0;
2085     }
2086
2087     if (clonetid) {
2088         VPRINT("Recovery: Ending transaction on clone volume ...");
2089         AFSVolEndTrans(fromconn, clonetid, &rcode);
2090         VDONE;
2091     }
2092     if (totid) {
2093         VPRINT("Recovery: Ending transaction on destination volume ...");
2094         AFSVolEndTrans(toconn, totid, &rcode);
2095         VDONE;
2096     }
2097     if (fromtid) {              /* put it on-line */
2098         VPRINT("Recovery: Setting volume flags on source volume ...");
2099         AFSVolSetFlags(fromconn, fromtid, 0);
2100         VDONE;
2101
2102         VPRINT("Recovery: Ending transaction on source volume ...");
2103         AFSVolEndTrans(fromconn, fromtid, &rcode);
2104         VDONE;
2105     }
2106
2107     VPRINT("Recovery: Accessing VLDB.\n");
2108     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2109     if (vcode) {
2110         fprintf(STDOUT, "FATAL: VLDB access error: abort cleanup\n");
2111         fflush(STDOUT);
2112         goto done;
2113     }
2114     MapHostToNetwork(&entry);
2115
2116     /* Delete either the volume on the source location or the target location.
2117      * If the vldb entry still points to the source location, then we know the
2118      * volume move didn't finish so we remove the volume from the target
2119      * location. Otherwise, we remove the volume from the source location.
2120      */
2121     if (Lp_Match(afromserver, afrompart, &entry)) {     /* didn't move - delete target volume */
2122         if (pntg) {
2123             fprintf(STDOUT,
2124                     "move incomplete - attempt cleanup of target partition - no guarantee\n");
2125             fflush(STDOUT);
2126         }
2127
2128         if (volid && toconn) {
2129             code = DoVolDelete(toconn, volid, atopart,
2130                                "destination", 0, NULL, "Recovery:");
2131             if (code == VNOVOL) {
2132                 EPRINT1(code, "Recovery: Failed to start transaction on %u\n", volid);
2133             }
2134         }
2135
2136         /* put source volume on-line */
2137         if (fromconn) {
2138             VPRINT1("Recovery: Creating transaction on source volume %u ...",
2139                     afromvol);
2140             tmp = fromtid;
2141             code =
2142                 AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy,
2143                                   &tmp);
2144             fromtid = tmp;
2145             if (!code) {
2146                 VDONE;
2147
2148                 VPRINT1("Recovery: Setting flags on source volume %u ...",
2149                         afromvol);
2150                 AFSVolSetFlags(fromconn, fromtid, 0);
2151                 VDONE;
2152
2153                 VPRINT1
2154                     ("Recovery: Ending transaction on source volume %u ...",
2155                      afromvol);
2156                 AFSVolEndTrans(fromconn, fromtid, &rcode);
2157                 VDONE;
2158             } else {
2159                 VPRINT1
2160                     ("\nRecovery: Unable to start transaction on source volume %u.\n",
2161                      afromvol);
2162             }
2163         }
2164     } else {                    /* yep, move complete */
2165         if (pntg) {
2166             fprintf(STDOUT,
2167                     "move complete - attempt cleanup of source partition - no guarantee\n");
2168             fflush(STDOUT);
2169         }
2170
2171         /* delete backup volume */
2172         if (fromconn) {
2173             code = DoVolDelete(fromconn, backupId, afrompart,
2174                                "backup", 0, NULL, "Recovery:");
2175             if (code == VNOVOL) {
2176                 EPRINT1(code, "Recovery: Failed to start transaction on %u\n", backupId);
2177             }
2178
2179             code = DoVolDelete(fromconn, afromvol, afrompart, "source",
2180                                (atoserver != afromserver)?atoserver:0,
2181                         NULL, NULL);
2182             if (code == VNOVOL) {
2183                 EPRINT1(code, "Failed to start transaction on %u\n", afromvol);
2184             }
2185         }
2186     }
2187
2188     /* common cleanup - delete local clone */
2189     if (newVol) {
2190         code = DoVolDelete(fromconn, newVol, afrompart,
2191                            "clone", 0, NULL, "Recovery:");
2192         if (code == VNOVOL) {
2193             EPRINT1(code, "Recovery: Failed to start transaction on %u\n", newVol);
2194         }
2195     }
2196
2197     /* unlock VLDB entry */
2198     if (islocked) {
2199         VPRINT1("Recovery: Releasing lock on VLDB entry for volume %u ...",
2200                 afromvol);
2201         ubik_VL_ReleaseLock(cstruct, 0, afromvol, -1,
2202                             (LOCKREL_OPCODE | LOCKREL_AFSID | LOCKREL_TIMESTAMP));
2203         VDONE;
2204     }
2205   done:                 /* routine cleanup */
2206     if (volName)
2207         free(volName);
2208 #ifdef  ENABLE_BUGFIX_1165
2209     if (infop)
2210         free(infop);
2211 #endif
2212     if (fromconn)
2213         rx_DestroyConnection(fromconn);
2214     if (toconn)
2215         rx_DestroyConnection(toconn);
2216
2217     if (pntg) {
2218         fprintf(STDOUT, "cleanup complete - user verify desired result\n");
2219         fflush(STDOUT);
2220     }
2221     exit(1);
2222 }
2223
2224
2225 int
2226 UV_MoveVolume(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2227               afs_uint32 atoserver, afs_int32 atopart)
2228 {
2229     return UV_MoveVolume2(afromvol, afromserver, afrompart,
2230                           atoserver, atopart, 0);
2231 }
2232
2233
2234 /* Copy volume <afromvol> from <afromserver> <afrompart> to <atoserver>
2235  * <atopart>.  The new volume is named by <atovolname>.  The new volume
2236  * has ID <atovolid> if that is nonzero; otherwise a new ID is allocated
2237  * from the VLDB.  the following flags are supported:
2238  *
2239  *     RV_RDONLY  - target volume is RO
2240  *     RV_OFFLINE - leave target volume offline
2241  *     RV_CPINCR  - do incremental dump if target exists
2242  *     RV_NOVLDB  - don't create/update VLDB entry
2243  *     RV_NOCLONE - don't use a copy clone
2244  */
2245 int
2246 UV_CopyVolume2(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2247                char *atovolname, afs_uint32 atoserver, afs_int32 atopart,
2248                afs_uint32 atovolid, int flags)
2249 {
2250     /* declare stuff 'volatile' that may be used from setjmp/longjmp and may
2251      * be changing during the copy */
2252     int volatile pntg;
2253     afs_int32 volatile clonetid;
2254     afs_int32 volatile totid;
2255     afs_int32 volatile fromtid;
2256     struct rx_connection * volatile fromconn;
2257     struct rx_connection * volatile toconn;
2258     afs_uint32 volatile cloneVol;
2259
2260     char vname[64];
2261     afs_int32 rcode;
2262     afs_int32 fromDate, cloneFromDate;
2263     struct restoreCookie cookie;
2264     afs_int32 vcode, code;
2265     afs_uint32 newVol;
2266     afs_int32 volflag;
2267     struct volser_status tstatus;
2268     struct destServer destination;
2269     struct nvldbentry entry, newentry, storeEntry;
2270     afs_int32 error;
2271     afs_int32 tmp;
2272     afs_uint32 tmpVol;
2273
2274     fromconn = (struct rx_connection *)0;
2275     toconn = (struct rx_connection *)0;
2276     fromtid = 0;
2277     totid = 0;
2278     clonetid = 0;
2279     error = 0;
2280     pntg = 0;
2281     newVol = 0;
2282
2283     /* support control-c processing */
2284     if (setjmp(env))
2285         goto mfail;
2286     (void)signal(SIGINT, sigint_handler);
2287
2288     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2289     EGOTO1(mfail, vcode,
2290            "Could not fetch the entry for the volume  %u from the VLDB \n",
2291            afromvol);
2292     MapHostToNetwork(&entry);
2293
2294     pntg = 1;
2295     toconn = UV_Bind(atoserver, AFSCONF_VOLUMEPORT);    /* get connections to the servers */
2296     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
2297     fromtid = totid = 0;        /* initialize to uncreated */
2298
2299     /* ***
2300      * clone the read/write volume locally.
2301      * ***/
2302
2303     cloneVol = 0;
2304     if (!(flags & RV_NOCLONE)) {
2305         VPRINT1("Starting transaction on source volume %u ...", afromvol);
2306         tmp = fromtid;
2307         code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy,
2308                                  &tmp);
2309         fromtid = tmp;
2310         EGOTO1(mfail, code, "Failed to create transaction on the volume %u\n",
2311                afromvol);
2312         VDONE;
2313
2314         /* Get a clone id */
2315         VPRINT1("Allocating new volume id for clone of volume %u ...",
2316                 afromvol);
2317         cloneVol = 0;
2318         tmpVol = cloneVol;
2319         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &tmpVol);
2320         cloneVol = tmpVol;
2321         EGOTO1(mfail, vcode,
2322            "Could not get an ID for the clone of volume %u from the VLDB\n",
2323            afromvol);
2324         VDONE;
2325     }
2326
2327     if (atovolid) {
2328         newVol = atovolid;
2329     } else {
2330         /* Get a new volume id */
2331         VPRINT1("Allocating new volume id for copy of volume %u ...", afromvol);
2332         newVol = 0;
2333         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &newVol);
2334         EGOTO1(mfail, vcode,
2335                "Could not get an ID for the copy of volume %u from the VLDB\n",
2336                afromvol);
2337         VDONE;
2338     }
2339
2340     if (!(flags & RV_NOCLONE)) {
2341         /* Do the clone. Default flags on clone are set to delete on salvage and out of service */
2342         VPRINT1("Cloning source volume %u ...", afromvol);
2343         strcpy(vname, "copy-clone-temp");
2344         tmpVol = cloneVol;
2345         code =
2346             AFSVolClone(fromconn, fromtid, 0, readonlyVolume, vname,
2347                         &tmpVol);
2348         cloneVol = tmpVol;
2349         EGOTO1(mfail, code, "Failed to clone the source volume %u\n",
2350                afromvol);
2351         VDONE;
2352
2353         VPRINT1("Ending the transaction on the source volume %u ...", afromvol);
2354         rcode = 0;
2355         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2356         fromtid = 0;
2357         if (!code)
2358             code = rcode;
2359         EGOTO1(mfail, code,
2360                "Failed to end the transaction on the source volume %u\n",
2361                afromvol);
2362         VDONE;
2363     }
2364
2365     /* ***
2366      * Create the destination volume
2367      * ***/
2368
2369     if (!(flags & RV_NOCLONE)) {
2370         VPRINT1("Starting transaction on the cloned volume %u ...", cloneVol);
2371         tmp = clonetid;
2372         code =
2373             AFSVolTransCreate_retry(fromconn, cloneVol, afrompart, ITOffline,
2374                           &tmp);
2375         clonetid = tmp;
2376         EGOTO1(mfail, code,
2377                "Failed to start a transaction on the cloned volume%u\n",
2378                cloneVol);
2379         VDONE;
2380
2381         VPRINT1("Setting flags on cloned volume %u ...", cloneVol);
2382         code =
2383             AFSVolSetFlags(fromconn, clonetid,
2384                            VTDeleteOnSalvage | VTOutOfService); /*redundant */
2385         EGOTO1(mfail, code, "Could not set flags on the cloned volume %u\n",
2386                cloneVol);
2387         VDONE;
2388
2389         /* remember time from which we've dumped the volume */
2390         VPRINT1("Getting status of cloned volume %u ...", cloneVol);
2391         code = AFSVolGetStatus(fromconn, clonetid, &tstatus);
2392         EGOTO1(mfail, code,
2393                "Failed to get the status of the cloned volume %u\n",
2394                cloneVol);
2395         VDONE;
2396
2397         fromDate = CLOCKADJ(tstatus.creationDate);
2398     } else {
2399         fromDate = 0;
2400     }
2401
2402     /* create a volume on the target machine */
2403     cloneFromDate = 0;
2404     tmp = totid;
2405     code = AFSVolTransCreate_retry(toconn, newVol, atopart, ITOffline, &tmp);
2406     totid = tmp;
2407     if (!code) {
2408         if ((flags & RV_CPINCR)) {
2409             VPRINT1("Getting status of pre-existing volume %u ...", newVol);
2410             code = AFSVolGetStatus(toconn, totid, &tstatus);
2411             EGOTO1(mfail, code,
2412                    "Failed to get the status of the pre-existing volume %u\n",
2413                    newVol);
2414             VDONE;
2415
2416             /* Using the update date should be OK here, but add some fudge */
2417             cloneFromDate = CLOCKADJ(tstatus.updateDate);
2418             if ((flags & RV_NOCLONE))
2419                 fromDate = cloneFromDate;
2420
2421             /* XXX We should check that the source volume's creationDate is
2422              * XXX not newer than the existing target volume, and if not,
2423              * XXX throw away the existing target and do a full dump. */
2424
2425             goto cpincr;
2426         }
2427
2428         /* Delete the existing volume.
2429          * While we are deleting the volume in these steps, the transaction
2430          * we started against the cloned volume (clonetid above) will be
2431          * sitting idle. It will get cleaned up after 600 seconds
2432          */
2433         VPRINT1("Deleting pre-existing volume %u on destination ...", newVol);
2434         code = AFSVolDeleteVolume(toconn, totid);
2435         EGOTO1(mfail, code,
2436                "Could not delete the pre-existing volume %u on destination\n",
2437                newVol);
2438         VDONE;
2439
2440         VPRINT1
2441             ("Ending transaction on pre-existing volume %u on destination ...",
2442              newVol);
2443         code = AFSVolEndTrans(toconn, totid, &rcode);
2444         totid = 0;
2445         if (!code)
2446             code = rcode;
2447         EGOTO1(mfail, code,
2448                "Could not end the transaction on pre-existing volume %u on destination\n",
2449                newVol);
2450         VDONE;
2451     }
2452
2453     VPRINT1("Creating the destination volume %u ...", newVol);
2454     tmp = totid;
2455     code =
2456         AFSVolCreateVolume(toconn, atopart, atovolname,
2457                            (flags & RV_RDONLY) ? volser_RO : volser_RW,
2458                            newVol, &newVol, &tmp);
2459     totid = tmp;
2460     EGOTO1(mfail, code, "Failed to create the destination volume %u\n",
2461            newVol);
2462     VDONE;
2463
2464     VPRINT1("Setting volume flags on destination volume %u ...", newVol);
2465     code =
2466         AFSVolSetFlags(toconn, totid, (VTDeleteOnSalvage | VTOutOfService));
2467     EGOTO1(mfail, code,
2468            "Failed to set the flags on the destination volume %u\n", newVol);
2469     VDONE;
2470
2471 cpincr:
2472
2473     destination.destHost = ntohl(atoserver);
2474     destination.destPort = AFSCONF_VOLUMEPORT;
2475     destination.destSSID = 1;
2476
2477     strncpy(cookie.name, atovolname, VOLSER_OLDMAXVOLNAME);
2478     cookie.type = (flags & RV_RDONLY) ? ROVOL : RWVOL;
2479     cookie.parent = 0;
2480     cookie.clone = 0;
2481
2482     /***
2483      * Now dump the clone to the new volume
2484      ***/
2485
2486     if (!(flags & RV_NOCLONE)) {
2487         /* XXX probably should have some code here that checks to see if
2488          * XXX we are copying to same server and partition - if so, just
2489          * XXX use a clone to save disk space */
2490
2491         /* Copy the clone to the new volume */
2492         VPRINT2("Dumping from clone %u on source to volume %u on destination ...",
2493             cloneVol, newVol);
2494         code =
2495             AFSVolForward(fromconn, clonetid, cloneFromDate, &destination,
2496                           totid, &cookie);
2497         EGOTO1(mfail, code, "Failed to move data for the volume %u\n",
2498                newVol);
2499         VDONE;
2500
2501         VPRINT1("Ending transaction on cloned volume %u ...", cloneVol);
2502         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
2503         if (!code)
2504             code = rcode;
2505         clonetid = 0;
2506         EGOTO1(mfail, code,
2507                "Failed to end the transaction on the cloned volume %u\n",
2508                cloneVol);
2509         VDONE;
2510     }
2511
2512     /* ***
2513      * reattach to the main-line volume, and incrementally dump it.
2514      * ***/
2515
2516     VPRINT1("Starting transaction on source volume %u ...", afromvol);
2517     tmp = fromtid;
2518     code = AFSVolTransCreate_retry(fromconn, afromvol, afrompart, ITBusy, &tmp);
2519     fromtid = tmp;
2520     EGOTO1(mfail, code,
2521            "Failed to create a transaction on the source volume %u\n",
2522            afromvol);
2523     VDONE;
2524
2525     /* now do the incremental */
2526     VPRINT2
2527         ("Doing the%s dump from source to destination for volume %u ... ",
2528          (flags & RV_NOCLONE) ? "" : " incremental",
2529          afromvol);
2530     code =
2531         AFSVolForward(fromconn, fromtid, fromDate, &destination, totid,
2532                       &cookie);
2533     EGOTO1(mfail, code,
2534            "Failed to do the%s dump from old site to new site\n",
2535            (flags & RV_NOCLONE) ? "" : " incremental");
2536     VDONE;
2537
2538     VPRINT1("Setting volume flags on destination volume %u ...", newVol);
2539     volflag = ((flags & RV_OFFLINE) ? VTOutOfService : 0);      /* off or on-line */
2540     code = AFSVolSetFlags(toconn, totid, volflag);
2541     EGOTO(mfail, code,
2542           "Failed to set the flags to make destination volume online\n");
2543     VDONE;
2544
2545     /* put new volume online */
2546     VPRINT1("Ending transaction on destination volume %u ...", newVol);
2547     code = AFSVolEndTrans(toconn, totid, &rcode);
2548     totid = 0;
2549     if (!code)
2550         code = rcode;
2551     EGOTO1(mfail, code,
2552            "Failed to end the transaction on the destination volume %u\n",
2553            newVol);
2554     VDONE;
2555
2556     VPRINT1("Ending transaction on source volume %u ...", afromvol);
2557     code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2558     fromtid = 0;
2559     if (!code)
2560         code = rcode;
2561     EGOTO1(mfail, code,
2562            "Failed to end the transaction on the source volume %u\n",
2563            afromvol);
2564     VDONE;
2565
2566     fromtid = 0;
2567
2568     if (!(flags & RV_NOCLONE)) {
2569         code = DoVolDelete(fromconn, cloneVol, afrompart,
2570                            "cloned", 0, NULL, NULL);
2571         if (code && code != VNOVOL) {
2572             error = code;
2573             goto mfail;
2574         }
2575
2576         code = 0;               /* clone missing? that's ok */
2577     }
2578
2579     if (!(flags & RV_NOVLDB)) {
2580         /* create the vldb entry for the copied volume */
2581         strncpy(newentry.name, atovolname, VOLSER_OLDMAXVOLNAME);
2582         newentry.nServers = 1;
2583         newentry.serverNumber[0] = atoserver;
2584         newentry.serverPartition[0] = atopart;
2585         newentry.flags = (flags & RV_RDONLY) ? VLF_ROEXISTS : VLF_RWEXISTS;
2586         newentry.serverFlags[0] = (flags & RV_RDONLY) ? VLSF_ROVOL : VLSF_RWVOL;
2587         newentry.volumeId[RWVOL] = newVol;
2588         newentry.volumeId[ROVOL] = (flags & RV_RDONLY) ? newVol : 0;
2589         newentry.volumeId[BACKVOL] = 0;
2590         newentry.cloneId = 0;
2591         /*map into right byte order, before passing to xdr, the stuff has to be in host
2592          * byte order. Xdr converts it into network order */
2593         MapNetworkToHost(&newentry, &storeEntry);
2594         /* create the vldb entry */
2595         vcode = VLDB_CreateEntry(&storeEntry);
2596         if (vcode) {
2597             fprintf(STDERR,
2598                     "Could not create a VLDB entry for the volume %s %lu\n",
2599                     atovolname, (unsigned long)newVol);
2600             /*destroy the created volume */
2601             VPRINT1("Deleting the newly created volume %u\n", newVol);
2602             AFSVolDeleteVolume(toconn, totid);
2603             error = vcode;
2604             goto mfail;
2605         }
2606         VPRINT2("Created the VLDB entry for the volume %s %u\n", atovolname,
2607                 newVol);
2608     }
2609
2610     /* normal cleanup code */
2611
2612     if (fromtid) {
2613         VPRINT1("Cleanup: Ending transaction on source volume %u ...",
2614                 afromvol);
2615         code = AFSVolEndTrans(fromconn, fromtid, &rcode);
2616         if (code || rcode) {
2617             VPRINT("\n");
2618             fprintf(STDERR,
2619                     "Could not end transaction on the source volume %lu\n",
2620                     (unsigned long)afromvol);
2621             if (!error)
2622                 error = (code ? code : rcode);
2623         }
2624         VDONE;
2625     }
2626
2627     if (clonetid) {
2628         VPRINT1("Cleanup: Ending transaction on clone volume %u ...",
2629                 cloneVol);
2630         code = AFSVolEndTrans(fromconn, clonetid, &rcode);
2631         if (code || rcode) {
2632             VPRINT("\n");
2633             fprintf(STDERR,
2634                     "Could not end transaction on the source's clone volume %lu\n",
2635                     (unsigned long)cloneVol);
2636             if (!error)
2637                 error = (code ? code : rcode);
2638         }
2639         VDONE;
2640     }
2641
2642     if (totid) {
2643         VPRINT1("Cleanup: Ending transaction on destination volume %u ...",
2644                 newVol);
2645         code = AFSVolEndTrans(toconn, totid, &rcode);
2646         if (code) {
2647             VPRINT("\n");
2648             fprintf(STDERR,
2649                     "Could not end transaction on destination volume %lu\n",
2650                     (unsigned long)newVol);
2651             if (!error)
2652                 error = (code ? code : rcode);
2653         }
2654         VDONE;
2655     }
2656     if (fromconn)
2657         rx_DestroyConnection(fromconn);
2658     if (toconn)
2659         rx_DestroyConnection(toconn);
2660     PrintError("", error);
2661     return error;
2662
2663     /* come here only when the sky falls */
2664   mfail:
2665
2666     if (pntg) {
2667         fprintf(STDOUT,
2668                 "vos copy: operation interrupted, cleanup in progress...\n");
2669         fprintf(STDOUT, "clear transaction contexts\n");
2670         fflush(STDOUT);
2671     }
2672
2673     if (clonetid) {
2674         VPRINT("Recovery: Ending transaction on clone volume ...");
2675         AFSVolEndTrans(fromconn, clonetid, &rcode);
2676         VDONE;
2677     }
2678     if (totid) {
2679         VPRINT("Recovery: Ending transaction on destination volume ...");
2680         AFSVolEndTrans(toconn, totid, &rcode);
2681         VDONE;
2682     }
2683     if (fromtid) {              /* put it on-line */
2684         VPRINT("Recovery: Ending transaction on source volume ...");
2685         AFSVolEndTrans(fromconn, fromtid, &rcode);
2686         VDONE;
2687     }
2688
2689     VPRINT("Recovery: Accessing VLDB.\n");
2690     vcode = VLDB_GetEntryByID(afromvol, -1, &entry);
2691     if (vcode) {
2692         fprintf(STDOUT, "FATAL: VLDB access error: abort cleanup\n");
2693         fflush(STDOUT);
2694         goto done;
2695     }
2696     MapHostToNetwork(&entry);
2697
2698     /* common cleanup - delete local clone */
2699     if (cloneVol) {
2700         DoVolDelete(fromconn, cloneVol, afrompart, "clone", 0, NULL,
2701                     "Recovery:");
2702     }
2703
2704   done:                 /* routine cleanup */
2705     if (fromconn)
2706         rx_DestroyConnection(fromconn);
2707     if (toconn)
2708         rx_DestroyConnection(toconn);
2709
2710     if (pntg) {
2711         fprintf(STDOUT, "cleanup complete - user verify desired result\n");
2712         fflush(STDOUT);
2713     }
2714     exit(1);
2715 }
2716
2717
2718 int
2719 UV_CopyVolume(afs_uint32 afromvol, afs_uint32 afromserver, afs_int32 afrompart,
2720               char *atovolname, afs_uint32 atoserver, afs_int32 atopart)
2721 {
2722     return UV_CopyVolume2(afromvol, afromserver, afrompart,
2723                           atovolname, atoserver, atopart, 0, 0);
2724 }
2725
2726
2727
2728 /* Make a new backup of volume <avolid> on <aserver> and <apart>
2729  * if one already exists, update it
2730  */
2731
2732 int
2733 UV_BackupVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid)
2734 {
2735     struct rx_connection *aconn = (struct rx_connection *)0;
2736     afs_int32 ttid = 0, btid = 0;
2737     afs_uint32 backupID;
2738     afs_int32 code = 0, rcode = 0;
2739     struct nvldbentry entry, storeEntry;
2740     afs_int32 error = 0;
2741     int vldblocked = 0, vldbmod = 0;
2742
2743     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
2744
2745     /* the calls to VLDB will succeed only if avolid is a RW volume,
2746      * since we are following the RW hash chain for searching */
2747     code = VLDB_GetEntryByID(avolid, RWVOL, &entry);
2748     if (code) {
2749         fprintf(STDERR,
2750                 "Could not fetch the entry for the volume %lu from the VLDB \n",
2751                 (unsigned long)avolid);
2752         error = code;
2753         goto bfail;
2754     }
2755     MapHostToNetwork(&entry);
2756
2757     /* These operations require the VLDB be locked since it means the VLDB
2758      * will change or the vldb is already locked.
2759      */
2760     if (!(entry.flags & VLF_BACKEXISTS) ||      /* backup volume doesnt exist */
2761         (entry.flags & VLOP_ALLOPERS) ||        /* vldb lock already held */
2762         (entry.volumeId[BACKVOL] == INVALID_BID)) {     /* no assigned backup volume id */
2763
2764         code = ubik_VL_SetLock(cstruct, 0, avolid, RWVOL, VLOP_BACKUP);
2765         if (code) {
2766             fprintf(STDERR,
2767                     "Could not lock the VLDB entry for the volume %lu\n",
2768                     (unsigned long)avolid);
2769             error = code;
2770             goto bfail;
2771         }
2772         vldblocked = 1;
2773
2774         /* Reread the vldb entry */
2775         code = VLDB_GetEntryByID(avolid, RWVOL, &entry);
2776         if (code) {
2777             fprintf(STDERR,
2778                     "Could not fetch the entry for the volume %lu from the VLDB \n",
2779                     (unsigned long)avolid);
2780             error = code;
2781             goto bfail;
2782         }
2783         MapHostToNetwork(&entry);
2784     }
2785
2786     if (!ISNAMEVALID(entry.name)) {
2787         fprintf(STDERR, "Name of the volume %s exceeds the size limit\n",
2788                 entry.name);
2789         error = VOLSERBADNAME;
2790         goto bfail;
2791     }
2792
2793     backupID = entry.volumeId[BACKVOL];
2794     if (backupID == INVALID_BID) {
2795         /* Get a backup volume id from the VLDB and update the vldb
2796          * entry with it.
2797          */
2798         code = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &backupID);
2799         if (code) {
2800             fprintf(STDERR,
2801                     "Could not allocate ID for the backup volume of  %lu from the VLDB\n",
2802                     (unsigned long)avolid);
2803             error = code;
2804             goto bfail;
2805         }
2806         entry.volumeId[BACKVOL] = backupID;
2807         vldbmod = 1;
2808     }
2809
2810     code = DoVolClone(aconn, avolid, apart, backupVolume, backupID, "backup",
2811                       entry.name, NULL, ".backup", NULL, NULL);
2812     if (code) {
2813         error = code;
2814         goto bfail;
2815     }
2816
2817     /* Mark vldb as backup exists */
2818     if (!(entry.flags & VLF_BACKEXISTS)) {
2819         entry.flags |= VLF_BACKEXISTS;
2820         vldbmod = 1;
2821     }
2822
2823     /* Now go back to the backup volume and bring it on line */
2824     code = AFSVolTransCreate_retry(aconn, backupID, apart, ITOffline, &btid);
2825     if (code) {
2826         fprintf(STDERR,
2827                 "Failed to start a transaction on the backup volume %lu\n",
2828                 (unsigned long)backupID);
2829         error = code;
2830         goto bfail;
2831     }
2832
2833     code = AFSVolSetFlags(aconn, btid, 0);
2834     if (code) {
2835         fprintf(STDERR, "Could not mark the backup volume %lu on line \n",
2836                 (unsigned long)backupID);
2837         error = code;
2838         goto bfail;
2839     }
2840
2841     code = AFSVolEndTrans(aconn, btid, &rcode);
2842     btid = 0;
2843     if (code || rcode) {
2844         fprintf(STDERR,
2845                 "Failed to end the transaction on the backup volume %lu\n",
2846                 (unsigned long)backupID);
2847         error = (code ? code : rcode);
2848         goto bfail;
2849     }
2850
2851     /* Will update the vldb below */
2852
2853   bfail:
2854     if (ttid) {
2855         code = AFSVolEndTrans(aconn, ttid, &rcode);
2856         if (code || rcode) {
2857             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
2858                     (unsigned long)avolid);
2859             if (!error)
2860                 error = (code ? code : rcode);
2861         }
2862     }
2863
2864     if (btid) {
2865         code = AFSVolEndTrans(aconn, btid, &rcode);
2866         if (code || rcode) {
2867             fprintf(STDERR,
2868                     "Could not end transaction the backup volume %lu\n",
2869                     (unsigned long)backupID);
2870             if (!error)
2871                 error = (code ? code : rcode);
2872         }
2873     }
2874
2875     /* Now update the vldb - if modified */
2876     if (vldblocked) {
2877         if (vldbmod) {
2878             MapNetworkToHost(&entry, &storeEntry);
2879             code =
2880                 VLDB_ReplaceEntry(avolid, RWVOL, &storeEntry,
2881                                   (LOCKREL_OPCODE | LOCKREL_AFSID |
2882                                    LOCKREL_TIMESTAMP));
2883             if (code) {
2884                 fprintf(STDERR,
2885                         "Could not update the VLDB entry for the volume %lu \n",
2886                         (unsigned long)avolid);
2887                 if (!error)
2888                     error = code;
2889             }
2890         } else {
2891             code =
2892                 ubik_VL_ReleaseLock(cstruct, 0, avolid, RWVOL,
2893                           (LOCKREL_OPCODE | LOCKREL_AFSID |
2894                            LOCKREL_TIMESTAMP));
2895             if (code) {
2896                 fprintf(STDERR,
2897                         "Could not unlock the VLDB entry for the volume %lu \n",
2898                         (unsigned long)avolid);
2899                 if (!error)
2900                     error = code;
2901             }
2902         }
2903     }
2904
2905     if (aconn)
2906         rx_DestroyConnection(aconn);
2907
2908     PrintError("", error);
2909     return error;
2910 }
2911
2912 /* Make a new clone of volume <avolid> on <aserver> and <apart>
2913  * using volume ID <acloneid>, or a new ID allocated from the VLDB.
2914  * The new volume is named by <aname>, or by appending ".clone" to
2915  * the existing name if <aname> is NULL.  The following flags are
2916  * supported:
2917  *
2918  *     RV_RDONLY  - target volume is RO
2919  *     RV_OFFLINE - leave target volume offline
2920  */
2921
2922 int
2923 UV_CloneVolume(afs_uint32 aserver, afs_int32 apart, afs_uint32 avolid,
2924                afs_uint32 acloneid, char *aname, int flags)
2925 {
2926     struct rx_connection *aconn = (struct rx_connection *)0;
2927     afs_int32 ttid = 0, btid = 0;
2928     afs_int32 code = 0, rcode = 0;
2929     char vname[VOLSER_MAXVOLNAME + 1];
2930     afs_int32 error = 0;
2931     volEntries volumeInfo;
2932     int type = 0;
2933
2934     aconn = UV_Bind(aserver, AFSCONF_VOLUMEPORT);
2935
2936     if (!aname) {
2937         volumeInfo.volEntries_val = (volintInfo *) 0;
2938         volumeInfo.volEntries_len = 0;
2939         code = AFSVolListOneVolume(aconn, apart, avolid, &volumeInfo);
2940         if (code) {
2941             fprintf(stderr, "Could not get info for volume %lu\n",
2942                     (unsigned long)avolid);
2943             error = code;
2944             goto bfail;
2945         }
2946         strncpy(vname, volumeInfo.volEntries_val[0].name,
2947                 VOLSER_OLDMAXVOLNAME - 7);
2948         vname[VOLSER_OLDMAXVOLNAME - 7] = 0;
2949         strcat(vname, ".clone");
2950         aname = vname;
2951         if (volumeInfo.volEntries_val)
2952             free(volumeInfo.volEntries_val);
2953     }
2954
2955     if (!acloneid) {
2956         /* Get a clone id */
2957         VPRINT1("Allocating new volume id for clone of volume %u ...",
2958                 avolid);
2959         code = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &acloneid);
2960         EGOTO1(bfail, code,
2961            "Could not get an ID for the clone of volume %u from the VLDB\n",
2962            avolid);
2963         VDONE;
2964     }
2965
2966     if (flags & RV_RWONLY)
2967         type = readwriteVolume;
2968     else if (flags & RV_RDONLY)
2969         type = readonlyVolume;
2970     else
2971         type = backupVolume;
2972
2973     code = DoVolClone(aconn, avolid, apart, type, acloneid, "clone",
2974                       NULL, aname, NULL, NULL, NULL);
2975     if (code) {
2976         error = code;
2977         goto bfail;
2978     }
2979
2980     /* Now go back to the backup volume and bring it on line */
2981     if (!(flags & RV_OFFLINE)) {
2982         code = AFSVolTransCreate_retry(aconn, acloneid, apart, ITOffline, &btid);
2983         if (code) {
2984             fprintf(STDERR,
2985                     "Failed to start a transaction on the clone volume %lu\n",
2986                     (unsigned long)acloneid);
2987             error = code;
2988             goto bfail;
2989         }
2990
2991         code = AFSVolSetFlags(aconn, btid, 0);
2992         if (code) {
2993             fprintf(STDERR, "Could not mark the clone volume %lu on line \n",
2994                     (unsigned long)acloneid);
2995             error = code;
2996             goto bfail;
2997         }
2998
2999         code = AFSVolEndTrans(aconn, btid, &rcode);
3000         btid = 0;
3001         if (code || rcode) {
3002             fprintf(STDERR,
3003                     "Failed to end the transaction on the clone volume %lu\n",
3004                     (unsigned long)acloneid);
3005             error = (code ? code : rcode);
3006             goto bfail;
3007         }
3008     }
3009
3010   bfail:
3011     if (ttid) {
3012         code = AFSVolEndTrans(aconn, ttid, &rcode);
3013         if (code || rcode) {
3014             fprintf(STDERR, "Could not end transaction on the volume %lu\n",
3015                     (unsigned long)avolid);
3016             if (!error)
3017                 error = (code ? code : rcode);
3018         }
3019     }
3020
3021     if (btid) {
3022         code = AFSVolEndTrans(aconn, btid, &rcode);
3023         if (code || rcode) {
3024             fprintf(STDERR,
3025                     "Could not end transaction on the clone volume %lu\n",
3026                     (unsigned long)acloneid);
3027             if (!error)
3028                 error = (code ? code : rcode);
3029         }
3030     }
3031
3032     if (aconn)
3033         rx_DestroyConnection(aconn);
3034
3035     PrintError("", error);
3036     return error;
3037 }
3038
3039 #define ONERROR(ec, ep, es) do { \
3040     if (ec) { \
3041         fprintf(STDERR, (es), (ep)); \
3042         error = (ec); \
3043         goto rfail; \
3044     } \
3045 } while (0)
3046 #define ONERROR0(ec, es) do { \
3047     if (ec) { \
3048         fprintf(STDERR, (es)); \
3049         error = (ec); \
3050         goto rfail; \
3051     } \
3052 } while (0)
3053 #define ERROREXIT(ec) do { \
3054     error = (ec); \
3055     goto rfail; \
3056 } while (0)
3057
3058 /* Get a "transaction" on this replica.  Create the volume
3059  * if necessary.  Return the time from which a dump should
3060  * be made (0 if it's a new volume)
3061  */
3062 static int
3063 GetTrans(struct nvldbentry *vldbEntryPtr, afs_int32 index,
3064          struct rx_connection **connPtr, afs_int32 * transPtr,
3065          afs_uint32 * crtimePtr, afs_uint32 * uptimePtr,
3066          afs_int32 *origflags, afs_uint32 tmpVolId)
3067 {
3068     afs_uint32 volid;
3069     struct volser_status tstatus;
3070     int code = 0;
3071     int rcode, tcode;
3072     char hoststr[16];
3073
3074     *connPtr = (struct rx_connection *)0;
3075     *transPtr = 0;
3076     *crtimePtr = 0;
3077     *uptimePtr = 0;
3078
3079     /* get connection to the replication site */
3080     *connPtr = UV_Bind(vldbEntryPtr->serverNumber[index], AFSCONF_VOLUMEPORT);
3081     if (!*connPtr)
3082         goto fail;              /* server is down */
3083
3084     volid = vldbEntryPtr->volumeId[ROVOL];
3085
3086     if (volid) {
3087         code =
3088             AFSVolTransCreate_retry(*connPtr, volid,
3089                               vldbEntryPtr->serverPartition[index], ITOffline,
3090                               transPtr);
3091
3092         if (!code && (origflags[index] & VLSF_DONTUSE)) {
3093             /* If RO_DONTUSE is set, this is supposed to be an entirely new
3094              * site. Don't trust any data on it, since it is possible we
3095              * have encountered some temporary volume from some other
3096              * incomplete volume operation. It is difficult to detect if
3097              * that has happened vs if this is a legit volume, so just
3098              * delete it to be safe. */
3099
3100             VPRINT1("Deleting extant RO_DONTUSE site on %s...",
3101                     noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
3102                                                 serverNumber[index], hoststr) :
3103                     hostutil_GetNameByINet(vldbEntryPtr->
3104                                            serverNumber[index]));
3105
3106             code = AFSVolDeleteVolume(*connPtr, *transPtr);
3107             if (code) {
3108                 PrintError("Failed to delete RO_DONTUSE site: ", code);
3109                 goto fail;
3110             }
3111
3112             tcode = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
3113             *transPtr = 0;
3114             if (!tcode) {
3115                 tcode = rcode;
3116             }
3117             if (tcode) {
3118                 PrintError("Failed to end transaction on RO_DONTUSE site: ",
3119                            tcode);
3120                 goto fail;
3121             }
3122
3123             VDONE;
3124
3125             /* emulate what TransCreate would have returned, so we try to
3126              * create the volume below */
3127             code = VNOVOL;
3128         }
3129     }
3130
3131     /* If the volume does not exist, create it */
3132     if (!volid || code) {
3133         char volname[VL_MAXNAMELEN];
3134         char hoststr[16];
3135
3136         if (volid && (code != VNOVOL)) {
3137             PrintError("Failed to start a transaction on the RO volume.\n",
3138                        code);
3139             goto fail;
3140         }
3141
3142         strlcpy(volname, vldbEntryPtr->name, sizeof(volname));
3143
3144         if (strlcat(volname,
3145                     tmpVolId?".roclone":".readonly",
3146                     sizeof(volname)) >= sizeof(volname)) {
3147             code = ENOMEM;
3148             PrintError("Volume name is too long\n", code);
3149             goto fail;
3150         }
3151
3152         if (verbose) {
3153             fprintf(STDOUT,
3154                     "Creating new volume %lu on replication site %s: ",
3155                     tmpVolId?(unsigned long)tmpVolId:(unsigned long)volid,
3156                     noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
3157                                                 serverNumber[index], hoststr) :
3158                     hostutil_GetNameByINet(vldbEntryPtr->
3159                                            serverNumber[index]));
3160             fflush(STDOUT);
3161         }
3162
3163         code =
3164           AFSVolCreateVolume(*connPtr, vldbEntryPtr->serverPartition[index],
3165                              volname, volser_RO,
3166                              vldbEntryPtr->volumeId[RWVOL],
3167                              tmpVolId?&tmpVolId:&volid,
3168                              transPtr);
3169         if (code) {
3170             PrintError("Failed to create the ro volume: ", code);
3171             goto fail;
3172         }
3173         vldbEntryPtr->volumeId[ROVOL] = volid;
3174
3175         VDONE;
3176
3177         /* The following is a bit redundant, since create sets these flags by default */
3178         code =
3179             AFSVolSetFlags(*connPtr, *transPtr,
3180                            VTDeleteOnSalvage | VTOutOfService);
3181         if (code) {
3182             PrintError("Failed to set flags on the ro volume: ", code);
3183             goto fail;
3184         }
3185     }
3186
3187     /* Otherwise, the transaction did succeed, so get the creation date of the
3188      * latest RO volume on the replication site
3189      */
3190     else {
3191         VPRINT2("Updating existing ro volume %u on %s ...\n", volid,
3192                 noresolve ? afs_inet_ntoa_r(vldbEntryPtr->
3193                                             serverNumber[index], hoststr) :
3194                 hostutil_GetNameByINet(vldbEntryPtr->serverNumber[index]));
3195
3196         code = AFSVolGetStatus(*connPtr, *transPtr, &tstatus);
3197         if (code) {
3198             PrintError("Failed to get status of volume on destination: ",
3199                        code);
3200             goto fail;
3201         }
3202         if (tmpVolId) {
3203             code = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
3204             *transPtr = 0;
3205             if (!code)
3206                 code = rcode;
3207             if (!code)
3208                 code = DoVolClone(*connPtr, volid,
3209                                   vldbEntryPtr->serverPartition[index],
3210                                   readonlyVolume, tmpVolId, "temporary",
3211                                   vldbEntryPtr->name, NULL, ".roclone", NULL,
3212                                   transPtr);
3213             if (code)
3214                 goto fail;
3215         }
3216         *crtimePtr = CLOCKADJ(tstatus.creationDate);
3217         *uptimePtr = CLOCKADJ(tstatus.updateDate);
3218     }
3219
3220     return 0;
3221
3222   fail:
3223     if (*transPtr) {
3224         tcode = AFSVolEndTrans(*connPtr, *transPtr, &rcode);
3225         *transPtr = 0;
3226         if (!tcode)
3227             tcode = rcode;
3228         if (tcode && tcode != ENOENT)
3229             PrintError("Could not end transaction on a ro volume: ", tcode);
3230     }
3231
3232     return code;
3233 }
3234
3235 static int
3236 SimulateForwardMultiple(struct rx_connection *fromconn, afs_int32 fromtid,
3237                         afs_int32 fromdate, manyDests * tr, afs_int32 flags,
3238                         void *cookie, manyResults * results)
3239 {
3240     unsigned int i;
3241
3242     for (i = 0; i < tr->manyDests_len; i++) {
3243         results->manyResults_val[i] =
3244             AFSVolForward(fromconn, fromtid, fromdate,
3245                           &(tr->manyDests_val[i].server),
3246                           tr->manyDests_val[i].trans, cookie);
3247     }
3248     return 0;
3249 }
3250
3251 /**
3252  * Check if a trans has timed out, and recreate it if necessary.
3253  *
3254  * @param[in] aconn  RX connection to the relevant server
3255  * @param[inout] atid  Transaction ID to check; if we recreated the trans,
3256  *                     contains the new trans ID on success
3257  * @param[in] apart  Partition for the transaction
3258  * @param[in] astat  The status of the original transaction
3259  *
3260  * @return operation status
3261  *  @retval 0 existing transaction is still valid, or we managed to recreate
3262  *            the trans successfully
3263  *  @retval nonzero Fatal error; bail out
3264  */
3265 static int
3266 CheckTrans(struct rx_connection *aconn, afs_int32 *atid, afs_int32 apart,
3267            struct volser_status *astat)
3268 {
3269     struct volser_status new_status;
3270     afs_int32 code;
3271
3272     memset(&new_status, 0, sizeof(new_status));
3273     code = AFSVolGetStatus(aconn, *atid, &new_status);
3274     if (code) {
3275         if (code == ENOENT) {
3276             *atid = 0;
3277             VPRINT1("Old transaction on cloned volume %lu timed out, "
3278                     "restarting transaction\n", (long unsigned) astat->volID);
3279             code = AFSVolTransCreate_retry(aconn, astat->volID, apart,
3280                                            ITBusy, atid);
3281             if (code) {
3282                 PrintError("Failed to recreate cloned RO volume transaction\n",
3283                            code);
3284                 return 1;
3285             }
3286
3287             memset(&new_status, 0, sizeof(new_status));
3288             code = AFSVolGetStatus(aconn, *atid, &new_status);
3289             if (code) {
3290                 PrintError("Failed to get status on recreated transaction\n",
3291                            code);
3292                 return 1;
3293             }
3294
3295             if (memcmp(&new_status, astat, sizeof(new_status)) != 0) {
3296                 PrintError("Recreated transaction on cloned RO volume, but "
3297                            "the volume has changed!\n", 0);
3298                 return 1;
3299             }
3300         } else {
3301             PrintError("Unable to get status of current cloned RO transaction\n",
3302                        code);
3303             return 1;
3304         }
3305     } else {
3306         if (memcmp(&new_status, astat, sizeof(new_status)) != 0) {
3307             /* sanity check */
3308             PrintError("Internal error: current GetStatus does not match "
3309                        "original GetStatus?\n", 0);
3310             return 1;
3311         }
3312     }
3313
3314     return 0;
3315 }
3316
3317 static void
3318 PutTrans(afs_int32 *vldbindex, struct replica *replicas,
3319          struct rx_connection **toconns, struct release *times,
3320          afs_int32 volcount)
3321 {
3322     afs_int32 s, code = 0, rcode = 0;
3323     /* End the transactions and destroy the connections */
3324     for (s = 0; s < volcount; s++) {
3325         if (replicas[s].trans) {
3326             code = AFSVolEndTrans(toconns[s], replicas[s].trans, &rcode);
3327
3328             replicas[s].trans = 0;
3329             if (!code)
3330                 code = rcode;
3331             if (code) {
3332                 if ((s == 0) || (code != ENOENT)) {
3333                     PrintError("Could not end transaction on a ro volume: ",
3334                                code);
3335                 } else {
3336                     PrintError
3337                         ("Transaction timed out on a ro volume. Will retry.\n",
3338                          0);
3339                     if (times[s].vldbEntryIndex < *vldbindex)
3340                         *vldbindex = times[s].vldbEntryIndex;
3341                 }
3342             }
3343         }
3344         if (toconns[s])
3345             rx_DestroyConnection(toconns[s]);
3346         toconns[s] = 0;
3347     }
3348 }
3349
3350 /**
3351  * Release a volume to read-only sites
3352  *
3353  * Release volume <afromvol> on <afromserver> <afrompart> to all its RO
3354  * sites (complete release), unless the previous release was incomplete
3355  * or new sites were added without changes to the read-write volume, in
3356  * which case we bring the remaining volumes up to date with the volumes
3357  * that were previously released successfully.
3358  *
3359  * Will create a clone from the RW, then dump the clone out to
3360  * the remaining replicas. If there is more than 1 RO sites,
3361  * ensure that the VLDB says at least one RO is available all
3362  * the time: Influences when we write back the VLDB entry.
3363  *
3364  * @param[in] afromvol      volume to be released
3365  * @param[in] afromserver   server containing afromvol
3366  * @param[in] afrompart     partition containing afromvol
3367  * @param[in] flags         bitmap of options
3368  *                            REL_COMPLETE  - force a complete release
3369  *                            REL_FULLDUMPS - force full dumps
3370  */
3371 int
3372 UV_ReleaseVolume(afs_uint32 afromvol, afs_uint32 afromserver,
3373                  afs_int32 afrompart, int flags)
3374 {
3375     char vname[64];
3376     afs_int32 code = 0;
3377     afs_int32 vcode, rcode, tcode;
3378     afs_uint32 cloneVolId = 0, roVolId;
3379     struct replica *replicas = 0;
3380     struct nvldbentry entry, storeEntry;
3381     int i, volcount = 0, m, vldbindex;
3382     int failure;
3383     struct restoreCookie cookie;
3384     struct rx_connection **toconns = 0;
3385     struct release *times = 0;
3386     int nservers = 0;
3387     struct rx_connection *fromconn = (struct rx_connection *)0;
3388     afs_int32 error = 0;
3389     int islocked = 0;
3390     afs_int32 clonetid = 0, onlinetid;
3391     afs_int32 fromtid = 0;
3392     afs_uint32 fromdate = 0;
3393     afs_uint32 thisdate;
3394     time_t tmv;
3395     int s;
3396     manyDests tr;
3397     manyResults results;
3398     int rwindex, roindex, roclone, roexists;
3399     afs_uint32 rwcrdate = 0, rwupdate = 0;
3400     afs_uint32 clcrdate;
3401     struct rtime {
3402         int validtime;
3403         afs_uint32 uptime;
3404     } remembertime[NMAXNSERVERS];
3405     int releasecount = 0;
3406     struct volser_status volstatus;
3407     char hoststr[16];
3408     afs_int32 origflags[NMAXNSERVERS];
3409     struct volser_status orig_status;
3410     int notreleased = 0;
3411     int tried_justnewsites = 0;
3412     int justnewsites = 0; /* are we just trying to release to new RO sites? */
3413     int sites = 0; /* number of ro sites */
3414     int new_sites = 0; /* number of ro sites markes as new */
3415
3416     typedef enum {
3417         CR_PARTIAL    = 0x0000, /**< just new sites added or recover from a previous failed release */
3418         CR_FORCED     = 0x0001, /**< complete: forced by caller */
3419         CR_LAST_OK    = 0x0002, /**< complete: no sites have been marked as new release */
3420         CR_ALL_NEW    = 0x0004, /**< complete: all sites have been marked as new release */
3421         CR_NEW_RW     = 0x0008, /**< complete: read-write has changed */
3422         CR_RO_MISSING = 0x0010, /**< complete: ro clone is missing */
3423     } complete_release_t;
3424
3425     complete_release_t complete_release = CR_PARTIAL;
3426
3427     memset(remembertime, 0, sizeof(remembertime));
3428     memset(&results, 0, sizeof(results));
3429     memset(origflags, 0, sizeof(origflags));
3430
3431     vcode = ubik_VL_SetLock(cstruct, 0, afromvol, RWVOL, VLOP_RELEASE);
3432     if (vcode != VL_RERELEASE)
3433         ONERROR(vcode, afromvol,
3434                 "Could not lock the VLDB entry for the volume %u.\n");
3435     islocked = 1;
3436
3437     /* Get the vldb entry in readable format */
3438     vcode = VLDB_GetEntryByID(afromvol, RWVOL, &entry);
3439     ONERROR(vcode, afromvol,
3440             "Could not fetch the entry for the volume %u from the VLDB.\n");
3441     MapHostToNetwork(&entry);
3442
3443     if (verbose)
3444         EnumerateEntry(&entry);
3445
3446     if (!ISNAMEVALID(entry.name))
3447         ONERROR(VOLSERBADOP, entry.name,
3448                 "Volume name %s is too long, rename before releasing.\n");
3449     if (entry.volumeId[RWVOL] != afromvol)
3450         ONERROR(VOLSERBADOP, afromvol,
3451                 "The volume %u being released is not a read-write volume.\n");
3452     if (entry.nServers <= 1)
3453         ONERROR(VOLSERBADOP, afromvol,
3454                 "Volume %u has no replicas - release operation is meaningless!\n");
3455     if (strlen(entry.name) > (VOLSER_OLDMAXVOLNAME - 10))
3456         ONERROR(VOLSERBADOP, entry.name,
3457                 "RO volume name %s exceeds (VOLSER_OLDMAXVOLNAME - 10) character limit\n");
3458
3459     /* roclone is true if one of the RO volumes is on the same
3460      * partition as the RW volume. In this case, we make the RO volume
3461      * on the same partition a clone instead of a complete copy.
3462      */
3463
3464     roindex = Lp_ROMatch(afromserver, afrompart, &entry) - 1;
3465     roclone = ((roindex == -1) ? 0 : 1);
3466     rwindex = Lp_GetRwIndex(&entry);
3467     if (rwindex < 0)
3468         ONERROR0(VOLSERNOVOL, "There is no RW volume \n");
3469
3470     /* Make sure we have a RO volume id to work with */
3471     if (entry.volumeId[ROVOL] == INVALID_BID) {
3472         /* need to get a new RO volume id */
3473         vcode = ubik_VL_GetNewVolumeId(cstruct, 0, 1, &roVolId);
3474         ONERROR(vcode, entry.name, "Cant allocate ID for RO volume of %s\n");
3475
3476         entry.volumeId[ROVOL] = roVolId;
3477         MapNetworkToHost(&entry, &storeEntry);
3478         vcode = VLDB_ReplaceEntry(afromvol, RWVOL, &storeEntry, 0);
3479         ONERROR(vcode, entry.name, "Could not update vldb entry for %s.\n");
3480     }
3481
3482     /*
3483      * Determine if this is to be a complete release or a recovery of a
3484      * previous unfinished release. The previous release is considered to be
3485      * unfinished when the clone was successfully distributed to at least one
3486      * (but not all) of the read-only sites, as indicated by the NEW_REPSITE
3487      * vldb flags.
3488      *
3489      * The caller can override the vldb flags check using the -force
3490      * or -force-reclone flag, to force this to be a complete release.
3491      */
3492     for (i = 0; i < entry.nServers; i++) {
3493         if (entry.serverFlags[i] & VLSF_ROVOL) {
3494             sites++;
3495             if (entry.serverFlags[i] & VLSF_NEWREPSITE)
3496                 new_sites++;
3497             if (entry.serverFlags[i] & VLSF_DONTUSE)
3498                 notreleased++;
3499         }
3500         origflags[i] = entry.serverFlags[i];
3501     }
3502
3503     if (flags & REL_COMPLETE) {
3504         complete_release |= CR_FORCED;
3505     }
3506
3507     if (new_sites == 0) {
3508         complete_release |= CR_LAST_OK;
3509     } else if (new_sites == sites) {
3510         complete_release |= CR_ALL_NEW;
3511     }
3512
3513     if ((complete_release & (CR_LAST_OK | CR_ALL_NEW))
3514         && !(complete_release & CR_FORCED)) {
3515         if (notreleased && notreleased != sites) {
3516             /* we have some new unreleased sites. try to just release to those,
3517              * if the RW has not changed. The caller can override with -force
3518              * or with -force-reclone. */
3519             justnewsites = 1;
3520         }
3521     }
3522
3523     /* Determine which volume id to use and see if it exists */
3524     cloneVolId = (complete_release || entry.cloneId == 0)
3525                   ? entry.volumeId[ROVOL] : entry.cloneId;
3526
3527     code = VolumeExists(afromserver, afrompart, cloneVolId);
3528     roexists = ((code == ENODEV) ? 0 : 1);
3529
3530     fromconn = UV_Bind(afromserver, AFSCONF_VOLUMEPORT);
3531     if (!fromconn)
3532         ONERROR(-1, afromserver,
3533                 "Cannot establish connection with server 0x%x\n");
3534
3535     if (!complete_release) {
3536         if (!roexists) {
3537             complete_release |= CR_RO_MISSING;  /* Do a complete release if RO clone does not exist */
3538         } else {
3539             /* Begin transaction on RW and mark it busy while we query it */
3540             code = AFSVolTransCreate_retry(
3541                         fromconn, afromvol, afrompart, ITBusy, &fromtid
3542                    );
3543             ONERROR(code, afromvol,
3544                     "Failed to start transaction on RW volume %u\n");
3545
3546             /* Query the creation date for the RW */
3547             code = AFSVolGetStatus(fromconn, fromtid, &volstatus);
3548             ONERROR(code, afromvol,
3549                     "Failed to get the status of RW volume %u\n");
3550             rwcrdate = volstatus.creationDate;
3551
3552             /* End transaction on RW */
3553             code = AFSVolEndTrans(fromconn, fromtid, &rcode);
3554             fromtid = 0;
3555             ONERROR((code ? code : rcode), afromvol,
3556                     "Failed to end transaction on RW volume %u\n");
3557
3558             /* Begin transaction on clone and mark it busy while we query it */
3559             code = AFSVolTransCreate_retry(
3560                         fromconn, cloneVolId, afrompart, ITBusy, &clonetid
3561                    );
3562             ONERROR(code, cloneVolId,
3563                     "Failed to start transaction on RW clone %u\n");
3564
3565             /* Query the creation date for the clone */
3566             code = AFSVolGetStatus(fromconn, clonetid, &volstatus);
3567             ONERROR(code, cloneVolId,
3568                     "Failed to get the status of RW clone %u\n");
3569             clcrdate = volstatus.creationDate;
3570
3571             /* End transaction on clone */
3572             code = AFSVolEndTrans(fromconn, clonetid, &rcode);
3573             clonetid = 0;
3574             ONERROR((code ? code : rcode), cloneVolId,