Refuse to attach inode partitions with UFS logging
[openafs.git] / src / vol / partition.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  *
9  * Portions Copyright (c) 2003 Apple Computer, Inc.
10  * Portions Copyright (c) 2006 Sine Nomine Associates
11  */
12
13 /*
14
15         System:         VICE-TWO
16         Module:         partition.c
17         Institution:    The Information Technology Center, Carnegie-Mellon University
18
19  */
20
21 #include <afsconfig.h>
22 #include <afs/param.h>
23
24
25 #include <ctype.h>
26 #include <string.h>
27 #ifdef AFS_NT40_ENV
28 #include <windows.h>
29 #include <winbase.h>
30 #include <winioctl.h>
31 #else
32 #include <sys/param.h>
33 #include <sys/types.h>
34 #include <unistd.h>
35
36 #if AFS_HAVE_STATVFS || AFS_HAVE_STATVFS64
37 #include <sys/statvfs.h>
38 #endif /* AFS_HAVE_STATVFS */
39 #if defined(AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV)
40 #include <sys/mount.h>
41 #endif
42
43 #if !defined(AFS_SGI_ENV)
44 #ifdef  AFS_OSF_ENV
45 #include <sys/mount.h>
46 #include <ufs/fs.h>
47 #else /* AFS_OSF_ENV */
48 #ifdef AFS_VFSINCL_ENV
49 #define VFS
50 #ifdef  AFS_SUN5_ENV
51 #include <sys/fs/ufs_fs.h>
52 #else
53 #if defined(AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV)
54 #include <ufs/ufs/dinode.h>
55 #include <ufs/ffs/fs.h>
56 #else
57 #include <ufs/fs.h>
58 #endif
59 #endif
60 #else /* AFS_VFSINCL_ENV */
61 #if !defined(AFS_AIX_ENV) && !defined(AFS_LINUX22_ENV) && !defined(AFS_DARWIN_ENV) && !defined(AFS_XBSD_ENV)
62 #include <sys/fs.h>
63 #endif
64 #endif /* AFS_VFSINCL_ENV */
65 #endif /* AFS_OSF_ENV */
66 #include <errno.h>
67 #include <sys/stat.h>
68 #include <stdio.h>
69 #include <sys/file.h>
70 #ifdef  AFS_AIX_ENV
71 #include <sys/vfs.h>
72 #include <sys/lockf.h>
73 #else
74 #ifdef  AFS_HPUX_ENV
75 #include <sys/vfs.h>
76 #include <unistd.h>
77 #include <fcntl.h>
78 #include <checklist.h>
79 #else
80 #if     defined(AFS_SUN_ENV)
81 #include <sys/vfs.h>
82 #ifndef AFS_SUN5_ENV
83 #include <mntent.h>
84 #endif
85 #endif
86 #ifdef AFS_SUN5_ENV
87 #include <unistd.h>
88 #include <sys/mnttab.h>
89 #include <sys/mntent.h>
90 #else
91 #ifdef AFS_LINUX22_ENV
92 #include <mntent.h>
93 #include <sys/statfs.h>
94 #else
95 #include <fstab.h>
96 #endif
97 #endif
98 #endif
99 #endif
100 #endif /* AFS_SGI_ENV */
101 #endif /* AFS_NT40_ENV */
102 #if defined(AFS_SGI_ENV)
103 #include <sys/errno.h>
104 #include <sys/stat.h>
105 #include <stdio.h>
106 #include <sys/file.h>
107 #include <mntent.h>
108 #endif
109
110 #include <rx/xdr.h>
111 #include <afs/afsint.h>
112 #include "nfs.h"
113 #include <afs/errors.h>
114 #include "lock.h"
115 #include "lwp.h"
116 #include <afs/afssyscalls.h>
117 #include "ihandle.h"
118 #ifdef AFS_NAMEI_ENV
119 #ifdef AFS_NT40_ENV
120 #include "ntops.h"
121 #else
122 #include "namei_ops.h"
123 #include <dirent.h>
124 #endif /* AFS_NT40_ENV */
125 #endif /* AFS_NAMEI_ENV */
126 #include "vnode.h"
127 #include "volume.h"
128 #include "partition.h"
129 #ifdef AFS_PTHREAD_ENV
130 #include <assert.h>
131 #else /* AFS_PTHREAD_ENV */
132 #include <afs/assert.h>
133 #endif /* AFS_PTHREAD_ENV */
134
135 #if defined(AFS_HPUX_ENV)
136 #include <sys/types.h>
137 #include <sys/privgrp.h>
138 #endif /* defined(AFS_HPUX_ENV) */
139
140 #ifdef AFS_AIX42_ENV
141 #include <jfs/filsys.h>
142 #endif
143
144 #ifdef O_LARGEFILE
145
146 #define afs_stat        stat64
147 #define afs_open        open64
148 #define afs_fopen       fopen64
149 #ifndef AFS_NT40_ENV
150 #if AFS_HAVE_STATVFS64
151 # define afs_statvfs    statvfs64
152 #else
153 # if AFS_HAVE_STATFS64
154 #  define afs_statfs    statfs64
155 #else
156 #  if AFS_HAVE_STATVFS
157 #   define afs_statvfs  statvfs
158 #  else
159 #   define afs_statfs   statfs
160 #  endif /* !AFS_HAVE_STATVFS */
161 # endif /* !AFS_HAVE_STATFS64 */
162 #endif /* !AFS_HAVE_STATVFS64 */
163 #endif /* !AFS_NT40_ENV */
164
165 #else /* !O_LARGEFILE */
166
167 #define afs_stat        stat
168 #define afs_open        open
169 #define afs_fopen       fopen
170 #ifndef AFS_NT40_ENV
171 #if AFS_HAVE_STATVFS
172 #define afs_statvfs     statvfs
173 #else /* !AFS_HAVE_STATVFS */
174 #define afs_statfs      statfs
175 #endif /* !AFS_HAVE_STATVFS */
176 #endif /* !AFS_NT40_ENV */
177
178 #endif /* !O_LARGEFILE */
179
180 /*@printflike@*/ extern void Log(const char *format, ...);
181
182 int aixlow_water = 8;           /* default 8% */
183 struct DiskPartition64 *DiskPartitionList;
184
185 #ifdef AFS_DEMAND_ATTACH_FS
186 static struct DiskPartition64 *DiskPartitionTable[VOLMAXPARTS+1];
187
188 static struct DiskPartition64 * VLookupPartition_r(char * path);
189 static void AddPartitionToTable_r(struct DiskPartition64 *);
190 #endif /* AFS_DEMAND_ATTACH_FS */
191
192 #ifdef AFS_SGI_XFS_IOPS_ENV
193 /* Verify that the on disk XFS inodes on the partition are large enough to
194  * hold the AFS attribute. Returns -1 if the attribute can't be set or is
195  * too small to fit in the inode. Returns 0 if the attribute does fit in
196  * the XFS inode.
197  */
198 #include <afs/xfsattrs.h>
199 static int
200 VerifyXFSInodeSize(char *part, char *fstype)
201 {
202     afs_xfs_attr_t junk;
203     int length = SIZEOF_XFS_ATTR_T;
204     int fd = 0;
205     int code = -1;
206     struct fsxattr fsx;
207
208     if (strcmp("xfs", fstype))
209         return 0;
210
211     if (attr_set(part, AFS_XFS_ATTR, &junk, length, ATTR_ROOT) == 0) {
212         if (((fd = open(part, O_RDONLY, 0)) != -1)
213             && (fcntl(fd, F_FSGETXATTRA, &fsx) == 0)) {
214
215             if (fsx.fsx_nextents) {
216                 Log("Partition %s: XFS inodes too small, exiting.\n", part);
217                 Log("Run xfs_size_check utility and remake partitions.\n");
218             } else
219                 code = 0;
220         }
221
222         if (fd > 0)
223             close(fd);
224         (void)attr_remove(part, AFS_XFS_ATTR, ATTR_ROOT);
225     }
226     return code;
227 }
228 #endif /* AFS_SGI_XFS_IOPS_ENV */
229
230 int
231 VInitPartitionPackage(void)
232 {
233 #ifdef AFS_DEMAND_ATTACH_ENV
234     memset(&DiskPartitionTable, 0, sizeof(DiskPartitionTable));
235 #endif /* AFS_DEMAND_ATTACH_ENV */
236     return 0;
237 }
238
239 static void
240 VInitPartition_r(char *path, char *devname, Device dev)
241 {
242     struct DiskPartition64 *dp, *op;
243     dp = (struct DiskPartition64 *)malloc(sizeof(struct DiskPartition64));
244     /* Add it to the end, to preserve order when we print statistics */
245     for (op = DiskPartitionList; op; op = op->next) {
246         if (!op->next)
247             break;
248     }
249     if (op)
250         op->next = dp;
251     else
252         DiskPartitionList = dp;
253     dp->next = 0;
254     dp->name = (char *)malloc(strlen(path) + 1);
255     strncpy(dp->name, path, strlen(path) + 1);
256     dp->index = volutil_GetPartitionID(path);
257 #if defined(AFS_NAMEI_ENV) && !defined(AFS_NT40_ENV)
258     /* Create a lockfile for the partition, of the form /vicepa/Lock/vicepa */
259     dp->devName = (char *)malloc(2 * strlen(path) + 6);
260     strcpy(dp->devName, path);
261     strcat(dp->devName, "/");
262     strcat(dp->devName, "Lock");
263     mkdir(dp->devName, 0700);
264     strcat(dp->devName, path);
265     close(afs_open(dp->devName, O_RDWR | O_CREAT, 0600));
266     dp->device = dp->index;
267 #else
268     dp->devName = (char *)malloc(strlen(devname) + 1);
269     strncpy(dp->devName, devname, strlen(devname) + 1);
270     dp->device = dev;
271 #endif
272     dp->lock_fd = INVALID_FD;
273     dp->flags = 0;
274     dp->f_files = 1;            /* just a default value */
275 #if defined(AFS_NAMEI_ENV) && !defined(AFS_NT40_ENV)
276     if (programType == fileServer)
277         (void)namei_ViceREADME(VPartitionPath(dp));
278 #endif
279     VSetPartitionDiskUsage_r(dp);
280 #ifdef AFS_DEMAND_ATTACH_FS
281     AddPartitionToTable_r(dp);
282     queue_Init(&dp->vol_list.head);
283     assert(pthread_cond_init(&dp->vol_list.cv, NULL) == 0);
284     dp->vol_list.len = 0;
285     dp->vol_list.busy = 0;
286 #endif /* AFS_DEMAND_ATTACH_FS */
287 }
288
289 static void
290 VInitPartition(char *path, char *devname, Device dev)
291 {
292     VOL_LOCK;
293     VInitPartition_r(path, devname, dev);
294     VOL_UNLOCK;
295 }
296
297 #ifndef AFS_NT40_ENV
298 /* VAttachPartitions() finds the vice partitions on this server. Calls
299  * VCheckPartition() to do some basic checks on the partition. If the partition
300  * is a valid vice partition, VCheckPartition will add it to the DiskPartition
301  * list.
302  * Returns the number of errors returned by VCheckPartition. An error in
303  * VCheckPartition means that partition is a valid vice partition but the
304  * fileserver should not start because of the error found on that partition.
305  *
306  * AFS_NAMEI_ENV
307  * No specific user space file system checks, since we don't know what
308  * is being used for vice partitions.
309  *
310  * Use partition name as devname.
311  */
312 int
313 VCheckPartition(char *part, char *devname)
314 {
315     struct afs_stat status;
316 #if !defined(AFS_LINUX20_ENV) && !defined(AFS_NT40_ENV)
317     char AFSIDatPath[MAXPATHLEN];
318 #endif
319
320     /* Only keep track of "/vicepx" partitions since it can get hairy
321      * when NFS mounts are involved.. */
322     if (strncmp(part, VICE_PARTITION_PREFIX, VICE_PREFIX_SIZE)) {
323         return 0;
324     }
325     if (afs_stat(part, &status) < 0) {
326         Log("VInitVnodes: Couldn't find file system %s; ignored\n", part);
327         return 0;
328     }
329 #ifndef AFS_AIX32_ENV
330     if (programType == fileServer) {
331         char salvpath[MAXPATHLEN];
332         strcpy(salvpath, part);
333         strcat(salvpath, "/FORCESALVAGE");
334         if (afs_stat(salvpath, &status) == 0) {
335             Log("VInitVnodes: Found %s; aborting\n", salvpath);
336             return -1;
337         }
338     }
339 #endif
340
341 #if !defined(AFS_LINUX20_ENV) && !defined(AFS_NT40_ENV)
342     strcpy(AFSIDatPath, part);
343     strcat(AFSIDatPath, "/AFSIDat");
344 #ifdef AFS_NAMEI_ENV
345     if (afs_stat(AFSIDatPath, &status) < 0) {
346         DIR *dirp;
347         struct dirent *dp;
348
349         dirp = opendir(part);
350         assert(dirp);
351         while ((dp = readdir(dirp))) {
352             if (dp->d_name[0] == 'V') {
353                 Log("This program is compiled with AFS_NAMEI_ENV, but partition %s seems to contain volumes which don't use the namei-interface; aborting\n", part);
354                 closedir(dirp);
355                 return -1;
356             }
357         }
358         closedir(dirp);
359     }
360 #else /* AFS_NAMEI_ENV */
361     if (afs_stat(AFSIDatPath, &status) == 0) {
362         Log("This program is compiled without AFS_NAMEI_ENV, but partition %s seems to contain volumes which use the namei-interface; aborting\n", part);
363         return -1;
364     }
365
366 #ifdef AFS_SGI_XFS_IOPS_ENV
367     if (VerifyXFSInodeSize(part, status.st_fstype) < 0)
368         return -1;
369 #endif
370 #endif /* AFS_NAMEI_ENV */
371 #endif /* !AFS_LINUX20_ENV && !AFS_NT40_ENV */
372
373 #if defined(AFS_DUX40_ENV) && !defined(AFS_NAMEI_ENV)
374     if (status.st_ino != ROOTINO) {
375         Log("%s is not a mounted file system; ignored.\n", part);
376         return 0;
377     }
378 #endif
379
380     VInitPartition(part, devname, status.st_dev);
381
382     return 0;
383 }
384
385 /* VIsAlwaysAttach() checks whether a /vicepX directory should always be
386  * attached (return value 1), or only attached when it is a separately
387  * mounted partition (return value 0).  For non-NAMEI environments, it
388  * always returns 0.
389  */
390 static int
391 VIsAlwaysAttach(char *part)
392 {
393 #ifdef AFS_NAMEI_ENV
394     struct afs_stat st;
395     char checkfile[256];
396     int ret;
397
398     if (strncmp(part, VICE_PARTITION_PREFIX, VICE_PREFIX_SIZE))
399         return 0;
400
401     strncpy(checkfile, part, 100);
402     strcat(checkfile, "/");
403     strcat(checkfile, VICE_ALWAYSATTACH_FILE);
404
405     ret = afs_stat(checkfile, &st);
406     return (ret < 0) ? 0 : 1;
407 #else /* AFS_NAMEI_ENV */
408     return 0;
409 #endif /* AFS_NAMEI_ENV */
410 }
411
412 /* VAttachPartitions2() looks for and attaches /vicepX partitions
413  * where a special file (VICE_ALWAYSATTACH_FILE) exists.  This is
414  * used to attach /vicepX directories which aren't on dedicated
415  * partitions, in the NAMEI fileserver.
416  */
417 void
418 VAttachPartitions2(void)
419 {
420 #ifdef AFS_NAMEI_ENV
421     DIR *dirp;
422     struct dirent *de;
423     char pname[32];
424
425     dirp = opendir("/");
426     while ((de = readdir(dirp))) {
427         strcpy(pname, "/");
428         strncat(pname, de->d_name, 20);
429         pname[sizeof(pname) - 1] = '\0';
430
431         /* Only keep track of "/vicepx" partitions since automounter
432          * may hose us */
433         if (VIsAlwaysAttach(pname))
434             VCheckPartition(pname, "");
435     }
436     closedir(dirp);
437 #endif /* AFS_NAMEI_ENV */
438 }
439 #endif /* AFS_NT40_ENV */
440
441 #ifdef AFS_SUN5_ENV
442 int
443 VAttachPartitions(void)
444 {
445     int errors = 0;
446     struct mnttab mnt;
447     FILE *mntfile;
448
449     if (!(mntfile = afs_fopen(MNTTAB, "r"))) {
450         Log("Can't open %s\n", MNTTAB);
451         perror(MNTTAB);
452         exit(-1);
453     }
454     while (!getmntent(mntfile, &mnt)) {
455         /* Ignore non ufs or non read/write partitions */
456         /* but allow zfs too if we're in the NAMEI environment */
457         if (
458 #ifdef AFS_NAMEI_ENV
459             (((strcmp(mnt.mnt_fstype, "ufs") &&
460                 strcmp(mnt.mnt_fstype, "zfs"))))
461 #else
462             (strcmp(mnt.mnt_fstype, "ufs") != 0)
463 #endif
464             || (strncmp(mnt.mnt_mntopts, "ro,ignore", 9) == 0))
465             continue;
466         
467         /* If we're going to always attach this partition, do it later. */
468         if (VIsAlwaysAttach(mnt.mnt_mountp))
469             continue;
470
471 #ifndef AFS_NAMEI_ENV
472         if (hasmntopt(&mnt, "logging") != NULL) {
473             Log("This program is compiled without AFS_NAMEI_ENV, and "
474                 "partition %s is mounted with the 'logging' option. "
475                 "Using the inode fileserver backend with 'logging' UFS "
476                 "partitions causes volume corruption, so please either "
477                 "mount the partition without logging, or use the namei "
478                 "fileserver backend. Aborting...\n", mnt.mnt_mountp);
479             errors++;
480         }
481 #endif /* !AFS_NAMEI_ENV */
482
483         if (VCheckPartition(mnt.mnt_mountp, mnt.mnt_special) < 0)
484             errors++;
485     }
486
487     (void)fclose(mntfile);
488
489     /* Process the always-attach partitions, if any. */
490     VAttachPartitions2();
491
492     return errors;
493 }
494
495 #endif /* AFS_SUN5_ENV */
496 #if defined(AFS_SGI_ENV) || (defined(AFS_SUN_ENV) && !defined(AFS_SUN5_ENV)) || defined(AFS_HPUX_ENV)
497 int
498 VAttachPartitions(void)
499 {
500     int errors = 0;
501     FILE *mfd;
502     struct mntent *mntent;
503
504     if ((mfd = setmntent(MOUNTED, "r")) == NULL) {
505         Log("Problems in getting mount entries(setmntent)\n");
506         exit(-1);
507     }
508     while (mntent = getmntent(mfd)) {
509         if (!hasmntopt(mntent, MNTOPT_RW))
510             continue;
511
512         /* If we're going to always attach this partition, do it later. */
513         if (VIsAlwaysAttach(mntent->mnt_dir))
514             continue;
515
516         if (VCheckPartition(mntent->mnt_dir, mntent->mnt_fsname) < 0)
517             errors++;
518     }
519
520     endmntent(mfd);
521
522     /* Process the always-attach partitions, if any. */
523     VAttachPartitions2();
524
525     return errors;
526 }
527 #endif
528 #ifdef AFS_AIX_ENV
529 /*
530  * (This function was grabbed from df.c)
531  */
532 int
533 getmount(register struct vmount **vmountpp)
534 {
535     int size;
536     register struct vmount *vm;
537     int nmounts;
538
539     /* set initial size of mntctl buffer to a MAGIC NUMBER */
540     size = BUFSIZ;
541
542     /* try the operation until ok or a fatal error */
543     while (1) {
544         if ((vm = (struct vmount *)malloc(size)) == NULL) {
545             /* failed getting memory for mount status buf */
546             perror("FATAL ERROR: get_stat malloc failed\n");
547             exit(-1);
548         }
549
550         /*
551          * perform the QUERY mntctl - if it returns > 0, that is the
552          * number of vmount structures in the buffer.  If it returns
553          * -1, an error occured.  If it returned 0, then look in
554          * first word of buffer for needed size.
555          */
556         if ((nmounts = mntctl(MCTL_QUERY, size, (caddr_t) vm)) > 0) {
557             /* OK, got it, now return */
558             *vmountpp = vm;
559             return (nmounts);
560
561         } else if (nmounts == 0) {
562             /* the buffer wasn't big enough .... */
563             /* .... get required buffer size */
564             size = *(int *)vm;
565             free(vm);
566
567         } else {
568             /* some other kind of error occurred */
569             free(vm);
570             return (-1);
571         }
572     }
573 }
574
575 int
576 VAttachPartitions(void)
577 {
578     int errors = 0;
579     int nmounts;
580     struct vmount *vmountp;
581
582     if ((nmounts = getmount(&vmountp)) <= 0) {
583         Log("Problems in getting # of mount entries(getmount)\n");
584         exit(-1);
585     }
586     for (; nmounts;
587          nmounts--, vmountp =
588          (struct vmount *)((int)vmountp + vmountp->vmt_length)) {
589         char *part = vmt2dataptr(vmountp, VMT_STUB);
590
591         if (vmountp->vmt_flags & (MNT_READONLY | MNT_REMOVABLE | MNT_REMOTE))
592             continue;           /* Ignore any "special" partitions */
593
594 #ifdef AFS_AIX42_ENV
595 #ifndef AFS_NAMEI_ENV
596         {
597             struct superblock fs;
598             /* The Log statements are non-sequiters in the SalvageLog and don't
599              * even appear in the VolserLog, so restrict them to the FileLog.
600              */
601             if (ReadSuper(&fs, vmt2dataptr(vmountp, VMT_OBJECT)) < 0) {
602                 if (programType == fileServer)
603                     Log("Can't read superblock for %s, ignoring it.\n", part);
604                 continue;
605             }
606             if (IsBigFilesFileSystem(&fs)) {
607                 if (programType == fileServer)
608                     Log("%s is a big files filesystem, ignoring it.\n", part);
609                 continue;
610             }
611         }
612 #endif
613 #endif
614
615         /* If we're going to always attach this partition, do it later. */
616         if (VIsAlwaysAttach(part))
617             continue;
618
619         if (VCheckPartition(part, vmt2dataptr(vmountp, VMT_OBJECT)) < 0)
620             errors++;
621     }
622
623     /* Process the always-attach partitions, if any. */
624     VAttachPartitions2();
625
626     return errors;
627 }
628 #endif
629 #if defined(AFS_DUX40_ENV) || defined(AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV)
630 int
631 VAttachPartitions(void)
632 {
633     int errors = 0;
634     struct fstab *fsent;
635
636     if (setfsent() < 0) {
637         Log("Error listing filesystems.\n");
638         exit(-1);
639     }
640
641     while ((fsent = getfsent())) {
642         if (strcmp(fsent->fs_type, "rw") != 0)
643             continue;
644
645         /* If we're going to always attach this partition, do it later. */
646         if (VIsAlwaysAttach(fsent->fs_file))
647             continue;
648
649         if (VCheckPartition(fsent->fs_file, fsent->fs_spec) < 0)
650             errors++;
651     }
652     endfsent();
653
654     /* Process the always-attach partitions, if any. */
655     VAttachPartitions2();
656
657     return errors;
658 }
659 #endif
660
661 #ifdef AFS_NT40_ENV
662 #include <string.h>
663 #include <sys/stat.h>
664 /* VValidVPTEntry
665  *
666  * validate names in vptab.
667  *
668  * Return value:
669  * 1 valid entry
670  * 0 invalid entry
671  */
672
673 int
674 VValidVPTEntry(struct vptab *vpe)
675 {
676     int len = strlen(vpe->vp_name);
677     int i;
678
679     if (len < VICE_PREFIX_SIZE + 1 || len > VICE_PREFIX_SIZE + 2)
680         return 0;
681     if (strncmp(vpe->vp_name, VICE_PARTITION_PREFIX, VICE_PREFIX_SIZE))
682         return 0;
683
684     for (i = VICE_PREFIX_SIZE; i < len; i++) {
685         if (vpe->vp_name[i] < 'a' || vpe->vp_name[i] > 'z') {
686             Log("Invalid partition name %s in registry, ignoring it.\n",
687                 vpe->vp_name);
688             return 0;
689         }
690     }
691     if (len == VICE_PREFIX_SIZE + 2) {
692         i = (int)(vpe->vp_name[VICE_PREFIX_SIZE] - 'a') * 26 +
693             (int)(vpe->vp_name[VICE_PREFIX_SIZE + 1] - 'a');
694         if (i > 255) {
695             Log("Invalid partition name %s in registry, ignoring it.\n",
696                 vpe->vp_name);
697             return 0;
698         }
699     }
700
701     len = strlen(vpe->vp_dev);
702     if (len != 2 || vpe->vp_dev[1] != ':' || vpe->vp_dev[0] < 'A'
703         || vpe->vp_dev[0] > 'Z') {
704         Log("Invalid device name %s in registry, ignoring it.\n",
705             vpe->vp_dev);
706         return 0;
707     }
708
709     return 1;
710 }
711
712 int
713 VCheckPartition(char *partName)
714 {
715     char volRoot[4];
716     char volFsType[64];
717     DWORD dwDummy;
718     int err;
719
720     /* partName is presumed to be of the form "X:" */
721     (void)sprintf(volRoot, "%c:\\", *partName);
722
723     if (!GetVolumeInformation(volRoot,  /* volume root directory */
724                               NULL,     /* volume name buffer */
725                               0,        /* volume name size */
726                               NULL,     /* volume serial number */
727                               &dwDummy, /* max component length */
728                               &dwDummy, /* file system flags */
729                               volFsType,        /* file system name */
730                               sizeof(volFsType))) {
731         err = GetLastError();
732         Log("VCheckPartition: Failed to get partition information for %s, ignoring it.\n", partName);
733         return -1;
734     }
735
736     if (strcmp(volFsType, "NTFS")) {
737         Log("VCheckPartition: Partition %s is not an NTFS partition, ignoring it.\n", partName);
738         return -1;
739     }
740
741     return 0;
742 }
743
744
745 int
746 VAttachPartitions(void)
747 {
748     struct DiskPartition64 *partP, *prevP, *nextP;
749     struct vpt_iter iter;
750     struct vptab entry;
751
752     if (vpt_Start(&iter) < 0) {
753         Log("No partitions to attach.\n");
754         return 0;
755     }
756
757     while (0 == vpt_NextEntry(&iter, &entry)) {
758         if (!VValidVPTEntry(&entry)) {
759             continue;
760         }
761
762         /* This test for duplicates relies on the fact that the method
763          * of storing the partition names in the NT registry means the same
764          * partition name will never appear twice in the list.
765          */
766         for (partP = DiskPartitionList; partP; partP = partP->next) {
767             if (*partP->devName == *entry.vp_dev) {
768                 Log("Same drive (%s) used for both partition %s and partition %s, ignoring both.\n", entry.vp_dev, partP->name, entry.vp_name);
769                 partP->flags = PART_DUPLICATE;
770                 break;          /* Only one entry will ever be in this list. */
771             }
772         }
773         if (partP)
774             continue;           /* found a duplicate */
775
776         if (VCheckPartition(entry.vp_dev) < 0)
777             continue;
778         /* This test allows for manually inserting the FORCESALVAGE flag
779          * and thereby invoking the salvager. scandisk obviously won't be
780          * doing this for us.
781          */
782         if (programType == fileServer) {
783             struct afs_stat status;
784             char salvpath[MAXPATHLEN];
785             strcpy(salvpath, entry.vp_dev);
786             strcat(salvpath, "\\FORCESALVAGE");
787             if (afs_stat(salvpath, &status) == 0) {
788                 Log("VAttachPartitions: Found %s; aborting\n", salvpath);
789                 exit(1);
790             }
791         }
792         VInitPartition(entry.vp_name, entry.vp_dev, *entry.vp_dev - 'A');
793     }
794     vpt_Finish(&iter);
795
796     /* Run through partition list and clear out the dupes. */
797     prevP = nextP = NULL;
798     for (partP = DiskPartitionList; partP; partP = nextP) {
799         nextP = partP->next;
800         if (partP->flags == PART_DUPLICATE) {
801             if (prevP)
802                 prevP->next = partP->next;
803             else
804                 DiskPartitionList = partP->next;
805             free(partP);
806         } else
807             prevP = partP;
808     }
809
810     return 0;
811 }
812 #endif
813
814 #ifdef AFS_LINUX22_ENV
815 int
816 VAttachPartitions(void)
817 {
818     int errors = 0;
819     FILE *mfd;
820     struct mntent *mntent;
821
822     if ((mfd = setmntent("/proc/mounts", "r")) == NULL) {
823         if ((mfd = setmntent("/etc/mtab", "r")) == NULL) {
824             Log("Problems in getting mount entries(setmntent)\n");
825             exit(-1);
826         }
827     }
828     while ((mntent = getmntent(mfd))) {
829         /* If we're going to always attach this partition, do it later. */
830         if (VIsAlwaysAttach(mntent->mnt_dir))
831             continue;
832
833         if (VCheckPartition(mntent->mnt_dir, mntent->mnt_fsname) < 0)
834             errors++;
835     }
836     endmntent(mfd);
837
838     /* Process the always-attach partitions, if any. */
839     VAttachPartitions2();
840
841     return errors;
842 }
843 #endif /* AFS_LINUX22_ENV */
844
845 /* This routine is to be called whenever the actual name of the partition
846  * is required. The canonical name is still in part->name.
847  */
848 char *
849 VPartitionPath(struct DiskPartition64 *part)
850 {
851 #ifdef AFS_NT40_ENV
852     return part->devName;
853 #else
854     return part->name;
855 #endif
856 }
857
858 /* get partition structure, abortp tells us if we should abort on failure */
859 struct DiskPartition64 *
860 VGetPartition_r(char *name, int abortp)
861 {
862     register struct DiskPartition64 *dp;
863 #ifdef AFS_DEMAND_ATTACH_FS
864     dp = VLookupPartition_r(name);
865 #else /* AFS_DEMAND_ATTACH_FS */
866     for (dp = DiskPartitionList; dp; dp = dp->next) {
867         if (strcmp(dp->name, name) == 0)
868             break;
869     }
870 #endif /* AFS_DEMAND_ATTACH_FS */
871     if (abortp)
872         assert(dp != NULL);
873     return dp;
874 }
875
876 struct DiskPartition64 *
877 VGetPartition(char *name, int abortp)
878 {
879     struct DiskPartition64 *retVal;
880     VOL_LOCK;
881     retVal = VGetPartition_r(name, abortp);
882     VOL_UNLOCK;
883     return retVal;
884 }
885
886 #ifdef AFS_NT40_ENV
887 void
888 VSetPartitionDiskUsage_r(register struct DiskPartition64 *dp)
889 {
890     ULARGE_INTEGER free_user, total, free_total;
891     int ufree, tot, tfree;
892
893     if (!GetDiskFreeSpaceEx
894         (VPartitionPath(dp), &free_user, &total, &free_total)) {
895         printf("Failed to get disk space info for %s, error = %d\n", dp->name,
896                GetLastError());
897         return;
898     }
899
900     /* Convert to 1K units. */
901     ufree = (int)Int64ShraMod32(free_user.QuadPart, 10);
902     tot = (int)Int64ShraMod32(total.QuadPart, 10);
903     tfree = (int)Int64ShraMod32(free_total.QuadPart, 10);
904
905     dp->minFree = tfree - ufree;        /* only used in VPrintDiskStats_r */
906     dp->totalUsable = tot;
907     dp->free = tfree;
908 }
909
910 #else
911 void
912 VSetPartitionDiskUsage_r(register struct DiskPartition64 *dp)
913 {
914     int bsize, code;
915     afs_int64 totalblks, free, used, availblks;
916     int reserved;
917 #ifdef afs_statvfs
918     struct afs_statvfs statbuf;
919 #else
920     struct afs_statfs statbuf;
921 #endif
922
923     if (dp->flags & PART_DONTUPDATE)
924         return;
925     /* Note:  we don't bother syncing because it's only an estimate, update
926      * is syncing every 30 seconds anyway, we only have to keep the disk
927      * approximately 10% from full--you just can't get the stuff in from
928      * the net fast enough to worry */
929 #ifdef afs_statvfs
930     code = afs_statvfs(dp->name, &statbuf);
931 #else
932     code = afs_statfs(dp->name, &statbuf);
933 #endif
934     if (code < 0) {
935         Log("statfs of %s failed in VSetPartitionDiskUsage (errno = %d)\n",
936             dp->name, errno);
937         return;
938     }
939     if (statbuf.f_blocks == -1) {       /* Undefined; skip stats.. */
940         Log("statfs of %s failed in VSetPartitionDiskUsage\n", dp->name);
941         return;
942     }
943     totalblks = statbuf.f_blocks;
944     free = statbuf.f_bfree;
945     reserved = free - statbuf.f_bavail;
946 #ifdef afs_statvfs
947     bsize = statbuf.f_frsize;
948 #else
949     bsize = statbuf.f_bsize;
950 #endif
951     availblks = totalblks - reserved;
952     dp->f_files = statbuf.f_files;      /* max # of files in partition */
953
954     /* Now free and totalblks are in fragment units, but we want them in
955      * 1K units.
956      */
957     if (bsize >= 1024) {
958         free *= (bsize / 1024);
959         totalblks *= (bsize / 1024);
960         availblks *= (bsize / 1024);
961         reserved *= (bsize / 1024);
962     } else {
963         free /= (1024 / bsize);
964         totalblks /= (1024 / bsize);
965         availblks /= (1024 / bsize);
966         reserved /= (1024 / bsize);
967     }
968     /* now compute remaining figures */
969     used = totalblks - free;
970
971     dp->minFree = reserved;     /* only used in VPrintDiskStats_r */
972     dp->totalUsable = availblks;
973     dp->free = availblks - used;        /* this is exactly f_bavail */
974 }
975 #endif /* AFS_NT40_ENV */
976
977 void
978 VSetPartitionDiskUsage(register struct DiskPartition64 *dp)
979 {
980     VOL_LOCK;
981     VSetPartitionDiskUsage_r(dp);
982     VOL_UNLOCK;
983 }
984
985 void
986 VResetDiskUsage_r(void)
987 {
988     struct DiskPartition64 *dp;
989     for (dp = DiskPartitionList; dp; dp = dp->next) {
990         VSetPartitionDiskUsage_r(dp);
991 #ifndef AFS_PTHREAD_ENV
992         IOMGR_Poll();
993 #endif /* !AFS_PTHREAD_ENV */
994     }
995 }
996
997 void
998 VResetDiskUsage(void)
999 {
1000     VOL_LOCK;
1001     VResetDiskUsage_r();
1002     VOL_UNLOCK;
1003 }
1004
1005 void
1006 VAdjustDiskUsage_r(Error * ec, Volume * vp, afs_sfsize_t blocks,
1007                    afs_sfsize_t checkBlocks)
1008 {
1009     *ec = 0;
1010     /* why blocks instead of checkBlocks in the check below?  Otherwise, any check
1011      * for less than BlocksSpare would skip the error-checking path, and we
1012      * could grow existing files forever, not just for another BlocksSpare
1013      * blocks. */
1014     if (blocks > 0) {
1015 #ifdef  AFS_AIX32_ENV
1016         afs_int32 rem, minavail;
1017
1018         if ((rem = vp->partition->free - checkBlocks) < (minavail =
1019                                                          (vp->partition->
1020                                                           totalUsable *
1021                                                           aixlow_water) /
1022                                                          100))
1023 #else
1024         if (vp->partition->free - checkBlocks < 0)
1025 #endif
1026             *ec = VDISKFULL;
1027         else if (V_maxquota(vp)
1028                  && V_diskused(vp) + checkBlocks > V_maxquota(vp))
1029             *ec = VOVERQUOTA;
1030     }
1031     vp->partition->free -= blocks;
1032     V_diskused(vp) += blocks;
1033 }
1034
1035 void
1036 VAdjustDiskUsage(Error * ec, Volume * vp, afs_sfsize_t blocks,
1037                  afs_sfsize_t checkBlocks)
1038 {
1039     VOL_LOCK;
1040     VAdjustDiskUsage_r(ec, vp, blocks, checkBlocks);
1041     VOL_UNLOCK;
1042 }
1043
1044 int
1045 VDiskUsage_r(Volume * vp, afs_sfsize_t blocks)
1046 {
1047     if (blocks > 0) {
1048 #ifdef  AFS_AIX32_ENV
1049         afs_int32 rem, minavail;
1050
1051         if ((rem = vp->partition->free - blocks) < (minavail =
1052                                                     (vp->partition->
1053                                                      totalUsable *
1054                                                      aixlow_water) / 100))
1055 #else
1056         if (vp->partition->free - blocks < 0)
1057 #endif
1058             return (VDISKFULL);
1059     }
1060     vp->partition->free -= blocks;
1061     return 0;
1062 }
1063
1064 int
1065 VDiskUsage(Volume * vp, afs_sfsize_t blocks)
1066 {
1067     int retVal;
1068     VOL_LOCK;
1069     retVal = VDiskUsage_r(vp, blocks);
1070     VOL_UNLOCK;
1071     return retVal;
1072 }
1073
1074 void
1075 VPrintDiskStats_r(void)
1076 {
1077     struct DiskPartition64 *dp;
1078     for (dp = DiskPartitionList; dp; dp = dp->next) {
1079         Log("Partition %s: %d available 1K blocks (minfree=%d), ", dp->name,
1080             dp->totalUsable, dp->minFree);
1081         if (dp->free < 0)
1082             Log("overallocated by %d blocks\n", -dp->free);
1083         else
1084             Log("%d free blocks\n", dp->free);
1085     }
1086 }
1087
1088 void
1089 VPrintDiskStats(void)
1090 {
1091     VOL_LOCK;
1092     VPrintDiskStats_r();
1093     VOL_UNLOCK;
1094 }
1095
1096 #ifdef AFS_NT40_ENV
1097 /* Need a separate lock file on NT, since NT only has mandatory file locks. */
1098 #define LOCKFILE "LOCKFILE"
1099 void
1100 VLockPartition_r(char *name)
1101 {
1102     struct DiskPartition64 *dp = VGetPartition_r(name, 0);
1103     OVERLAPPED lap;
1104
1105     if (!dp)
1106         return;
1107     if (dp->lock_fd == INVALID_FD) {
1108         char path[64];
1109         int rc;
1110         (void)sprintf(path, "%s\\%s", VPartitionPath(dp), LOCKFILE);
1111         dp->lock_fd =
1112             (FD_t)CreateFile(path, GENERIC_WRITE,
1113                             FILE_SHARE_READ | FILE_SHARE_WRITE, NULL,
1114                             CREATE_ALWAYS, FILE_ATTRIBUTE_HIDDEN, NULL);
1115         assert(dp->lock_fd != INVALID_FD);
1116
1117         memset(&lap, 0, sizeof(lap));
1118         rc = LockFileEx((HANDLE) dp->lock_fd, LOCKFILE_EXCLUSIVE_LOCK, 0, 1,
1119                         0, &lap);
1120         assert(rc);
1121     }
1122 }
1123
1124 void
1125 VUnlockPartition_r(char *name)
1126 {
1127     register struct DiskPartition64 *dp = VGetPartition_r(name, 0);
1128     OVERLAPPED lap;
1129
1130     if (!dp)
1131         return;                 /* no partition, will fail later */
1132     memset(&lap, 0, sizeof(lap));
1133
1134     UnlockFileEx((HANDLE) dp->lock_fd, 0, 1, 0, &lap);
1135     CloseHandle((HANDLE) dp->lock_fd);
1136     dp->lock_fd = INVALID_FD;
1137 }
1138 #else /* AFS_NT40_ENV */
1139
1140 #if defined(AFS_HPUX_ENV)
1141 #define BITS_PER_CHAR   (8)
1142 #define BITS(type)      (sizeof(type) * BITS_PER_CHAR)
1143
1144 #define LOCKRDONLY_OFFSET       ((PRIV_LOCKRDONLY - 1) / BITS(int))
1145 #endif /* defined(AFS_HPUX_ENV) */
1146
1147 void
1148 VLockPartition_r(char *name)
1149 {
1150     register struct DiskPartition64 *dp = VGetPartition_r(name, 0);
1151     char *partitionName;
1152     int retries, code;
1153     struct timeval pausing;
1154 #if defined(AFS_HPUX_ENV)
1155     int lockfRtn;
1156     struct privgrp_map privGrpList[PRIV_MAXGRPS];
1157     unsigned int *globalMask;
1158     int globalMaskIndex;
1159 #endif /* defined(AFS_HPUX_ENV) */
1160 #if defined(AFS_DARWIN_ENV)
1161     char lockfile[MAXPATHLEN];
1162 #endif /* defined(AFS_DARWIN_ENV) */
1163 #ifdef AFS_NAMEI_ENV
1164 #ifdef AFS_AIX42_ENV
1165     char LockFileName[MAXPATHLEN + 1];
1166
1167     sprintf((char *)&LockFileName, "%s/AFSINODE_FSLock", name);
1168     partitionName = (char *)&LockFileName;
1169 #endif
1170 #endif
1171
1172     if (!dp)
1173         return;                 /* no partition, will fail later */
1174     if (dp->lock_fd != -1)
1175         return;
1176
1177 #if    defined(AFS_SUN5_ENV) || defined(AFS_AIX41_ENV)
1178 #if !defined(AFS_AIX42_ENV) || !defined(AFS_NAMEI_ENV)
1179     partitionName = dp->devName;
1180 #endif
1181     code = O_RDWR;
1182 #elif defined(AFS_DARWIN_ENV)
1183     strlcpy((partitionName = lockfile), dp->name, sizeof(lockfile));
1184     strlcat(lockfile, "/.lock.afs", sizeof(lockfile));
1185     code = O_RDONLY | O_CREAT;
1186 #else
1187     partitionName = dp->name;
1188     code = O_RDONLY;
1189 #endif
1190
1191     for (retries = 25; retries; retries--) {
1192         dp->lock_fd = afs_open(partitionName, code);
1193         if (dp->lock_fd != -1)
1194             break;
1195         if (errno == ENOENT)
1196             code |= O_CREAT;
1197         pausing.tv_sec = 0;
1198         pausing.tv_usec = 500000;
1199         select(0, NULL, NULL, NULL, &pausing);
1200     }
1201     assert(retries != 0);
1202
1203 #if defined (AFS_HPUX_ENV)
1204
1205     assert(getprivgrp(privGrpList) == 0);
1206
1207     /*
1208      * In general, it will difficult and time-consuming ,if not impossible,
1209      * to try to find the privgroup to which this process belongs that has the
1210      * smallest membership, to minimise the security hole.  So, we use the privgrp
1211      * to which everybody belongs.
1212      */
1213     /* first, we have to find the global mask */
1214     for (globalMaskIndex = 0; globalMaskIndex < PRIV_MAXGRPS;
1215          globalMaskIndex++) {
1216         if (privGrpList[globalMaskIndex].priv_groupno == PRIV_GLOBAL) {
1217             globalMask =
1218                 &(privGrpList[globalMaskIndex].priv_mask[LOCKRDONLY_OFFSET]);
1219             break;
1220         }
1221     }
1222
1223     if (((*globalMask) & privmask(PRIV_LOCKRDONLY)) == 0) {
1224         /* allow everybody to set a lock on a read-only file descriptor */
1225         (*globalMask) |= privmask(PRIV_LOCKRDONLY);
1226         assert(setprivgrp(PRIV_GLOBAL, privGrpList[globalMaskIndex].priv_mask)
1227                == 0);
1228
1229         lockfRtn = lockf(dp->lock_fd, F_LOCK, 0);
1230
1231         /* remove the privilege granted to everybody to lock a read-only fd */
1232         (*globalMask) &= ~(privmask(PRIV_LOCKRDONLY));
1233         assert(setprivgrp(PRIV_GLOBAL, privGrpList[globalMaskIndex].priv_mask)
1234                == 0);
1235     } else {
1236         /* in this case, we should be able to do this with impunity, anyway */
1237         lockfRtn = lockf(dp->lock_fd, F_LOCK, 0);
1238     }
1239
1240     assert(lockfRtn != -1);
1241 #else
1242 #if defined(AFS_AIX_ENV) || defined(AFS_SUN5_ENV)
1243     assert(lockf(dp->lock_fd, F_LOCK, 0) != -1);
1244 #else
1245     assert(flock(dp->lock_fd, LOCK_EX) == 0);
1246 #endif /* defined(AFS_AIX_ENV) || defined(AFS_SUN5_ENV) */
1247 #endif
1248 }
1249
1250 void
1251 VUnlockPartition_r(char *name)
1252 {
1253     register struct DiskPartition64 *dp = VGetPartition_r(name, 0);
1254     if (!dp)
1255         return;                 /* no partition, will fail later */
1256     close(dp->lock_fd);
1257     dp->lock_fd = -1;
1258 }
1259
1260 #endif /* AFS_NT40_ENV */
1261
1262 void
1263 VLockPartition(char *name)
1264 {
1265     VOL_LOCK;
1266     VLockPartition_r(name);
1267     VOL_UNLOCK;
1268 }
1269
1270 void
1271 VUnlockPartition(char *name)
1272 {
1273     VOL_LOCK;
1274     VUnlockPartition_r(name);
1275     VOL_UNLOCK;
1276 }
1277
1278 #ifdef AFS_DEMAND_ATTACH_FS
1279
1280 /* XXX not sure this will work on AFS_NT40_ENV
1281  * needs to be tested!
1282  */
1283
1284 /**
1285  * lookup a disk partition object by its index number.
1286  *
1287  * @param[in] id      partition index number
1288  * @param[in] abortp  see abortp usage note below
1289  *
1290  * @return disk partition object
1291  *   @retval NULL no such disk partition
1292  *
1293  * @note when abortp is non-zero, lookups which would return
1294  *       NULL will result in an assertion failure
1295  *
1296  * @pre VOL_LOCK must be held
1297  *
1298  * @internal volume package internal use only
1299  */
1300
1301 struct DiskPartition64 * 
1302 VGetPartitionById_r(afs_int32 id, int abortp)
1303 {
1304     struct DiskPartition64 *dp = NULL;
1305
1306     if ((id >= 0) && (id <= VOLMAXPARTS)) {
1307         dp = DiskPartitionTable[id];
1308     }
1309
1310     if (abortp) {
1311         assert(dp != NULL);
1312     }
1313     return dp;
1314 }
1315
1316 /**
1317  * lookup a disk partition object by its index number.
1318  *
1319  * @param[in] id      partition index number
1320  * @param[in] abortp  see abortp usage note below
1321  *
1322  * @return disk partition object
1323  *   @retval NULL no such disk partition
1324  *
1325  * @note when abortp is non-zero, lookups which would return
1326  *       NULL will result in an assertion failure
1327  */
1328
1329 struct DiskPartition64 *
1330 VGetPartitionById(afs_int32 id, int abortp)
1331 {
1332     struct DiskPartition64 * dp;
1333
1334     VOL_LOCK;
1335     dp = VGetPartitionById_r(id, abortp);
1336     VOL_UNLOCK;
1337
1338     return dp;
1339 }
1340
1341 static struct DiskPartition64 * 
1342 VLookupPartition_r(char * path)
1343 {
1344     afs_int32 id = volutil_GetPartitionID(path);
1345
1346     if (id < 0 || id > VOLMAXPARTS)
1347         return NULL;
1348
1349     return DiskPartitionTable[id];
1350 }
1351
1352 static void 
1353 AddPartitionToTable_r(struct DiskPartition64 *dp)
1354 {
1355     assert(dp->index >= 0 && dp->index <= VOLMAXPARTS);
1356     DiskPartitionTable[dp->index] = dp;
1357 }
1358
1359 #if 0
1360 static void 
1361 DeletePartitionFromTable_r(struct DiskPartition64 *dp)
1362 {
1363     assert(dp->index >= 0 && dp->index <= VOLMAXPARTS);
1364     DiskPartitionTable[dp->index] = NULL;
1365 }
1366 #endif
1367 #endif /* AFS_DEMAND_ATTACH_FS */