5c2c832e1b82575942886b043c61032722b58114
[openafs.git] / src / afs / afs.h
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #ifndef _AFS_H_
11 #define _AFS_H_
12 /*
13  * AFS system call opcodes
14  */
15 #ifdef KDUMP_KERNEL
16 #include <afs/afs_args.h>
17 #include <afs/afs_consts.h>
18 #else
19 #include "afs/afs_args.h"
20 #include "afs/afs_consts.h"
21 #endif
22
23 /*
24  * afs_fsfragsize cannot be less than 1023, or some cache-tracking
25  * calculations will be incorrect (since we track cache usage in kb).
26  * Some filesystems have fundamental blocksizes less than 1k, and
27  * normally we would tune afs_fsfragsize to be fragsize-1, but we must
28  * make sure to check that afs_fsfragsize does not go below this value.
29  */
30 #define AFS_MIN_FRAGSIZE 1023
31
32 /* Upper bound on number of iovecs out uio routines will deal with. */
33 #define AFS_MAXIOVCNT       16
34
35
36 extern int afs_shuttingdown;
37
38 /*
39  * Macros to uniquely identify the AFS vfs struct
40  */
41 #define AFS_VFSMAGIC            0x1234
42 #if defined(AFS_SUN5_ENV) || defined(AFS_HPUX90_ENV) || defined(AFS_LINUX20_ENV)
43 #define AFS_VFSFSID             99
44 #else
45 #if defined(AFS_SGI_ENV)
46 #define AFS_VFSFSID             afs_fstype
47 #else
48 #define AFS_VFSFSID             AFS_MOUNT_AFS
49 #endif
50 #endif
51
52 /* Moved from VNOPS/afs_vnop_flocks so can be used in prototypes */
53 #if     defined(AFS_HPUX102_ENV)
54 #define AFS_FLOCK       k_flock
55 #else
56 #if     defined(AFS_SUN56_ENV) || (defined(AFS_LINUX24_ENV) && !(defined(AFS_LINUX26_ENV) && defined(AFS_LINUX_64BIT_KERNEL)))
57 #define AFS_FLOCK       flock64
58 #else
59 #define AFS_FLOCK       flock
60 #endif /* AFS_SUN65_ENV */
61 #endif /* AFS_HPUX102_ENV */
62
63 /* The following are various levels of afs debugging */
64 #define AFSDEB_GENERAL          1       /* Standard debugging */
65 #define AFSDEB_NETWORK          2       /* low level afs networking */
66 #define AFSDEB_RX               4       /* RX debugging */
67 #define AFSDEB_VNLAYER          8       /* interface layer to AFS (aixops, gfsops, etc) */
68
69 /* generic undefined vice id */
70 #define UNDEFVID            (-1)
71
72 /* The basic defines for the Andrew file system
73     better keep things powers of two so "& (foo-1)" hack works for masking bits */
74 #define NBRS            15      /* max number of queued daemon requests */
75 #define NUSERS          16      /* hash table size for unixuser table */
76 #define NSERVERS        16      /* hash table size for server table */
77 #define NVOLS           64      /* hash table size for volume table */
78 #define NFENTRIES       256     /* hash table size for disk volume table */
79 #define VCSIZE         1024     /* stat cache hash table size */
80 #define DCSIZE          512     /* disk cache hash table size */
81 #define CBRSIZE         512     /* call back returns hash table size */
82 #define PIGGYSIZE       1350    /* max piggyback size */
83 #define MAXVOLS         128     /* max vols we can store */
84 #define MAXSYSNAME      128     /* max sysname (i.e. @sys) size */
85 #define MAXNUMSYSNAMES  32      /* max that current constants allow */
86 #define NOTOKTIMEOUT    (2*3600)        /* time after which to timeout conns sans tokens */
87 #define NOPAG           0xffffffff
88 #define AFS_NCBRS       1024    /* max # of call back return entries */
89 #define AFS_MAXCBRSCALL 32      /* max to return in a given call (must be <= AFSCBMAX) */
90 #define AFS_SALLOC_LOW_WATER    250     /* Min free blocks before allocating more */
91 #define AFS_LRALLOCSIZ  4096    /* "Large" allocated size */
92 #define VCACHE_FREE     5
93 #define AFS_NRXPACKETS  80
94 #define AFS_RXDEADTIME  50
95 #define AFS_HARDDEADTIME        120
96 #define AFS_IDLEDEADTIME        50
97 #define AFS_BLKBITS     12
98 #define AFS_BLKSIZE     (1 << AFS_BLKBITS)
99
100 extern afs_int32 afs_rx_deadtime;
101 extern afs_int32 afs_rx_harddead;
102 extern afs_int32 afs_rx_idledead;
103
104 struct sysname_info {
105     char *name;
106     short offset;
107     signed char index, allocked;
108 };
109
110 /* flags to use with AFSOP_CACHEINIT */
111 #define AFSCALL_INIT_MEMCACHE        0x1        /* use a memory-based cache */
112
113 /* below here used only for kernel procedures */
114 #ifdef KERNEL
115 /* Store synchrony flags - SYNC means that data should be forced to server's
116  * disk immediately upon completion. */
117 #define AFS_ASYNC       0
118 #define AFS_SYNC        1
119 #define AFS_VMSYNC_INVAL 2      /* sync and invalidate pages */
120 #define AFS_LASTSTORE   4
121 #define AFS_VMSYNC      8       /* sync pages but do not invalidate */
122
123 /* background request structure */
124 #define BPARMS          4
125
126 #define BOP_NOOP        0       /* leave 0 unused */
127 #define BOP_FETCH       1       /* parm1 is chunk to get */
128 #define BOP_STORE       2       /* parm1 is chunk to store */
129 #define BOP_PATH        3       /* parm1 is path, parm2 is chunk to fetch */
130
131 #if defined(AFS_CACHE_BYPASS)
132 #define BOP_FETCH_NOCACHE       4   /* parms are: vnode ptr, offset, segment ptr, addr, cred ptr */
133 #endif
134 #ifdef AFS_DARWIN_ENV
135 #define BOP_MOVE        5        /* ptr1 afs_uspc_param ptr2 sname ptr3 dname */
136 #endif
137
138 #define B_DONTWAIT      1       /* On failure return; don't wait */
139
140 /* protocol is: refCount is incremented by user to take block out of free pool.
141     Next, BSTARTED is set when daemon finds request.  This prevents
142     other daemons from picking up the same request.  Finally, when
143     request is done, refCount is zeroed.  BDONE and BWAIT are used by
144     dudes waiting for operation to proceed to a certain point before returning.
145 */
146 #define BSTARTED        1       /* request picked up by a daemon */
147 #define BUVALID         2       /* code is valid (store) */
148 #define BUWAIT          4       /* someone is waiting for BUVALID */
149 struct brequest {
150     struct vcache *vc;          /* vnode to use, with vrefcount bumped */
151     afs_ucred_t *cred;  /* credentials to use for operation */
152     afs_size_t size_parm[BPARMS];       /* random parameters */
153     void *ptr_parm[BPARMS];     /* pointer parameters */
154     afs_int32 code;             /* return code */
155     short refCount;             /* use counter for this structure */
156     char opcode;                /* what to do (store, fetch, etc) */
157     char flags;                 /* free, etc */
158     afs_int32 ts;               /* counter "timestamp" */
159 };
160
161 struct SecretToken {
162     char data[56];
163 };
164
165 struct ClearToken {
166     afs_int32 AuthHandle;
167     char HandShakeKey[8];
168     afs_int32 ViceId;
169     afs_int32 BeginTimestamp;
170     afs_int32 EndTimestamp;
171 };
172
173 struct VenusFid {
174     afs_int32 Cell;             /* better sun packing if at end of structure */
175     struct AFSFid Fid;
176 };
177
178 /* Temporary struct to be passed between afs_fid and afs_vget; in SunOS4.x we can only pass a maximum of 10 bytes for a handle (we ideally need 16!) */
179 struct SmallFid {
180     afs_int32 Volume;
181     afs_int32 CellAndUnique;
182     u_short Vnode;
183 };
184 /* The actual number of bytes in the SmallFid, not the sizeof struct. */
185 #define SIZEOF_SMALLFID 10
186
187 /* Queues
188  * ------
189  *
190  *  Circular queues, implemented with pointers. Structures may contain as many
191  *  queues as required, which may be located at any point within the structure,
192  *  providing the QEntry macro is used to translate between a queue pointer, and
193  *  the address of its containing structure
194  */
195
196 struct afs_q {
197     struct afs_q *next;
198     struct afs_q *prev;
199 };
200
201 #define QZero(e)    ((e)->prev = (e)->next = NULL)
202 #define QInit(q)    ((q)->prev = (q)->next = (q))
203 #define QAdd(q,e)   ((e)->next = (q)->next, (e)->prev = (q), \
204                         (q)->next->prev = (e), (q)->next = (e))
205 #define QRemove(e)  ((e)->next->prev = (e)->prev, (e)->prev->next = (e)->next, (e)->prev = NULL, (e)->next = NULL)
206 #define QNext(e)    ((e)->next)
207 #define QPrev(e)    ((e)->prev)
208 #define QEmpty(q)   ((q)->prev == (q))
209 /* this one takes q1 and sticks it on the end of q2 - that is, the other end, not the end
210  * that things are added onto.  q1 shouldn't be empty, it's silly */
211 #define QCat(q1,q2) ((q2)->prev->next = (q1)->next, (q1)->next->prev=(q2)->prev, (q1)->prev->next=(q2), (q2)->prev=(q1)->prev, (q1)->prev=(q1)->next=(q1))
212
213 /* Given a pointer to an afs_q within a structure, go back to the address of
214  * the parent structure
215  */
216
217 #define QEntry(queue, structure, member) \
218         ((structure *)((char *)(queue)-(char *)(&((structure *)NULL)->member)))
219
220 /* And implement operations for individual lists in terms of the above macro */
221
222 #define QTOV(e)     QEntry(e, struct vcache, vlruq)
223 #define QTOC(e)     QEntry(e, struct cell, lruq)
224 #define QTOVH(e)    QEntry(e, struct vcache, vhashq)
225
226 /*!
227  * List of free slot numbers
228  */
229 struct afs_slotlist {
230     afs_uint32 slot;
231     struct afs_slotlist *next;
232 };
233
234 struct vrequest {
235     afs_int32 uid;              /* user id making the request */
236     afs_int32 busyCount;        /* how many busies we've seen so far */
237     afs_int32 flags;            /* things like O_SYNC, O_NONBLOCK go here */
238     char initd;                 /* if non-zero, Error fields meaningful */
239     char accessError;           /* flags for overriding error return code */
240     char volumeError;           /* encountered a missing or busy volume */
241     char networkError;          /* encountered network problems */
242     char permWriteError;        /* fileserver returns permenent error. */
243     char tokenError;            /* a token error other than expired. */
244     char idleError;             /* the server idled too long */
245     char skipserver[AFS_MAXHOSTS];
246 };
247 #define VOLMISSING 1
248 #define VOLBUSY 2
249
250 /* structure linked off of a server to keep track of queued returned
251  * callbacks.  Sent asynchronously when we run a little low on free dudes.
252  */
253 struct afs_cbr {
254     struct afs_cbr **pprev;
255     struct afs_cbr *next;
256
257     struct afs_cbr **hash_pprev;
258     struct afs_cbr *hash_next;
259
260     struct AFSFid fid;
261     unsigned int dynalloc:1;
262 };
263
264 /* cellinfo file magic number */
265 #define AFS_CELLINFO_MAGIC      0xf32817cd
266
267 /* cell flags */
268 #define CNoSUID                 0x02    /* disable suid bit for this cell */
269 #define CLinkedCell4            0x04    /* reserved for ADDCELL2 pioctl */
270 #define CNoAFSDB                0x08    /* never bother trying AFSDB */
271 #define CHasVolRef              0x10    /* volumes were referenced */
272 #define CLinkedCell             0x20    /* has a linked cell in lcellp */
273 #define CHush                   0x40    /* don't display until referenced */
274
275 struct cell {
276     struct afs_q lruq;          /* lru q next and prev */
277     char *cellName;             /* char string name of cell */
278     afs_int32 cellIndex;        /* sequence number */
279     afs_int32 cellNum;          /* semi-permanent cell number */
280     struct server *cellHosts[AFS_MAXCELLHOSTS]; /* volume *location* hosts */
281     struct cell *lcellp;        /* Associated linked cell */
282     u_short fsport;             /* file server port */
283     u_short vlport;             /* volume server port */
284     short states;               /* state flags */
285     time_t timeout;             /* data expire time, if non-zero */
286     struct cell_name *cnamep;   /* pointer to our cell_name */
287     afs_rwlock_t lock;          /* protects cell data */
288     unsigned char cellHandle[16];       /* deterministic handle for this cell */
289 };
290
291 struct cell_name {
292     struct cell_name *next;
293     afs_int32 cellnum;
294     char *cellname;
295     char used;
296 };
297
298 struct cell_alias {
299     struct cell_alias *next;
300     afs_int32 index;
301     char *alias;
302     char *cell;
303 };
304
305 #define afs_PutCell(cellp, locktype)
306
307 /* the unixuser flag bit definitions */
308 #define UHasTokens      1       /* are the st and ct fields valid (ever set)? */
309 #define UTokensBad      2       /* are tokens bad? */
310 #define UPrimary        4       /* on iff primary identity */
311 #define UNeedsReset     8       /* needs afs_ResetAccessCache call done */
312 #define UPAGCounted    16       /* entry seen during PAG search (for stats) */
313 #define UNFSGetCreds   32       /* getting creds for NFS client */
314 /* A flag used by afs_GCPAGs to keep track of
315  * which entries in afs_users need to be deleted.
316  * The lifetime of its presence in the table is the
317  * lifetime of the afs_GCPAGs function.
318  */
319 #define TMP_UPAGNotReferenced   128
320
321 /* unixuser notify events */
322 #define UTokensObtained 1
323 #define UTokensDropped  2
324
325 /* values for afs_gcpags */
326 enum { AFS_GCPAGS_NOTCOMPILED = 0, AFS_GCPAGS_OK =
327         1, AFS_GCPAGS_USERDISABLED, AFS_GCPAGS_EPROC0, AFS_GCPAGS_EPROCN,
328     AFS_GCPAGS_EEQPID, AFS_GCPAGS_EINEXACT, AFS_GCPAGS_EPROCEND,
329     AFS_GCPAGS_EPROCWALK, AFS_GCPAGS_ECREDWALK, AFS_GCPAGS_EPIDCHECK,
330     AFS_GCPAGS_ENICECHECK
331 };
332
333 extern afs_int32 afs_gcpags;
334 extern afs_int32 afs_gcpags_procsize;
335 extern afs_int32 afs_bkvolpref;
336 extern char afs_cachebasedir[1024];
337 extern afs_int32 afs_numcachefiles;
338 extern afs_int32 afs_numfilesperdir;
339
340 struct rxkadToken {
341     afs_int32 ticketLen;
342     char * ticket;
343     struct ClearToken clearToken;
344 };
345
346 union tokenUnion {
347     struct rxkadToken rxkad;
348 };
349
350 struct tokenJar {
351     struct tokenJar *next;
352     int type;
353     union tokenUnion content;
354 };
355
356 struct unixuser {
357     struct unixuser *next;      /* next hash pointer */
358     afs_int32 uid;              /* search based on uid and cell */
359     afs_int32 cell;
360     afs_int32 viceId;           /* Optional viced ID corresponding to current tokens */
361     short refCount;             /* reference count for allocation */
362     char states;                /* flag info */
363     afs_int32 tokenTime;        /* last time tokens were set, used for timing out conn data */
364     struct tokenJar *tokens;
365     struct afs_exporter *exporter;      /* more info about the exporter for the remote user */
366     void *cellinfo;             /* pointer to cell info (PAG manager only) */
367 };
368
369 struct afs_conn {
370     /* Per-connection block. */
371     struct afs_conn *next;              /* Next dude same server. */
372     struct unixuser *user;      /* user validated with respect to. */
373     struct rx_connection *id;   /* RPC connid. */
374     struct srvAddr *srvr;       /* server associated with this conn */
375     short refCount;             /* reference count for allocation */
376     unsigned short port;        /* port associated with this connection */
377     char forceConnectFS;        /* Should we try again with these tokens? */
378 };
379
380
381 #define SQNULL -1
382
383 /* Fid comparison routines */
384 #define FidCmp(a,b) ((a)->Fid.Unique != (b)->Fid.Unique \
385     || (a)->Fid.Vnode != (b)->Fid.Vnode \
386     || (a)->Fid.Volume != (b)->Fid.Volume \
387     || (a)->Cell != (b)->Cell)
388
389 #define FidMatches(afid,tvc) ((tvc)->f.fid.Fid.Vnode == (afid)->Fid.Vnode && \
390         (tvc)->f.fid.Fid.Volume == (afid)->Fid.Volume && \
391         (tvc)->f.fid.Cell == (afid)->Cell && \
392         ( (tvc)->f.fid.Fid.Unique == (afid)->Fid.Unique || \
393          (!(afid)->Fid.Unique && ((tvc)->f.states & CUnique))))
394
395
396 #define SRVADDR_MH      1
397 #define SRVADDR_ISDOWN  0x20    /* same as SRVR_ISDOWN */
398 #define  SRVADDR_NOUSE    0x40  /* Don't use this srvAddr */
399 struct srvAddr {
400     struct srvAddr *next_bkt;   /* next item in hash bucket */
401     struct srvAddr *next_sa;    /* another interface on same host */
402     struct server *server;      /* back to parent */
403     struct afs_conn *conns;             /* All user connections to this server */
404     afs_int32 sa_ip;            /* Host addr in network byte order */
405     u_short sa_iprank;          /* indiv ip address priority */
406     u_short sa_portal;          /* port addr in network byte order */
407     u_char sa_flags;
408 };
409
410 /*
411  * Values used in the flags field of the server structure below.
412  *
413  *      AFS_SERVER_FLAG_ACTIVATED Has the server ever had a user connection
414  *                                associated with it?
415  */
416 #define AFS_SERVER_FLAG_ACTIVATED       0x01
417 #define SNO_LHOSTS                      0x04
418 #define SYES_LHOSTS                     0x08
419 #define SVLSRV_UUID                     0x10
420 #define SRVR_ISDOWN                     0x20
421 #define SRVR_MULTIHOMED                 0x40
422 #define SRVR_ISGONE                     0x80
423 #define SNO_INLINEBULK                  0x100
424 #define SNO_64BIT                       0x200
425 #define SCAPS_KNOWN                     0x400
426
427 #define SRV_CAPABILITIES(ts) \
428 { if ( !(ts->flags & SCAPS_KNOWN)) afs_GetCapabilities(ts); ts->capabilities; }
429
430 #define afs_serverSetNo64Bit(s) ((s)->srvr->server->flags |= SNO_64BIT)
431 #define afs_serverHasNo64Bit(s) ((s)->srvr->server->flags & SNO_64BIT)
432
433 struct server {
434     union {
435         struct {
436             afsUUID suuid;
437             afs_int32 addr_uniquifier;
438             afs_int32 spares[2];
439         } _srvUuid;
440         struct {
441             struct srvAddr haddr;
442         } _srvId;
443     } _suid;
444 #define sr_uuid         _suid._srvUuid.suuid
445 #define sr_addr_uniquifier      _suid._srvUuid.addr_uniquifier
446 #define sr_host         _suid._srvId.haddr.ip
447 #define sr_portal       _suid._srvId.haddr.portal
448 #define sr_rank         _suid._srvId.haddr.ip_rank
449 #define sr_flags        _suid._srvId.haddr.flags
450 #define sr_conns        _suid._srvId.haddr.conns
451     struct server *next;        /* Ptr to next server in hash chain */
452     struct cell *cell;          /* Cell in which this host resides */
453     struct afs_cbr *cbrs;       /* Return list of callbacks */
454     afs_int32 activationTime;   /* Time when this record was first activated */
455     afs_int32 lastDowntimeStart;        /* Time when last downtime incident began */
456     afs_int32 numDowntimeIncidents;     /* # (completed) downtime incidents */
457     afs_int32 sumOfDowntimes;   /* Total downtime experienced, in seconds */
458     struct srvAddr *addr;
459     afs_uint32 flags;           /* Misc flags */
460     afs_int32 capabilities;
461 };
462
463 #define afs_PutServer(servp, locktype)
464
465 /* structs for some pioctls  - these are (or should be)
466  * also in venus.h
467  */
468 struct spref {
469     struct in_addr host;
470     unsigned short rank;
471 };
472
473 struct sprefrequest_33 {
474     unsigned short offset;
475     unsigned short num_servers;
476 };
477
478
479 struct sprefrequest {           /* new struct for 3.4 */
480     unsigned short offset;
481     unsigned short num_servers;
482     unsigned short flags;
483 };
484 #define DBservers 1
485
486 struct sprefinfo {
487     unsigned short next_offset;
488     unsigned short num_servers;
489     struct spref servers[1];    /* we overrun this array intentionally... */
490 };
491
492 struct setspref {
493     unsigned short flags;
494     unsigned short num_servers;
495     struct spref servers[1];    /* we overrun this array intentionally... */
496 };
497 /* struct for GAG pioctl
498  */
499 struct gaginfo {
500     afs_uint32 showflags, logflags, logwritethruflag, spare[3];
501     unsigned char spare2[128];
502 };
503 #define GAGUSER    1
504 #define GAGCONSOLE 2
505 #define logwritethruON  1
506
507 struct rxparams {
508     afs_int32 rx_initReceiveWindow, rx_maxReceiveWindow, rx_initSendWindow,
509         rx_maxSendWindow, rxi_nSendFrags, rxi_nRecvFrags, rxi_OrphanFragSize;
510     afs_int32 rx_maxReceiveSize, rx_MyMaxSendSize;
511     afs_uint32 spare[21];
512 };
513
514 /* struct for checkservers */
515
516 struct chservinfo {
517     int magic;
518     char tbuffer[128];
519     int tsize;
520     afs_int32 tinterval;
521     afs_int32 tflags;
522 };
523
524
525 /* state bits for volume */
526 #define VRO                     1       /* volume is readonly */
527 #define VRecheck                2       /* recheck volume info with server */
528 #define VBackup                 4       /* is this a backup volume? */
529 #define VForeign                8       /* this is a non-afs volume */
530 #define VResort         16      /* server order was rearranged, sort when able */
531 #define VMoreReps       32      /* This volume has more replicas than we are   */
532                              /* keeping track of now -- check with VLDB     */
533
534 enum repstate { not_busy, end_not_busy = 6, rd_busy, rdwr_busy, offline };
535
536 struct volume {
537     /* One structure per volume, describing where the volume is located
538      * and where its mount points are. */
539     struct volume *next;        /* Next volume in hash list. */
540     afs_int32 cell;             /* the cell in which the volume resides */
541     afs_rwlock_t lock;          /* the lock for this structure */
542     afs_int32 volume;           /* This volume's ID number. */
543     char *name;                 /* This volume's name, or 0 if unknown */
544     struct server *serverHost[AFS_MAXHOSTS];    /* servers serving this volume */
545     enum repstate status[AFS_MAXHOSTS]; /* busy, offline, etc */
546     struct VenusFid dotdot;     /* dir to access as .. */
547     struct VenusFid mtpoint;    /* The mount point for this volume. */
548     afs_int32 rootVnode, rootUnique;    /* Volume's root fid */
549     afs_int32 roVol;
550     afs_int32 backVol;
551     afs_int32 rwVol;            /* For r/o vols, original read/write volume. */
552     afs_int32 accessTime;       /* last time we used it */
553     afs_int32 vtix;             /* volume table index */
554     afs_int32 copyDate;         /* copyDate field, for tracking vol releases */
555     afs_int32 expireTime;       /* for per-volume callbacks... */
556     short refCount;             /* reference count for allocation */
557     char states;                /* here for alignment reasons */
558 };
559
560 #define afs_PutVolume(av, locktype) ((av)->refCount--)
561
562 /* format of an entry in volume info file */
563 struct fvolume {
564     afs_int32 cell;             /* cell for this entry */
565     afs_int32 volume;           /* volume */
566     afs_int32 next;             /* has index */
567     struct VenusFid dotdot;     /* .. value */
568     struct VenusFid mtpoint;    /* mt point's fid */
569     afs_int32 rootVnode, rootUnique;    /* Volume's root fid */
570 };
571
572 struct SimpleLocks {
573     struct SimpleLocks *next;
574     int type;
575     afs_int32 boff, eoff;
576     afs_int32 pid;
577 #if     defined(AFS_AIX32_ENV) || defined(AFS_SUN5_ENV) || defined(AFS_SGI_ENV)
578     afs_int32 sysid;
579 #endif
580 };
581
582 /* vcache state bits */
583 #define CStatd          0x00000001      /* has this file ever been stat'd? */
584 #define CBackup         0x00000002      /* file is on a backup volume */
585 #define CRO             0x00000004      /* is it on a read-only volume */
586 #define CMValid         0x00000008      /* is the mount point info valid? */
587 #define CCore           0x00000010      /* storing a core file, needed since we don't get an open */
588 #define CDirty          0x00000020      /* file has been modified since first open (... O_RDWR) */
589 #define CSafeStore      0x00000040      /* close must wait for store to finish (should be in fd) */
590 #define CMAPPED         0x00000080      /* Mapped files; primarily used by SunOS 4.0.x */
591 #define CNSHARE         0x00000100      /* support O_NSHARE semantics */
592 #define CLied           0x00000200
593 #define CTruth          0x00000400
594
595 #if defined(AFS_DARWIN80_ENV)
596 #define CDeadVnode        0x00000800
597 #elif defined(AFS_DARWIN_ENV)
598 #define CUBCinit        0x00000800
599 #else
600 #define CWRITE_IGN      0x00000800      /* Next OS hack only */
601 #endif
602
603 #define CUnique         0x00001000      /* vc's uniquifier - latest unifiquier for fid */
604 #define CForeign        0x00002000      /* this is a non-afs vcache */
605 #define CReadDir        0x00004000      /* readdir in progress */
606 #define CUnlinked       0x00010000
607 #define CBulkStat       0x00020000      /* loaded by a bulk stat, and not ref'd since */
608 #define CUnlinkedDel    0x00040000
609 #define CVFlushed       0x00080000
610 #ifdef AFS_LINUX22_ENV
611 #define CPageWrite      0x00200000      /* to detect vm deadlock - linux */
612 #elif defined(AFS_SGI_ENV)
613 #define CWritingUFS     0x00200000      /* to detect vm deadlock - used by sgi */
614 #elif defined(AFS_DARWIN80_ENV)
615 #define CEvent          0x00200000      /* to preclude deadlock when sending events */
616 #endif
617 #define CCreating       0x00400000      /* avoid needless store after open truncate */
618 #define CPageHog        0x00800000      /* AIX - dumping large cores is a page hog. */
619 #define CDCLock         0x02000000      /* Vnode lock held over call to GetDownD */
620 #define CBulkFetching   0x04000000      /* stats are being fetched by bulk stat */
621 #define CExtendedFile   0x08000000      /* extended file via ftruncate call. */
622 #define CVInit          0x10000000      /* being initialized */
623 #define CMetaDirty      0x20000000      /* vnode meta-data needs to be flushed */
624
625 /* vcache vstate bits */
626 #define VRevokeWait   0x1
627 #define VPageCleaning 0x2       /* Solaris - Cache Trunc Daemon sez keep out */
628
629 /* Dirty disconnected vcache flags. */
630 #define VDisconSetTime          0x00000001      /* set time. */
631 #define VDisconSetMode          0x00000002      /* set mode. */
632 /* XXX: to be continued ? */
633 #define VDisconTrunc            0x00000020      /* truncate file. */
634 #define VDisconSetAttrMask      0x0000003F      /* Masks for setattr ops. */
635 #define VDisconWriteClose       0x00000400      /* Write op on file close. */
636 #define VDisconWriteFlush       0x00000800      /* Write op on normal fsync/flush. */
637 #define VDisconWriteOsiFlush    0x00001000      /* Write op on osi flush. */
638
639 #define VDisconRemove           0x00002000      /* Remove vnop. */
640 #define VDisconCreate           0x00004000      /* Create vnop. */
641 #define VDisconCreated          0x00008000      /* A file that was created during
642                                                    this resync operation */
643 #define VDisconRename           0x00010000      /* Rename vnop. */
644 #define VDisconRenameSameDir    0x00020000      /* Rename in same dir. */
645
646 /*... to be continued ...  */
647
648 #if defined(AFS_CACHE_BYPASS)
649 /* vcache (file) cachingStates bits */
650 #define FCSDesireBypass   0x1   /* This file should bypass the cache */
651 #define FCSBypass         0x2   /* This file is currently NOT being cached */
652 #define FCSManuallySet    0x4   /* The bypass flags were set, or reset, manually (via pioctl)
653                                                                    and should not be overridden by the file's name */
654
655 /* Flag values used by the Transition routines */
656 #define TRANSChangeDesiredBit           0x1     /* The Transition routine should set or
657                                                                                  * reset the FCSDesireBypass bit */
658 #define TRANSVcacheIsLocked                     0x2     /* The Transition routine does not need to
659                                                                                  * lock vcache (it's already locked) */
660 #define TRANSSetManualBit               0x4     /* The Transition routine should set FCSManuallySet so that
661                                                                          * filename checking does not override pioctl requests */
662 #endif /* AFS_CACHE_BYPASS */
663
664 #define CPSIZE      2
665 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
666 #define vrefCount   v->v_usecount
667 #else
668 #define vrefCount   v.v_count
669 #endif /* AFS_XBSD_ENV */
670
671 #if defined(AFS_DARWIN80_ENV)
672 #define VREFCOUNT_GT(v, y)    vnode_isinuse(AFSTOV(v), (y))
673 #elif defined(AFS_FBSD_ENV)
674 #define VREFCOUNT(v)            (vrefcnt(AFSTOV(v)))
675 #define VREFCOUNT_GT(v, y)      (vrefcnt(AFSTOV(v)) > y)
676 #elif defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV)
677 #define VREFCOUNT(v)          ((v)->vrefCount)
678 #define VREFCOUNT_GT(v, y)    (AFSTOV(v)->v_usecount > (y))
679 #elif defined(AFS_LINUX24_ENV)
680 #define VREFCOUNT(v)            atomic_read(&(AFSTOV(v)->v_count))
681 #define VREFCOUNT_GT(v, y)      (VREFCOUNT(v)>y)
682 #define VREFCOUNT_SET(v, c)     atomic_set(&(AFSTOV(v)->v_count), c)
683 #define VREFCOUNT_DEC(v)        atomic_dec(&(AFSTOV(v)->v_count))
684 #define VREFCOUNT_INC(v)        atomic_inc(&(AFSTOV(v)->v_count))
685 #else
686 #define VREFCOUNT(v)            ((v)->vrefCount)
687 #define VREFCOUNT_GT(v,y)     ((v)->vrefCount > (y))
688 #define VREFCOUNT_SET(v, c)     (v)->vrefCount = c;
689 #define VREFCOUNT_DEC(v)        (v)->vrefCount--;
690 #define VREFCOUNT_INC(v)        (v)->vrefCount++;
691 #define d_unhash(d) list_empty(&(d)->d_hash)
692 #define dget_locked(d) dget(d)
693 #endif
694
695 #define AFS_MAXDV   0x7fffffff  /* largest dataversion number */
696 #ifdef AFS_64BIT_CLIENT
697 #define AFS_NOTRUNC 0x7fffffffffffffffLL        /* largest positive int64 number */
698 #else /* AFS_64BIT_CLIENT */
699 #define AFS_NOTRUNC 0x7fffffff  /* largest dataversion number */
700 #endif /* AFS_64BIT_CLIENT */
701
702 extern afs_int32 vmPageHog;     /* counter for # of vnodes which are page hogs. */
703
704 #if defined(AFS_DARWIN80_ENV)
705 #define VTOAFS(v) ((struct vcache *)vnode_fsnode((v)))
706 #define AFSTOV(vc) ((vc)->v)
707 #elif defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV) || (defined(AFS_LINUX22_ENV) && !defined(STRUCT_SUPER_OPERATIONS_HAS_ALLOC_INODE))
708 #define VTOAFS(v) ((struct vcache *)(v)->v_data)
709 #define AFSTOV(vc) ((vc)->v)
710 #else
711 #define VTOAFS(V) ((struct vcache *)(V))
712 #define AFSTOV(V) (&(V)->v)
713 #endif
714
715 struct afs_vnuniq {
716     afs_uint32 vnode;
717     afs_uint32 unique;
718 };
719
720 /* VCache elements which are kept on disk, and in the kernel */
721 struct fvcache {
722     struct VenusFid fid;
723     struct mstat {
724         afs_size_t Length;
725         afs_hyper_t DataVersion;
726         afs_uint32 Date;
727         afs_uint32 Owner;
728         afs_uint32 Group;
729         afs_uint16 Mode;        /* XXXX Should be afs_int32 XXXX */
730         afs_uint16 LinkCount;
731 #ifdef AFS_DARWIN80_ENV
732         afs_uint16 Type;
733 #else
734         /* vnode type is in v.v_type */
735 #endif
736     } m;
737     struct afs_vnuniq parent;
738
739     /*! Truncate file to this position at the next store */
740     afs_size_t truncPos;
741
742     /*! System:AnyUser's access to this. */
743     afs_int32 anyAccess;
744
745     /*! state bits */
746     afs_uint32 states;
747
748     /*! Disconnected flags for this vcache element. */
749     afs_uint32 ddirty_flags;
750     /*! Shadow vnode + unique keep the shadow dir location. */
751     struct afs_vnuniq shadow;
752     /*! The old parent FID for renamed vnodes */
753     struct afs_vnuniq oldParent;
754 };
755
756 /* INVARIANTs: (vlruq.next != NULL) == (vlruq.prev != NULL)
757  *             nextfree => !vlruq.next && ! vlruq.prev
758  * !(avc->nextfree) && !avc->vlruq.next => (FreeVCList == avc->nextfree)
759  */
760 struct vcache {
761 #if defined(AFS_XBSD_ENV) || defined(AFS_DARWIN_ENV) || (defined(AFS_LINUX22_ENV) && !defined(STRUCT_SUPER_OPERATIONS_HAS_ALLOC_INODE))
762     struct vnode *v;
763 #else
764     struct vnode v;             /* Has reference count in v.v_count */
765 #endif
766     struct afs_q vlruq;         /* lru q next and prev */
767 #if !defined(AFS_LINUX22_ENV)
768     struct vcache *nextfree;    /* next on free list (if free) */
769 #endif
770     struct vcache *hnext;       /* Hash next */
771     struct afs_q vhashq;        /* Hashed per-volume list */
772     /*! Queue of dirty vcaches. Lock with afs_disconDirtyLock */
773     struct afs_q dirtyq;
774     /*! Queue of vcaches with shadow entries. Lock with afs_disconDirtyLock */
775     struct afs_q shadowq;
776     /*! Queue of vcaches with dirty metadata. Locked by afs_xvcdirty */
777     struct afs_q metadirty;
778     /*! Vcaches slot number in the disk backup. Protected by tvc->lock */
779     afs_uint32 diskSlot;
780     struct fvcache f;
781     afs_rwlock_t lock;          /* The lock on the vcache contents. */
782 #if     defined(AFS_SUN5_ENV)
783     /* Lock used to protect the activeV, multipage, and vstates fields.
784      * Do not try to get the vcache lock when the vlock is held */
785     afs_rwlock_t vlock;
786 #endif                          /* defined(AFS_SUN5_ENV) */
787 #if     defined(AFS_SUN5_ENV)
788     krwlock_t rwlock;
789     struct cred *credp;
790 #endif
791 #ifdef AFS_BOZONLOCK_ENV
792     afs_bozoLock_t pvnLock;     /* see locks.x */
793 #endif
794 #ifdef  AFS_AIX32_ENV
795     afs_lock_t pvmlock;
796     vmhandle_t vmh;
797 #if defined(AFS_AIX51_ENV)
798     vmid_t segid;
799 #else
800     int segid;
801 #endif
802     struct ucred *credp;
803 #endif
804 #ifdef AFS_AIX_ENV
805     int ownslock;               /* pid of owner of excl lock, else 0 - defect 3083 */
806 #endif
807 #ifdef AFS_DARWIN80_ENV
808     lck_mtx_t *rwlock;
809 #elif defined(AFS_DARWIN_ENV)
810     struct lock__bsd__ rwlock;
811 #endif
812 #ifdef AFS_XBSD_ENV
813 # if defined(AFS_NBSD50_ENV)
814   struct krwlock rwlock;
815 # elif !defined(AFS_DFBSD_ENV)
816     struct lock rwlock;
817 #endif
818 #endif
819
820     struct VenusFid *mvid;      /* Either parent dir (if root) or root (if mt pt) */
821     char *linkData;             /* Link data if a symlink. */
822     afs_hyper_t flushDV;        /* data version last flushed from text */
823     afs_hyper_t mapDV;          /* data version last flushed from map */
824     struct server *callback;    /* The callback host, if any */
825     afs_uint32 cbExpires;       /* time the callback expires */
826     struct afs_q callsort;      /* queue in expiry order, sort of */
827     struct axscache *Access;    /* a list of cached access bits */
828     afs_int32 last_looker;      /* pag/uid from last lookup here */
829 #if     defined(AFS_SUN5_ENV)
830     afs_int32 activeV;
831 #endif                          /* defined(AFS_SUN5_ENV) */
832     struct SimpleLocks *slocks;
833     short opens;                /* The numbers of opens, read or write, on this file. */
834     short execsOrWriters;       /* The number of execs (if < 0) or writers (if > 0) of
835                                  * this file. */
836     short flockCount;           /* count of flock readers, or -1 if writer */
837     char mvstat;                /* 0->normal, 1->mt pt, 2->root. */
838
839 #if defined(AFS_CACHE_BYPASS)
840         char cachingStates;                     /* Caching policies for this file */
841         afs_uint32 cachingTransitions;          /* # of times file has flopped between caching and not */
842 #if defined(AFS_LINUX24_ENV)
843         off_t next_seq_offset;  /* Next sequential offset (used by prefetch/readahead) */
844 #else
845         off_t next_seq_blk_offset; /* accounted in blocks for Solaris & IRIX */
846 #endif
847 #endif
848
849 #if     defined(AFS_SUN5_ENV)
850     afs_uint32 vstates;         /* vstate bits */
851 #endif                          /* defined(AFS_SUN5_ENV) */
852     struct dcache *dchint;
853     struct dcache *dcreaddir;   /* dcache for in-progress readdir */
854     unsigned int readdir_pid;   /* pid of the thread in readdir */
855 #ifdef AFS_LINUX22_ENV
856     u_short mapcnt;             /* Number of mappings of this file. */
857 #endif
858 #if defined(AFS_SGI_ENV)
859     daddr_t lastr;              /* for read-ahead */
860 #ifdef AFS_SGI64_ENV
861     uint64_t vc_rwlockid;       /* kthread owning rwlock */
862 #else
863     short vc_rwlockid;          /* pid of process owning rwlock */
864 #endif
865     short vc_locktrips;         /* # of rwlock reacquisitions */
866     sema_t vc_rwlock;           /* vop_rwlock for afs */
867     pgno_t mapcnt;              /* # of pages mapped */
868     struct cred *cred;          /* last writer's cred */
869 #ifdef AFS_SGI64_ENV
870     struct bhv_desc vc_bhv_desc;        /* vnode's behavior data. */
871 #endif
872 #endif                          /* AFS_SGI_ENV */
873 #if defined(AFS_LINUX26_ENV)
874     cred_t *cred;               /* last writer's cred */
875 #endif
876     afs_int32 vc_error;         /* stash write error for this vnode. */
877     int xlatordv;               /* Used by nfs xlator */
878     afs_ucred_t *uncred;
879     int asynchrony;             /* num kbytes to store behind */
880 #ifdef AFS_SUN5_ENV
881     short multiPage;            /* count of multi-page getpages in progress */
882 #endif
883 };
884
885 #define DONT_CHECK_MODE_BITS    0
886 #define CHECK_MODE_BITS         1
887 #define CMB_ALLOW_EXEC_AS_READ  2       /* For the NFS xlator */
888
889 #if defined(AFS_SGI_ENV)
890 #define AVCRWLOCK(avc)          (valusema(&(avc)->vc_rwlock) <= 0)
891
892 /* SGI vnode rwlock macros and flags. */
893 #ifndef AFS_SGI62_ENV
894 /* The following are defined here. SGI 6.2 declares them in vnode.h */
895 #define VRWLOCK_READ            0
896 #define VRWLOCK_WRITE           1
897 #define VRWLOCK_WRITE_DIRECT    2
898 #endif
899
900 #ifdef AFS_SGI53_ENV
901 #ifdef AFS_SGI62_ENV
902 #define AFS_RWLOCK_T vrwlock_t
903 #else
904 #define AFS_RWLOCK_T int
905 #endif /* AFS_SGI62_ENV */
906 #ifdef AFS_SGI64_ENV
907 #include <ksys/behavior.h>
908 #define AFS_RWLOCK(V,F) \
909         afs_rwlock(&VTOAFS(V)->vc_bhv_desc, (F));
910 #define AFS_RWUNLOCK(V,F) \
911         afs_rwunlock(&VTOAFS(V)->vc_bhv_desc, (F));
912
913 #else
914 #define AFS_RWLOCK(V,F) afs_rwlock((vnode_t *)(V), (F) )
915 #define AFS_RWUNLOCK(V,F) afs_rwunlock((vnode_t *)(V), (F) )
916 #endif
917 #else /* AFS_SGI53_ENV */
918 #define AFS_RWLOCK(V,F) afs_rwlock((V))
919 #define AFS_RWUNLOCK(V,F) afs_rwunlock((V))
920 #endif /* AFS_SGI53_ENV */
921 #endif /* AFS_SGI_ENV */
922
923 struct vcxstat {
924     struct VenusFid fid;
925     afs_hyper_t DataVersion;
926     afs_rwlock_t lock;
927     afs_int32 parentVnode;
928     afs_int32 parentUnique;
929     afs_hyper_t flushDV;
930     afs_hyper_t mapDV;
931     afs_int32 truncPos;
932     afs_int32 randomUid[CPSIZE];
933     afs_int32 callback;         /* Now a pointer to 'server' struct */
934     afs_int32 cbExpires;
935     afs_int32 randomAccess[CPSIZE];
936     afs_int32 anyAccess;
937     short opens;
938     short execsOrWriters;
939     short flockCount;
940     char mvstat;
941     afs_uint32 states;
942 };
943
944 struct vcxstat2 {
945     afs_int32 callerAccess;
946     afs_int32 cbExpires;
947     afs_int32 anyAccess;
948     char mvstat;
949 };
950
951 struct sbstruct {
952     int sb_thisfile;
953     int sb_default;
954 };
955
956 /* CM inititialization parameters. What CM actually used after calculations
957  * based on passed in arguments.
958  */
959 #define CMI_VERSION 1           /* increment when adding new fields. */
960 struct cm_initparams {
961     int cmi_version;
962     int cmi_nChunkFiles;
963     int cmi_nStatCaches;
964     int cmi_nDataCaches;
965     int cmi_nVolumeCaches;
966     int cmi_firstChunkSize;
967     int cmi_otherChunkSize;
968     int cmi_cacheSize;          /* The original cache size, in 1K blocks. */
969     unsigned cmi_setTime:1;
970     unsigned cmi_memCache:1;
971     int spare[16 - 9];          /* size of struct is 16 * 4 = 64 bytes */
972 };
973
974
975 /*----------------------------------------------------------------------
976  * AFS Data cache definitions
977  *
978  * Each entry describes a Unix file on the local disk that is
979  * is serving as a cached copy of all or part of a Vice file.
980  * Entries live in circular queues for each hash table slot
981  *
982  * Which queue is this thing in?  Good question.
983  * A struct dcache entry is in the freeDSlot queue when not associated with a cache slot (file).
984  * Otherwise, it is in the DLRU queue.  The freeDSlot queue uses the lruq.next field as
985  * its "next" pointer.
986  *
987  * Cache entries in the DLRU queue are either associated with vice files, in which case
988  * they are hashed by afs_dvnextTbl and afs_dcnextTbl pointers, or they are in the freeDCList
989  * and are not associated with any vice file.  This last list uses the afs_dvnextTbl pointer for
990  * its "next" pointer.
991  *----------------------------------------------------------------------*/
992
993 #define NULLIDX     (-1)        /* null index definition */
994 /* struct dcache states bits */
995 #define DRO         1
996 #define DBackup     2
997 #define DRW         4
998 #define DWriting    8           /* file being written (used for cache validation) */
999
1000 /* dcache data flags */
1001 #define DFEntryMod      0x02    /* has entry itself been modified? */
1002 #define DFFetching      0x04    /* file is currently being fetched */
1003
1004 /* dcache meta flags */
1005 #define DFNextStarted   0x01    /* next chunk has been prefetched already */
1006 #define DFFetchReq      0x10    /* someone is waiting for DFFetching to go on */
1007
1008
1009 /* flags in afs_indexFlags array */
1010 #define IFEverUsed      1       /* index entry has >= 1 byte of data */
1011 #define IFFree          2       /* index entry in freeDCList */
1012 #define IFDataMod       4       /* file needs to be written out */
1013 #define IFFlag          8       /* utility flag */
1014 #define IFDirtyPages    16      /* Solaris-only. contains dirty pages */
1015 #define IFAnyPages      32
1016 #define IFDiscarded     64      /* index entry in discardDCList */
1017
1018 #ifdef AFS_DARWIN100_ENV
1019 typedef user_addr_t iparmtype; /* 64 bit */
1020 typedef user_addr_t uparmtype; /* 64 bit */
1021 #else
1022 typedef char * uparmtype;
1023 #ifdef AFS_SGI65_ENV
1024 typedef afs_uint32 iparmtype;
1025 #else
1026 typedef long iparmtype;
1027 #endif
1028 #endif
1029
1030 #if SIZEOF_VOID_P == SIZEOF_UNSIGNED_INT
1031 # define uintptrsz unsigned int
1032 #elif SIZEOF_VOID_P == SIZEOF_UNSIGNED_LONG
1033 # define uintptrsz unsigned long
1034 #elif SIZEOF_VOID_P == SIZEOF_UNSIGNED_LONG_LONG
1035 # define uintptrsz unsigned long long
1036 #else
1037 # error "Unable to determine casting for pointers"
1038 #endif
1039
1040 struct afs_ioctl {
1041     uparmtype in;               /* input buffer */
1042     uparmtype out;              /* output buffer */
1043     short in_size;              /* Size of input buffer <= 2K */
1044     short out_size;             /* Maximum size of output buffer, <= 2K */
1045 };
1046
1047 /*
1048  * This version of afs_ioctl is required to pass in 32 bit user space
1049  * pointers into a 64 bit kernel.
1050  */
1051
1052 struct afs_ioctl32 {
1053     unsigned int in;
1054     unsigned int out;
1055     short in_size;
1056     short out_size;
1057 };
1058
1059
1060 /* CacheItems file has a header of type struct afs_fheader
1061  * (keep aligned properly). Since we already have sgi_62 clients running
1062  * with a 32 bit inode, a change is required to the header so that
1063  * they can distinguish the old 32 bit inode CacheItems file and zap it
1064  * instead of using it.
1065  */
1066 struct afs_fheader {
1067 #define AFS_FHMAGIC         0x7635abaf  /* uses version number */
1068     afs_int32 magic;
1069 #define AFS_CI_VERSION 4
1070     afs_int32 version;
1071     afs_uint32 dataSize;
1072     afs_int32 firstCSize;
1073     afs_int32 otherCSize;
1074 };
1075
1076 #if defined(AFS_CACHE_VNODE_PATH)
1077 typedef char *afs_ufs_dcache_id_t;
1078 #elif defined(AFS_SGI61_ENV) || defined(AFS_SUN57_64BIT_ENV)
1079 /* Using ino64_t here so that user level debugging programs compile
1080  * the size correctly.
1081  */
1082 typedef ino64_t afs_ufs_dcache_id_t;
1083 #elif defined(AFS_LINUX26_ENV)
1084 #define MAX_FH_LEN 10
1085 typedef union {
1086 #if defined(NEW_EXPORT_OPS)
1087     struct fid fh;
1088 #endif
1089     __u32 raw[MAX_FH_LEN];
1090 } afs_ufs_dcache_id_t;
1091 extern int cache_fh_type;
1092 extern int cache_fh_len;
1093 #elif defined(AFS_LINUX_64BIT_KERNEL) && !defined(AFS_S390X_LINUX24_ENV)
1094 typedef long afs_ufs_dcache_id_t;
1095 #elif defined(AFS_AIX51_ENV) || defined(AFS_HPUX1123_ENV)
1096 typedef ino_t afs_ufs_dcache_id_t;
1097 #else
1098 typedef afs_int32 afs_ufs_dcache_id_t;
1099 #endif
1100
1101 typedef afs_int32 afs_mem_dcache_id_t;
1102
1103 typedef union {
1104     afs_ufs_dcache_id_t ufs;
1105     afs_mem_dcache_id_t mem;
1106 } afs_dcache_id_t;
1107
1108 /* it does not compile outside kernel */
1109 struct buffer {
1110   afs_int32 fid;              /* is adc->index, the cache file number */
1111   afs_dcache_id_t inode;          /* is adc->f.inode, the inode number of the cac\
1112                                  he file */
1113   afs_int32 page;
1114   afs_int32 accesstime;
1115   struct buffer *hashNext;
1116   char *data;
1117   char lockers;
1118   char dirty;
1119   char hashIndex;
1120   afs_rwlock_t lock;          /* the lock for this structure */
1121 };
1122
1123 /* kept on disk and in dcache entries */
1124 struct fcache {
1125     struct VenusFid fid;        /* Fid for this file */
1126     afs_int32 modTime;          /* last time this entry was modified */
1127     afs_hyper_t versionNo;      /* Associated data version number */
1128     afs_int32 chunk;            /* Relative chunk number */
1129     afs_dcache_id_t inode;              /* Unix inode for this chunk */
1130     afs_int32 chunkBytes;       /* Num bytes in this chunk */
1131     char states;                /* Has this chunk been modified? */
1132 };
1133
1134 /* magic numbers to specify the cache type */
1135
1136 #define AFS_FCACHE_TYPE_UFS 0x0
1137 #define AFS_FCACHE_TYPE_MEM 0x1
1138 #define AFS_FCACHE_TYPE_NFS 0x2
1139 #define AFS_FCACHE_TYPE_EPI 0x3
1140
1141 /* kept in memory */
1142 struct dcache {
1143     struct afs_q lruq;          /* Free queue for in-memory images */
1144     struct afs_q dirty;         /* Queue of dirty entries that need written */
1145     afs_rwlock_t lock;          /* Protects validPos, some f */
1146     afs_rwlock_t tlock;         /* Atomizes updates to refCount */
1147     afs_rwlock_t mflock;        /* Atomizes accesses/updates to mflags */
1148     afs_size_t validPos;        /* number of valid bytes during fetch */
1149     afs_int32 index;            /* The index in the CacheInfo file */
1150     short refCount;             /* Associated reference count. */
1151     char dflags;                /* Data flags */
1152     char mflags;                /* Meta flags */
1153     struct fcache f;            /* disk image */
1154     afs_int32 bucket;           /* which bucket these dcache entries are in */
1155     /*
1156      * Locking rules:
1157      *
1158      * dcache.lock protects the actual contents of the cache file (in
1159      * f.inode), subfields of f except those noted below, dflags and
1160      * validPos.
1161      *
1162      * dcache.tlock is used to make atomic updates to refCount.  Zero
1163      * refCount dcache entries are protected by afs_xdcache instead of
1164      * tlock.
1165      *
1166      * dcache.mflock is used to access and update mflags.  It cannot be
1167      * held without holding the corresponding dcache.lock.  Updating
1168      * mflags requires holding dcache.lock(R) and dcache.mflock(W), and
1169      * checking for mflags requires dcache.lock(R) and dcache.mflock(R).
1170      * Note that dcache.lock(W) gives you the right to update mflags,
1171      * as dcache.mflock(W) can only be held with dcache.lock(R).
1172      *
1173      * dcache.index, dcache.f.fid, dcache.f.chunk and dcache.f.inode are
1174      * write-protected by afs_xdcache and read-protected by refCount.
1175      * Once an entry is referenced, these values cannot change, and if
1176      * it's on the free list (with refCount=0), it can be reused for a
1177      * different file/chunk.  These values can only be written while
1178      * holding afs_xdcache(W) and allocating this dcache entry (thereby
1179      * ensuring noone else has a refCount on it).
1180      */
1181 };
1182
1183 /* afs_memcache.c */
1184 struct memCacheEntry {
1185   int size;                   /* # of valid bytes in this entry */
1186   int dataSize;               /* size of allocated data area */
1187   afs_lock_t afs_memLock;
1188   char *data;                 /* bytes */
1189 };
1190
1191 struct afs_FetchOutput {
1192     struct AFSVolSync tsync;
1193     struct AFSFetchStatus OutStatus;
1194     struct AFSCallBack CallBack;
1195 };
1196
1197 /* macro to mark a dcache entry as bad */
1198 #define ZapDCE(x) \
1199     do { \
1200         (x)->f.fid.Fid.Unique = 0; \
1201         afs_indexUnique[(x)->index] = 0; \
1202         (x)->dflags |= DFEntryMod; \
1203     } while(0)
1204
1205 /* FakeOpen and Fake Close used to be real subroutines.  They're only used in
1206  * sun_subr and afs_vnodeops, and they're very frequently called, so I made
1207  * them into macros.  They do:
1208  * FakeOpen:  fake the file being open for writing.  avc->lock must be held
1209  * in write mode.  Having the file open for writing is like having a DFS
1210  * write-token: you're known to have the best version of the data around,
1211  * and so the CM won't let it be overwritten by random server info.
1212  * FakeClose:  undo the effects of FakeOpen, noting that we want to ensure
1213  * that a real close eventually gets done.  We use CCore to achieve this if
1214  * we would end up closing the file.  avc->lock must be held in write mode */
1215
1216 #ifdef AFS_AIX_IAUTH_ENV
1217 #define CRKEEP(V, C)  (V)->linkData = (char*)crdup((C))
1218 #else
1219 #define CRKEEP(V, C)  crhold((C)); (V)->linkData = (char*)(C)
1220 #endif
1221
1222 #define afs_FakeOpen(avc) { avc->opens++; avc->execsOrWriters++; }
1223 #define afs_FakeClose(avc, acred) \
1224 { if (avc->execsOrWriters == 1) {  \
1225         /* we're the last writer, just use CCore flag */   \
1226         avc->f.states |= CCore; /* causes close to be called later */ \
1227                                                                       \
1228         /* The cred and vnode holds will be released in afs_FlushActiveVcaches */  \
1229         AFS_FAST_HOLD(avc);     /* So it won't disappear */           \
1230         CRKEEP(avc, acred); /* Should use a better place for the creds */ \
1231     }                                                                         \
1232     else {                                                                    \
1233         /* we're not the last writer, let the last one do the store-back for us */    \
1234         avc->opens--;                                                         \
1235         avc->execsOrWriters--;                                                \
1236     }                                                                         \
1237 }
1238
1239 #define AFS_ZEROS   64          /* zero buffer */
1240
1241 /*#define afs_DirtyPages(avc)   (((avc)->f.states & CDirty) || osi_VMDirty_p((avc)))*/
1242 #define afs_DirtyPages(avc)     ((avc)->f.states & CDirty)
1243
1244 #define afs_InReadDir(avc) (((avc)->f.states & CReadDir) && (avc)->readdir_pid == MyPidxx2Pid(MyPidxx))
1245
1246 /* The PFlush algorithm makes use of the fact that Fid.Unique is not used in
1247   below hash algorithms.  Change it if need be so that flushing algorithm
1248   doesn't move things from one hash chain to another
1249 */
1250 /* extern int afs_dhashsize; */
1251 #define DCHash(v, c)    ((((v)->Fid.Vnode + (v)->Fid.Volume + (c))) & (afs_dhashsize-1))
1252         /*Vnode, Chunk -> Hash table index */
1253 #define DVHash(v)       ((((v)->Fid.Vnode + (v)->Fid.Volume )) & (afs_dhashsize-1))
1254         /*Vnode -> Other hash table index */
1255 /* don't hash on the cell, our callback-breaking code sometimes fails to compute
1256     the cell correctly, and only scans one hash bucket */
1257 #define VCHash(fid)     (((fid)->Fid.Volume + (fid)->Fid.Vnode) & (VCSIZE-1))
1258 /* Hash only on volume to speed up volume callbacks. */
1259 #define VCHashV(fid) ((fid)->Fid.Volume & (VCSIZE-1))
1260
1261 extern struct dcache **afs_indexTable;  /*Pointers to in-memory dcache entries */
1262 extern afs_int32 *afs_indexUnique;      /*dcache entry Fid.Unique */
1263 extern afs_int32 *afs_dvnextTbl;        /*Dcache hash table links */
1264 extern afs_int32 *afs_dcnextTbl;        /*Dcache hash table links */
1265 extern afs_int32 afs_cacheFiles;        /*Size of afs_indexTable */
1266 extern afs_int32 afs_cacheBlocks;       /*1K blocks in cache */
1267 extern afs_int32 afs_cacheStats;        /*Stat entries in cache */
1268 extern struct vcache *afs_vhashT[VCSIZE];       /*Stat cache hash table */
1269 extern struct afs_q afs_vhashTV[VCSIZE]; /* cache hash table on volume */
1270 extern afs_int32 afs_initState; /*Initialization state */
1271 extern afs_int32 afs_termState; /* Termination state */
1272 extern struct VenusFid afs_rootFid;     /*Root for whole file system */
1273 extern afs_int32 afs_allCBs;    /* Count of callbacks */
1274 extern afs_int32 afs_oddCBs;    /* Count of odd callbacks */
1275 extern afs_int32 afs_evenCBs;   /* Count of even callbacks */
1276 extern afs_int32 afs_allZaps;   /* Count of fid deletes */
1277 extern afs_int32 afs_oddZaps;   /* Count of odd fid deletes */
1278 extern afs_int32 afs_evenZaps;  /* Count of even fid deletes */
1279 extern struct brequest afs_brs[NBRS];   /* request structures */
1280
1281 #define UHash(auid)     ((auid) & (NUSERS-1))
1282 #define VHash(avol)     ((avol)&(NVOLS-1))
1283 #define SHash(aserv)    ((ntohl(aserv)) & (NSERVERS-1))
1284 #define FVHash(acell,avol)  (((avol)+(acell)) & (NFENTRIES-1))
1285
1286 /* Performance hack - we could replace VerifyVCache2 with the appropriate
1287  * GetVCache incantation, and could eliminate even this code from afs_UFSRead
1288  * by making intentionally invalidating quick.stamp in the various callbacks
1289  * expiration/breaking code */
1290 #ifdef AFS_DARWIN_ENV
1291 #define afs_VerifyVCache(avc, areq)  \
1292   (((avc)->f.states & CStatd) ? (osi_VM_Setup(avc, 0), 0) : \
1293    afs_VerifyVCache2((avc),areq))
1294 #else
1295 #define afs_VerifyVCache(avc, areq)  \
1296   (((avc)->f.states & CStatd) ? 0 : afs_VerifyVCache2((avc),areq))
1297 #endif
1298
1299 #define DO_STATS 1              /* bits used by FindVCache */
1300 #define DO_VLRU 2
1301 #define IS_SLOCK 4
1302 #define IS_WLOCK 8
1303 #define FIND_CDEAD 16
1304
1305 /* values for flag param of afs_CheckVolumeNames */
1306 #define AFS_VOLCHECK_EXPIRED    0x1     /* volumes whose callbacks have expired */
1307 #define AFS_VOLCHECK_BUSY       0x2     /* volumes which were marked busy */
1308 #define AFS_VOLCHECK_MTPTS      0x4     /* mount point invalidation also */
1309 #define AFS_VOLCHECK_FORCE      0x8     /* do all forcibly */
1310
1311 #endif /* KERNEL */
1312
1313 #define AFS_FSPORT          ((unsigned short) htons(7000))
1314 #define AFS_VLPORT          ((unsigned short) htons(7003))
1315
1316 #define afs_read(avc, uio, acred, albn, abpp, nolock) \
1317         (*(afs_cacheType->vread))(avc, uio, acred, albn, abpp, nolock)
1318 #define afs_write(avc, uio, aio, acred, nolock) \
1319         (*(afs_cacheType->vwrite))(avc, uio, aio, acred, nolock)
1320
1321 #define afs_rdwr(avc, uio, rw, io, cred) \
1322     (((rw) == UIO_WRITE) ? afs_write(avc, uio, io, cred, 0) : afs_read(avc, uio, cred, 0, 0, 0))
1323 #define afs_nlrdwr(avc, uio, rw, io, cred) \
1324     (((rw) == UIO_WRITE) ? afs_write(avc, uio, io, cred, 1) : afs_read(avc, uio, cred, 0, 0, 1))
1325
1326 /* Cache size truncation uses the following low and high water marks:
1327  * If the cache is more than 95% full (CM_DCACHECOUNTFREEPCT), the cache
1328  * truncation daemon is awakened and will free up space until the cache is 85%
1329  * (CM_DCACHESPACEFREEPCT - CM_DCACHEEXTRAPCT) full.
1330  * afs_UFSWrite and afs_GetDCache (when it needs to fetch data) will wait on
1331  * afs_WaitForCacheDrain if the cache is 98% (CM_WAITFORDRAINPCT) full.
1332  * afs_GetDownD wakes those processes once the cache is 95% full
1333  * (CM_CACHESIZEDRAINEDPCT).
1334  */
1335 #define CM_MAXDISCARDEDCHUNKS   16      /* # of chunks */
1336 #define CM_DCACHECOUNTFREEPCT   95      /* max pct of chunks in use */
1337 #define CM_DCACHESPACEFREEPCT   90      /* max pct of space in use */
1338 #define CM_DCACHEEXTRAPCT        5      /* extra to get when freeing */
1339 #define CM_CACHESIZEDRAINEDPCT  95      /* wakeup processes when down to here. */
1340 #define CM_WAITFORDRAINPCT      98      /* sleep if cache is this full. */
1341
1342 /* when afs_cacheBlocks is large, settle for slightly decreased precision */
1343 #define PERCENT(p, v) \
1344     ((afs_cacheBlocks & 0xffe00000) ? ((v) / 100 * (p)) : ((p) * (v) / 100))
1345
1346 #define afs_CacheIsTooFull() \
1347     (afs_blocksUsed - afs_blocksDiscarded > \
1348         PERCENT(CM_DCACHECOUNTFREEPCT, afs_cacheBlocks) || \
1349      afs_freeDCCount - afs_discardDCCount < \
1350         PERCENT(100 - CM_DCACHECOUNTFREEPCT, afs_cacheFiles))
1351
1352 /* Handy max length of a numeric string. */
1353 #define CVBS    12              /* max afs_int32 is 2^32 ~ 4*10^9, +1 for NULL, +luck */
1354
1355 #define refpanic(foo) if (afs_norefpanic) \
1356         { printf( foo ); afs_norefpanic++;} else osi_Panic( foo )
1357
1358 /*
1359 ** these are defined in the AIX source code sys/fs_locks.h but are not
1360 ** defined anywhere in the /usr/include directory
1361 */
1362 #if     defined(AFS_AIX41_ENV)
1363 #define VN_LOCK(vp)             simple_lock(&(vp)->v_lock)
1364 #define VN_UNLOCK(vp)           simple_unlock(&(vp)->v_lock)
1365 #endif
1366
1367 /* get a file's serial number from a vnode */
1368 #ifndef afs_vnodeToInumber
1369 #if defined(AFS_SGI62_ENV) || defined(AFS_HAVE_VXFS) || defined(AFS_DARWIN_ENV)
1370 #define afs_vnodeToInumber(V) VnodeToIno(V)
1371 #else
1372 #define afs_vnodeToInumber(V) (VTOI(V)->i_number)
1373 #endif /* AFS_SGI62_ENV */
1374 #endif
1375
1376 /* get a file's device number from a vnode */
1377 #ifndef afs_vnodeToDev
1378 #if defined(AFS_SGI62_ENV) || defined(AFS_HAVE_VXFS) || defined(AFS_DARWIN_ENV)
1379 #define afs_vnodeToDev(V) VnodeToDev(V)
1380 #elif defined(UKERNEL)
1381 #define afs_vnodeToDev(V) (VTOI(V) ? (VTOI(V)->i_dev) : (-1))
1382 #else
1383 #define afs_vnodeToDev(V) (VTOI(V)->i_dev)
1384 #endif
1385 #endif
1386
1387 /* declare something so that prototypes don't flip out */
1388 /* appears struct buf stuff is only actually passed around as a pointer,
1389    except with libuafs, in which case it is actually defined */
1390
1391 struct buf;
1392
1393 struct rxfs_storeVariables {
1394     struct rx_call *call;
1395     struct vcache *vcache;
1396     char *tbuffer;
1397     struct iovec *tiov;
1398     afs_int32 tnio;
1399     afs_int32 hasNo64bit;
1400     struct AFSStoreStatus InStatus;
1401 };
1402
1403 struct storeOps {
1404     int (*prepare)(void *rock, afs_uint32 size, afs_uint32 *bytestoxfer);
1405     int (*read)(void *rock, struct osi_file *tfile, afs_uint32 offset,
1406         afs_uint32 tlen, afs_uint32 *bytesread);
1407     int (*write)(void *rock, afs_uint32 tlen, afs_uint32 *byteswritten);
1408     int (*status)(void *rock);
1409     int (*padd)(void *rock, afs_uint32 tlen);
1410     int (*close)(void *rock, struct AFSFetchStatus *OutStatus,
1411         afs_int32 *doProcessFS);
1412     int (*destroy)(void **rock, afs_int32 error);
1413     int (*storeproc)(struct storeOps *, void *, struct dcache *, int *,
1414                      afs_size_t *);
1415 };
1416
1417 struct fetchOps {
1418     int (*more)(void *rock, afs_int32 *length, afs_uint32 *moredata);
1419     int (*read)(void *rock, afs_uint32 tlen, afs_uint32 *bytesread);
1420     int (*write)(void *rock, struct osi_file *fp, afs_uint32 offset,
1421         afs_uint32 tlen, afs_uint32 *byteswritten);
1422     int (*close)(void *rock, struct vcache *avc, struct dcache *adc,
1423         struct afs_FetchOutput *Outputs);
1424     int (*destroy)(void **rock, afs_int32 error);
1425 };
1426
1427 /* fakestat support: opaque storage for afs_EvalFakeStat to remember
1428  * what vcache should be released.
1429  */
1430 struct afs_fakestat_state {
1431     char valid;
1432     char did_eval;
1433     char need_release;
1434     struct vcache *root_vp;
1435 };
1436
1437 extern int afs_fakestat_enable;
1438
1439 #ifdef AFS_MAXVCOUNT_ENV
1440 extern int afsd_dynamic_vcaches;
1441 #else
1442 #define afsd_dynamic_vcaches 0
1443 #endif
1444
1445 /*
1446  * Wrappers for access to credentials structure members
1447  * Linux uses the kernel cred structure if available, with the
1448  * wrappers defined in LINUX/osi_machdep.h
1449  */
1450 #if defined(AFS_NBSD40_ENV)
1451 /* in osi_machdep.h as expected */
1452 #elif !(defined(AFS_LINUX26_ENV) && defined(STRUCT_TASK_STRUCT_HAS_CRED))
1453 #define afs_cr_uid(cred) ((cred)->cr_uid)
1454 #define afs_cr_gid(cred) ((cred)->cr_gid)
1455 #define afs_cr_ruid(cred) ((cred)->cr_ruid)
1456 #define afs_cr_rgid(cred) ((cred)->cr_rgid)
1457
1458 static_inline void
1459 afs_set_cr_uid(afs_ucred_t *cred, uid_t uid) {
1460     cred->cr_uid = uid;
1461 }
1462 static_inline void
1463 afs_set_cr_gid(afs_ucred_t *cred, gid_t gid) {
1464     cred->cr_gid = gid;
1465 }
1466 static_inline void
1467 afs_set_cr_ruid(afs_ucred_t *cred, uid_t uid) {
1468     cred->cr_ruid = uid;
1469 }
1470 static_inline void
1471 afs_set_cr_rgid(afs_ucred_t *cred, gid_t gid) {
1472     cred->cr_rgid = gid;
1473 }
1474 #endif
1475 #endif /* _AFS_H_ */