linux-kmem-destroy-fix-20070609
[openafs.git] / src / afs / LINUX / osi_vfsops.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 /*
11  * VFS operations for Linux
12  *
13  * super_block operations should return negated errno to Linux.
14  */
15 #include <afsconfig.h>
16 #include "afs/param.h"
17
18 RCSID
19     ("$Header$");
20
21 #define __NO_VERSION__          /* don't define kernel_version in module.h */
22 #include <linux/module.h> /* early to avoid printf->printk mapping */
23 #include "afs/sysincludes.h"
24 #include "afsincludes.h"
25 #include "afs/afs_stats.h"
26 #if !defined(AFS_LINUX26_ENV)
27 #include "h/locks.h"
28 #endif
29 #if defined(AFS_LINUX24_ENV)
30 #include "h/smp_lock.h"
31 #endif
32
33
34 struct vcache *afs_globalVp = 0;
35 struct vfs *afs_globalVFS = 0;
36 #if defined(AFS_LINUX24_ENV)
37 struct vfsmount *afs_cacheMnt;
38 #endif
39 int afs_was_mounted = 0;        /* Used to force reload if mount/unmount/mount */
40
41 extern struct super_operations afs_sops;
42 #if defined(AFS_LINUX26_ENV)
43 extern struct export_operations afs_export_ops;
44 #endif
45 extern afs_rwlock_t afs_xvcache;
46 extern struct afs_q VLRU;
47
48 extern struct dentry_operations afs_dentry_operations;
49
50 /* Forward declarations */
51 static void iattr2vattr(struct vattr *vattrp, struct iattr *iattrp);
52 static int afs_root(struct super_block *afsp);
53 struct super_block *afs_read_super(struct super_block *sb, void *data, int silent);
54 int afs_fill_super(struct super_block *sb, void *data, int silent);
55
56 /* afs_file_system
57  * VFS entry for Linux - installed in init_module
58  * Linux mounts file systems by:
59  * 1) register_filesystem(&afs_file_system) - done in init_module
60  * 2) Mount call comes to us via do_mount -> read_super -> afs_read_super.
61  *    We are expected to setup the super_block. See afs_read_super.
62  */
63
64
65 /* afs_read_super
66  * read the "super block" for AFS - roughly eguivalent to struct vfs.
67  * dev, covered, s_rd_only, s_dirt, and s_type will be set by read_super.
68  */
69 #if defined(AFS_LINUX26_ENV)
70 #ifdef GET_SB_HAS_STRUCT_VFSMOUNT
71 int
72 afs_get_sb(struct file_system_type *fs_type, int flags,
73            const char *dev_name, void *data, struct vfsmount *mnt)
74 #else
75 static struct superblock *
76 afs_get_sb(struct file_system_type *fs_type, int flags,
77            const char *dev_name, void *data)
78 #endif
79 {
80 #ifdef GET_SB_HAS_STRUCT_VFSMOUNT
81     return get_sb_nodev(fs_type, flags, data, afs_fill_super, mnt);
82 #else
83     return get_sb_nodev(fs_type, flags, data, afs_fill_super);
84 #endif
85 }
86
87
88 struct file_system_type afs_fs_type = {
89     .owner = THIS_MODULE,
90     .name = "afs",
91     .get_sb = afs_get_sb,
92     .kill_sb = kill_anon_super,
93     .fs_flags = FS_BINARY_MOUNTDATA,
94 };
95 #elif defined(AFS_LINUX24_ENV)
96 DECLARE_FSTYPE(afs_fs_type, "afs", afs_read_super, 0);
97 #else
98 struct file_system_type afs_fs_type = {
99     "afs",                      /* name - used by mount operation. */
100     0,                          /* requires_dev - no for network filesystems. mount() will 
101                                  * pass us an "unnamed" device. */
102     afs_read_super,             /* wrapper to afs_mount */
103     NULL                        /* pointer to next file_system_type once registered. */
104 };
105 #endif
106
107 #if defined(AFS_LINUX26_ENV)
108 struct backing_dev_info afs_backing_dev_info = {
109     .ra_pages           = 0, /* disable readahead, afs does prefetch */
110 };
111
112 int
113 afs_fill_super(struct super_block *sb, void *data, int silent)
114 #else
115 struct super_block *
116 afs_read_super(struct super_block *sb, void *data, int silent)
117 #endif
118 {
119     int code = 0;
120
121     AFS_GLOCK();
122     if (afs_was_mounted) {
123         printf
124             ("You must reload the AFS kernel extensions before remounting AFS.\n");
125         AFS_GUNLOCK();
126 #if defined(AFS_LINUX26_ENV)
127         return -EINVAL;
128 #else
129         return NULL;
130 #endif
131     }
132     afs_was_mounted = 1;
133
134     /* Set basics of super_block */
135 #if !defined(AFS_LINUX24_ENV)
136     lock_super(sb);
137 #endif
138 #if defined(AFS_LINUX26_ENV)
139    __module_get(THIS_MODULE);
140 #else
141     MOD_INC_USE_COUNT;
142 #endif
143
144     afs_globalVFS = sb;
145     sb->s_blocksize = 1024;
146     sb->s_blocksize_bits = 10;
147     sb->s_magic = AFS_VFSMAGIC;
148     sb->s_op = &afs_sops;       /* Super block (vfs) ops */
149 #if defined(AFS_LINUX26_ENV)
150     sb->s_export_op = &afs_export_ops;
151 #endif
152 #if defined(MAX_NON_LFS)
153 #ifdef AFS_64BIT_CLIENT
154 #if !defined(MAX_LFS_FILESIZE)
155 #if BITS_PER_LONG==32
156 #define MAX_LFS_FILESIZE (((u64)PAGE_CACHE_SIZE << (BITS_PER_LONG-1))-1) 
157 #elif BITS_PER_LONG==64
158 #define MAX_LFS_FILESIZE 0x7fffffffffffffff
159 #endif
160 #endif
161     sb->s_maxbytes = MAX_LFS_FILESIZE;
162 #else
163     sb->s_maxbytes = MAX_NON_LFS;
164 #endif
165 #endif
166     code = afs_root(sb);
167     if (code) {
168         afs_globalVFS = NULL;
169 #if defined(AFS_LINUX26_ENV)
170         module_put(THIS_MODULE);
171 #else
172         MOD_DEC_USE_COUNT;
173 #endif
174     }
175
176 #if !defined(AFS_LINUX24_ENV)
177     unlock_super(sb);
178 #endif
179
180     AFS_GUNLOCK();
181 #if defined(AFS_LINUX26_ENV)
182     return code ? -EINVAL : 0;
183 #else
184     return code ? NULL : sb;
185 #endif
186 }
187
188
189 /* afs_root - stat the root of the file system. AFS global held on entry. */
190 static int
191 afs_root(struct super_block *afsp)
192 {
193     register afs_int32 code = 0;
194     struct vrequest treq;
195     register struct vcache *tvp = 0;
196
197     AFS_STATCNT(afs_root);
198     if (afs_globalVp && (afs_globalVp->states & CStatd)) {
199         tvp = afs_globalVp;
200     } else {
201         cred_t *credp = crref();
202
203         if (afs_globalVp) {
204             afs_PutVCache(afs_globalVp);
205             afs_globalVp = NULL;
206         }
207
208         if (!(code = afs_InitReq(&treq, credp)) && !(code = afs_CheckInit())) {
209             tvp = afs_GetVCache(&afs_rootFid, &treq, NULL, NULL);
210             if (tvp) {
211                 struct inode *ip = AFSTOV(tvp);
212                 struct vattr vattr;
213
214                 afs_getattr(tvp, &vattr, credp);
215                 afs_fill_inode(ip, &vattr);
216
217                 /* setup super_block and mount point inode. */
218                 afs_globalVp = tvp;
219 #if defined(AFS_LINUX24_ENV)
220                 afsp->s_root = d_alloc_root(ip);
221 #else
222                 afsp->s_root = d_alloc_root(ip, NULL);
223 #endif
224                 afsp->s_root->d_op = &afs_dentry_operations;
225             } else
226                 code = ENOENT;
227         }
228         crfree(credp);
229     }
230
231     afs_Trace2(afs_iclSetp, CM_TRACE_VFSROOT, ICL_TYPE_POINTER, afs_globalVp,
232                ICL_TYPE_INT32, code);
233     return code;
234 }
235
236 /* super_operations */
237
238 /* afs_notify_change
239  * Linux version of setattr call. What to change is in the iattr struct.
240  * We need to set bits in both the Linux inode as well as the vcache.
241  */
242 int
243 afs_notify_change(struct dentry *dp, struct iattr *iattrp)
244 {
245     struct vattr vattr;
246     cred_t *credp = crref();
247     struct inode *ip = dp->d_inode;
248     int code;
249
250     VATTR_NULL(&vattr);
251     iattr2vattr(&vattr, iattrp);        /* Convert for AFS vnodeops call. */
252
253 #if defined(AFS_LINUX26_ENV)
254     lock_kernel();
255 #endif
256     AFS_GLOCK();
257     code = afs_setattr(VTOAFS(ip), &vattr, credp);
258     if (!code) {
259         afs_getattr(VTOAFS(ip), &vattr, credp);
260         vattr2inode(ip, &vattr);
261     }
262     AFS_GUNLOCK();
263 #if defined(AFS_LINUX26_ENV)
264     unlock_kernel();
265 #endif
266     crfree(credp);
267     return -code;
268 }
269
270
271 #if defined(STRUCT_SUPER_HAS_ALLOC_INODE)
272 static kmem_cache_t *afs_inode_cachep;
273
274 static struct inode *
275 afs_alloc_inode(struct super_block *sb)
276 {
277     struct vcache *vcp;
278
279 #if defined(SLAB_KERNEL)
280     vcp = (struct vcache *) kmem_cache_alloc(afs_inode_cachep, SLAB_KERNEL);
281 #else
282     vcp = (struct vcache *) kmem_cache_alloc(afs_inode_cachep, GFP_KERNEL);
283 #endif
284     if (!vcp)
285         return NULL;
286
287     return AFSTOV(vcp);
288 }
289
290 static void
291 afs_destroy_inode(struct inode *inode)
292 {
293     kmem_cache_free(afs_inode_cachep, inode);
294 }
295
296 static void
297 init_once(void * foo, kmem_cache_t * cachep, unsigned long flags)
298 {
299     struct vcache *vcp = (struct vcache *) foo;
300
301     if ((flags & (SLAB_CTOR_VERIFY|SLAB_CTOR_CONSTRUCTOR)) ==
302         SLAB_CTOR_CONSTRUCTOR)
303         inode_init_once(AFSTOV(vcp));
304 }
305
306 int
307 afs_init_inodecache(void)
308 {
309 #ifndef SLAB_RECLAIM_ACCOUNT
310 #define SLAB_RECLAIM_ACCOUNT 0
311 #endif
312
313     afs_inode_cachep = kmem_cache_create("afs_inode_cache",
314                                          sizeof(struct vcache),
315                                          0, SLAB_HWCACHE_ALIGN | SLAB_RECLAIM_ACCOUNT,
316                                          init_once, NULL);
317     if (afs_inode_cachep == NULL)
318         return -ENOMEM;
319     return 0;
320 }
321
322 void
323 afs_destroy_inodecache(void)
324 {
325     if (afs_inode_cachep)
326         (void) kmem_cache_destroy(afs_inode_cachep);
327 }
328 #else
329 int
330 afs_init_inodecache(void)
331 {
332     return 0;
333 }
334
335 void
336 afs_destroy_inodecache(void)
337 {
338     return;
339 }
340 #endif
341
342 static void
343 afs_clear_inode(struct inode *ip)
344 {
345     struct vcache *vcp = VTOAFS(ip);
346
347     if (vcp->vlruq.prev || vcp->vlruq.next)
348         osi_Panic("inode freed while on LRU");
349     if (vcp->hnext)
350         osi_Panic("inode freed while still hashed");
351
352 #if !defined(STRUCT_SUPER_HAS_ALLOC_INODE)
353     afs_osi_Free(ip->u.generic_ip, sizeof(struct vcache));
354 #endif
355 }
356
357 /* afs_put_super
358  * Called from unmount to release super_block. */
359 static void
360 afs_put_super(struct super_block *sbp)
361 {
362     AFS_GLOCK();
363     AFS_STATCNT(afs_unmount);
364
365 #if !defined(AFS_LINUX26_ENV)
366     if (!suser()) {
367         AFS_GUNLOCK();
368         return;
369     }
370 #endif
371
372     afs_globalVFS = 0;
373     afs_globalVp = 0;
374
375     osi_linux_free_inode_pages();       /* invalidate and release remaining AFS inodes. */
376     afs_shutdown();
377 #if defined(AFS_LINUX24_ENV)
378     mntput(afs_cacheMnt);
379 #endif
380
381     osi_linux_verify_alloced_memory();
382     AFS_GUNLOCK();
383
384     sbp->s_dev = 0;
385 #if defined(AFS_LINUX26_ENV)
386     module_put(THIS_MODULE);
387 #else
388     MOD_DEC_USE_COUNT;
389 #endif
390 }
391
392
393 /* afs_statfs
394  * statp is in user space, so we need to cobble together a statfs, then
395  * copy it.
396  */
397 #if defined(AFS_LINUX26_ENV)
398 int
399 #if defined(STATFS_TAKES_DENTRY)
400 afs_statfs(struct dentry *dentry, struct kstatfs *statp)
401 #else
402 afs_statfs(struct super_block *sbp, struct kstatfs *statp)
403 #endif
404 #elif defined(AFS_LINUX24_ENV)
405 int
406 afs_statfs(struct super_block *sbp, struct statfs *statp)
407 #else
408 int
409 afs_statfs(struct super_block *sbp, struct statfs *__statp, int size)
410 #endif
411 {
412 #if !defined(AFS_LINUX24_ENV)
413     struct statfs stat, *statp;
414
415     if (size < sizeof(struct statfs))
416         return;
417
418     memset(&stat, 0, size);
419     statp = &stat;
420 #else
421     memset(statp, 0, sizeof(*statp));
422 #endif
423
424     AFS_STATCNT(afs_statfs);
425
426     /* hardcode in case that which is giveth is taken away */
427     statp->f_type = 0x5346414F;
428 #if defined(STATFS_TAKES_DENTRY)
429     statp->f_bsize = dentry->d_sb->s_blocksize;
430 #else
431     statp->f_bsize = sbp->s_blocksize;
432 #endif
433     statp->f_blocks = statp->f_bfree = statp->f_bavail = statp->f_files =
434         statp->f_ffree = 9000000;
435     statp->f_fsid.val[0] = AFS_VFSMAGIC;
436     statp->f_fsid.val[1] = AFS_VFSFSID;
437     statp->f_namelen = 256;
438
439 #if !defined(AFS_LINUX24_ENV)
440     memcpy_tofs(__statp, &stat, size);
441 #endif
442     return 0;
443 }
444
445 struct super_operations afs_sops = {
446 #if defined(STRUCT_SUPER_HAS_ALLOC_INODE)
447   .alloc_inode =        afs_alloc_inode,
448   .destroy_inode =      afs_destroy_inode,
449 #endif
450   .clear_inode =        afs_clear_inode,
451   .put_super =          afs_put_super,
452   .statfs =             afs_statfs,
453 #if !defined(AFS_LINUX24_ENV)
454   .notify_change =      afs_notify_change,
455 #endif
456 };
457
458 /************** Support routines ************************/
459
460 /* vattr_setattr
461  * Set iattr data into vattr. Assume vattr cleared before call.
462  */
463 static void
464 iattr2vattr(struct vattr *vattrp, struct iattr *iattrp)
465 {
466     vattrp->va_mask = iattrp->ia_valid;
467     if (iattrp->ia_valid & ATTR_MODE)
468         vattrp->va_mode = iattrp->ia_mode;
469     if (iattrp->ia_valid & ATTR_UID)
470         vattrp->va_uid = iattrp->ia_uid;
471     if (iattrp->ia_valid & ATTR_GID)
472         vattrp->va_gid = iattrp->ia_gid;
473     if (iattrp->ia_valid & ATTR_SIZE)
474         vattrp->va_size = iattrp->ia_size;
475     if (iattrp->ia_valid & ATTR_ATIME) {
476 #if defined(AFS_LINUX26_ENV)
477         vattrp->va_atime.tv_sec = iattrp->ia_atime.tv_sec;
478 #else
479         vattrp->va_atime.tv_sec = iattrp->ia_atime;
480 #endif
481         vattrp->va_atime.tv_usec = 0;
482     }
483     if (iattrp->ia_valid & ATTR_MTIME) {
484 #if defined(AFS_LINUX26_ENV)
485         vattrp->va_mtime.tv_sec = iattrp->ia_mtime.tv_sec;
486 #else
487         vattrp->va_mtime.tv_sec = iattrp->ia_mtime;
488 #endif
489         vattrp->va_mtime.tv_usec = 0;
490     }
491     if (iattrp->ia_valid & ATTR_CTIME) {
492 #if defined(AFS_LINUX26_ENV)
493         vattrp->va_ctime.tv_sec = iattrp->ia_ctime.tv_sec;
494 #else
495         vattrp->va_ctime.tv_sec = iattrp->ia_ctime;
496 #endif
497         vattrp->va_ctime.tv_usec = 0;
498     }
499 }
500
501 /* vattr2inode
502  * Rewrite the inode cache from the attr. Assumes all vattr fields are valid.
503  */
504 void
505 vattr2inode(struct inode *ip, struct vattr *vp)
506 {
507     ip->i_ino = vp->va_nodeid;
508     ip->i_nlink = vp->va_nlink;
509     ip->i_blocks = vp->va_blocks;
510 #ifdef STRUCT_INODE_HAS_I_BLKBITS
511     ip->i_blkbits = AFS_BLKBITS;
512 #endif
513 #ifdef STRUCT_INODE_HAS_I_BLKSIZE
514     ip->i_blksize = vp->va_blocksize;
515 #endif
516     ip->i_rdev = vp->va_rdev;
517     ip->i_mode = vp->va_mode;
518     ip->i_uid = vp->va_uid;
519     ip->i_gid = vp->va_gid;
520     ip->i_size = vp->va_size;
521 #if defined(AFS_LINUX26_ENV)
522     ip->i_atime.tv_sec = vp->va_atime.tv_sec;
523     ip->i_mtime.tv_sec = vp->va_mtime.tv_sec;
524     /* Set the mtime nanoseconds to the sysname generation number.
525      * This convinces NFS clients that all directories have changed
526      * any time the sysname list changes.
527      */
528     ip->i_mtime.tv_nsec = afs_sysnamegen;
529     ip->i_ctime.tv_sec = vp->va_ctime.tv_sec;
530 #else
531     ip->i_atime = vp->va_atime.tv_sec;
532     ip->i_mtime = vp->va_mtime.tv_sec;
533     ip->i_ctime = vp->va_ctime.tv_sec;
534 #endif
535 }
536
537 /* osi_linux_free_inode_pages
538  *
539  * Free all vnodes remaining in the afs hash.  Must be done before
540  * shutting down afs and freeing all memory.
541  */
542 void
543 osi_linux_free_inode_pages(void)
544 {
545     int i;
546     struct vcache *tvc, *nvc;
547     extern struct vcache *afs_vhashT[VCSIZE];
548
549     for (i = 0; i < VCSIZE; i++) {
550         for (tvc = afs_vhashT[i]; tvc; ) {
551             int slept;
552         
553             nvc = tvc->hnext;
554             if (afs_FlushVCache(tvc, &slept))           /* slept always 0 for linux? */
555                 printf("Failed to invalidate all pages on inode 0x%p\n", tvc);
556             tvc = nvc;
557         }
558     }
559 }