libafs: memset dirHeader->hashTable
[openafs.git] / src / afs / afs_osi_vm.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include "afs/param.h"
12
13
14 #include "afs/sysincludes.h"    /* Standard vendor system headers */
15 #include "afsincludes.h"        /* Afs-based standard headers */
16 #include "afs/afs_stats.h"      /* afs statistics */
17 #ifdef AFS_AIX_ENV
18 #include <sys/adspace.h>        /* for vm_att(), vm_det() */
19 #endif
20
21 int
22 osi_Active(struct vcache *avc)
23 {
24     AFS_STATCNT(osi_Active);
25 #if defined(AFS_AIX_ENV) || defined(AFS_SUN5_ENV) || (AFS_LINUX20_ENV) || defined(AFS_DARWIN_ENV) || defined(AFS_XBSD_ENV)
26     if ((avc->opens > 0) || (avc->f.states & CMAPPED))
27         return 1;               /* XXX: Warning, verify this XXX  */
28 #elif defined(AFS_SGI_ENV)
29     if ((avc->opens > 0) || AFS_VN_MAPPED(AFSTOV(avc)))
30         return 1;
31 #else
32     if (avc->opens > 0 || (AFSTOV(avc)->v_flag & VTEXT))
33         return (1);
34 #endif
35     return 0;
36 }
37
38 /* this call, unlike osi_FlushText, is supposed to discard caches that may
39    contain invalid information if a file is written remotely, but that may
40    contain valid information that needs to be written back if the file is
41    being written locally.  It doesn't subsume osi_FlushText, since the latter
42    function may be needed to flush caches that are invalidated by local writes.
43
44    avc->pvnLock is already held, avc->lock is guaranteed not to be held (by
45    us, of course).
46 */
47 void
48 osi_FlushPages(struct vcache *avc, afs_ucred_t *credp)
49 {
50     afs_hyper_t origDV;
51 #if defined(AFS_CACHE_BYPASS)
52     /* The optimization to check DV under read lock below is identical a
53      * change in CITI cache bypass work.  The problem CITI found in 1999
54      * was that this code and background daemon doing prefetching competed
55      * for the vcache entry shared lock.  It's not clear to me from the
56      * tech report, but it looks like CITI fixed the general prefetch code
57      * path as a bonus when experimenting on prefetch for cache bypass, see
58      * citi-tr-01-3.
59      */
60 #endif
61     if (vType(avc) == VDIR) {
62         /* not applicable to directories; they're never mapped or stored in
63          * pages */
64         return;
65     }
66     ObtainReadLock(&avc->lock);
67     /* If we've already purged this version, or if we're the ones
68      * writing this version, don't flush it (could lose the
69      * data we're writing). */
70     if ((hcmp((avc->f.m.DataVersion), (avc->mapDV)) <= 0)
71         || ((avc->execsOrWriters > 0) && afs_DirtyPages(avc))) {
72         ReleaseReadLock(&avc->lock);
73         return;
74     }
75     ReleaseReadLock(&avc->lock);
76     ObtainWriteLock(&avc->lock, 10);
77     /* Check again */
78     if ((hcmp((avc->f.m.DataVersion), (avc->mapDV)) <= 0)
79         || ((avc->execsOrWriters > 0) && afs_DirtyPages(avc))) {
80         ReleaseWriteLock(&avc->lock);
81         return;
82     }
83     if (hiszero(avc->mapDV)) {
84         hset(avc->mapDV, avc->f.m.DataVersion);
85         ReleaseWriteLock(&avc->lock);
86         return;
87     }
88
89     AFS_STATCNT(osi_FlushPages);
90     hset(origDV, avc->f.m.DataVersion);
91     afs_Trace3(afs_iclSetp, CM_TRACE_FLUSHPAGES, ICL_TYPE_POINTER, avc,
92                ICL_TYPE_INT32, origDV.low, ICL_TYPE_INT32, avc->f.m.Length);
93
94     ReleaseWriteLock(&avc->lock);
95 #ifndef AFS_FBSD70_ENV
96     AFS_GUNLOCK();
97 #endif
98     osi_VM_FlushPages(avc, credp);
99 #ifndef AFS_FBSD70_ENV
100     AFS_GLOCK();
101 #endif
102     ObtainWriteLock(&avc->lock, 88);
103
104     /* do this last, and to original version, since stores may occur
105      * while executing above PUTPAGE call */
106     hset(avc->mapDV, origDV);
107     ReleaseWriteLock(&avc->lock);
108 }
109
110 #ifdef  AFS_TEXT_ENV
111
112 /* This call is supposed to flush all caches that might be invalidated
113  * by either a local write operation or a write operation done on
114  * another client.  This call may be called repeatedly on the same
115  * version of a file, even while a file is being written, so it
116  * shouldn't do anything that would discard newly written data before
117  * it is written to the file system. */
118
119 void
120 osi_FlushText_really(struct vcache *vp)
121 {
122     afs_hyper_t fdv;            /* version before which we'll flush */
123
124     AFS_STATCNT(osi_FlushText);
125     /* see if we've already flushed this data version */
126     if (hcmp(vp->f.m.DataVersion, vp->flushDV) <= 0)
127         return;
128
129     ObtainWriteLock(&afs_ftf, 317);
130     hset(fdv, vp->f.m.DataVersion);
131
132     /* why this disgusting code below?
133      *    xuntext, called by xrele, doesn't notice when it is called
134      * with a freed text object.  Sun continually calls xrele or xuntext
135      * without any locking, as long as VTEXT is set on the
136      * corresponding vnode.
137      *    But, if the text object is locked when you check the VTEXT
138      * flag, several processes can wait in xuntext, waiting for the
139      * text lock; when the second one finally enters xuntext's
140      * critical region, the text object is already free, but the check
141      * was already done by xuntext's caller.
142      *    Even worse, it turns out that xalloc locks the text object
143      * before reading or stating a file via the vnode layer.  Thus, we
144      * could end up in getdcache, being asked to bring in a new
145      * version of a file, but the corresponding text object could be
146      * locked.  We can't flush the text object without causing
147      * deadlock, so now we just don't try to lock the text object
148      * unless it is guaranteed to work.  And we try to flush the text
149      * when we need to a bit more often at the vnode layer.  Sun
150      * really blew the vm-cache flushing interface.
151      */
152
153 #if defined (AFS_HPUX_ENV)
154     if (vp->v.v_flag & VTEXT) {
155         xrele(vp);
156
157         if (vp->v.v_flag & VTEXT) {     /* still has a text object? */
158             ReleaseWriteLock(&afs_ftf);
159             return;
160         }
161     }
162 #endif
163
164     /* next do the stuff that need not check for deadlock problems */
165     mpurge(vp);
166
167     /* finally, record that we've done it */
168     hset(vp->flushDV, fdv);
169     ReleaseWriteLock(&afs_ftf);
170
171 }
172 #endif /* AFS_TEXT_ENV */
173
174 /* ? is it moderately likely that there are dirty VM pages associated with
175  * this vnode?
176  *
177  *  Prereqs:  avc must be write-locked
178  *
179  *  System Dependencies:  - *must* support each type of system for which
180  *                          memory mapped files are supported, even if all
181  *                          it does is return TRUE;
182  *
183  * NB:  this routine should err on the side of caution for ProcessFS to work
184  *      correctly (or at least, not to introduce worse bugs than already exist)
185  */
186 #ifdef  notdef
187 int
188 osi_VMDirty_p(struct vcache *avc)
189 {
190     int dirtyPages;
191
192     if (avc->execsOrWriters <= 0)
193         return 0;               /* can't be many dirty pages here, I guess */
194
195 #if defined (AFS_AIX32_ENV)
196 #ifdef  notdef
197     /* because of the level of hardware involvment with VM and all the
198      * warnings about "This routine must be called at VMM interrupt
199      * level", I thought it would be safest to disable interrupts while
200      * looking at the software page fault table.  */
201
202     /* convert vm handle into index into array:  I think that stoinio is
203      * always zero...  Look into this XXX  */
204 #define VMHASH(handle) ( \
205                         ( ((handle) & ~vmker.stoinio)  \
206                          ^ ((((handle) & ~vmker.stoinio) & vmker.stoimask) << vmker.stoihash) \
207                          ) & 0x000fffff)
208
209     if (avc->segid) {
210         unsigned int pagef, pri, index, next;
211
212         index = VMHASH(avc->segid);
213         if (scb_valid(index)) { /* could almost be an ASSERT */
214
215             pri = disable_ints();
216             for (pagef = scb_sidlist(index); pagef >= 0; pagef = next) {
217                 next = pft_sidfwd(pagef);
218                 if (pft_modbit(pagef)) {        /* has page frame been modified? */
219                     enable_ints(pri);
220                     return 1;
221                 }
222             }
223             enable_ints(pri);
224         }
225     }
226 #undef VMHASH
227 #endif
228 #endif /* AFS_AIX32_ENV */
229
230 #if defined (AFS_SUN5_ENV)
231     if (avc->f.states & CMAPPED) {
232         struct page *pg;
233         for (pg = avc->v.v_s.v_Pages; pg; pg = pg->p_vpnext) {
234             if (pg->p_mod) {
235                 return 1;
236             }
237         }
238     }
239 #endif
240     return 0;
241 }
242 #endif /* notdef */
243
244
245 /*
246  * Solaris osi_ReleaseVM should not drop and re-obtain the vcache entry lock.
247  * This leads to bad races when osi_ReleaseVM() is called from
248  * afs_InvalidateAllSegments().
249
250  * We can do this because Solaris osi_VM_Truncate() doesn't care whether the
251  * vcache entry lock is held or not.
252  *
253  * For other platforms, in some cases osi_VM_Truncate() doesn't care, but
254  * there may be cases where it does care.  If so, it would be good to fix
255  * them so they don't care.  Until then, we assume the worst.
256  *
257  * Locking:  the vcache entry lock is held.  It is dropped and re-obtained.
258  */
259 void
260 osi_ReleaseVM(struct vcache *avc, afs_ucred_t *acred)
261 {
262 #ifdef  AFS_SUN5_ENV
263     AFS_GUNLOCK();
264     osi_VM_Truncate(avc, 0, acred);
265     AFS_GLOCK();
266 #else
267     ReleaseWriteLock(&avc->lock);
268     AFS_GUNLOCK();
269     osi_VM_Truncate(avc, 0, acred);
270     AFS_GLOCK();
271     ObtainWriteLock(&avc->lock, 80);
272 #endif
273 }