vol, volser, and viced type fixes
[openafs.git] / src / vol / ihandle.c
index cfd7614..2ea3fb7 100644 (file)
 #include <afsconfig.h>
 #include <afs/param.h>
 
-RCSID("$Header$");
 
 #include <stdio.h>
 #include <sys/types.h>
 #include <errno.h>
+#include <string.h>
 #ifdef AFS_NT40_ENV
 #include <fcntl.h>
 #else
@@ -30,19 +30,13 @@ RCSID("$Header$");
 #include <sys/resource.h>
 #endif
 #endif
-#ifdef HAVE_STRING_H
-#include <string.h>
-#else
-#ifdef HAVE_STRINGS_H
-#include <strings.h>
-#endif
-#endif
+
 #include <rx/xdr.h>
 #include <afs/afsint.h>
 #include <errno.h>
 #include <afs/afssyscalls.h>
-#include "ihandle.h"
 #include "nfs.h"
+#include "ihandle.h"
 #include "viceinode.h"
 #ifdef AFS_PTHREAD_ENV
 #include <assert.h>
@@ -51,7 +45,15 @@ RCSID("$Header$");
 #endif /* AFS_PTHREAD_ENV */
 #include <limits.h>
 
-extern afs_int32 DErrno;
+#ifndef AFS_NT40_ENV
+#ifdef O_LARGEFILE
+#define afs_stat       stat64
+#define afs_fstat      fstat64
+#else /* !O_LARGEFILE */
+#define        afs_stat        stat
+#define        afs_fstat       fstat
+#endif /* !O_LARGEFILE */
+#endif /* AFS_NT40_ENV */
 
 #ifdef AFS_PTHREAD_ENV
 pthread_once_t ih_glock_once = PTHREAD_ONCE_INIT;
@@ -75,11 +77,16 @@ FdHandle_t *fdLruHead;
 FdHandle_t *fdLruTail;
 
 int ih_Inited = 0;
+int ih_PkgDefaultsSet = 0;
 
 /* Most of the servers use fopen/fdopen. Since the FILE structure
  * only has eight bits for the file descriptor, the cache size
  * has to be less than 256. The cache can be made larger as long
  * as you are sure you don't need fopen/fdopen. */
+
+/* As noted in ihandle.h, the fileno member of FILE on most platforms
+ * in 2008 is a 16- or 32-bit signed int. -Matt
+ */
 int fdMaxCacheSize = 0;
 int fdCacheSize = 0;
 
@@ -89,35 +96,61 @@ int fdInUseCount = 0;
 /* Hash table for inode handles */
 IHashBucket_t ihashTable[I_HANDLE_HASH_SIZE];
 
+void *ih_sync_thread(void *);
+
+/* start-time configurable I/O limits */
+ih_init_params vol_io_params;
+
+void ih_PkgDefaults(void)
+{
+    /* once */
+    ih_PkgDefaultsSet = 1;
+
+    /* default to well-known values */
+    vol_io_params.fd_handle_setaside = FD_HANDLE_SETASIDE;
+
+    /* initial fd cachesize.  the only one that will be used if
+     * the application does not call ih_UseLargeCache().  set this
+     * to a value representable in fileno member of the system's
+     * FILE structure (or equivalent). */
+    vol_io_params.fd_initial_cachesize = FD_DEFAULT_CACHESIZE;
+
+    /* fd cache size that will be used if/when ih_UseLargeCache()
+     * is called */
+    vol_io_params.fd_max_cachesize = FD_MAX_CACHESIZE;
+}
 
 #ifdef AFS_PTHREAD_ENV
 /* Initialize the global ihandle mutex */
-void ih_glock_init()
+void
+ih_glock_init(void)
 {
     assert(pthread_mutex_init(&ih_glock_mutex, NULL) == 0);
 }
 #endif /* AFS_PTHREAD_ENV */
 
 /* Initialize the file descriptor cache */
-void ih_Initialize() {
+void
+ih_Initialize(void)
+{
     int i;
     assert(!ih_Inited);
     ih_Inited = 1;
     DLL_INIT_LIST(ihAvailHead, ihAvailTail);
     DLL_INIT_LIST(fdAvailHead, fdAvailTail);
     DLL_INIT_LIST(fdLruHead, fdLruTail);
-    for (i = 0 ; i < I_HANDLE_HASH_SIZE ; i++) {
+    for (i = 0; i < I_HANDLE_HASH_SIZE; i++) {
        DLL_INIT_LIST(ihashTable[i].ihash_head, ihashTable[i].ihash_tail);
     }
 #if defined(AFS_NT40_ENV)
-    fdMaxCacheSize = FD_MAX_CACHESIZE;
+    fdMaxCacheSize = vol_io_params.fd_max_cachesize;
 #elif defined(AFS_SUN5_ENV) || defined(AFS_NBSD_ENV)
     {
        struct rlimit rlim;
        assert(getrlimit(RLIMIT_NOFILE, &rlim) == 0);
        rlim.rlim_cur = rlim.rlim_max;
        assert(setrlimit(RLIMIT_NOFILE, &rlim) == 0);
-       fdMaxCacheSize = rlim.rlim_cur-FD_HANDLE_SETASIDE;
+       fdMaxCacheSize = rlim.rlim_cur - vol_io_params.fd_handle_setaside;
 #ifdef AFS_NBSD_ENV
        /* XXX this is to avoid using up all system fd netbsd is
         * somewhat broken and have set maximum fd for a root process
@@ -129,64 +162,99 @@ void ih_Initialize() {
         */
        fdMaxCacheSize /= 4;
 #endif
-       fdMaxCacheSize = MIN(fdMaxCacheSize, FD_MAX_CACHESIZE);
+       fdMaxCacheSize = MIN(fdMaxCacheSize, vol_io_params.fd_max_cachesize);
        assert(fdMaxCacheSize > 0);
     }
 #elif defined(AFS_HPUX_ENV)
     /* Avoid problems with "UFSOpen: igetinode failed" panics on HPUX 11.0 */
     fdMaxCacheSize = 0;
 #else
-    fdMaxCacheSize = MAX(sysconf(_SC_OPEN_MAX)-FD_HANDLE_SETASIDE, 0);
-    fdMaxCacheSize = MIN(fdMaxCacheSize, FD_MAX_CACHESIZE);
+    {
+       long fdMax = MAX(sysconf(_SC_OPEN_MAX) - vol_io_params.fd_handle_setaside,
+                                        0);
+       fdMaxCacheSize = (int)MIN(fdMax, vol_io_params.fd_max_cachesize);
+    }
 #endif
-    fdCacheSize = MIN(fdMaxCacheSize, FD_DEFAULT_CACHESIZE);
+    fdCacheSize = MIN(fdMaxCacheSize, vol_io_params.fd_initial_cachesize);
+
+    {
+#ifdef AFS_PTHREAD_ENV
+       pthread_t syncer;
+       pthread_attr_t tattr;
+
+       pthread_attr_init(&tattr);
+       pthread_attr_setdetachstate(&tattr, PTHREAD_CREATE_DETACHED);
+
+       pthread_create(&syncer, &tattr, ih_sync_thread, NULL);
+#else /* AFS_PTHREAD_ENV */
+       PROCESS syncer;
+       LWP_CreateProcess(ih_sync_thread, 16*1024, LWP_MAX_PRIORITY - 2,
+           NULL, "ih_syncer", &syncer);
+#endif /* AFS_PTHREAD_ENV */
+    }
+
 }
 
 /* Make the file descriptor cache as big as possible. Don't this call
- * if the program uses fopen or fdopen. */
-void ih_UseLargeCache() {
-    IH_LOCK
+ * if the program uses fopen or fdopen, if fd_max_cachesize cannot be
+ * represented in the fileno member of the system FILE structure (or
+ * equivalent).
+ */
+void
+ih_UseLargeCache(void)
+{
+    IH_LOCK;
+
+    if (!ih_PkgDefaultsSet) {
+        ih_PkgDefaults();
+    }
 
     if (!ih_Inited) {
-       ih_Initialize();
+        ih_Initialize();
     }
+
     fdCacheSize = fdMaxCacheSize;
 
-    IH_UNLOCK
+    IH_UNLOCK;
 }
 
 /* Allocate a chunk of inode handles */
-void iHandleAllocateChunk()
+void
+iHandleAllocateChunk(void)
 {
     int i;
     IHandle_t *ihP;
 
     assert(ihAvailHead == NULL);
-    ihP = (IHandle_t *)malloc(I_HANDLE_MALLOCSIZE * sizeof(IHandle_t));
+    ihP = (IHandle_t *) malloc(I_HANDLE_MALLOCSIZE * sizeof(IHandle_t));
     assert(ihP != NULL);
-    for (i = 0 ; i < I_HANDLE_MALLOCSIZE ; i++) {
+    for (i = 0; i < I_HANDLE_MALLOCSIZE; i++) {
        ihP[i].ih_refcnt = 0;
        DLL_INSERT_TAIL(&ihP[i], ihAvailHead, ihAvailTail, ih_next, ih_prev);
     }
 }
 
 /* Initialize an inode handle */
-IHandle_t *ih_init(int dev, int vid, Inode ino)
+IHandle_t *
+ih_init(int dev, int vid, Inode ino)
 {
     int ihash = IH_HASH(dev, vid, ino);
     IHandle_t *ihP;
 
-    IH_LOCK
+    if (!ih_PkgDefaultsSet) {
+        ih_PkgDefaults();
+    }
 
+    IH_LOCK;
     if (!ih_Inited) {
-       ih_Initialize();
+        ih_Initialize();
     }
 
     /* Do we already have a handle for this Inode? */
-    for (ihP = ihashTable[ihash].ihash_head ; ihP ; ihP = ihP->ih_next) {
+    for (ihP = ihashTable[ihash].ihash_head; ihP; ihP = ihP->ih_next) {
        if (ihP->ih_ino == ino && ihP->ih_vid == vid && ihP->ih_dev == dev) {
            ihP->ih_refcnt++;
-           IH_UNLOCK
+           IH_UNLOCK;
            return ihP;
        }
     }
@@ -202,35 +270,38 @@ IHandle_t *ih_init(int dev, int vid, Inode ino)
     ihP->ih_vid = vid;
     ihP->ih_ino = ino;
     ihP->ih_flags = 0;
+    ihP->ih_synced = 0;
     ihP->ih_refcnt = 1;
     DLL_INIT_LIST(ihP->ih_fdhead, ihP->ih_fdtail);
     DLL_INSERT_TAIL(ihP, ihashTable[ihash].ihash_head,
                    ihashTable[ihash].ihash_tail, ih_next, ih_prev);
-    IH_UNLOCK
+    IH_UNLOCK;
     return ihP;
 }
 
 /* Copy an inode handle */
-IHandle_t *ih_copy(IHandle_t *ihP)
+IHandle_t *
+ih_copy(IHandle_t * ihP)
 {
-    IH_LOCK
+    IH_LOCK;
     assert(ih_Inited);
     assert(ihP->ih_refcnt > 0);
     ihP->ih_refcnt++;
-    IH_UNLOCK
+    IH_UNLOCK;
     return ihP;
 }
 
 /* Allocate a chunk of file descriptor handles */
-void fdHandleAllocateChunk()
+void
+fdHandleAllocateChunk(void)
 {
     int i;
     FdHandle_t *fdP;
 
     assert(fdAvailHead == NULL);
-    fdP = (FdHandle_t *)malloc(FD_HANDLE_MALLOCSIZE * sizeof(FdHandle_t));
+    fdP = (FdHandle_t *) malloc(FD_HANDLE_MALLOCSIZE * sizeof(FdHandle_t));
     assert(fdP != NULL);
-    for (i = 0 ; i < FD_HANDLE_MALLOCSIZE ; i++) {
+    for (i = 0; i < FD_HANDLE_MALLOCSIZE; i++) {
        fdP[i].fd_status = FD_HANDLE_AVAIL;
        fdP[i].fd_ih = NULL;
        fdP[i].fd_fd = INVALID_FD;
@@ -239,16 +310,17 @@ void fdHandleAllocateChunk()
 }
 
 /* Allocate a chunk of stream handles */
-void streamHandleAllocateChunk()
+void
+streamHandleAllocateChunk(void)
 {
     int i;
     StreamHandle_t *streamP;
 
     assert(streamAvailHead == NULL);
     streamP = (StreamHandle_t *)
-             malloc(STREAM_HANDLE_MALLOCSIZE * sizeof(StreamHandle_t));
+       malloc(STREAM_HANDLE_MALLOCSIZE * sizeof(StreamHandle_t));
     assert(streamP != NULL);
-    for (i = 0 ; i < STREAM_HANDLE_MALLOCSIZE ; i++) {
+    for (i = 0; i < STREAM_HANDLE_MALLOCSIZE; i++) {
        streamP[i].str_fd = INVALID_FD;
        DLL_INSERT_TAIL(&streamP[i], streamAvailHead, streamAvailTail,
                        str_next, str_prev);
@@ -258,26 +330,27 @@ void streamHandleAllocateChunk()
 /*
  * Get a file descriptor handle given an Inode handle
  */
-FdHandle_t *ih_open(IHandle_t *ihP)
+FdHandle_t *
+ih_open(IHandle_t * ihP)
 {
     FdHandle_t *fdP;
     FD_t fd;
     FD_t closeFd;
 
-    if (!ihP) /* XXX should log here in the fileserver */
+    if (!ihP)                  /* XXX should log here in the fileserver */
        return NULL;
 
-    IH_LOCK
+    IH_LOCK;
 
     /* Do we already have an open file handle for this Inode? */
-    for (fdP = ihP->ih_fdtail ; fdP != NULL ; fdP = fdP->fd_ihprev) {
+    for (fdP = ihP->ih_fdtail; fdP != NULL; fdP = fdP->fd_ihprev) {
        if (fdP->fd_status != FD_HANDLE_INUSE) {
            assert(fdP->fd_status == FD_HANDLE_OPEN);
            fdP->fd_status = FD_HANDLE_INUSE;
            DLL_DELETE(fdP, fdLruHead, fdLruTail, fd_next, fd_prev);
            ihP->ih_refcnt++;
-           IH_UNLOCK
-           FDH_SEEK(fdP, 0, SEEK_SET);
+           IH_UNLOCK;
+           (void)FDH_SEEK(fdP, 0, SEEK_SET);
            return fdP;
        }
     }
@@ -286,12 +359,13 @@ FdHandle_t *ih_open(IHandle_t *ihP)
      * Try to open the Inode, return NULL on error.
      */
     fdInUseCount += 1;
-    IH_UNLOCK
+    IH_UNLOCK;
+ih_open_retry:
     fd = OS_IOPEN(ihP);
-    IH_LOCK
-    if (fd == INVALID_FD) {
+    IH_LOCK;
+    if (fd == INVALID_FD && (errno != EMFILE || fdLruHead == NULL) ) {
        fdInUseCount -= 1;
-       IH_UNLOCK
+       IH_UNLOCK;
        return NULL;
     }
 
@@ -299,13 +373,23 @@ FdHandle_t *ih_open(IHandle_t *ihP)
      * we permit the number of open files to exceed fdCacheSize.
      * We only recycle open file descriptors when the number
      * of open files reaches the size of the cache */
-    if (fdInUseCount > fdCacheSize && fdLruHead != NULL) {
+    if ((fdInUseCount > fdCacheSize || fd == INVALID_FD)  && fdLruHead != NULL) {
        fdP = fdLruHead;
        assert(fdP->fd_status == FD_HANDLE_OPEN);
        DLL_DELETE(fdP, fdLruHead, fdLruTail, fd_next, fd_prev);
        DLL_DELETE(fdP, fdP->fd_ih->ih_fdhead, fdP->fd_ih->ih_fdtail,
-            fd_ihnext, fd_ihprev);
+                  fd_ihnext, fd_ihprev);
        closeFd = fdP->fd_fd;
+       if (fd == INVALID_FD) {
+           fdCacheSize--;          /* reduce in order to not run into here too often */
+           DLL_INSERT_TAIL(fdP, fdAvailHead, fdAvailTail, fd_next, fd_prev);
+           fdP->fd_status = FD_HANDLE_AVAIL;
+           fdP->fd_ih = NULL;
+           fdP->fd_fd = INVALID_FD;
+           IH_UNLOCK;
+           OS_CLOSE(closeFd);
+           goto ih_open_retry;
+       }
     } else {
        if (fdAvailHead == NULL) {
            fdHandleAllocateChunk();
@@ -323,32 +407,32 @@ FdHandle_t *ih_open(IHandle_t *ihP)
     ihP->ih_refcnt++;
 
     /* Add this handle to the Inode's list of open descriptors */
-    DLL_INSERT_TAIL(fdP, ihP->ih_fdhead, ihP->ih_fdtail, fd_ihnext, fd_ihprev);
+    DLL_INSERT_TAIL(fdP, ihP->ih_fdhead, ihP->ih_fdtail, fd_ihnext,
+                   fd_ihprev);
 
     if (closeFd != INVALID_FD) {
-       IH_UNLOCK
+       IH_UNLOCK;
        OS_CLOSE(closeFd);
-       IH_LOCK
+       IH_LOCK;
        fdInUseCount -= 1;
     }
 
-    IH_UNLOCK
+    IH_UNLOCK;
     return fdP;
 }
 
 /*
  * Return a file descriptor handle to the cache
  */
-int fd_close(FdHandle_t *fdP)
+int
+fd_close(FdHandle_t * fdP)
 {
-    FD_t closeFd;
     IHandle_t *ihP;
 
     if (!fdP)
        return 0;
 
-    IH_LOCK
-
+    IH_LOCK;
     assert(ih_Inited);
     assert(fdInUseCount > 0);
     assert(fdP->fd_status == FD_HANDLE_INUSE);
@@ -361,7 +445,7 @@ int fd_close(FdHandle_t *fdP)
      * IH_REALLY_CLOSED) or we have too many open files.
      */
     if (ihP->ih_flags & IH_REALLY_CLOSED || fdInUseCount > fdCacheSize) {
-       IH_UNLOCK
+       IH_UNLOCK;
        return fd_reallyclose(fdP);
     }
 
@@ -374,9 +458,9 @@ int fd_close(FdHandle_t *fdP)
      */
     if (ihP->ih_refcnt > 1) {
        ihP->ih_refcnt--;
-       IH_UNLOCK
+       IH_UNLOCK;
     } else {
-       IH_UNLOCK
+       IH_UNLOCK;
        ih_release(ihP);
     }
 
@@ -387,7 +471,8 @@ int fd_close(FdHandle_t *fdP)
  * Actually close the file descriptor handle and return it to
  * the free list.
  */
-int fd_reallyclose(FdHandle_t *fdP)
+int
+fd_reallyclose(FdHandle_t * fdP)
 {
     FD_t closeFd;
     IHandle_t *ihP;
@@ -395,8 +480,7 @@ int fd_reallyclose(FdHandle_t *fdP)
     if (!fdP)
        return 0;
 
-    IH_LOCK
-
+    IH_LOCK;
     assert(ih_Inited);
     assert(fdInUseCount > 0);
     assert(fdP->fd_status == FD_HANDLE_INUSE);
@@ -416,22 +500,21 @@ int fd_reallyclose(FdHandle_t *fdP)
      * has completed its job.
      */
     if (!ihP->ih_fdhead) {
-        ihP->ih_flags &= ~IH_REALLY_CLOSED;
+       ihP->ih_flags &= ~IH_REALLY_CLOSED;
     }
 
-    IH_UNLOCK
+    IH_UNLOCK;
     OS_CLOSE(closeFd);
-    IH_LOCK
-
+    IH_LOCK;
     fdInUseCount -= 1;
 
     /* If this is not the only reference to the Inode then we can decrement
      * the reference count, otherwise we need to call ih_release. */
     if (ihP->ih_refcnt > 1) {
        ihP->ih_refcnt--;
-       IH_UNLOCK
+       IH_UNLOCK;
     } else {
-       IH_UNLOCK
+       IH_UNLOCK;
        ih_release(ihP);
     }
 
@@ -439,18 +522,18 @@ int fd_reallyclose(FdHandle_t *fdP)
 }
 
 /* Enable buffered I/O on a file descriptor */
-StreamHandle_t *stream_fdopen(FD_t fd)
+StreamHandle_t *
+stream_fdopen(FD_t fd)
 {
     StreamHandle_t *streamP;
 
-    IH_LOCK
+    IH_LOCK;
     if (streamAvailHead == NULL) {
        streamHandleAllocateChunk();
     }
     streamP = streamAvailHead;
     DLL_DELETE(streamP, streamAvailHead, streamAvailTail, str_next, str_prev);
-    IH_UNLOCK
-
+    IH_UNLOCK;
     streamP->str_fd = fd;
     streamP->str_buflen = 0;
     streamP->str_bufoff = 0;
@@ -461,24 +544,25 @@ StreamHandle_t *stream_fdopen(FD_t fd)
 }
 
 /* Open a file for buffered I/O */
-StreamHandle_t *stream_open(const char *filename, const char *mode)
+StreamHandle_t *
+stream_open(const char *filename, const char *mode)
 {
-    FD_t fd;
+    FD_t fd = INVALID_FD;
 
     if (strcmp(mode, "r") == 0) {
        fd = OS_OPEN(filename, O_RDONLY, 0);
     } else if (strcmp(mode, "r+") == 0) {
        fd = OS_OPEN(filename, O_RDWR, 0);
     } else if (strcmp(mode, "w") == 0) {
-       fd = OS_OPEN(filename, O_WRONLY|O_TRUNC|O_CREAT, 0);
+       fd = OS_OPEN(filename, O_WRONLY | O_TRUNC | O_CREAT, 0);
     } else if (strcmp(mode, "w+") == 0) {
-       fd = OS_OPEN(filename, O_RDWR|O_TRUNC|O_CREAT, 0);
+       fd = OS_OPEN(filename, O_RDWR | O_TRUNC | O_CREAT, 0);
     } else if (strcmp(mode, "a") == 0) {
-       fd = OS_OPEN(filename, O_WRONLY|O_APPEND|O_CREAT, 0);
+       fd = OS_OPEN(filename, O_WRONLY | O_APPEND | O_CREAT, 0);
     } else if (strcmp(mode, "a+") == 0) {
-       fd = OS_OPEN(filename, O_RDWR|O_APPEND|O_CREAT, 0);
+       fd = OS_OPEN(filename, O_RDWR | O_APPEND | O_CREAT, 0);
     } else {
-       assert(FALSE); /* not implemented */
+       assert(FALSE);          /* not implemented */
     }
 
     if (fd == INVALID_FD) {
@@ -488,9 +572,11 @@ StreamHandle_t *stream_open(const char *filename, const char *mode)
 }
 
 /* fread for buffered I/O handles */
-int stream_read(void *ptr, int size, int nitems, StreamHandle_t *streamP)
+afs_sfsize_t
+stream_read(void *ptr, afs_fsize_t size, afs_fsize_t nitems,
+           StreamHandle_t * streamP)
 {
-    int nbytes, bytesRead, bytesToRead;
+    afs_fsize_t nbytes, bytesRead, bytesToRead;
     char *p;
 
     /* Need to seek before changing direction */
@@ -508,8 +594,9 @@ int stream_read(void *ptr, int size, int nitems, StreamHandle_t *streamP)
     while (nbytes > 0 && !streamP->str_eof) {
        if (streamP->str_buflen == 0) {
            streamP->str_bufoff = 0;
-           streamP->str_buflen = OS_READ(streamP->str_fd, streamP->str_buffer,
-                                         STREAM_HANDLE_BUFSIZE);
+           streamP->str_buflen =
+               OS_READ(streamP->str_fd, streamP->str_buffer,
+                       STREAM_HANDLE_BUFSIZE);
            if (streamP->str_buflen < 0) {
                streamP->str_error = errno;
                streamP->str_buflen = 0;
@@ -525,7 +612,7 @@ int stream_read(void *ptr, int size, int nitems, StreamHandle_t *streamP)
        if (bytesToRead > streamP->str_buflen) {
            bytesToRead = streamP->str_buflen;
        }
-       memcpy(p, streamP->str_buffer+streamP->str_bufoff, bytesToRead);
+       memcpy(p, streamP->str_buffer + streamP->str_bufoff, bytesToRead);
        p += bytesToRead;
        streamP->str_bufoff += bytesToRead;
        streamP->str_buflen -= bytesToRead;
@@ -533,14 +620,17 @@ int stream_read(void *ptr, int size, int nitems, StreamHandle_t *streamP)
        nbytes -= bytesToRead;
     }
 
-    return (bytesRead/size);
+    return (bytesRead / size);
 }
 
 /* fwrite for buffered I/O handles */
-int stream_write(void *ptr, int size, int nitems, StreamHandle_t *streamP)
+afs_sfsize_t
+stream_write(void *ptr, afs_fsize_t size, afs_fsize_t nitems,
+            StreamHandle_t * streamP)
 {
     char *p;
-    int rc, nbytes, bytesWritten, bytesToWrite;
+    afs_sfsize_t rc;
+    afs_fsize_t nbytes, bytesWritten, bytesToWrite;
 
     /* Need to seek before changing direction */
     if (streamP->str_direction == STREAM_DIRECTION_NONE) {
@@ -571,7 +661,7 @@ int stream_write(void *ptr, int size, int nitems, StreamHandle_t *streamP)
        if (bytesToWrite > streamP->str_buflen) {
            bytesToWrite = streamP->str_buflen;
        }
-       memcpy(streamP->str_buffer+streamP->str_bufoff, p, bytesToWrite);
+       memcpy(streamP->str_buffer + streamP->str_bufoff, p, bytesToWrite);
        p += bytesToWrite;
        streamP->str_bufoff += bytesToWrite;
        streamP->str_buflen -= bytesToWrite;
@@ -579,17 +669,18 @@ int stream_write(void *ptr, int size, int nitems, StreamHandle_t *streamP)
        nbytes -= bytesToWrite;
     }
 
-    return (bytesWritten/size);
+    return (bytesWritten / size);
 }
 
 /* fseek for buffered I/O handles */
-int stream_seek(StreamHandle_t *streamP, int offset, int whence)
+int
+stream_seek(StreamHandle_t * streamP, afs_foff_t offset, int whence)
 {
-    int rc;
+    ssize_t rc;
     int retval = 0;
 
-    if (streamP->str_direction == STREAM_DIRECTION_WRITE &&
-       streamP->str_bufoff > 0) {
+    if (streamP->str_direction == STREAM_DIRECTION_WRITE
+       && streamP->str_bufoff > 0) {
        rc = OS_WRITE(streamP->str_fd, streamP->str_buffer,
                      streamP->str_bufoff);
        if (rc < 0) {
@@ -609,13 +700,14 @@ int stream_seek(StreamHandle_t *streamP, int offset, int whence)
 }
 
 /* fflush for buffered I/O handles */
-int stream_flush(StreamHandle_t *streamP)
+int
+stream_flush(StreamHandle_t * streamP)
 {
-    int rc;
+    ssize_t rc;
     int retval = 0;
 
-    if (streamP->str_direction == STREAM_DIRECTION_WRITE &&
-       streamP->str_bufoff > 0) {
+    if (streamP->str_direction == STREAM_DIRECTION_WRITE
+       && streamP->str_bufoff > 0) {
        rc = OS_WRITE(streamP->str_fd, streamP->str_buffer,
                      streamP->str_bufoff);
        if (rc < 0) {
@@ -630,14 +722,15 @@ int stream_flush(StreamHandle_t *streamP)
 }
 
 /* Free a buffered I/O handle */
-int stream_close(StreamHandle_t *streamP, int reallyClose)
+int
+stream_close(StreamHandle_t * streamP, int reallyClose)
 {
-    int rc;
+    ssize_t rc;
     int retval = 0;
 
     assert(streamP != NULL);
-    if (streamP->str_direction == STREAM_DIRECTION_WRITE &&
-       streamP->str_bufoff > 0) {
+    if (streamP->str_direction == STREAM_DIRECTION_WRITE
+       && streamP->str_bufoff > 0) {
        rc = OS_WRITE(streamP->str_fd, streamP->str_buffer,
                      streamP->str_bufoff);
        if (rc < 0) {
@@ -652,11 +745,10 @@ int stream_close(StreamHandle_t *streamP, int reallyClose)
     }
     streamP->str_fd = INVALID_FD;
 
-    IH_LOCK
+    IH_LOCK;
     DLL_INSERT_TAIL(streamP, streamAvailHead, streamAvailTail,
                    str_next, str_prev);
-    IH_UNLOCK
-
+    IH_UNLOCK;
     return retval;
 }
 
@@ -665,7 +757,8 @@ int stream_close(StreamHandle_t *streamP, int reallyClose)
  * IH_LOCK. Sets the IH_REALLY_CLOSED flag in the inode handle
  * if it fails to close all file handles.
  */
-static int ih_fdclose(IHandle_t *ihP)
+static int
+ih_fdclose(IHandle_t * ihP)
 {
     int closeCount, closedAll;
     FdHandle_t *fdP, *head, *tail, *next;
@@ -682,50 +775,48 @@ static int ih_fdclose(IHandle_t *ihP)
      * can drop the lock before we close the files.
      */
     for (fdP = ihP->ih_fdhead; fdP != NULL; fdP = next) {
-        next = fdP->fd_ihnext;
-        assert(fdP->fd_ih == ihP);
-        assert(fdP->fd_status == FD_HANDLE_OPEN ||
-               fdP->fd_status == FD_HANDLE_INUSE);
-        if (fdP->fd_status == FD_HANDLE_OPEN) {
-            DLL_DELETE(fdP, ihP->ih_fdhead, ihP->ih_fdtail,
-                fd_ihnext, fd_ihprev);
-            DLL_DELETE(fdP, fdLruHead, fdLruTail, fd_next, fd_prev);
-            DLL_INSERT_TAIL(fdP, head, tail, fd_next, fd_prev);
-        } else {
-            closedAll = 0;
-            ihP->ih_flags |= IH_REALLY_CLOSED;
-        }
+       next = fdP->fd_ihnext;
+       assert(fdP->fd_ih == ihP);
+       assert(fdP->fd_status == FD_HANDLE_OPEN
+              || fdP->fd_status == FD_HANDLE_INUSE);
+       if (fdP->fd_status == FD_HANDLE_OPEN) {
+           DLL_DELETE(fdP, ihP->ih_fdhead, ihP->ih_fdtail, fd_ihnext,
+                      fd_ihprev);
+           DLL_DELETE(fdP, fdLruHead, fdLruTail, fd_next, fd_prev);
+           DLL_INSERT_TAIL(fdP, head, tail, fd_next, fd_prev);
+       } else {
+           closedAll = 0;
+           ihP->ih_flags |= IH_REALLY_CLOSED;
+       }
     }
 
     /* If the ihandle reference count is 1, we should have
      * closed all file descriptors.
      */
     if (ihP->ih_refcnt == 1 || closedAll) {
-        assert(closedAll);
-        assert(!ihP->ih_fdhead);
-        assert(!ihP->ih_fdtail);
+       assert(closedAll);
+       assert(!ihP->ih_fdhead);
+       assert(!ihP->ih_fdtail);
     }
 
     if (head == NULL) {
-        return 0;       /* No file descriptors closed */
+       return 0;               /* No file descriptors closed */
     }
 
-    IH_UNLOCK
-
+    IH_UNLOCK;
     /*
      * Close the file descriptors
      */
     closeCount = 0;
     for (fdP = head; fdP != NULL; fdP = fdP->fd_next) {
-        OS_CLOSE(fdP->fd_fd);
-        fdP->fd_status = FD_HANDLE_AVAIL;
-        fdP->fd_fd = INVALID_FD;
-        fdP->fd_ih = NULL;
-        closeCount++;
+       OS_CLOSE(fdP->fd_fd);
+       fdP->fd_status = FD_HANDLE_AVAIL;
+       fdP->fd_fd = INVALID_FD;
+       fdP->fd_ih = NULL;
+       closeCount++;
     }
 
-    IH_LOCK
-
+    IH_LOCK;
     assert(fdInUseCount >= closeCount);
     fdInUseCount -= closeCount;
 
@@ -733,56 +824,77 @@ static int ih_fdclose(IHandle_t *ihP)
      * Append the temporary queue to the list of available descriptors
      */
     if (fdAvailHead == NULL) {
-        fdAvailHead = head;
-        fdAvailTail = tail;
+       fdAvailHead = head;
+       fdAvailTail = tail;
     } else {
-        fdAvailTail->fd_next = head;
-        head->fd_prev = fdAvailTail;
-        fdAvailTail = tail;
+       fdAvailTail->fd_next = head;
+       head->fd_prev = fdAvailTail;
+       fdAvailTail = tail;
     }
 
     return 0;
 }
 
 /* Close all cached file descriptors for this inode. */
-int ih_reallyclose(IHandle_t *ihP)
+int
+ih_reallyclose(IHandle_t * ihP)
 {
     if (!ihP)
-        return 0;
+       return 0;
 
-    IH_LOCK
+    IH_LOCK;
+    ihP->ih_refcnt++;   /* must not disappear over unlock */
+    if (ihP->ih_synced) {
+       FdHandle_t *fdP;
+       IH_UNLOCK;
+       
+       fdP = IH_OPEN(ihP);
+       if (fdP) { 
+           OS_SYNC(fdP->fd_fd);
+           FDH_CLOSE(fdP);
+       }
+       
+       IH_LOCK;
+    }
 
     assert(ihP->ih_refcnt > 0);
-    ih_fdclose(ihP);
+    ihP->ih_synced = 0;
 
-    IH_UNLOCK
+    ih_fdclose(ihP);
 
+    if (ihP->ih_refcnt > 1) {
+       ihP->ih_refcnt--;
+       IH_UNLOCK;
+    } else {
+       IH_UNLOCK;
+       ih_release(ihP);
+    }
     return 0;
 }
 
 /* Release an Inode handle. All cached file descriptors for this
  * inode are closed when the last reference to this handle is released
  */
-int ih_release(IHandle_t *ihP)
+int
+ih_release(IHandle_t * ihP)
 {
     int ihash;
 
     if (!ihP)
-        return 0;
-
-    IH_LOCK
+       return 0;
 
+    IH_LOCK;
     assert(ihP->ih_refcnt > 0);
 
     if (ihP->ih_refcnt > 1) {
-        ihP->ih_refcnt--;
-        IH_UNLOCK
-        return 0;
+       ihP->ih_refcnt--;
+       IH_UNLOCK;
+       return 0;
     }
 
     ihash = IH_HASH(ihP->ih_dev, ihP->ih_vid, ihP->ih_ino);
     DLL_DELETE(ihP, ihashTable[ihash].ihash_head,
-        ihashTable[ihash].ihash_tail, ih_next, ih_prev);
+              ihashTable[ihash].ihash_tail, ih_next, ih_prev);
 
     ih_fdclose(ihP);
 
@@ -790,13 +902,13 @@ int ih_release(IHandle_t *ihP)
 
     DLL_INSERT_TAIL(ihP, ihAvailHead, ihAvailTail, ih_next, ih_prev);
 
-    IH_UNLOCK
-
+    IH_UNLOCK;
     return 0;
 }
 
 /* Sync an inode to disk if its handle isn't NULL */
-int ih_condsync(IHandle_t *ihP)
+int
+ih_condsync(IHandle_t * ihP)
 {
     int code;
     FdHandle_t *fdP;
@@ -814,14 +926,77 @@ int ih_condsync(IHandle_t *ihP)
     return code;
 }
 
+void
+ih_sync_all(void) {
+
+    int ihash;
+
+    IH_LOCK;
+    for (ihash = 0; ihash < I_HANDLE_HASH_SIZE; ihash++) {
+       IHandle_t *ihP, *ihPnext;
+
+       ihP = ihashTable[ihash].ihash_head;
+       if (ihP)
+           ihP->ih_refcnt++;   /* must not disappear over unlock */
+       for (; ihP; ihP = ihPnext) {
+           
+           if (ihP->ih_synced) {
+               FdHandle_t *fdP;
+
+               ihP->ih_synced = 0;
+               IH_UNLOCK;
+
+               fdP = IH_OPEN(ihP);
+               if (fdP) { 
+                   OS_SYNC(fdP->fd_fd);
+                   FDH_CLOSE(fdP);
+               }
+
+               IH_LOCK;
+           }
+
+           /* when decrementing the refcount, the ihandle might disappear
+              and we might not even be able to proceed to the next one.
+              Hence the gymnastics putting a hold on the next one already */
+           ihPnext = ihP->ih_next;
+           if (ihPnext) ihPnext->ih_refcnt++;
+
+           if (ihP->ih_refcnt > 1) {
+               ihP->ih_refcnt--;
+           } else {
+               IH_UNLOCK;
+               ih_release(ihP);
+               IH_LOCK;
+           }
+
+       }
+    }
+    IH_UNLOCK;
+}
+
+void *
+ih_sync_thread(void *dummy) {
+    while(1) {
+
+#ifdef AFS_PTHREAD_ENV
+       sleep(10);
+#else /* AFS_PTHREAD_ENV */
+       IOMGR_Sleep(60);
+#endif /* AFS_PTHREAD_ENV */
+
+        ih_sync_all();
+    }
+    return NULL;
+}
 
 
 /*************************************************************************
  * OS specific support routines.
  *************************************************************************/
 #ifndef AFS_NAMEI_ENV
-Inode ih_icreate(IHandle_t *ih, int dev, char *part, Inode nI, int p1, int p2,
-             int p3, int p4)
+Inode
+ih_icreate(IHandle_t * ih, int dev, char *part, Inode nI, int p1, int p2,
+          int p3, int p4)
 {
     Inode ino;
 #ifdef AFS_3DISPARES
@@ -839,10 +1014,11 @@ Inode ih_icreate(IHandle_t *ih, int dev, char *part, Inode nI, int p1, int p2,
 
 
 #ifndef AFS_NT40_ENV
-int ih_size(int fd)
+afs_sfsize_t
+ih_size(int fd)
 {
-    struct stat status;
-    if (fstat(fd, &status)<0)
+    struct afs_stat status;
+    if (afs_fstat(fd, &status) < 0)
        return -1;
     return status.st_size;
 }