Allocate pathname buffers dynamically
[openafs.git] / src / vol / daemon_com.c
index f137efb..9b5149a 100644 (file)
@@ -1,7 +1,7 @@
 /*
  * Copyright 2006-2008, Sine Nomine Associates and others.
  * All Rights Reserved.
- * 
+ *
  * This software has been released under the terms of the IBM Public
  * License.  For details, see the LICENSE file in the top-level source
  * directory or online at http://www.openafs.org/dl/license10.html
 #include <afsconfig.h>
 #include <afs/param.h>
 
-RCSID
-    ("$Header$");
-
-#include <sys/types.h>
-#include <stdio.h>
-#ifdef AFS_NT40_ENV
-#include <winsock2.h>
-#include <time.h>
-#else
-#include <sys/param.h>
-#include <sys/socket.h>
-#include <netinet/in.h>
-#include <netdb.h>
-#include <sys/time.h>
-#endif
-#include <errno.h>
-#include <assert.h>
-#include <signal.h>
-#include <string.h>
-
+#include <roken.h>
+#include <afs/opr.h>
 
 #include <rx/xdr.h>
 #include <afs/afsint.h>
-#include "nfs.h"
 #include <afs/errors.h>
+#include <rx/rx_queue.h>
+
+#include "nfs.h"
 #include "daemon_com.h"
 #include "lwp.h"
 #include "lock.h"
@@ -54,6 +38,7 @@ RCSID
 #include "vnode.h"
 #include "volume.h"
 #include "partition.h"
+#include "common.h"
 #include <rx/rx_queue.h>
 
 #ifdef USE_UNIX_SOCKETS
@@ -61,14 +46,7 @@ RCSID
 #include <sys/un.h>
 #endif
 
-/*@printflike@*/ extern void Log(const char *format, ...);
-
-#ifdef osi_Assert
-#undef osi_Assert
-#endif
-#define osi_Assert(e) (void)(e)
-
-int (*V_BreakVolumeCallbacks) ();
+int (*V_BreakVolumeCallbacks) (VolumeId);
 
 #define MAXHANDLERS    4       /* Up to 4 clients; must be at least 2, so that
                                 * move = dump+restore can run on single server */
@@ -77,6 +55,18 @@ int (*V_BreakVolumeCallbacks) ();
 
 static int SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response * res);
 
+
+/*
+ * On AIX, connect() and bind() require use of SUN_LEN() macro;
+ * sizeof(struct sockaddr_un) will not suffice.
+ */
+#if defined(AFS_AIX_ENV) && defined(USE_UNIX_SOCKETS)
+#define AFS_SOCKADDR_LEN(sa)  SUN_LEN(sa)
+#else
+#define AFS_SOCKADDR_LEN(sa)  sizeof(*sa)
+#endif
+
+
 /* daemon com SYNC general interfaces */
 
 /**
@@ -91,17 +81,13 @@ static int SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC
 void
 SYNC_getAddr(SYNC_endpoint_t * endpoint, SYNC_sockaddr_t * addr)
 {
-#ifdef USE_UNIX_SOCKETS
-    char tbuffer[AFSDIR_PATH_MAX];
-#endif /* USE_UNIX_SOCKETS */
-
     memset(addr, 0, sizeof(*addr));
 
 #ifdef USE_UNIX_SOCKETS
-    strcompose(tbuffer, AFSDIR_PATH_MAX, AFSDIR_SERVER_LOCAL_DIRPATH, "/",
-               endpoint->un, NULL);
     addr->sun_family = AF_UNIX;
-    strncpy(addr->sun_path, tbuffer, (sizeof(struct sockaddr_un) - sizeof(short)));
+    snprintf(addr->sun_path, sizeof(addr->sun_path), "%s/%s",
+            AFSDIR_SERVER_LOCAL_DIRPATH, endpoint->un);
+    addr->sun_path[sizeof(addr->sun_path) - 1] = '\0';
 #else  /* !USE_UNIX_SOCKETS */
 #ifdef STRUCT_SOCKADDR_HAS_SA_LEN
     addr->sin_len = sizeof(struct sockaddr_in);
@@ -122,11 +108,11 @@ SYNC_getAddr(SYNC_endpoint_t * endpoint, SYNC_sockaddr_t * addr)
  * @post socket of domain specified in endpoint structure is created and
  *       returned to caller.
  */
-int
+osi_socket
 SYNC_getSock(SYNC_endpoint_t * endpoint)
 {
-    int sd;
-    assert((sd = socket(endpoint->domain, SOCK_STREAM, 0)) >= 0);
+    osi_socket sd;
+    opr_Verify((sd = socket(endpoint->domain, SOCK_STREAM, 0)) >= 0);
     return sd;
 }
 
@@ -151,7 +137,7 @@ SYNC_connect(SYNC_client_state * state)
        { 3, 3, 3, 5, 5, 5, 7, 15, 16, 24, 32, 40, 48, 0 };
     time_t *timeout = &backoff[0];
 
-    if (state->fd >= 0) {
+    if (state->fd != OSI_NULLSOCKET) {
        return 1;
     }
 
@@ -159,7 +145,7 @@ SYNC_connect(SYNC_client_state * state)
 
     for (;;) {
        state->fd = SYNC_getSock(&state->endpoint);
-       if (connect(state->fd, (struct sockaddr *)&addr, sizeof(addr)) >= 0)
+       if (connect(state->fd, (struct sockaddr *)&addr, AFS_SOCKADDR_LEN(&addr)) >= 0)
            return 1;
        if (!*timeout)
            break;
@@ -184,12 +170,8 @@ SYNC_connect(SYNC_client_state * state)
 int
 SYNC_disconnect(SYNC_client_state * state)
 {
-#ifdef AFS_NT40_ENV
-    closesocket(state->fd);
-#else
-    close(state->fd);
-#endif
-    state->fd = -1;
+    rk_closesocket(state->fd);
+    state->fd = OSI_NULLSOCKET;
     return 0;
 }
 
@@ -204,12 +186,11 @@ SYNC_disconnect(SYNC_client_state * state)
 afs_int32
 SYNC_closeChannel(SYNC_client_state * state)
 {
-    afs_int32 code;
     SYNC_command com;
     SYNC_response res;
     SYNC_PROTO_BUF_DECL(ores);
 
-    if (state->fd == -1)
+    if (state->fd == OSI_NULLSOCKET)
        return SYNC_OK;
 
     memset(&com, 0, sizeof(com));
@@ -271,16 +252,11 @@ SYNC_ask(SYNC_client_state * state, SYNC_command * com, SYNC_response * res)
     int tries;
     afs_uint32 now, timeout, code=SYNC_OK;
 
-    if (state->fatal_error) {
-       return SYNC_COM_ERROR;
-    }
-
-    if (state->fd == -1) {
+    if (state->fd == OSI_NULLSOCKET) {
        SYNC_connect(state);
     }
 
-    if (state->fd == -1) {
-       state->fatal_error = 1;
+    if (state->fd == OSI_NULLSOCKET) {
        return SYNC_COM_ERROR;
     }
 
@@ -290,7 +266,7 @@ SYNC_ask(SYNC_client_state * state, SYNC_command * com, SYNC_response * res)
 
     now = FT_ApproxTime();
     timeout = now + state->hard_timeout;
-    for (tries = 0; 
+    for (tries = 0;
         (tries <= state->retry_limit) && (now <= timeout);
         tries++, now = FT_ApproxTime()) {
        code = SYNC_ask_internal(state, com, res);
@@ -307,19 +283,18 @@ SYNC_ask(SYNC_client_state * state, SYNC_command * com, SYNC_response * res)
            SYNC_reconnect(state);
            /* try again */
        } else {
-           /* 
-            * unknown (probably protocol-specific) response code, pass it up to 
-            * the caller, and let them deal with it 
+           /*
+            * unknown (probably protocol-specific) response code, pass it up to
+            * the caller, and let them deal with it
             */
            break;
        }
     }
 
     if (code == SYNC_COM_ERROR) {
-       Log("SYNC_ask: fatal protocol error on circuit '%s'; disabling sync "
-           "protocol until next server restart\n", 
-           state->proto_name);
-       state->fatal_error = 1;
+       Log("SYNC_ask: too many / too latent fatal protocol errors on circuit "
+           "'%s'; giving up (tries %d timeout %d)\n",
+           state->proto_name, tries, timeout);
     }
 
     return code;
@@ -348,7 +323,7 @@ SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response *
     struct iovec iov[2];
 #endif
 
-    if (state->fd == -1) {
+    if (state->fd == OSI_NULLSOCKET) {
        Log("SYNC_ask:  invalid sync file descriptor on circuit '%s'\n",
            state->proto_name);
        res->hdr.response = SYNC_COM_ERROR;
@@ -362,11 +337,30 @@ SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response *
        goto done;
     }
 
+    /*
+     * fill in some common header fields
+     */
     com->hdr.proto_version = state->proto_version;
+    com->hdr.pkt_seq = ++state->pkt_seq;
+    com->hdr.com_seq = ++state->com_seq;
+#ifdef AFS_NT40_ENV
+    com->hdr.pid = 0;
+    com->hdr.tid = 0;
+#else
+    com->hdr.pid = getpid();
+#ifdef AFS_PTHREAD_ENV
+    com->hdr.tid = afs_pointer_to_int(pthread_self());
+#else
+    {
+       PROCESS handle = LWP_ThreadId();
+       com->hdr.tid = (handle) ? handle->index : 0;
+    }
+#endif /* !AFS_PTHREAD_ENV */
+#endif /* !AFS_NT40_ENV */
 
     memcpy(buf, &com->hdr, sizeof(com->hdr));
     if (com->payload.len) {
-       memcpy(buf + sizeof(com->hdr), com->payload.buf, 
+       memcpy(buf + sizeof(com->hdr), com->payload.buf,
               com->hdr.command_len - sizeof(com->hdr));
     }
 
@@ -425,7 +419,7 @@ SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response *
     res->recv_len = n;
 
     if (n < sizeof(res->hdr)) {
-       Log("SYNC_ask:  response too short on circuit '%s'\n", 
+       Log("SYNC_ask:  response too short on circuit '%s'\n",
            state->proto_name);
        res->hdr.response = SYNC_COM_ERROR;
        goto done;
@@ -435,7 +429,7 @@ SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response *
 #endif
 
     if ((n - sizeof(res->hdr)) > res->payload.len) {
-       Log("SYNC_ask:  response too long on circuit '%s'\n", 
+       Log("SYNC_ask:  response too long on circuit '%s'\n",
            state->proto_name);
        res->hdr.response = SYNC_COM_ERROR;
        goto done;
@@ -459,22 +453,25 @@ SYNC_ask_internal(SYNC_client_state * state, SYNC_command * com, SYNC_response *
 }
 
 
-/* 
- * daemon com SYNC server-side interfaces 
+/*
+ * daemon com SYNC server-side interfaces
  */
 
 /**
  * receive a command structure off a sync socket.
  *
- * @param[in] fd    socket descriptor
- * @param[out] com  sync command object to be populated
+ * @param[in]  state  pointer to server-side state object
+ * @param[in]  fd     file descriptor on which to perform i/o
+ * @param[out] com    sync command object to be populated
  *
  * @return operation status
  *    @retval SYNC_OK command received
  *    @retval SYNC_COM_ERROR there was a socket communications error
  */
 afs_int32
-SYNC_getCom(int fd, SYNC_command * com)
+SYNC_getCom(SYNC_server_state_t * state,
+           osi_socket fd,
+           SYNC_command * com)
 {
     int n;
     afs_int32 code = SYNC_OK;
@@ -539,15 +536,18 @@ SYNC_getCom(int fd, SYNC_command * com)
 /**
  * write a response structure to a sync socket.
  *
- * @param[in] fd
- * @param[in] res
+ * @param[in] state  handle to server-side state object
+ * @param[in] fd     file descriptor on which to perform i/o
+ * @param[in] res    handle to response packet
  *
  * @return operation status
  *    @retval SYNC_OK
  *    @retval SYNC_COM_ERROR
  */
 afs_int32
-SYNC_putRes(int fd, SYNC_response * res)
+SYNC_putRes(SYNC_server_state_t * state,
+           osi_socket fd,
+           SYNC_response * res)
 {
     int n;
     afs_int32 code = SYNC_OK;
@@ -568,10 +568,13 @@ SYNC_putRes(int fd, SYNC_response * res)
 #ifdef AFS_DEMAND_ATTACH_FS
     res->hdr.flags |= SYNC_FLAG_DAFS_EXTENSIONS;
 #endif
+    res->hdr.proto_version = state->proto_version;
+    res->hdr.pkt_seq = ++state->pkt_seq;
+    res->hdr.res_seq = ++state->res_seq;
 
     memcpy(buf, &res->hdr, sizeof(res->hdr));
     if (res->payload.len) {
-       memcpy(buf + sizeof(res->hdr), res->payload.buf, 
+       memcpy(buf + sizeof(res->hdr), res->payload.buf,
               res->hdr.response_len - sizeof(res->hdr));
     }
 
@@ -596,10 +599,9 @@ SYNC_putRes(int fd, SYNC_response * res)
 int
 SYNC_verifyProtocolString(char * buf, size_t len)
 {
-    int ret = 0;
     size_t s_len;
 
-    s_len = afs_strnlen(buf, len);
+    s_len = strnlen(buf, len);
 
     return (s_len == len) ? 1 : 0;
 }
@@ -645,9 +647,9 @@ SYNC_bindSock(SYNC_server_state_t * state)
        Log("SYNC_bindSock: setsockopt failed with (%d)\n", errno);
 
     for (numTries = 0; numTries < state->bind_retry_limit; numTries++) {
-       code = bind(state->fd, 
-                   (struct sockaddr *)&state->addr, 
-                   sizeof(state->addr));
+       code = bind(state->fd,
+                   (struct sockaddr *)&state->addr,
+                   AFS_SOCKADDR_LEN(&state->addr));
        if (code == 0)
            break;
        Log("SYNC_bindSock: bind failed with (%d), will sleep and retry\n",