windows-largefile-support-20060623
[openafs.git] / src / WINNT / afsd / cm_server.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afs/param.h>
11 #include <afs/stds.h>
12
13 #ifndef DJGPP
14 #include <windows.h>
15 #include <winsock2.h>
16 #include <nb30.h>
17 #else
18 #include <sys/socket.h>
19 #endif /* !DJGPP */
20 #include <stdlib.h>
21 #include <malloc.h>
22 #include <string.h>
23
24 #include "afsd.h"
25 #include <osi.h>
26 #include <rx/rx.h>
27
28 osi_rwlock_t cm_serverLock;
29
30 cm_server_t *cm_allServersp;
31
32 void
33 cm_ForceNewConnectionsAllServers(void)
34 {
35     cm_server_t *tsp;
36
37     lock_ObtainRead(&cm_serverLock);
38     for (tsp = cm_allServersp; tsp; tsp = tsp->allNextp) {
39         cm_GetServerNoLock(tsp);
40         cm_ForceNewConnections(tsp);
41         cm_PutServerNoLock(tsp);
42     }
43     lock_ReleaseRead(&cm_serverLock);
44 }
45
46 void 
47 cm_PingServer(cm_server_t *tsp)
48 {
49     long code;
50     int wasDown = 0;
51     cm_conn_t *connp;
52     struct rx_connection * callp;
53     long secs;
54     long usecs;
55     Capabilities caps = {0, 0};
56     char hoststr[16];
57
58     lock_ObtainMutex(&tsp->mx);
59     if (tsp->flags & CM_SERVERFLAG_PINGING) {
60         tsp->waitCount++;
61         osi_SleepM((LONG_PTR)tsp, &tsp->mx);
62         lock_ObtainMutex(&tsp->mx);
63         tsp->waitCount--;
64         if (tsp->waitCount == 0)
65             tsp->flags &= ~CM_SERVERFLAG_PINGING;
66         else 
67             osi_Wakeup((LONG_PTR)tsp);
68         lock_ReleaseMutex(&tsp->mx);
69         return;
70     }
71     tsp->flags |= CM_SERVERFLAG_PINGING;
72     wasDown = tsp->flags & CM_SERVERFLAG_DOWN;
73     afs_inet_ntoa_r(tsp->addr.sin_addr.S_un.S_addr, hoststr);
74     lock_ReleaseMutex(&tsp->mx);
75
76     code = cm_ConnByServer(tsp, cm_rootUserp, &connp);
77     if (code == 0) {
78         /* now call the appropriate ping call.  Drop the timeout if
79         * the server is known to be down, so that we don't waste a
80         * lot of time retiming out down servers.
81         */
82
83         osi_Log4(afsd_logp, "cm_PingServer server %s (%s) was %s with caps 0x%x",
84                   osi_LogSaveString(afsd_logp, hoststr), 
85                   tsp->type == CM_SERVER_VLDB ? "vldb" : "file",
86                   wasDown ? "down" : "up",
87                   tsp->capabilities);
88
89         if (wasDown)
90             rx_SetConnDeadTime(connp->callp, 10);
91         if (tsp->type == CM_SERVER_VLDB) {
92             code = VL_ProbeServer(connp->callp);
93         }
94         else {
95             /* file server */
96             callp = cm_GetRxConn(connp);
97             code = RXAFS_GetCapabilities(callp, &caps);
98             if (code == RXGEN_OPCODE)
99                 code = RXAFS_GetTime(callp, &secs, &usecs);
100             rx_PutConnection(callp);
101         }
102         if (wasDown)
103             rx_SetConnDeadTime(connp->callp, ConnDeadtimeout);
104         cm_PutConn(connp);
105     }   /* got an unauthenticated connection to this server */
106
107     lock_ObtainMutex(&tsp->mx);
108     if (code >= 0) {
109         /* mark server as up */
110         tsp->flags &= ~CM_SERVERFLAG_DOWN;
111
112         /* we currently handle 32-bits of capabilities */
113         if (caps.Capabilities_len > 0) {
114             tsp->capabilities = caps.Capabilities_val[0];
115             free(caps.Capabilities_val);
116             caps.Capabilities_len = 0;
117             caps.Capabilities_val = 0;
118         } else {
119             tsp->capabilities = 0;
120         }
121
122         osi_Log3(afsd_logp, "cm_PingServer server %s (%s) is up with caps 0x%x",
123                   osi_LogSaveString(afsd_logp, hoststr), 
124                   tsp->type == CM_SERVER_VLDB ? "vldb" : "file",
125                   tsp->capabilities);
126     } else {
127         /* mark server as down */
128         tsp->flags |= CM_SERVERFLAG_DOWN;
129         if (code != VRESTARTING)
130             cm_ForceNewConnections(tsp);
131
132         osi_Log3(afsd_logp, "cm_PingServer server %s (%s) is down with caps 0x%x",
133                   osi_LogSaveString(afsd_logp, hoststr), 
134                   tsp->type == CM_SERVER_VLDB ? "vldb" : "file",
135                   tsp->capabilities);
136     }
137
138     if (tsp->waitCount == 0)
139         tsp->flags &= ~CM_SERVERFLAG_PINGING;
140     else 
141         osi_Wakeup((LONG_PTR)tsp);
142     lock_ReleaseMutex(&tsp->mx);
143 }
144
145
146 void cm_CheckServers(long flags, cm_cell_t *cellp)
147 {
148     /* ping all file servers, up or down, with unauthenticated connection,
149      * to find out whether we have all our callbacks from the server still.
150      * Also, ping down VLDBs.
151      */
152     cm_server_t *tsp;
153     int doPing;
154     int isDown;
155
156     lock_ObtainWrite(&cm_serverLock);
157     for (tsp = cm_allServersp; tsp; tsp = tsp->allNextp) {
158         cm_GetServerNoLock(tsp);
159         lock_ReleaseWrite(&cm_serverLock);
160
161         /* now process the server */
162         lock_ObtainMutex(&tsp->mx);
163
164         doPing = 0;
165         isDown = tsp->flags & CM_SERVERFLAG_DOWN;
166
167         /* only do the ping if the cell matches the requested cell, or we're
168          * matching all cells (cellp == NULL), and if we've requested to ping
169          * this type of {up, down} servers.
170          */
171         if ((cellp == NULL || cellp == tsp->cellp) &&
172              ((isDown && (flags & CM_FLAG_CHECKDOWNSERVERS)) ||
173                (!isDown && (flags & CM_FLAG_CHECKUPSERVERS)))) {
174             doPing = 1;
175         }       /* we're supposed to check this up/down server */
176         lock_ReleaseMutex(&tsp->mx);
177
178         /* at this point, we've adjusted the server state, so do the ping and
179          * adjust things.
180          */
181         if (doPing) 
182             cm_PingServer(tsp);
183
184         /* also, run the GC function for connections on all of the
185          * server's connections.
186          */
187         cm_GCConnections(tsp);
188
189         lock_ObtainWrite(&cm_serverLock);
190         cm_PutServerNoLock(tsp);
191     }
192     lock_ReleaseWrite(&cm_serverLock);
193 }       
194
195 void cm_InitServer(void)
196 {
197     static osi_once_t once;
198         
199     if (osi_Once(&once)) {
200         lock_InitializeRWLock(&cm_serverLock, "cm_serverLock");
201         osi_EndOnce(&once);
202     }
203 }
204
205 void cm_GetServer(cm_server_t *serverp)
206 {
207     lock_ObtainWrite(&cm_serverLock);
208     serverp->refCount++;
209     lock_ReleaseWrite(&cm_serverLock);
210 }
211
212 void cm_GetServerNoLock(cm_server_t *serverp)
213 {
214     serverp->refCount++;
215 }
216
217 void cm_PutServer(cm_server_t *serverp)
218 {
219     lock_ObtainWrite(&cm_serverLock);
220     osi_assert(serverp->refCount-- > 0);
221     lock_ReleaseWrite(&cm_serverLock);
222 }
223
224 void cm_PutServerNoLock(cm_server_t *serverp)
225 {
226     osi_assert(serverp->refCount-- > 0);
227 }
228
229 void cm_SetServerNo64Bit(cm_server_t * serverp, int no64bit)
230 {
231     lock_ObtainMutex(&serverp->mx);
232     if (no64bit)
233         serverp->flags |= CM_SERVERFLAG_NO64BIT;
234     else
235         serverp->flags &= ~CM_SERVERFLAG_NO64BIT;
236     lock_ReleaseMutex(&serverp->mx);
237 }
238
239 void cm_SetServerPrefs(cm_server_t * serverp)
240 {
241     unsigned long       serverAddr;     /* in host byte order */
242     unsigned long       myAddr, myNet, mySubnet;/* in host byte order */
243     unsigned long       netMask;
244     int                 i;
245
246     int cm_noIPAddr;         /* number of client network interfaces */
247     int cm_IPAddr[CM_MAXINTERFACE_ADDR];    /* client's IP address in host order */
248     int cm_SubnetMask[CM_MAXINTERFACE_ADDR];/* client's subnet mask in host order*/
249     int cm_NetMtu[CM_MAXINTERFACE_ADDR];    /* client's MTU sizes */
250     int cm_NetFlags[CM_MAXINTERFACE_ADDR];  /* network flags */
251     long code;
252
253     /* get network related info */
254     cm_noIPAddr = CM_MAXINTERFACE_ADDR;
255     code = syscfg_GetIFInfo(&cm_noIPAddr,
256                             cm_IPAddr, cm_SubnetMask,
257                             cm_NetMtu, cm_NetFlags);
258
259     serverAddr = ntohl(serverp->addr.sin_addr.s_addr);
260     serverp->ipRank  = CM_IPRANK_LOW;   /* default setings */
261
262     for ( i=0; i < cm_noIPAddr; i++)
263     {
264         /* loop through all the client's IP address and compare
265         ** each of them against the server's IP address */
266
267         myAddr = cm_IPAddr[i];
268         if ( IN_CLASSA(myAddr) )
269             netMask = IN_CLASSA_NET;
270         else if ( IN_CLASSB(myAddr) )
271             netMask = IN_CLASSB_NET;
272         else if ( IN_CLASSC(myAddr) )
273             netMask = IN_CLASSC_NET;
274         else
275             netMask = 0;
276
277         myNet    =  myAddr & netMask;
278         mySubnet =  myAddr & cm_SubnetMask[i];
279
280         if ( (serverAddr & netMask) == myNet ) 
281         {
282             if ( (serverAddr & cm_SubnetMask[i]) == mySubnet)
283             {
284                 if ( serverAddr == myAddr ) 
285                     serverp->ipRank = min(serverp->ipRank,
286                                            CM_IPRANK_TOP);/* same machine */
287                 else serverp->ipRank = min(serverp->ipRank,
288                                             CM_IPRANK_HI); /* same subnet */
289             }
290             else serverp->ipRank = min(serverp->ipRank,CM_IPRANK_MED);
291             /* same net */
292         }       
293         /* random between 0..15*/
294         serverp->ipRank += min(serverp->ipRank, rand() % 0x000f);
295     } /* and of for loop */
296 }
297
298 cm_server_t *cm_NewServer(struct sockaddr_in *socketp, int type, cm_cell_t *cellp) {
299     cm_server_t *tsp;
300
301     osi_assert(socketp->sin_family == AF_INET);
302
303     tsp = malloc(sizeof(*tsp));
304     memset(tsp, 0, sizeof(*tsp));
305     tsp->type = type;
306     tsp->cellp = cellp;
307     tsp->refCount = 1;
308     lock_InitializeMutex(&tsp->mx, "cm_server_t mutex");
309     tsp->addr = *socketp;
310     tsp->flags = CM_SERVERFLAG_DOWN;    /* assume down; ping will mark up if available */
311
312     cm_SetServerPrefs(tsp); 
313
314     lock_ObtainWrite(&cm_serverLock);   /* get server lock */
315     tsp->allNextp = cm_allServersp;
316     cm_allServersp = tsp;
317     lock_ReleaseWrite(&cm_serverLock);  /* release server lock */
318
319     cm_PingServer(tsp);                 /* Obtain Capabilities and check up/down state */
320     return tsp;
321 }
322
323 /* find a server based on its properties */
324 cm_server_t *cm_FindServer(struct sockaddr_in *addrp, int type)
325 {
326     cm_server_t *tsp;
327
328     osi_assert(addrp->sin_family == AF_INET);
329         
330     lock_ObtainWrite(&cm_serverLock);
331     for (tsp = cm_allServersp; tsp; tsp=tsp->allNextp) {
332         if (tsp->type == type &&
333             tsp->addr.sin_addr.s_addr == addrp->sin_addr.s_addr) 
334             break;
335     }       
336
337     /* bump ref count if we found the server */
338     if (tsp) 
339         cm_GetServerNoLock(tsp);
340
341     /* drop big table lock */
342     lock_ReleaseWrite(&cm_serverLock);
343         
344     /* return what we found */
345     return tsp;
346 }       
347
348 cm_serverRef_t *cm_NewServerRef(cm_server_t *serverp)
349 {
350     cm_serverRef_t *tsrp;
351
352     cm_GetServer(serverp);
353     tsrp = malloc(sizeof(*tsrp));
354     tsrp->server = serverp;
355     tsrp->status = not_busy;
356     tsrp->next = NULL;
357     tsrp->refCount = 1;
358
359     return tsrp;
360 }
361
362 LONG_PTR cm_ChecksumServerList(cm_serverRef_t *serversp)
363 {
364     LONG_PTR sum = 0;
365     int first = 1;
366     cm_serverRef_t *tsrp;
367
368     lock_ObtainWrite(&cm_serverLock);
369     for (tsrp = serversp; tsrp; tsrp=tsrp->next) {
370         if (first)
371             first = 0;
372         else
373             sum <<= 1;
374         sum ^= (LONG_PTR) tsrp->server;
375     }
376
377     lock_ReleaseWrite(&cm_serverLock);
378     return sum;
379 }
380
381 /*
382 ** Insert a server into the server list keeping the list sorted in 
383 ** asending order of ipRank. 
384 ** 
385 ** The refCount of the cm_serverRef_t is increased
386 */
387 void cm_InsertServerList(cm_serverRef_t** list, cm_serverRef_t* element)
388 {
389     cm_serverRef_t      *current=*list;
390     unsigned short ipRank = element->server->ipRank;
391
392     lock_ObtainWrite(&cm_serverLock);
393     element->refCount++;                /* increase refCount */
394
395     /* insertion into empty list  or at the beginning of the list */
396     if ( !current || (current->server->ipRank > ipRank) )
397     {
398         element->next = *list;
399         *list = element;
400         lock_ReleaseWrite(&cm_serverLock);
401         return ;        
402     }
403         
404     while ( current->next ) /* find appropriate place to insert */
405     {
406         if ( current->next->server->ipRank > ipRank )
407             break;
408         else current = current->next;
409     }
410     element->next = current->next;
411     current->next = element;
412     lock_ReleaseWrite(&cm_serverLock);
413 }       
414 /*
415 ** Re-sort the server list with the modified rank
416 ** returns 0 if element was changed successfully. 
417 ** returns 1 if  list remained unchanged.
418 */
419 long cm_ChangeRankServer(cm_serverRef_t** list, cm_server_t*    server)
420 {
421     cm_serverRef_t  **current=list;
422     cm_serverRef_t      *element=0;
423
424     /* if there is max of one element in the list, nothing to sort */
425     if ( (!*current) || !((*current)->next)  )
426         return 1;               /* list unchanged: return success */
427
428     lock_ObtainWrite(&cm_serverLock);
429     /* if the server is on the list, delete it from list */
430     while ( *current )
431     {
432         if ( (*current)->server == server)
433         {
434             element = (*current);
435             *current = (*current)->next; /* delete it */
436             break;
437         }
438         current = & ( (*current)->next);        
439     }
440     lock_ReleaseWrite(&cm_serverLock);
441
442     /* if this volume is not replicated on this server  */
443     if (!element)
444         return 1;       /* server is not on list */
445
446     /* re-insert deleted element into the list with modified rank*/
447     cm_InsertServerList(list, element);
448
449     /* reduce refCount which was increased by cm_InsertServerList */
450     lock_ObtainWrite(&cm_serverLock);
451     element->refCount--;
452     lock_ReleaseWrite(&cm_serverLock);
453     return 0;
454 }
455 /*
456 ** If there are more than one server on the list and the first n servers on 
457 ** the list have the same rank( n>1), then randomise among the first n servers.
458 */
459 void cm_RandomizeServer(cm_serverRef_t** list)
460 {
461     int                 count, picked;
462     cm_serverRef_t*     tsrp = *list, *lastTsrp;
463     unsigned short      lowestRank;
464
465     /* an empty list or a list with only one element */
466     if ( !tsrp || ! tsrp->next )
467         return ; 
468
469     lock_ObtainWrite(&cm_serverLock);
470
471     /* count the number of servers with the lowest rank */
472     lowestRank = tsrp->server->ipRank;
473     for ( count=1, tsrp=tsrp->next; tsrp; tsrp=tsrp->next)
474     {
475         if ( tsrp->server->ipRank != lowestRank)
476             break;
477         else
478             count++;
479     }           
480
481     /* if there is only one server with the lowest rank, we are done */
482     if ( count <= 1 ) {
483         lock_ReleaseWrite(&cm_serverLock);
484         return ;
485     }   
486
487     picked = rand() % count;
488     if ( !picked ) {
489         lock_ReleaseWrite(&cm_serverLock);
490         return ;
491     }   
492
493     tsrp = *list;
494     while (--picked >= 0)
495     {
496         lastTsrp = tsrp;
497         tsrp = tsrp->next;
498     }
499     lastTsrp->next = tsrp->next;  /* delete random element from list*/
500     tsrp->next     = *list; /* insert element at the beginning of list */
501     *list          = tsrp;
502     lock_ReleaseWrite(&cm_serverLock);
503 }       
504
505 /* call cm_FreeServer while holding a write lock on cm_serverLock */
506 void cm_FreeServer(cm_server_t* serverp)
507 {
508     cm_PutServerNoLock(serverp);
509     if (serverp->refCount == 0)
510     {
511         /* we need to check to ensure that all of the connections
512          * for this server have a 0 refCount; otherwise, they will
513          * not be garbage collected 
514          */
515         cm_GCConnections(serverp);  /* connsp */
516
517         if (!(serverp->flags & CM_SERVERFLAG_PREF_SET)) {
518             lock_FinalizeMutex(&serverp->mx);
519             if ( cm_allServersp == serverp )
520                 cm_allServersp = serverp->allNextp;
521             else {
522                 cm_server_t *tsp;
523
524                 for(tsp = cm_allServersp; tsp->allNextp; tsp=tsp->allNextp) {
525                     if ( tsp->allNextp == serverp ) {
526                         tsp->allNextp = serverp->allNextp;
527                         break;
528                     }
529                 }
530             }
531             free(serverp);
532         }
533     }
534 }
535
536 void cm_FreeServerList(cm_serverRef_t** list)
537 {
538     cm_serverRef_t  **current = list;
539     cm_serverRef_t  **nextp = 0;
540     cm_serverRef_t  * next = 0;
541
542     lock_ObtainWrite(&cm_serverLock);
543
544     while (*current)
545     {
546         nextp = &(*current)->next;
547         if (--((*current)->refCount) == 0) {
548             next = *nextp;
549             cm_FreeServer((*current)->server);
550             free(*current);
551             *current = next;
552         } else {
553            current = nextp;
554         }
555     }
556   
557     lock_ReleaseWrite(&cm_serverLock);
558 }
559