1fa14cb37a3fca97873557e6bbdd4965a47a393e
[openafs.git] / src / ubik / beacon.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13
14 #include <sys/types.h>
15 #include <string.h>
16 #include <stdarg.h>
17 #include <errno.h>
18
19 #ifdef AFS_NT40_ENV
20 #include <winsock2.h>
21 #include <time.h>
22 #else
23 #include <sys/file.h>
24 #include <sys/time.h>
25 #include <sys/socket.h>
26 #include <netinet/in.h>
27 #include <netdb.h>
28 #endif
29
30 #include <lock.h>
31 #include <rx/xdr.h>
32 #include <rx/rx.h>
33 #include <rx/rx_multi.h>
34 #include <afs/cellconfig.h>
35 #ifndef AFS_NT40_ENV
36 #include <afs/afsutil.h>
37 #include <afs/netutils.h>
38 #endif
39
40 #define UBIK_INTERNALS
41 #include "ubik.h"
42 #include "ubik_int.h"
43
44 /*! \name statics used to determine if we're the sync site */
45 static afs_int32 syncSiteUntil = 0;     /*!< valid only if amSyncSite */
46 int ubik_amSyncSite = 0;        /*!< flag telling if I'm sync site */
47 static int nServers;            /*!< total number of servers */
48 static char amIMagic = 0;       /*!< is this host the magic host */
49 char amIClone = 0;              /*!< is this a clone which doesn't vote */
50 static char ubik_singleServer = 0;
51 /*\}*/
52 int (*ubik_CRXSecurityProc) (void *rock, struct rx_securityClass **,
53                              afs_int32 *);
54 void *ubik_CRXSecurityRock;
55 afs_int32 ubikSecIndex;
56 struct rx_securityClass *ubikSecClass;
57 static int ubeacon_InitServerListCommon(afs_int32 ame,
58                                         struct afsconf_cell *info,
59                                         char clones[],
60                                         afs_int32 aservers[]);
61 static int verifyInterfaceAddress(afs_uint32 *ame, struct afsconf_cell *info,
62                                   afs_uint32 aservers[]);
63 static int updateUbikNetworkAddress(afs_uint32 ubik_host[UBIK_MAX_INTERFACE_ADDR]);
64
65
66 /*! \file
67  * Module responsible for both deciding if we're currently the sync site,
68  * and keeping collecting votes so as to stay sync site.
69  *
70  * The basic module contacts all of the servers it can, trying to get them to vote
71  * for this server for sync site.  The vote request message (called a beacon message)
72  * also specifies until which time this site claims to be the sync site, if at all, thus enabling
73  * receiving sites to know how long the sync site guarantee is made for.
74  *
75  * Each  of these beacon messages is thus both a declaration of how long this site will
76  * remain sync site, and an attempt to extend that time by collecting votes for a later
77  * sync site extension.
78  *
79  * The voting module is responsible for choosing a reasonable time until which it promises
80  * not to vote for someone else.  This parameter (BIG seconds) is not actually passed in
81  * the interface (perhaps it should be?) but is instead a compile time constant that both
82  * sides know about.
83  
84  * The beacon and vote modules work intimately together; the vote module decides how long
85  * it should promise the beacon module its vote, and the beacon module takes all of these
86  * votes and decides for how long it is the synchronization site.
87  */
88
89 /*! \brief procedure called from debug rpc call to get this module's state for debugging */
90 void
91 ubeacon_Debug(register struct ubik_debug *aparm)
92 {
93     /* fill in beacon's state fields in the ubik_debug structure */
94     aparm->syncSiteUntil = syncSiteUntil;
95     aparm->nServers = nServers;
96 }
97
98 /*!
99  * \brief Procedure that determines whether this site has enough current votes to remain sync site.
100  *
101  * Called from higher-level modules (everything but the vote module).
102  *
103  * If we're the sync site, check that our guarantees, obtained by the ubeacon_Interact()
104  * light-weight process, haven't expired.  We're sync site as long as a majority of the
105  * servers in existence have promised us unexpired guarantees.  The variable #ubik_syncSiteUntil
106  * contains the time at which the latest of the majority of the sync site guarantees expires
107  * (if the variable #ubik_amSyncSite is true)
108  * This module also calls up to the recovery module if it thinks that the recovery module
109  * may have to pick up a new database (which offucr sif [sic] we lose the sync site votes).
110  *
111  * \return 1 if local site is the sync site
112  * \return 0 if sync site is elsewhere
113  */
114 int
115 ubeacon_AmSyncSite(void)
116 {
117     register afs_int32 now;
118     register afs_int32 rcode;
119
120     /* special case for fast startup */
121     if (nServers == 1 && !amIClone) {
122         return 1;               /* one guy is always the sync site */
123     }
124
125     if (ubik_amSyncSite == 0 || amIClone)
126         rcode = 0;              /* if I don't think I'm the sync site, say so */
127     else {
128         now = FT_ApproxTime();
129         if (syncSiteUntil <= now) {     /* if my votes have expired, say so */
130             if (ubik_amSyncSite)
131                 ubik_dprint("Ubik: I am no longer the sync site\n");
132             ubik_amSyncSite = 0;
133             rcode = 0;
134         } else {
135             rcode = 1;          /* otherwise still have the required votes */
136         }
137     }
138     if (rcode == 0)
139         urecovery_ResetState(); /* force recovery to re-execute */
140     ubik_dprint("beacon: amSyncSite is %d\n", rcode);
141     return rcode;
142 }
143
144 /*!
145  * \see ubeacon_InitServerListCommon()
146  */
147 int
148 ubeacon_InitServerListByInfo(afs_int32 ame, struct afsconf_cell *info, 
149                              char clones[])
150 {
151     afs_int32 code;
152
153     code = ubeacon_InitServerListCommon(ame, info, clones, 0);
154     return code;
155 }
156
157 /*!
158  * \param ame "address of me"
159  * \param aservers list of other servers
160  *
161  * \see ubeacon_InitServerListCommon()
162  */
163 ubeacon_InitServerList(afs_int32 ame, register afs_int32 aservers[])
164 {
165     afs_int32 code;
166
167     code =
168         ubeacon_InitServerListCommon(ame, (struct afsconf_cell *)0, 0,
169                                      aservers);
170     return code;
171 }
172
173 /*!
174  * \brief setup server list
175  *
176  * \param ame "address of me"
177  * \param aservers list of other servers
178  *
179  * called only at initialization to set up the list of servers to 
180  * contact for votes.  Just creates the server structure.  
181  *
182  * The "magic" host is the one with the lowest internet address.  It is
183  * magic because its vote counts epsilon more than the others.  This acts
184  * as a tie-breaker when we have an even number of hosts in the system.
185  * For example, if the "magic" host is up in a 2 site system, then it
186  * is sync site.  Without the magic host hack, if anyone crashed in a 2
187  * site system, we'd be out of business.
188  *
189  * \note There are two connections in every server structure, one for
190  * vote calls (which must always go through quickly) and one for database 
191  * operations, which are subject to waiting for locks.  If we used only 
192  * one, the votes would sometimes get held up behind database operations, 
193  * and the sync site guarantees would timeout even though the host would be 
194  * up for communication.
195  *
196  * \see ubeacon_InitServerList(), ubeacon_InitServerListByInfo()
197  */
198 ubeacon_InitServerListCommon(afs_int32 ame, struct afsconf_cell *info, 
199                              char clones[], register afs_int32 aservers[])
200 {
201     register struct ubik_server *ts;
202     afs_int32 me = -1;
203     register afs_int32 servAddr;
204     register afs_int32 i, code;
205     afs_int32 magicHost;
206     struct ubik_server *magicServer;
207
208     /* verify that the addresses passed in are correct */
209     if ((code = verifyInterfaceAddress(&ame, info, aservers)))
210         return code;
211
212     /* get the security index to use, if we can */
213     if (ubik_CRXSecurityProc) {
214         i = (*ubik_CRXSecurityProc) (ubik_CRXSecurityRock, &ubikSecClass,
215                                      &ubikSecIndex);
216     } else
217         i = 1;
218     if (i) {
219         /* don't have sec module yet */
220         ubikSecIndex = 0;
221         ubikSecClass = rxnull_NewClientSecurityObject();
222     }
223     magicHost = ntohl(ame);     /* do comparisons in host order */
224     magicServer = (struct ubik_server *)0;
225
226     if (info) {
227         for (i = 0; i < info->numServers; i++) {
228             if (ntohl((afs_uint32) info->hostAddr[i].sin_addr.s_addr) ==
229                 ntohl((afs_uint32) ame)) {
230                 me = i;
231                 if (clones[i]) {
232                     amIClone = 1;
233                     magicHost = 0;
234                 }
235             }
236         }
237         nServers = 0;
238         for (i = 0; i < info->numServers; i++) {
239             if (i == me)
240                 continue;
241             ts = (struct ubik_server *)malloc(sizeof(struct ubik_server));
242             memset(ts, 0, sizeof(struct ubik_server));
243             ts->next = ubik_servers;
244             ubik_servers = ts;
245             ts->addr[0] = info->hostAddr[i].sin_addr.s_addr;
246             if (clones[i]) {
247                 ts->isClone = 1;
248             } else {
249                 if (!magicHost
250                     || ntohl((afs_uint32) ts->addr[0]) <
251                     (afs_uint32) magicHost) {
252                     magicHost = ntohl(ts->addr[0]);
253                     magicServer = ts;
254                 }
255                 ++nServers;
256             }
257             /* for vote reqs */
258             ts->vote_rxcid =
259                 rx_NewConnection(info->hostAddr[i].sin_addr.s_addr,
260                                  ubik_callPortal, VOTE_SERVICE_ID,
261                                  ubikSecClass, ubikSecIndex);
262             /* for disk reqs */
263             ts->disk_rxcid =
264                 rx_NewConnection(info->hostAddr[i].sin_addr.s_addr,
265                                  ubik_callPortal, DISK_SERVICE_ID,
266                                  ubikSecClass, ubikSecIndex);
267             ts->up = 1;
268         }
269     } else {
270         i = 0;
271         while ((servAddr = *aservers++)) {
272             if (i >= MAXSERVERS)
273                 return UNHOSTS; /* too many hosts */
274             ts = (struct ubik_server *)malloc(sizeof(struct ubik_server));
275             memset(ts, 0, sizeof(struct ubik_server));
276             ts->next = ubik_servers;
277             ubik_servers = ts;
278             ts->addr[0] = servAddr;     /* primary address in  net byte order */
279             ts->vote_rxcid = rx_NewConnection(servAddr, ubik_callPortal, VOTE_SERVICE_ID, ubikSecClass, ubikSecIndex);  /* for vote reqs */
280             ts->disk_rxcid = rx_NewConnection(servAddr, ubik_callPortal, DISK_SERVICE_ID, ubikSecClass, ubikSecIndex);  /* for disk reqs */
281             ts->isClone = 0;    /* don't know about clones */
282             ts->up = 1;
283             if (ntohl((afs_uint32) servAddr) < (afs_uint32) magicHost) {
284                 magicHost = ntohl(servAddr);
285                 magicServer = ts;
286             }
287             i++;
288         }
289     }
290     if (magicServer)
291         magicServer->magic = 1; /* remember for when counting votes */
292
293     if (!amIClone && !magicServer)
294         amIMagic = 1;
295     if (info) {
296         if (!amIClone)
297             ++nServers;         /* count this server as well as the remotes */
298     } else
299         nServers = i + 1;       /* count this server as well as the remotes */
300
301     ubik_quorum = (nServers >> 1) + 1;  /* compute the majority figure */
302     /* send addrs to all other servers */
303     code = updateUbikNetworkAddress(ubik_host);
304     if (code)
305         return code;
306
307 /* Shoud we set some defaults for RX??
308     r_retryInterval = 2;        
309     r_nRetries = (RPCTIMEOUT/r_retryInterval);
310 */
311     if (info) {
312         if (!ubik_servers)      /* special case 1 server */
313             ubik_singleServer = 1;
314         if (nServers == 1 && !amIClone) {
315             ubik_amSyncSite = 1;        /* let's start as sync site */
316             syncSiteUntil = 0x7fffffff; /* and be it quite a while */
317         }
318     } else {
319         if (nServers == 1)      /* special case 1 server */
320             ubik_singleServer = 1;
321     }
322
323     if (ubik_singleServer) {
324         if (!ubik_amSyncSite)
325             ubik_dprint("Ubik: I am the sync site - 1 server\n");
326         ubik_amSyncSite = 1;
327         syncSiteUntil = 0x7fffffff;     /* quite a while */
328     }
329     return 0;
330 }
331
332 /*! 
333  * \brief main lwp loop for code that sends out beacons.
334  * 
335  * This code only runs while we're sync site or we want to be the sync site.
336  * It runs in its very own light-weight process.
337  */
338 void *
339 ubeacon_Interact(void *dummy)
340 {
341     register afs_int32 code;
342     struct timeval tt;
343     struct rx_connection *connections[MAXSERVERS];
344     struct ubik_server *servers[MAXSERVERS];
345     register afs_int32 i;
346     register struct ubik_server *ts;
347     afs_int32 temp, yesVotes, lastWakeupTime, oldestYesVote, syncsite;
348     struct ubik_tid ttid;
349     afs_int32 startTime;
350
351     /* loop forever getting votes */
352     lastWakeupTime = 0;         /* keep track of time we last started a vote collection */
353     while (1) {
354
355         /* don't wakeup more than every POLLTIME seconds */
356         temp = (lastWakeupTime + POLLTIME) - FT_ApproxTime();
357         /* don't sleep if last collection phase took too long (probably timed someone out ) */
358         if (temp > 0) {
359             if (temp > POLLTIME)
360                 temp = POLLTIME;
361             tt.tv_sec = temp;
362             tt.tv_usec = 0;
363 #ifdef AFS_PTHREAD_ENV
364             code = select(0, 0, 0, 0, &tt);
365 #else
366             code = IOMGR_Select(0, 0, 0, 0, &tt);
367 #endif
368         } else
369             code = 0;
370
371         lastWakeupTime = FT_ApproxTime();       /* started a new collection phase */
372
373         if (ubik_singleServer)
374             continue;           /* special-case 1 server for speedy startup */
375
376         if (!uvote_ShouldIRun())
377             continue;           /* if voter has heard from a better candidate than us, don't bother running */
378
379         /* otherwise we should run for election, or we're the sync site (and have already won);
380          * send out the beacon packets */
381         /* build list of all up hosts (noticing dead hosts are running again
382          * is a task for the recovery module, not the beacon module), and
383          * prepare to send them an r multi-call containing the beacon message */
384         i = 0;                  /* collect connections */
385         for (ts = ubik_servers; ts; ts = ts->next) {
386             if (ts->up && ts->addr[0] != ubik_host[0]) {
387                 servers[i] = ts;
388                 connections[i++] = ts->vote_rxcid;
389             }
390         }
391         servers[i] = (struct ubik_server *)0;   /* end of list */
392         /* note that we assume in the vote module that we'll always get at least BIGTIME 
393          * seconds of vote from anyone who votes for us, which means we can conservatively
394          * assume we'll be fine until SMALLTIME seconds after we start collecting votes */
395         /* this next is essentially an expansion of rgen's ServBeacon routine */
396
397         ttid.epoch = ubik_epochTime;
398         if (ubik_dbase->flags & DBWRITING) {
399             /*
400              * if a write is in progress, we have to send the writeTidCounter
401              * which holds the tid counter of the write transaction , and not
402              * send the tidCounter value which holds the tid counter of the
403              * last transaction.
404              */
405             ttid.counter = ubik_dbase->writeTidCounter;
406         } else
407             ttid.counter = ubik_dbase->tidCounter + 1;
408 #if defined(UBIK_PAUSE)
409         ubik_dbase->flags |= DBVOTING;
410 #endif /* UBIK_PAUSE */
411
412         /* now analyze return codes, counting up our votes */
413         yesVotes = 0;           /* count how many to ensure we have quorum */
414         oldestYesVote = 0x7fffffff;     /* time quorum expires */
415         syncsite = ubeacon_AmSyncSite();
416         startTime = FT_ApproxTime();
417         /*
418          * Don't waste time using mult Rx calls if there are no connections out there
419          */
420         if (i > 0) {
421             multi_Rx(connections, i) {
422                 multi_VOTE_Beacon(syncsite, startTime, &ubik_dbase->version,
423                                   &ttid);
424                 temp = FT_ApproxTime(); /* now, more or less */
425                 ts = servers[multi_i];
426                 ts->lastBeaconSent = temp;
427                 code = multi_error;
428                 /* note that the vote time (the return code) represents the time
429                  * the vote was computed, *not* the time the vote expires.  We compute
430                  * the latter down below if we got enough votes to go with */
431                 if (code > 0) {
432                     ts->lastVoteTime = code;
433                     if (code < oldestYesVote)
434                         oldestYesVote = code;
435                     ts->lastVote = 1;
436                     if (!ts->isClone)
437                         yesVotes += 2;
438                     if (ts->magic)
439                         yesVotes++;     /* the extra epsilon */
440                     ts->up = 1; /* server is up (not really necessary: recovery does this for real) */
441                     ts->beaconSinceDown = 1;
442                     ubik_dprint("yes vote from host %s\n",
443                                 afs_inet_ntoa(ts->addr[0]));
444                 } else if (code == 0) {
445                     ts->lastVoteTime = temp;
446                     ts->lastVote = 0;
447                     ts->beaconSinceDown = 1;
448                     ubik_dprint("no vote from %s\n",
449                                 afs_inet_ntoa(ts->addr[0]));
450                 } else if (code < 0) {
451                     ts->up = 0;
452                     ts->beaconSinceDown = 0;
453                     urecovery_LostServer();
454                     ubik_dprint("time out from %s\n",
455                                 afs_inet_ntoa(ts->addr[0]));
456                 }
457             }
458             multi_End;
459         }
460         /* now call our own voter module to see if we'll vote for ourself.  Note that
461          * the same restrictions apply for our voting for ourself as for our voting
462          * for anyone else. */
463         i = SVOTE_Beacon((struct rx_call *)0, ubeacon_AmSyncSite(), startTime,
464                          &ubik_dbase->version, &ttid);
465         if (i) {
466             yesVotes += 2;
467             if (amIMagic)
468                 yesVotes++;     /* extra epsilon */
469             if (i < oldestYesVote)
470                 oldestYesVote = i;
471         }
472 #if defined(UBIK_PAUSE)
473         ubik_dbase->flags &= ~DBVOTING;
474 #endif /* UBIK_PAUSE */
475
476         /* now decide if we have enough votes to become sync site.
477          * Note that we can still get enough votes even if we didn't for ourself. */
478         if (yesVotes > nServers) {      /* yesVotes is bumped by 2 or 3 for each site */
479             if (!ubik_amSyncSite)
480                 ubik_dprint("Ubik: I am the sync site\n");
481             ubik_amSyncSite = 1;
482             syncSiteUntil = oldestYesVote + SMALLTIME;
483 #ifndef AFS_PTHREAD_ENV
484                 /* I did not find a corresponding LWP_WaitProcess(&ubik_amSyncSite) --
485                    this may be a spurious signal call -- sjenkins */
486                 LWP_NoYieldSignal(&ubik_amSyncSite);
487 #endif
488         } else {
489             if (ubik_amSyncSite)
490                 ubik_dprint("Ubik: I am no longer the sync site\n");
491             ubik_amSyncSite = 0;
492             urecovery_ResetState();     /* tell recovery we're no longer the sync site */
493         }
494
495     }                           /* while loop */
496     return NULL;
497 }
498
499 /*!
500  * \brief Verify that a given IP addresses does actually exist on this machine.
501  *
502  * \param ame      the pointer to my IP address specified in the
503  *                 CellServDB file. 
504  * \param aservers an array containing IP 
505  *                 addresses of remote ubik servers. The array is 
506  *                 terminated by a zero address.
507  *
508  * Algorithm     : Verify that my IP addresses \p ame does actually exist
509  *                 on this machine.  If any of my IP addresses are there 
510  *                 in the remote server list \p aserver, remove them from 
511  *                 this list.  Update global variable \p ubik_host[] with 
512  *                 my IP addresses.
513  *
514  * \return 0 on success, non-zero on failure
515  */
516 static
517 verifyInterfaceAddress(afs_uint32 *ame, struct afsconf_cell *info,
518                        afs_uint32 aservers[]) {
519     afs_uint32 myAddr[UBIK_MAX_INTERFACE_ADDR], *servList, tmpAddr;
520     afs_uint32 myAddr2[UBIK_MAX_INTERFACE_ADDR];
521     int tcount, count, found, i, j, totalServers, start, end, usednetfiles =
522         0;
523
524     if (info)
525         totalServers = info->numServers;
526     else {                      /* count the number of servers */
527         for (totalServers = 0, servList = aservers; *servList; servList++)
528             totalServers++;
529     }
530
531     if (AFSDIR_SERVER_NETRESTRICT_FILEPATH || AFSDIR_SERVER_NETINFO_FILEPATH) {
532         /*
533          * Find addresses we are supposed to register as per the netrestrict file
534          * if it exists, else just register all the addresses we find on this 
535          * host as returned by rx_getAllAddr (in NBO)
536          */
537         char reason[1024];
538         count =
539             parseNetFiles(myAddr, NULL, NULL, UBIK_MAX_INTERFACE_ADDR, reason,
540                           AFSDIR_SERVER_NETINFO_FILEPATH,
541                           AFSDIR_SERVER_NETRESTRICT_FILEPATH);
542         if (count < 0) {
543             ubik_print("ubik: Can't register any valid addresses:%s\n",
544                        reason);
545             ubik_print("Aborting..\n");
546             return UBADHOST;
547         }
548         usednetfiles++;
549     } else {
550         /* get all my interface addresses in net byte order */
551         count = rx_getAllAddr(myAddr, UBIK_MAX_INTERFACE_ADDR);
552     }
553
554     if (count <= 0) {           /* no address found */
555         ubik_print("ubik: No network addresses found, aborting..");
556         return UBADHOST;
557     }
558
559     /* verify that the My-address passed in by ubik is correct */
560     for (j = 0, found = 0; j < count; j++) {
561         if (*ame == myAddr[j]) {        /* both in net byte order */
562             found = 1;
563             break;
564         }
565     }
566
567     if (!found) {
568         ubik_print("ubik: primary address %s does not exist\n",
569                    afs_inet_ntoa(*ame));
570         /* if we had the result of rx_getAllAddr already, avoid subverting
571          * the "is gethostbyname(gethostname()) us" check. If we're
572          * using NetInfo/NetRestrict, we assume they have enough clue
573          * to avoid that big hole in their foot from the loaded gun. */
574         if (usednetfiles) {
575             /* take the address we did get, then see if ame was masked */
576             *ame = myAddr[0];
577             tcount = rx_getAllAddr(myAddr2, UBIK_MAX_INTERFACE_ADDR);
578             if (tcount <= 0) {  /* no address found */
579                 ubik_print("ubik: No network addresses found, aborting..");
580                 return UBADHOST;
581             }
582
583             /* verify that the My-address passed in by ubik is correct */
584             for (j = 0, found = 0; j < tcount; j++) {
585                 if (*ame == myAddr2[j]) {       /* both in net byte order */
586                     found = 1;
587                     break;
588                 }
589             }
590         }
591         if (!found)
592             return UBADHOST;
593     }
594
595     /* if any of my addresses are there in serverList, then
596      ** use that as my primary addresses : the higher level 
597      ** application screwed up in dealing with multihomed concepts
598      */
599     for (j = 0, found = 0; j < count; j++) {
600         for (i = 0; i < totalServers; i++) {
601             if (info)
602                 tmpAddr = (afs_uint32) info->hostAddr[i].sin_addr.s_addr;
603             else
604                 tmpAddr = aservers[i];
605             if (myAddr[j] == tmpAddr) {
606                 *ame = tmpAddr;
607                 if (!info)
608                     aservers[i] = 0;
609                 found = 1;
610             }
611         }
612     }
613     if (found)
614         ubik_print("Using %s as my primary address\n", afs_inet_ntoa(*ame));
615
616     if (!info) {
617         /* get rid of servers which were purged because all 
618          ** those interface addresses are myself 
619          */
620         for (start = 0, end = totalServers - 1; (start < end); start++, end--) {
621             /* find the first zero entry from the beginning */
622             for (; (start < end) && (aservers[start]); start++);
623
624             /* find the last non-zero entry from the end */
625             for (; (end >= 0) && (!aservers[end]); end--);
626
627             /* if there is nothing more to purge, exit from loop */
628             if (start >= end)
629                 break;
630
631             /* move the entry */
632             aservers[start] = aservers[end];
633             aservers[end] = 0;  /* this entry was moved */
634         }
635     }
636
637     /* update all my addresses in ubik_host in such a way 
638      ** that ubik_host[0] has the primary address 
639      */
640     ubik_host[0] = *ame;
641     for (j = 0, i = 1; j < count; j++)
642         if (*ame != myAddr[j])
643             ubik_host[i++] = myAddr[j];
644
645     return 0;                   /* return success */
646 }
647
648
649 /*! 
650  * \brief Exchange IP address information with remote servers.
651  *
652  * \param ubik_host an array containing all my IP addresses.
653  *
654  * Algorithm     : Do an RPC to all remote ubik servers infroming them 
655  *                 about my IP addresses. Get their IP addresses and
656  *                 update my linked list of ubik servers \p ubik_servers
657  *
658  * \return 0 on success, non-zero on failure
659  */
660 int
661 updateUbikNetworkAddress(afs_uint32 ubik_host[UBIK_MAX_INTERFACE_ADDR])
662 {
663     int j, count, code = 0;
664     UbikInterfaceAddr inAddr, outAddr;
665     struct rx_connection *conns[MAXSERVERS];
666     struct ubik_server *ts, *server[MAXSERVERS];
667     char buffer[32];
668
669     for (count = 0, ts = ubik_servers; ts; count++, ts = ts->next) {
670         conns[count] = ts->disk_rxcid;
671         server[count] = ts;
672     }
673
674
675     /* inform all other servers only if there are more than one
676      * database servers in the cell */
677
678     if (count > 0) {
679
680         for (j = 0; j < UBIK_MAX_INTERFACE_ADDR; j++)
681             inAddr.hostAddr[j] = ntohl(ubik_host[j]);
682
683
684         /* do the multi-RX RPC to all other servers */
685         multi_Rx(conns, count) {
686             multi_DISK_UpdateInterfaceAddr(&inAddr, &outAddr);
687             ts = server[multi_i];       /* reply received from this server */
688             if (!multi_error) {
689                 if (ts->addr[0] != htonl(outAddr.hostAddr[0])) {
690                     code = UBADHOST;
691                     strcpy(buffer, (char *)afs_inet_ntoa(ts->addr[0]));
692                     ubik_print("ubik:Two primary addresses for same server \
693                     %s %s\n", buffer, afs_inet_ntoa(htonl(outAddr.hostAddr[0])));
694                 } else {
695                     for (j = 1; j < UBIK_MAX_INTERFACE_ADDR; j++)
696                         ts->addr[j] = htonl(outAddr.hostAddr[j]);
697                 }
698             } else if (multi_error == RXGEN_OPCODE) {   /* pre 3.5 remote server */
699                 ubik_print
700                     ("ubik server %s does not support UpdateInterfaceAddr RPC\n",
701                      afs_inet_ntoa(ts->addr[0]));
702             } else if (multi_error == UBADHOST) {
703                 code = UBADHOST;        /* remote CellServDB inconsistency */
704                 ubik_print("Inconsistent Cell Info on server: ");
705                 for (j = 0; j < UBIK_MAX_INTERFACE_ADDR && ts->addr[j]; j++)
706                     ubik_print("%s ", afs_inet_ntoa(ts->addr[j]));
707                 ubik_print("\n");
708             } else {
709                 ts->up = 0;     /* mark the remote server as down */
710             }
711         }
712         multi_End;
713     }
714     return code;
715 }