1d080abf46e0c1f7a298abcf8e728de99532a1ca
[openafs.git] / src / bozo / bnode.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13 #include <afs/procmgmt.h>
14 #include <roken.h>
15
16 #include <stddef.h>
17
18 #include <lwp.h>
19 #include <rx/rx.h>
20 #include <afs/audit.h>
21 #include <afs/afsutil.h>
22 #include <afs/fileutil.h>
23
24 #include "bnode.h"
25 #include "bosprototypes.h"
26
27 #ifndef WCOREDUMP
28 #define WCOREDUMP(x) ((x) & 0200)
29 #endif
30
31 #define BNODE_LWP_STACKSIZE     (16 * 1024)
32 #define BNODE_ERROR_COUNT_MAX   16   /* maximum number of retries */
33
34 int bnode_waiting = 0;
35 static PROCESS bproc_pid;       /* pid of waker-upper */
36 static struct bnode *allBnodes = 0;     /* list of all bnodes */
37 static struct bnode_proc *allProcs = 0; /* list of all processes for which we're waiting */
38 static struct bnode_type *allTypes = 0; /* list of registered type handlers */
39
40 static struct bnode_stats {
41     int weirdPids;
42 } bnode_stats;
43
44 extern const char *DoCore;
45 extern const char *DoPidFiles;
46 #ifndef AFS_NT40_ENV
47 extern char **environ;          /* env structure */
48 #endif
49
50 int hdl_notifier(struct bnode_proc *tp);
51
52 /* Remember the name of the process, if any, that failed last */
53 static void
54 RememberProcName(struct bnode_proc *ap)
55 {
56     struct bnode *tbnodep;
57
58     tbnodep = ap->bnode;
59     if (tbnodep->lastErrorName) {
60         free(tbnodep->lastErrorName);
61         tbnodep->lastErrorName = NULL;
62     }
63     if (ap->coreName)
64         tbnodep->lastErrorName = strdup(ap->coreName);
65 }
66
67 /* utility for use by BOP_HASCORE functions to determine where a core file might
68  * be stored.
69  */
70 int
71 bnode_CoreName(struct bnode *abnode, char *acoreName, char *abuffer)
72 {
73     if (DoCore) {
74         strcpy(abuffer, DoCore);
75         strcat(abuffer, "/");
76         strcat(abuffer, AFSDIR_CORE_FILE);
77     } else
78         strcpy(abuffer, AFSDIR_SERVER_CORELOG_FILEPATH);
79     if (acoreName) {
80         strcat(abuffer, acoreName);
81         strcat(abuffer, ".");
82     }
83     strcat(abuffer, abnode->name);
84     return 0;
85 }
86
87 /* save core file, if any */
88 static void
89 SaveCore(struct bnode *abnode, struct bnode_proc
90          *aproc)
91 {
92     char tbuffer[256];
93     struct stat tstat;
94     afs_int32 code = 0;
95     char *corefile = NULL;
96 #ifdef BOZO_SAVE_CORES
97     struct timeval Start;
98     struct tm *TimeFields;
99     char FileName[256];
100 #endif
101
102     /* Linux always appends the PID to core dumps from threaded processes, so
103      * we have to scan the directory to find core files under another name. */
104     if (DoCore) {
105         strcpy(tbuffer, DoCore);
106         strcat(tbuffer, "/");
107         strcat(tbuffer, AFSDIR_CORE_FILE);
108     } else
109         code = stat(AFSDIR_SERVER_CORELOG_FILEPATH, &tstat);
110     if (code) {
111         DIR *logdir;
112         struct dirent *file;
113         size_t length;
114         unsigned long pid;
115         const char *coredir = AFSDIR_LOGS_DIR;
116
117         if (DoCore)
118           coredir = DoCore;
119
120         logdir = opendir(coredir);
121         if (logdir == NULL)
122             return;
123         while ((file = readdir(logdir)) != NULL) {
124             if (strncmp(file->d_name, "core.", 5) != 0)
125                 continue;
126             pid = atol(file->d_name + 5);
127             if (pid == aproc->pid) {
128                 length = strlen(coredir) + strlen(file->d_name) + 2;
129                 corefile = malloc(length);
130                 if (corefile == NULL) {
131                     closedir(logdir);
132                     return;
133                 }
134                 snprintf(corefile, length, "%s/%s", coredir, file->d_name);
135                 code = 0;
136                 break;
137             }
138         }
139         closedir(logdir);
140     } else {
141         corefile = strdup(tbuffer);
142     }
143     if (code)
144         return;
145
146     bnode_CoreName(abnode, aproc->coreName, tbuffer);
147 #ifdef BOZO_SAVE_CORES
148     FT_GetTimeOfDay(&Start, 0);
149     TimeFields = localtime(&Start.tv_sec);
150     sprintf(FileName, "%s.%d%02d%02d%02d%02d%02d", tbuffer,
151             TimeFields->tm_year + 1900, TimeFields->tm_mon + 1, TimeFields->tm_mday,
152             TimeFields->tm_hour, TimeFields->tm_min, TimeFields->tm_sec);
153     strcpy(tbuffer, FileName);
154 #endif
155     code = renamefile(corefile, tbuffer);
156     free(corefile);
157 }
158
159 int
160 bnode_GetString(struct bnode *abnode, char *abuffer,
161                 afs_int32 alen)
162 {
163     return BOP_GETSTRING(abnode, abuffer, alen);
164 }
165
166 int
167 bnode_GetParm(struct bnode *abnode, afs_int32 aindex,
168               char *abuffer, afs_int32 alen)
169 {
170     return BOP_GETPARM(abnode, aindex, abuffer, alen);
171 }
172
173 int
174 bnode_GetStat(struct bnode *abnode, afs_int32 * astatus)
175 {
176     return BOP_GETSTAT(abnode, astatus);
177 }
178
179 int
180 bnode_RestartP(struct bnode *abnode)
181 {
182     return BOP_RESTARTP(abnode);
183 }
184
185 static int
186 bnode_Check(struct bnode *abnode)
187 {
188     if (abnode->flags & BNODE_WAIT) {
189         abnode->flags &= ~BNODE_WAIT;
190         LWP_NoYieldSignal(abnode);
191     }
192     return 0;
193 }
194
195 /* tell if an instance has a core file */
196 int
197 bnode_HasCore(struct bnode *abnode)
198 {
199     return BOP_HASCORE(abnode);
200 }
201
202 /* wait for all bnodes to stabilize */
203 int
204 bnode_WaitAll(void)
205 {
206     struct bnode *tb;
207     afs_int32 code;
208     afs_int32 stat;
209
210   retry:
211     for (tb = allBnodes; tb; tb = tb->next) {
212         bnode_Hold(tb);
213         code = BOP_GETSTAT(tb, &stat);
214         if (code) {
215             bnode_Release(tb);
216             return code;
217         }
218         if (stat != tb->goal) {
219             tb->flags |= BNODE_WAIT;
220             LWP_WaitProcess(tb);
221             bnode_Release(tb);
222             goto retry;
223         }
224         bnode_Release(tb);
225     }
226     return 0;
227 }
228
229 /* wait until bnode status is correct */
230 int
231 bnode_WaitStatus(struct bnode *abnode, int astatus)
232 {
233     afs_int32 code;
234     afs_int32 stat;
235
236     bnode_Hold(abnode);
237     while (1) {
238         /* get the status */
239         code = BOP_GETSTAT(abnode, &stat);
240         if (code)
241             return code;
242
243         /* otherwise, check if we're done */
244         if (stat == astatus) {
245             bnode_Release(abnode);
246             return 0;           /* done */
247         }
248         if (astatus != abnode->goal) {
249             bnode_Release(abnode);
250             return -1;          /* no longer our goal, don't keep waiting */
251         }
252         /* otherwise, block */
253         abnode->flags |= BNODE_WAIT;
254         LWP_WaitProcess(abnode);
255     }
256 }
257
258 int
259 bnode_ResetErrorCount(struct bnode *abnode)
260 {
261     abnode->errorStopCount = 0;
262     abnode->errorStopDelay = 0;
263     return 0;
264 }
265
266 int
267 bnode_SetStat(struct bnode *abnode, int agoal)
268 {
269     abnode->goal = agoal;
270     bnode_Check(abnode);
271     BOP_SETSTAT(abnode, agoal);
272     abnode->flags &= ~BNODE_ERRORSTOP;
273     return 0;
274 }
275
276 int
277 bnode_SetGoal(struct bnode *abnode, int agoal)
278 {
279     abnode->goal = agoal;
280     bnode_Check(abnode);
281     return 0;
282 }
283
284 int
285 bnode_SetFileGoal(struct bnode *abnode, int agoal)
286 {
287     if (abnode->fileGoal == agoal)
288         return 0;               /* already done */
289     abnode->fileGoal = agoal;
290     WriteBozoFile(0);
291     return 0;
292 }
293
294 /* apply a function to all bnodes in the system */
295 int
296 bnode_ApplyInstance(int (*aproc) (struct bnode *tb, void *), void *arock)
297 {
298     struct bnode *tb, *nb;
299     afs_int32 code;
300
301     for (tb = allBnodes; tb; tb = nb) {
302         nb = tb->next;
303         code = (*aproc) (tb, arock);
304         if (code)
305             return code;
306     }
307     return 0;
308 }
309
310 struct bnode *
311 bnode_FindInstance(char *aname)
312 {
313     struct bnode *tb;
314
315     for (tb = allBnodes; tb; tb = tb->next) {
316         if (!strcmp(tb->name, aname))
317             return tb;
318     }
319     return NULL;
320 }
321
322 static struct bnode_type *
323 FindType(char *aname)
324 {
325     struct bnode_type *tt;
326
327     for (tt = allTypes; tt; tt = tt->next) {
328         if (!strcmp(tt->name, aname))
329             return tt;
330     }
331     return (struct bnode_type *)0;
332 }
333
334 int
335 bnode_Register(char *atype, struct bnode_ops *aprocs, int anparms)
336 {
337     struct bnode_type *tt;
338
339     for (tt = allTypes; tt; tt = tt->next) {
340         if (!strcmp(tt->name, atype))
341             break;
342     }
343     if (!tt) {
344         tt = (struct bnode_type *)malloc(sizeof(struct bnode_type));
345         memset(tt, 0, sizeof(struct bnode_type));
346         tt->next = allTypes;
347         allTypes = tt;
348         tt->name = atype;
349     }
350     tt->ops = aprocs;
351     return 0;
352 }
353
354 afs_int32
355 bnode_Create(char *atype, char *ainstance, struct bnode ** abp, char *ap1,
356              char *ap2, char *ap3, char *ap4, char *ap5, char *notifier,
357              int fileGoal, int rewritefile)
358 {
359     struct bnode_type *type;
360     struct bnode *tb;
361     char *notifierpath = NULL;
362     struct stat tstat;
363
364     if (bnode_FindInstance(ainstance))
365         return BZEXISTS;
366     type = FindType(atype);
367     if (!type)
368         return BZBADTYPE;
369
370     if (notifier && strcmp(notifier, NONOTIFIER)) {
371         /* construct local path from canonical (wire-format) path */
372         if (ConstructLocalBinPath(notifier, &notifierpath)) {
373             bozo_Log("BNODE-Create: Notifier program path invalid '%s'\n",
374                      notifier);
375             return BZNOCREATE;
376         }
377
378         if (stat(notifierpath, &tstat)) {
379             bozo_Log("BNODE-Create: Notifier program '%s' not found\n",
380                      notifierpath);
381             free(notifierpath);
382             return BZNOCREATE;
383         }
384     }
385     tb = (*type->ops->create) (ainstance, ap1, ap2, ap3, ap4, ap5);
386     if (!tb) {
387         free(notifierpath);
388         return BZNOCREATE;
389     }
390     tb->notifier = notifierpath;
391     *abp = tb;
392     tb->type = type;
393
394     /* The fs_create above calls bnode_InitBnode() which always sets the
395      ** fileGoal to BSTAT_NORMAL .... overwrite it with whatever is passed into
396      ** this function as a parameter... */
397     tb->fileGoal = fileGoal;
398
399     bnode_SetStat(tb, tb->goal);        /* nudge it once */
400
401     if (rewritefile != 0)
402         WriteBozoFile(0);
403
404     return 0;
405 }
406
407 int
408 bnode_DeleteName(char *ainstance)
409 {
410     struct bnode *tb;
411
412     tb = bnode_FindInstance(ainstance);
413     if (!tb)
414         return BZNOENT;
415
416     return bnode_Delete(tb);
417 }
418
419 int
420 bnode_Hold(struct bnode *abnode)
421 {
422     abnode->refCount++;
423     return 0;
424 }
425
426 int
427 bnode_Release(struct bnode *abnode)
428 {
429     abnode->refCount--;
430     if (abnode->refCount == 0 && abnode->flags & BNODE_DELETE) {
431         abnode->flags &= ~BNODE_DELETE; /* we're going for it */
432         bnode_Delete(abnode);
433     }
434     return 0;
435 }
436
437 int
438 bnode_Delete(struct bnode *abnode)
439 {
440     afs_int32 code;
441     struct bnode **lb, *ub;
442     afs_int32 temp;
443
444     if (abnode->refCount != 0) {
445         abnode->flags |= BNODE_DELETE;
446         return 0;
447     }
448
449     /* make sure the bnode is idle before zapping */
450     bnode_Hold(abnode);
451     code = BOP_GETSTAT(abnode, &temp);
452     bnode_Release(abnode);
453     if (code)
454         return code;
455     if (temp != BSTAT_SHUTDOWN)
456         return BZBUSY;
457
458     /* all clear to zap */
459     for (lb = &allBnodes, ub = *lb; ub; lb = &ub->next, ub = *lb) {
460         if (ub == abnode) {
461             /* unthread it from the list */
462             *lb = ub->next;
463             break;
464         }
465     }
466     free(abnode->name);         /* do this first, since bnode fields may be bad after BOP_DELETE */
467     code = BOP_DELETE(abnode);  /* don't play games like holding over this one */
468     WriteBozoFile(0);
469     return code;
470 }
471
472 /* function to tell if there's a timeout coming up */
473 int
474 bnode_PendingTimeout(struct bnode *abnode)
475 {
476     return (abnode->flags & BNODE_NEEDTIMEOUT);
477 }
478
479 /* function called to set / clear periodic bnode wakeup times */
480 int
481 bnode_SetTimeout(struct bnode *abnode, afs_int32 atimeout)
482 {
483     if (atimeout != 0) {
484         abnode->nextTimeout = FT_ApproxTime() + atimeout;
485         abnode->flags |= BNODE_NEEDTIMEOUT;
486         abnode->period = atimeout;
487         IOMGR_Cancel(bproc_pid);
488     } else {
489         abnode->flags &= ~BNODE_NEEDTIMEOUT;
490     }
491     return 0;
492 }
493
494 /* used by new bnode creation code to format bnode header */
495 int
496 bnode_InitBnode(struct bnode *abnode, struct bnode_ops *abnodeops,
497                 char *aname)
498 {
499     struct bnode **lb, *nb;
500
501     /* format the bnode properly */
502     memset(abnode, 0, sizeof(struct bnode));
503     abnode->ops = abnodeops;
504     abnode->name = strdup(aname);
505     if (!abnode->name)
506         return ENOMEM;
507     abnode->flags = BNODE_ACTIVE;
508     abnode->fileGoal = BSTAT_NORMAL;
509     abnode->goal = BSTAT_SHUTDOWN;
510
511     /* put the bnode at the end of the list so we write bnode file in same order */
512     for (lb = &allBnodes, nb = *lb; nb; lb = &nb->next, nb = *lb);
513     *lb = abnode;
514
515     return 0;
516 }
517
518 static int
519 DeleteProc(struct bnode_proc *abproc)
520 {
521     struct bnode_proc **pb, *tb;
522     struct bnode_proc *nb;
523
524     for (pb = &allProcs, tb = *pb; tb; pb = &tb->next, tb = nb) {
525         nb = tb->next;
526         if (tb == abproc) {
527             *pb = nb;
528             free(tb);
529             return 0;
530         }
531     }
532     return BZNOENT;
533 }
534
535 /* bnode lwp executes this code repeatedly */
536 static void *
537 bproc(void *unused)
538 {
539     afs_int32 code;
540     struct bnode *tb;
541     afs_int32 temp;
542     struct bnode_proc *tp;
543     struct bnode *nb;
544     int options;                /* must not be register */
545     struct timeval tv;
546     int setAny;
547     int status;
548
549     while (1) {
550         /* first figure out how long to sleep for */
551         temp = 0x7fffffff;      /* afs_int32 time; maxint doesn't work in select */
552         setAny = 0;
553         for (tb = allBnodes; tb; tb = tb->next) {
554             if (tb->flags & BNODE_NEEDTIMEOUT) {
555                 if (tb->nextTimeout < temp) {
556                     setAny = 1;
557                     temp = tb->nextTimeout;
558                 }
559             }
560         }
561         /* now temp has the time at which we should wakeup next */
562
563         /* sleep */
564         if (setAny)
565             temp -= FT_ApproxTime();    /* how many seconds until next event */
566         else
567             temp = 999999;
568         if (temp > 0) {
569             tv.tv_sec = temp;
570             tv.tv_usec = 0;
571             code = IOMGR_Select(0, 0, 0, 0, &tv);
572         } else
573             code = 0;           /* fake timeout code */
574
575         /* figure out why we woke up; child exit or timeouts */
576         FT_GetTimeOfDay(&tv, 0);        /* must do the real gettimeofday once and a while */
577         temp = tv.tv_sec;
578
579         /* check all bnodes to see which ones need timeout events */
580         for (tb = allBnodes; tb; tb = nb) {
581             if ((tb->flags & BNODE_NEEDTIMEOUT) && temp > tb->nextTimeout) {
582                 bnode_Hold(tb);
583                 BOP_TIMEOUT(tb);
584                 bnode_Check(tb);
585                 if (tb->flags & BNODE_NEEDTIMEOUT) {    /* check again, BOP_TIMEOUT could change */
586                     tb->nextTimeout = FT_ApproxTime() + tb->period;
587                 }
588                 nb = tb->next;
589                 bnode_Release(tb);      /* delete may occur here */
590             } else
591                 nb = tb->next;
592         }
593
594         if (code < 0) {
595             /* signalled, probably by incoming signal */
596             while (1) {
597                 options = WNOHANG;
598                 bnode_waiting = options | 0x800000;
599                 code = waitpid((pid_t) - 1, &status, options);
600                 bnode_waiting = 0;
601                 if (code == 0 || code == -1)
602                     break;      /* all done */
603                 /* otherwise code has a process id, which we now search for */
604                 for (tp = allProcs; tp; tp = tp->next)
605                     if (tp->pid == code)
606                         break;
607                 if (tp) {
608                     /* found the pid */
609                     tb = tp->bnode;
610                     bnode_Hold(tb);
611
612                     /* count restarts in last 30 seconds */
613                     if (temp > tb->rsTime + 30) {
614                         /* it's been 30 seconds we've been counting */
615                         tb->rsTime = temp;
616                         tb->rsCount = 0;
617                     }
618
619
620                     if (WIFSIGNALED(status) == 0) {
621                         /* exited, not signalled */
622                         tp->lastExit = WEXITSTATUS(status);
623                         tp->lastSignal = 0;
624                         if (tp->lastExit) {
625                             tb->errorCode = tp->lastExit;
626                             tb->lastErrorExit = FT_ApproxTime();
627                             RememberProcName(tp);
628                             tb->errorSignal = 0;
629                         }
630                         if (tp->coreName)
631                             bozo_Log("%s:%s exited with code %d\n", tb->name,
632                                      tp->coreName, tp->lastExit);
633                         else
634                             bozo_Log("%s exited with code %d\n", tb->name,
635                                      tp->lastExit);
636                     } else {
637                         /* Signal occurred, perhaps spurious due to shutdown request.
638                          * If due to a shutdown request, don't overwrite last error
639                          * information.
640                          */
641                         tp->lastSignal = WTERMSIG(status);
642                         tp->lastExit = 0;
643                         if (tp->lastSignal != SIGQUIT
644                             && tp->lastSignal != SIGTERM
645                             && tp->lastSignal != SIGKILL) {
646                             tb->errorSignal = tp->lastSignal;
647                             tb->lastErrorExit = FT_ApproxTime();
648                             RememberProcName(tp);
649                         }
650                         if (tp->coreName)
651                             bozo_Log("%s:%s exited on signal %d%s\n",
652                                      tb->name, tp->coreName, tp->lastSignal,
653                                      WCOREDUMP(status) ? " (core dumped)" :
654                                      "");
655                         else
656                             bozo_Log("%s exited on signal %d%s\n", tb->name,
657                                      tp->lastSignal,
658                                      WCOREDUMP(status) ? " (core dumped)" :
659                                      "");
660                         SaveCore(tb, tp);
661                     }
662                     tb->lastAnyExit = FT_ApproxTime();
663
664                     if (tb->notifier) {
665                         bozo_Log("BNODE: Notifier %s will be called\n",
666                                  tb->notifier);
667                         hdl_notifier(tp);
668                     }
669
670                     if (tb->goal && tb->rsCount++ > 10) {
671                         /* 10 in 30 seconds */
672                         if (tb->errorStopCount >= BNODE_ERROR_COUNT_MAX) {
673                             tb->errorStopDelay = 0;     /* max reached, give up. */
674                         } else {
675                             tb->errorStopCount++;
676                             if (!tb->errorStopDelay) {
677                                 tb->errorStopDelay = 1;
678                             } else {
679                                 tb->errorStopDelay *= 2;
680                             }
681                         }
682                         tb->flags |= BNODE_ERRORSTOP;
683                         bnode_SetGoal(tb, BSTAT_SHUTDOWN);
684                         bozo_Log
685                             ("BNODE '%s' repeatedly failed to start, perhaps missing executable.\n",
686                              tb->name);
687                     }
688                     BOP_PROCEXIT(tb, tp);
689                     bnode_Check(tb);
690                     bnode_Release(tb);  /* bnode delete can happen here */
691                     DeleteProc(tp);
692                 } else
693                     bnode_stats.weirdPids++;
694             }
695         }
696     }
697     return NULL;
698 }
699
700 static afs_int32
701 SendNotifierData(int fd, struct bnode_proc *tp)
702 {
703     struct bnode *tb = tp->bnode;
704     char buffer[1000], *bufp = buffer, *buf1;
705     int len;
706
707     /*
708      * First sent out the bnode_proc struct
709      */
710     (void)sprintf(bufp, "BEGIN bnode_proc\n");
711     bufp += strlen(bufp);
712     (void)sprintf(bufp, "comLine: %s\n", tp->comLine);
713     bufp += strlen(bufp);
714     if (!(buf1 = tp->coreName))
715         buf1 = "(null)";
716     (void)sprintf(bufp, "coreName: %s\n", buf1);
717     bufp += strlen(bufp);
718     (void)sprintf(bufp, "pid: %ld\n", afs_printable_int32_ld(tp->pid));
719     bufp += strlen(bufp);
720     (void)sprintf(bufp, "lastExit: %ld\n", afs_printable_int32_ld(tp->lastExit));
721     bufp += strlen(bufp);
722 #ifdef notdef
723     (void)sprintf(bufp, "lastSignal: %ld\n", afs_printable_int32_ld(tp->lastSignal));
724     bufp += strlen(bufp);
725 #endif
726     (void)sprintf(bufp, "flags: %ld\n", afs_printable_int32_ld(tp->flags));
727     bufp += strlen(bufp);
728     (void)sprintf(bufp, "END bnode_proc\n");
729     bufp += strlen(bufp);
730     len = (int)(bufp - buffer);
731     if (write(fd, buffer, len) < 0) {
732         return -1;
733     }
734
735     /*
736      * Now sent out the bnode struct
737      */
738     bufp = buffer;
739     (void)sprintf(bufp, "BEGIN bnode\n");
740     bufp += strlen(bufp);
741     (void)sprintf(bufp, "name: %s\n", tb->name);
742     bufp += strlen(bufp);
743     (void)sprintf(bufp, "rsTime: %ld\n", afs_printable_int32_ld(tb->rsTime));
744     bufp += strlen(bufp);
745     (void)sprintf(bufp, "rsCount: %ld\n", afs_printable_int32_ld(tb->rsCount));
746     bufp += strlen(bufp);
747     (void)sprintf(bufp, "procStartTime: %ld\n", afs_printable_int32_ld(tb->procStartTime));
748     bufp += strlen(bufp);
749     (void)sprintf(bufp, "procStarts: %ld\n", afs_printable_int32_ld(tb->procStarts));
750     bufp += strlen(bufp);
751     (void)sprintf(bufp, "lastAnyExit: %ld\n", afs_printable_int32_ld(tb->lastAnyExit));
752     bufp += strlen(bufp);
753     (void)sprintf(bufp, "lastErrorExit: %ld\n", afs_printable_int32_ld(tb->lastErrorExit));
754     bufp += strlen(bufp);
755     (void)sprintf(bufp, "errorCode: %ld\n", afs_printable_int32_ld(tb->errorCode));
756     bufp += strlen(bufp);
757     (void)sprintf(bufp, "errorSignal: %ld\n", afs_printable_int32_ld(tb->errorSignal));
758     bufp += strlen(bufp);
759 /*
760     (void) sprintf(bufp, "lastErrorName: %s\n", tb->lastErrorName);
761     bufp += strlen(bufp);
762 */
763     (void)sprintf(bufp, "goal: %d\n", tb->goal);
764     bufp += strlen(bufp);
765     (void)sprintf(bufp, "END bnode\n");
766     bufp += strlen(bufp);
767     len = (int)(bufp - buffer);
768     if (write(fd, buffer, len) < 0) {
769         return -1;
770     }
771     return 0;
772 }
773
774 int
775 hdl_notifier(struct bnode_proc *tp)
776 {
777 #ifndef AFS_NT40_ENV            /* NT notifier callout not yet implemented */
778     int pid;
779     struct stat tstat;
780
781     if (stat(tp->bnode->notifier, &tstat)) {
782         bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
783                  tp->bnode->notifier);
784         return (1);
785     }
786     if ((pid = fork()) == 0) {
787         FILE *fout;
788         struct bnode *tb = tp->bnode;
789
790 #if defined(AFS_HPUX_ENV) || defined(AFS_SUN5_ENV) || defined(AFS_SGI51_ENV)
791         setsid();
792 #elif defined(AFS_DARWIN90_ENV)
793         setpgid(0, 0);
794 #elif defined(AFS_LINUX20_ENV) || defined(AFS_AIX_ENV)
795         setpgrp();
796 #else
797         setpgrp(0, 0);
798 #endif
799         fout = popen(tb->notifier, "w");
800         if (fout == NULL) {
801             bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
802                      tb->notifier);
803             perror(tb->notifier);
804             exit(1);
805         }
806         SendNotifierData(fileno(fout), tp);
807         pclose(fout);
808         exit(0);
809     } else if (pid < 0) {
810         bozo_Log("Failed to fork creating process to handle notifier '%s'\n",
811                  tp->bnode->notifier);
812         return -1;
813     }
814 #endif /* AFS_NT40_ENV */
815     return (0);
816 }
817
818 /* Called by IOMGR at low priority on IOMGR's stack shortly after a SIGCHLD
819  * occurs.  Wakes up bproc do redo things */
820 void *
821 bnode_SoftInt(void *param)
822 {
823     /* int asignal = (int) param; */
824
825     IOMGR_Cancel(bproc_pid);
826     return 0;
827 }
828
829 /* Called at signal interrupt level; queues function to be called
830  * when IOMGR runs again.
831  */
832 void
833 bnode_Int(int asignal)
834 {
835     if (asignal == SIGQUIT || asignal == SIGTERM) {
836         IOMGR_SoftSig(bozo_ShutdownAndExit, (void *)(intptr_t)asignal);
837     } else {
838         IOMGR_SoftSig(bnode_SoftInt, (void *)(intptr_t)asignal);
839     }
840 }
841
842
843 /* intialize the whole system */
844 int
845 bnode_Init(void)
846 {
847     PROCESS junk;
848     afs_int32 code;
849     struct sigaction newaction;
850     static int initDone = 0;
851
852     if (initDone)
853         return 0;
854     initDone = 1;
855     memset(&bnode_stats, 0, sizeof(bnode_stats));
856     LWP_InitializeProcessSupport(1, &junk);     /* just in case */
857     IOMGR_Initialize();
858     code = LWP_CreateProcess(bproc, BNODE_LWP_STACKSIZE,
859                              /* priority */ 1, (void *) /* parm */ 0,
860                              "bnode-manager", &bproc_pid);
861     if (code)
862         return code;
863     memset(&newaction, 0, sizeof(newaction));
864     newaction.sa_handler = bnode_Int;
865     code = sigaction(SIGCHLD, &newaction, NULL);
866     if (code)
867         return errno;
868     code = sigaction(SIGQUIT, &newaction, NULL);
869     if (code)
870         return errno;
871     code = sigaction(SIGTERM, &newaction, NULL);
872     if (code)
873         return errno;
874     return code;
875 }
876
877 /* free token list returned by parseLine */
878 int
879 bnode_FreeTokens(struct bnode_token *alist)
880 {
881     struct bnode_token *nlist;
882     for (; alist; alist = nlist) {
883         nlist = alist->next;
884         free(alist->key);
885         free(alist);
886     }
887     return 0;
888 }
889
890 static int
891 space(int x)
892 {
893     if (x == 0 || x == ' ' || x == '\t' || x == '\n')
894         return 1;
895     else
896         return 0;
897 }
898
899 int
900 bnode_ParseLine(char *aline, struct bnode_token **alist)
901 {
902     char tbuffer[256];
903     char *tptr = NULL;
904     int inToken;
905     struct bnode_token *first, *last;
906     struct bnode_token *ttok;
907     int tc;
908
909     inToken = 0;                /* not copying token chars at start */
910     first = (struct bnode_token *)0;
911     last = (struct bnode_token *)0;
912     while (1) {
913         tc = *aline++;
914         if (tc == 0 || space(tc)) {     /* terminating null gets us in here, too */
915             if (inToken) {
916                 inToken = 0;    /* end of this token */
917                 *tptr++ = 0;
918                 ttok =
919                     (struct bnode_token *)malloc(sizeof(struct bnode_token));
920                 ttok->next = (struct bnode_token *)0;
921                 ttok->key = strdup(tbuffer);
922                 if (last) {
923                     last->next = ttok;
924                     last = ttok;
925                 } else
926                     last = ttok;
927                 if (!first)
928                     first = ttok;
929             }
930         } else {
931             /* an alpha character */
932             if (!inToken) {
933                 tptr = tbuffer;
934                 inToken = 1;
935             }
936             if (tptr - tbuffer >= sizeof(tbuffer))
937                 return -1;      /* token too long */
938             *tptr++ = tc;
939         }
940         if (tc == 0) {
941             /* last token flushed 'cause space(0) --> true */
942             if (last)
943                 last->next = (struct bnode_token *)0;
944             *alist = first;
945             return 0;
946         }
947     }
948 }
949
950 #define MAXVARGS            128
951 int
952 bnode_NewProc(struct bnode *abnode, char *aexecString, char *coreName,
953               struct bnode_proc **aproc)
954 {
955     struct bnode_token *tlist, *tt;
956     afs_int32 code;
957     struct bnode_proc *tp;
958     pid_t cpid;
959     char *argv[MAXVARGS];
960     int i;
961
962     code = bnode_ParseLine(aexecString, &tlist);        /* try parsing first */
963     if (code)
964         return code;
965     tp = (struct bnode_proc *)malloc(sizeof(struct bnode_proc));
966     memset(tp, 0, sizeof(struct bnode_proc));
967     tp->next = allProcs;
968     tp->bnode = abnode;
969     tp->comLine = aexecString;
970     tp->coreName = coreName;    /* may be null */
971     abnode->procStartTime = FT_ApproxTime();
972     abnode->procStarts++;
973
974     /* convert linked list of tokens into argv structure */
975     for (tt = tlist, i = 0; i < (MAXVARGS - 1) && tt; tt = tt->next, i++) {
976         argv[i] = tt->key;
977     }
978     argv[i] = NULL;             /* null-terminated */
979
980     cpid = spawnprocve(argv[0], argv, environ, -1);
981     osi_audit(BOSSpawnProcEvent, 0, AUD_STR, aexecString, AUD_END);
982
983     if (cpid == (pid_t) - 1) {
984         bozo_Log("Failed to spawn process for bnode '%s'\n", abnode->name);
985         bnode_FreeTokens(tlist);
986         free(tp);
987         return errno;
988     }
989     bozo_Log("%s started pid %ld: %s\n", abnode->name, cpid, aexecString);
990
991     bnode_FreeTokens(tlist);
992     allProcs = tp;
993     *aproc = tp;
994     tp->pid = cpid;
995     tp->flags = BPROC_STARTED;
996     tp->flags &= ~BPROC_EXITED;
997     BOP_PROCSTARTED(abnode, tp);
998     bnode_Check(abnode);
999     return 0;
1000 }
1001
1002 int
1003 bnode_StopProc(struct bnode_proc *aproc, int asignal)
1004 {
1005     int code;
1006     if (!(aproc->flags & BPROC_STARTED) || (aproc->flags & BPROC_EXITED))
1007         return BZNOTACTIVE;
1008
1009     osi_audit(BOSStopProcEvent, 0, AUD_STR, (aproc ? aproc->comLine : NULL),
1010               AUD_END);
1011
1012     code = kill(aproc->pid, asignal);
1013     bnode_Check(aproc->bnode);
1014     return code;
1015 }
1016
1017 int
1018 bnode_Deactivate(struct bnode *abnode)
1019 {
1020     struct bnode **pb, *tb;
1021     struct bnode *nb;
1022     if (!(abnode->flags & BNODE_ACTIVE))
1023         return BZNOTACTIVE;
1024     for (pb = &allBnodes, tb = *pb; tb; tb = nb) {
1025         nb = tb->next;
1026         if (tb == abnode) {
1027             *pb = nb;
1028             tb->flags &= ~BNODE_ACTIVE;
1029             return 0;
1030         }
1031     }
1032     return BZNOENT;
1033 }