9faa9926ef5422ebf418247c040b3f9cb73ad02a
[openafs.git] / src / bozo / bnode.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  *
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13 #include <afs/procmgmt.h>
14 #include <roken.h>
15
16 #include <stddef.h>
17
18 #include <lwp.h>
19 #include <rx/rx.h>
20 #include <afs/audit.h>
21 #include <afs/afsutil.h>
22 #include <afs/fileutil.h>
23 #include <opr/queue.h>
24
25 #include "bnode.h"
26 #include "bnode_internal.h"
27 #include "bosprototypes.h"
28
29 #ifndef WCOREDUMP
30 #define WCOREDUMP(x) ((x) & 0200)
31 #endif
32
33 #define BNODE_LWP_STACKSIZE     (16 * 1024)
34 #define BNODE_ERROR_COUNT_MAX   16   /* maximum number of retries */
35
36 int bnode_waiting = 0;
37 static PROCESS bproc_pid;       /* pid of waker-upper */
38 static struct bnode *allBnodes = 0;     /* list of all bnodes */
39 static struct bnode_proc *allProcs = 0; /* list of all processes for which we're waiting */
40 static struct opr_queue allTypes;       /**< List of all registered type handlers */
41
42 static struct bnode_stats {
43     int weirdPids;
44 } bnode_stats;
45
46 extern const char *DoCore;
47 extern const char *DoPidFiles;
48 #ifndef AFS_NT40_ENV
49 extern char **environ;          /* env structure */
50 #endif
51
52 int hdl_notifier(struct bnode_proc *tp);
53
54 /* Remember the name of the process, if any, that failed last */
55 static void
56 RememberProcName(struct bnode_proc *ap)
57 {
58     struct bnode *tbnodep;
59
60     tbnodep = ap->bnode;
61     if (tbnodep->lastErrorName) {
62         free(tbnodep->lastErrorName);
63         tbnodep->lastErrorName = NULL;
64     }
65     if (ap->coreName)
66         tbnodep->lastErrorName = strdup(ap->coreName);
67 }
68
69 /* utility for use by BOP_HASCORE functions to determine where a core file might
70  * be stored.
71  */
72 int
73 bnode_CoreName(struct bnode *abnode, char *acoreName, char *abuffer)
74 {
75     if (DoCore) {
76         strcpy(abuffer, DoCore);
77         strcat(abuffer, "/");
78         strcat(abuffer, AFSDIR_CORE_FILE);
79     } else
80         strcpy(abuffer, AFSDIR_SERVER_CORELOG_FILEPATH);
81     if (acoreName) {
82         strcat(abuffer, acoreName);
83         strcat(abuffer, ".");
84     }
85     strcat(abuffer, abnode->name);
86     return 0;
87 }
88
89 /* save core file, if any */
90 static void
91 SaveCore(struct bnode *abnode, struct bnode_proc
92          *aproc)
93 {
94     char tbuffer[256];
95     struct stat tstat;
96     afs_int32 code = 0;
97     char *corefile = NULL;
98 #ifdef BOZO_SAVE_CORES
99     struct timeval Start;
100     struct tm *TimeFields;
101     char FileName[256];
102 #endif
103
104     /* Linux always appends the PID to core dumps from threaded processes, so
105      * we have to scan the directory to find core files under another name. */
106     if (DoCore) {
107         strcpy(tbuffer, DoCore);
108         strcat(tbuffer, "/");
109         strcat(tbuffer, AFSDIR_CORE_FILE);
110     } else
111         code = stat(AFSDIR_SERVER_CORELOG_FILEPATH, &tstat);
112     if (code) {
113         DIR *logdir;
114         struct dirent *file;
115         unsigned long pid;
116         const char *coredir = AFSDIR_LOGS_DIR;
117
118         if (DoCore)
119           coredir = DoCore;
120
121         logdir = opendir(coredir);
122         if (logdir == NULL)
123             return;
124         while ((file = readdir(logdir)) != NULL) {
125             if (strncmp(file->d_name, "core.", 5) != 0)
126                 continue;
127             pid = atol(file->d_name + 5);
128             if (pid == aproc->pid) {
129                 asprintf(&corefile, "%s/%s", coredir, file->d_name);
130                 if (corefile == NULL) {
131                     closedir(logdir);
132                     return;
133                 }
134                 code = 0;
135                 break;
136             }
137         }
138         closedir(logdir);
139     } else {
140         corefile = strdup(tbuffer);
141     }
142     if (code)
143         return;
144
145     bnode_CoreName(abnode, aproc->coreName, tbuffer);
146 #ifdef BOZO_SAVE_CORES
147     FT_GetTimeOfDay(&Start, 0);
148     TimeFields = localtime(&Start.tv_sec);
149     sprintf(FileName, "%s.%d%02d%02d%02d%02d%02d", tbuffer,
150             TimeFields->tm_year + 1900, TimeFields->tm_mon + 1, TimeFields->tm_mday,
151             TimeFields->tm_hour, TimeFields->tm_min, TimeFields->tm_sec);
152     strcpy(tbuffer, FileName);
153 #endif
154     code = rk_rename(corefile, tbuffer);
155     free(corefile);
156 }
157
158 int
159 bnode_GetString(struct bnode *abnode, char *abuffer,
160                 afs_int32 alen)
161 {
162     return BOP_GETSTRING(abnode, abuffer, alen);
163 }
164
165 int
166 bnode_GetParm(struct bnode *abnode, afs_int32 aindex,
167               char *abuffer, afs_int32 alen)
168 {
169     return BOP_GETPARM(abnode, aindex, abuffer, alen);
170 }
171
172 int
173 bnode_GetStat(struct bnode *abnode, afs_int32 * astatus)
174 {
175     return BOP_GETSTAT(abnode, astatus);
176 }
177
178 int
179 bnode_RestartP(struct bnode *abnode)
180 {
181     return BOP_RESTARTP(abnode);
182 }
183
184 static int
185 bnode_Check(struct bnode *abnode)
186 {
187     if (abnode->flags & BNODE_WAIT) {
188         abnode->flags &= ~BNODE_WAIT;
189         LWP_NoYieldSignal(abnode);
190     }
191     return 0;
192 }
193
194 /* tell if an instance has a core file */
195 int
196 bnode_HasCore(struct bnode *abnode)
197 {
198     return BOP_HASCORE(abnode);
199 }
200
201 /* wait for all bnodes to stabilize */
202 int
203 bnode_WaitAll(void)
204 {
205     struct bnode *tb;
206     afs_int32 code;
207     afs_int32 stat;
208
209   retry:
210     for (tb = allBnodes; tb; tb = tb->next) {
211         bnode_Hold(tb);
212         code = BOP_GETSTAT(tb, &stat);
213         if (code) {
214             bnode_Release(tb);
215             return code;
216         }
217         if (stat != tb->goal) {
218             tb->flags |= BNODE_WAIT;
219             LWP_WaitProcess(tb);
220             bnode_Release(tb);
221             goto retry;
222         }
223         bnode_Release(tb);
224     }
225     return 0;
226 }
227
228 /* wait until bnode status is correct */
229 int
230 bnode_WaitStatus(struct bnode *abnode, int astatus)
231 {
232     afs_int32 code;
233     afs_int32 stat;
234
235     bnode_Hold(abnode);
236     while (1) {
237         /* get the status */
238         code = BOP_GETSTAT(abnode, &stat);
239         if (code)
240             return code;
241
242         /* otherwise, check if we're done */
243         if (stat == astatus) {
244             bnode_Release(abnode);
245             return 0;           /* done */
246         }
247         if (astatus != abnode->goal) {
248             bnode_Release(abnode);
249             return -1;          /* no longer our goal, don't keep waiting */
250         }
251         /* otherwise, block */
252         abnode->flags |= BNODE_WAIT;
253         LWP_WaitProcess(abnode);
254     }
255 }
256
257 int
258 bnode_ResetErrorCount(struct bnode *abnode)
259 {
260     abnode->errorStopCount = 0;
261     abnode->errorStopDelay = 0;
262     return 0;
263 }
264
265 int
266 bnode_SetStat(struct bnode *abnode, int agoal)
267 {
268     abnode->goal = agoal;
269     bnode_Check(abnode);
270     BOP_SETSTAT(abnode, agoal);
271     abnode->flags &= ~BNODE_ERRORSTOP;
272     return 0;
273 }
274
275 int
276 bnode_SetGoal(struct bnode *abnode, int agoal)
277 {
278     abnode->goal = agoal;
279     bnode_Check(abnode);
280     return 0;
281 }
282
283 int
284 bnode_SetFileGoal(struct bnode *abnode, int agoal)
285 {
286     if (abnode->fileGoal == agoal)
287         return 0;               /* already done */
288     abnode->fileGoal = agoal;
289     WriteBozoFile(0);
290     return 0;
291 }
292
293 /* apply a function to all bnodes in the system */
294 int
295 bnode_ApplyInstance(int (*aproc) (struct bnode *tb, void *), void *arock)
296 {
297     struct bnode *tb, *nb;
298     afs_int32 code;
299
300     for (tb = allBnodes; tb; tb = nb) {
301         nb = tb->next;
302         code = (*aproc) (tb, arock);
303         if (code)
304             return code;
305     }
306     return 0;
307 }
308
309 struct bnode *
310 bnode_FindInstance(char *aname)
311 {
312     struct bnode *tb;
313
314     for (tb = allBnodes; tb; tb = tb->next) {
315         if (!strcmp(tb->name, aname))
316             return tb;
317     }
318     return NULL;
319 }
320
321 static struct bnode_type *
322 FindType(char *aname)
323 {
324     struct opr_queue *cursor;
325
326     for (opr_queue_Scan(&allTypes, cursor)) {
327         struct bnode_type *tt = opr_queue_Entry(cursor, struct bnode_type, q);
328
329         if (!strcmp(tt->name, aname))
330             return tt;
331     }
332     return NULL;
333 }
334
335 int
336 bnode_Register(char *atype, struct bnode_ops *aprocs, int anparms)
337 {
338     struct opr_queue *cursor;
339     struct bnode_type *tt = NULL;
340
341     for (opr_queue_Scan(&allTypes, cursor), tt = NULL) {
342         tt = opr_queue_Entry(cursor, struct bnode_type, q);
343         if (!strcmp(tt->name, atype))
344             break;
345     }
346     if (!tt) {
347         tt = calloc(1, sizeof(struct bnode_type));
348         opr_queue_Init(&tt->q);
349         opr_queue_Prepend(&allTypes, &tt->q);
350         tt->name = atype;
351     }
352     tt->ops = aprocs;
353     return 0;
354 }
355
356 afs_int32
357 bnode_Create(char *atype, char *ainstance, struct bnode ** abp, char *ap1,
358              char *ap2, char *ap3, char *ap4, char *ap5, char *notifier,
359              int fileGoal, int rewritefile)
360 {
361     struct bnode_type *type;
362     struct bnode *tb;
363     char *notifierpath = NULL;
364     struct stat tstat;
365
366     if (bnode_FindInstance(ainstance))
367         return BZEXISTS;
368     type = FindType(atype);
369     if (!type)
370         return BZBADTYPE;
371
372     if (notifier && strcmp(notifier, NONOTIFIER)) {
373         /* construct local path from canonical (wire-format) path */
374         if (ConstructLocalBinPath(notifier, &notifierpath)) {
375             bozo_Log("BNODE-Create: Notifier program path invalid '%s'\n",
376                      notifier);
377             return BZNOCREATE;
378         }
379
380         if (stat(notifierpath, &tstat)) {
381             bozo_Log("BNODE-Create: Notifier program '%s' not found\n",
382                      notifierpath);
383             free(notifierpath);
384             return BZNOCREATE;
385         }
386     }
387     tb = (*type->ops->create) (ainstance, ap1, ap2, ap3, ap4, ap5);
388     if (!tb) {
389         free(notifierpath);
390         return BZNOCREATE;
391     }
392     tb->notifier = notifierpath;
393     *abp = tb;
394     tb->type = type;
395
396     /* The fs_create above calls bnode_InitBnode() which always sets the
397      ** fileGoal to BSTAT_NORMAL .... overwrite it with whatever is passed into
398      ** this function as a parameter... */
399     tb->fileGoal = fileGoal;
400
401     bnode_SetStat(tb, tb->goal);        /* nudge it once */
402
403     if (rewritefile != 0)
404         WriteBozoFile(0);
405
406     return 0;
407 }
408
409 int
410 bnode_DeleteName(char *ainstance)
411 {
412     struct bnode *tb;
413
414     tb = bnode_FindInstance(ainstance);
415     if (!tb)
416         return BZNOENT;
417
418     return bnode_Delete(tb);
419 }
420
421 int
422 bnode_Hold(struct bnode *abnode)
423 {
424     abnode->refCount++;
425     return 0;
426 }
427
428 int
429 bnode_Release(struct bnode *abnode)
430 {
431     abnode->refCount--;
432     if (abnode->refCount == 0 && abnode->flags & BNODE_DELETE) {
433         abnode->flags &= ~BNODE_DELETE; /* we're going for it */
434         bnode_Delete(abnode);
435     }
436     return 0;
437 }
438
439 int
440 bnode_Delete(struct bnode *abnode)
441 {
442     afs_int32 code;
443     struct bnode **lb, *ub;
444     afs_int32 temp;
445
446     if (abnode->refCount != 0) {
447         abnode->flags |= BNODE_DELETE;
448         return 0;
449     }
450
451     /* make sure the bnode is idle before zapping */
452     bnode_Hold(abnode);
453     code = BOP_GETSTAT(abnode, &temp);
454     bnode_Release(abnode);
455     if (code)
456         return code;
457     if (temp != BSTAT_SHUTDOWN)
458         return BZBUSY;
459
460     /* all clear to zap */
461     for (lb = &allBnodes, ub = *lb; ub; lb = &ub->next, ub = *lb) {
462         if (ub == abnode) {
463             /* unthread it from the list */
464             *lb = ub->next;
465             break;
466         }
467     }
468     free(abnode->name);         /* do this first, since bnode fields may be bad after BOP_DELETE */
469     code = BOP_DELETE(abnode);  /* don't play games like holding over this one */
470     WriteBozoFile(0);
471     return code;
472 }
473
474 /* function to tell if there's a timeout coming up */
475 int
476 bnode_PendingTimeout(struct bnode *abnode)
477 {
478     return (abnode->flags & BNODE_NEEDTIMEOUT);
479 }
480
481 /* function called to set / clear periodic bnode wakeup times */
482 int
483 bnode_SetTimeout(struct bnode *abnode, afs_int32 atimeout)
484 {
485     if (atimeout != 0) {
486         abnode->nextTimeout = FT_ApproxTime() + atimeout;
487         abnode->flags |= BNODE_NEEDTIMEOUT;
488         abnode->period = atimeout;
489         IOMGR_Cancel(bproc_pid);
490     } else {
491         abnode->flags &= ~BNODE_NEEDTIMEOUT;
492     }
493     return 0;
494 }
495
496 /* used by new bnode creation code to format bnode header */
497 int
498 bnode_InitBnode(struct bnode *abnode, struct bnode_ops *abnodeops,
499                 char *aname)
500 {
501     struct bnode **lb, *nb;
502
503     /* format the bnode properly */
504     memset(abnode, 0, sizeof(struct bnode));
505     abnode->ops = abnodeops;
506     abnode->name = strdup(aname);
507     if (!abnode->name)
508         return ENOMEM;
509     abnode->flags = BNODE_ACTIVE;
510     abnode->fileGoal = BSTAT_NORMAL;
511     abnode->goal = BSTAT_SHUTDOWN;
512
513     /* put the bnode at the end of the list so we write bnode file in same order */
514     for (lb = &allBnodes, nb = *lb; nb; lb = &nb->next, nb = *lb);
515     *lb = abnode;
516
517     return 0;
518 }
519
520 static int
521 DeleteProc(struct bnode_proc *abproc)
522 {
523     struct bnode_proc **pb, *tb;
524     struct bnode_proc *nb;
525
526     for (pb = &allProcs, tb = *pb; tb; pb = &tb->next, tb = nb) {
527         nb = tb->next;
528         if (tb == abproc) {
529             *pb = nb;
530             free(tb);
531             return 0;
532         }
533     }
534     return BZNOENT;
535 }
536
537 /* bnode lwp executes this code repeatedly */
538 static void *
539 bproc(void *unused)
540 {
541     afs_int32 code;
542     struct bnode *tb;
543     afs_int32 temp;
544     struct bnode_proc *tp;
545     struct bnode *nb;
546     int options;                /* must not be register */
547     struct timeval tv;
548     int setAny;
549     int status;
550
551     while (1) {
552         /* first figure out how long to sleep for */
553         temp = 0x7fffffff;      /* afs_int32 time; maxint doesn't work in select */
554         setAny = 0;
555         for (tb = allBnodes; tb; tb = tb->next) {
556             if (tb->flags & BNODE_NEEDTIMEOUT) {
557                 if (tb->nextTimeout < temp) {
558                     setAny = 1;
559                     temp = tb->nextTimeout;
560                 }
561             }
562         }
563         /* now temp has the time at which we should wakeup next */
564
565         /* sleep */
566         if (setAny)
567             temp -= FT_ApproxTime();    /* how many seconds until next event */
568         else
569             temp = 999999;
570         if (temp > 0) {
571             tv.tv_sec = temp;
572             tv.tv_usec = 0;
573             code = IOMGR_Select(0, 0, 0, 0, &tv);
574         } else
575             code = 0;           /* fake timeout code */
576
577         /* figure out why we woke up; child exit or timeouts */
578         FT_GetTimeOfDay(&tv, 0);        /* must do the real gettimeofday once and a while */
579         temp = tv.tv_sec;
580
581         /* check all bnodes to see which ones need timeout events */
582         for (tb = allBnodes; tb; tb = nb) {
583             if ((tb->flags & BNODE_NEEDTIMEOUT) && temp > tb->nextTimeout) {
584                 bnode_Hold(tb);
585                 BOP_TIMEOUT(tb);
586                 bnode_Check(tb);
587                 if (tb->flags & BNODE_NEEDTIMEOUT) {    /* check again, BOP_TIMEOUT could change */
588                     tb->nextTimeout = FT_ApproxTime() + tb->period;
589                 }
590                 nb = tb->next;
591                 bnode_Release(tb);      /* delete may occur here */
592             } else
593                 nb = tb->next;
594         }
595
596         if (code < 0) {
597             /* signalled, probably by incoming signal */
598             while (1) {
599                 options = WNOHANG;
600                 bnode_waiting = options | 0x800000;
601                 code = waitpid((pid_t) - 1, &status, options);
602                 bnode_waiting = 0;
603                 if (code == 0 || code == -1)
604                     break;      /* all done */
605                 /* otherwise code has a process id, which we now search for */
606                 for (tp = allProcs; tp; tp = tp->next)
607                     if (tp->pid == code)
608                         break;
609                 if (tp) {
610                     /* found the pid */
611                     tb = tp->bnode;
612                     bnode_Hold(tb);
613
614                     /* count restarts in last 30 seconds */
615                     if (temp > tb->rsTime + 30) {
616                         /* it's been 30 seconds we've been counting */
617                         tb->rsTime = temp;
618                         tb->rsCount = 0;
619                     }
620
621
622                     if (WIFSIGNALED(status) == 0) {
623                         /* exited, not signalled */
624                         tp->lastExit = WEXITSTATUS(status);
625                         tp->lastSignal = 0;
626                         if (tp->lastExit) {
627                             tb->errorCode = tp->lastExit;
628                             tb->lastErrorExit = FT_ApproxTime();
629                             RememberProcName(tp);
630                             tb->errorSignal = 0;
631                         }
632                         if (tp->coreName)
633                             bozo_Log("%s:%s exited with code %d\n", tb->name,
634                                      tp->coreName, tp->lastExit);
635                         else
636                             bozo_Log("%s exited with code %d\n", tb->name,
637                                      tp->lastExit);
638                     } else {
639                         /* Signal occurred, perhaps spurious due to shutdown request.
640                          * If due to a shutdown request, don't overwrite last error
641                          * information.
642                          */
643                         tp->lastSignal = WTERMSIG(status);
644                         tp->lastExit = 0;
645                         if (tp->lastSignal != SIGQUIT
646                             && tp->lastSignal != SIGTERM
647                             && tp->lastSignal != SIGKILL) {
648                             tb->errorSignal = tp->lastSignal;
649                             tb->lastErrorExit = FT_ApproxTime();
650                             RememberProcName(tp);
651                         }
652                         if (tp->coreName)
653                             bozo_Log("%s:%s exited on signal %d%s\n",
654                                      tb->name, tp->coreName, tp->lastSignal,
655                                      WCOREDUMP(status) ? " (core dumped)" :
656                                      "");
657                         else
658                             bozo_Log("%s exited on signal %d%s\n", tb->name,
659                                      tp->lastSignal,
660                                      WCOREDUMP(status) ? " (core dumped)" :
661                                      "");
662                         SaveCore(tb, tp);
663                     }
664                     tb->lastAnyExit = FT_ApproxTime();
665
666                     if (tb->notifier) {
667                         bozo_Log("BNODE: Notifier %s will be called\n",
668                                  tb->notifier);
669                         hdl_notifier(tp);
670                     }
671
672                     if (tb->goal && tb->rsCount++ > 10) {
673                         /* 10 in 30 seconds */
674                         if (tb->errorStopCount >= BNODE_ERROR_COUNT_MAX) {
675                             tb->errorStopDelay = 0;     /* max reached, give up. */
676                         } else {
677                             tb->errorStopCount++;
678                             if (!tb->errorStopDelay) {
679                                 tb->errorStopDelay = 1;
680                             } else {
681                                 tb->errorStopDelay *= 2;
682                             }
683                         }
684                         tb->flags |= BNODE_ERRORSTOP;
685                         bnode_SetGoal(tb, BSTAT_SHUTDOWN);
686                         bozo_Log
687                             ("BNODE '%s' repeatedly failed to start, perhaps missing executable.\n",
688                              tb->name);
689                     }
690                     BOP_PROCEXIT(tb, tp);
691                     bnode_Check(tb);
692                     bnode_Release(tb);  /* bnode delete can happen here */
693                     DeleteProc(tp);
694                 } else
695                     bnode_stats.weirdPids++;
696             }
697         }
698     }
699     return NULL;
700 }
701
702 static afs_int32
703 SendNotifierData(int fd, struct bnode_proc *tp)
704 {
705     struct bnode *tb = tp->bnode;
706     char buffer[1000], *bufp = buffer, *buf1;
707     int len;
708
709     /*
710      * First sent out the bnode_proc struct
711      */
712     (void)sprintf(bufp, "BEGIN bnode_proc\n");
713     bufp += strlen(bufp);
714     (void)sprintf(bufp, "comLine: %s\n", tp->comLine);
715     bufp += strlen(bufp);
716     if (!(buf1 = tp->coreName))
717         buf1 = "(null)";
718     (void)sprintf(bufp, "coreName: %s\n", buf1);
719     bufp += strlen(bufp);
720     (void)sprintf(bufp, "pid: %ld\n", afs_printable_int32_ld(tp->pid));
721     bufp += strlen(bufp);
722     (void)sprintf(bufp, "lastExit: %ld\n", afs_printable_int32_ld(tp->lastExit));
723     bufp += strlen(bufp);
724 #ifdef notdef
725     (void)sprintf(bufp, "lastSignal: %ld\n", afs_printable_int32_ld(tp->lastSignal));
726     bufp += strlen(bufp);
727 #endif
728     (void)sprintf(bufp, "flags: %ld\n", afs_printable_int32_ld(tp->flags));
729     bufp += strlen(bufp);
730     (void)sprintf(bufp, "END bnode_proc\n");
731     bufp += strlen(bufp);
732     len = (int)(bufp - buffer);
733     if (write(fd, buffer, len) < 0) {
734         return -1;
735     }
736
737     /*
738      * Now sent out the bnode struct
739      */
740     bufp = buffer;
741     (void)sprintf(bufp, "BEGIN bnode\n");
742     bufp += strlen(bufp);
743     (void)sprintf(bufp, "name: %s\n", tb->name);
744     bufp += strlen(bufp);
745     (void)sprintf(bufp, "rsTime: %ld\n", afs_printable_int32_ld(tb->rsTime));
746     bufp += strlen(bufp);
747     (void)sprintf(bufp, "rsCount: %ld\n", afs_printable_int32_ld(tb->rsCount));
748     bufp += strlen(bufp);
749     (void)sprintf(bufp, "procStartTime: %ld\n", afs_printable_int32_ld(tb->procStartTime));
750     bufp += strlen(bufp);
751     (void)sprintf(bufp, "procStarts: %ld\n", afs_printable_int32_ld(tb->procStarts));
752     bufp += strlen(bufp);
753     (void)sprintf(bufp, "lastAnyExit: %ld\n", afs_printable_int32_ld(tb->lastAnyExit));
754     bufp += strlen(bufp);
755     (void)sprintf(bufp, "lastErrorExit: %ld\n", afs_printable_int32_ld(tb->lastErrorExit));
756     bufp += strlen(bufp);
757     (void)sprintf(bufp, "errorCode: %ld\n", afs_printable_int32_ld(tb->errorCode));
758     bufp += strlen(bufp);
759     (void)sprintf(bufp, "errorSignal: %ld\n", afs_printable_int32_ld(tb->errorSignal));
760     bufp += strlen(bufp);
761 /*
762     (void) sprintf(bufp, "lastErrorName: %s\n", tb->lastErrorName);
763     bufp += strlen(bufp);
764 */
765     (void)sprintf(bufp, "goal: %d\n", tb->goal);
766     bufp += strlen(bufp);
767     (void)sprintf(bufp, "END bnode\n");
768     bufp += strlen(bufp);
769     len = (int)(bufp - buffer);
770     if (write(fd, buffer, len) < 0) {
771         return -1;
772     }
773     return 0;
774 }
775
776 int
777 hdl_notifier(struct bnode_proc *tp)
778 {
779 #ifndef AFS_NT40_ENV            /* NT notifier callout not yet implemented */
780     int pid;
781     struct stat tstat;
782
783     if (stat(tp->bnode->notifier, &tstat)) {
784         bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
785                  tp->bnode->notifier);
786         return (1);
787     }
788     if ((pid = fork()) == 0) {
789         FILE *fout;
790         struct bnode *tb = tp->bnode;
791
792 #if defined(AFS_HPUX_ENV) || defined(AFS_SUN5_ENV) || defined(AFS_SGI51_ENV)
793         setsid();
794 #elif defined(AFS_DARWIN90_ENV)
795         setpgid(0, 0);
796 #elif defined(AFS_LINUX20_ENV) || defined(AFS_AIX_ENV)
797         setpgrp();
798 #else
799         setpgrp(0, 0);
800 #endif
801         fout = popen(tb->notifier, "w");
802         if (fout == NULL) {
803             bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
804                      tb->notifier);
805             perror(tb->notifier);
806             exit(1);
807         }
808         SendNotifierData(fileno(fout), tp);
809         pclose(fout);
810         exit(0);
811     } else if (pid < 0) {
812         bozo_Log("Failed to fork creating process to handle notifier '%s'\n",
813                  tp->bnode->notifier);
814         return -1;
815     }
816 #endif /* AFS_NT40_ENV */
817     return (0);
818 }
819
820 /* Called by IOMGR at low priority on IOMGR's stack shortly after a SIGCHLD
821  * occurs.  Wakes up bproc do redo things */
822 void *
823 bnode_SoftInt(void *param)
824 {
825     /* int asignal = (int) param; */
826
827     IOMGR_Cancel(bproc_pid);
828     return 0;
829 }
830
831 /* Called at signal interrupt level; queues function to be called
832  * when IOMGR runs again.
833  */
834 void
835 bnode_Int(int asignal)
836 {
837     if (asignal == SIGQUIT || asignal == SIGTERM) {
838         IOMGR_SoftSig(bozo_ShutdownAndExit, (void *)(intptr_t)asignal);
839     } else {
840         IOMGR_SoftSig(bnode_SoftInt, (void *)(intptr_t)asignal);
841     }
842 }
843
844
845 /* intialize the whole system */
846 int
847 bnode_Init(void)
848 {
849     PROCESS junk;
850     afs_int32 code;
851     struct sigaction newaction;
852     static int initDone = 0;
853
854     if (initDone)
855         return 0;
856     initDone = 1;
857     opr_queue_Init(&allTypes);
858     memset(&bnode_stats, 0, sizeof(bnode_stats));
859     LWP_InitializeProcessSupport(1, &junk);     /* just in case */
860     IOMGR_Initialize();
861     code = LWP_CreateProcess(bproc, BNODE_LWP_STACKSIZE,
862                              /* priority */ 1, (void *) /* parm */ 0,
863                              "bnode-manager", &bproc_pid);
864     if (code)
865         return code;
866     memset(&newaction, 0, sizeof(newaction));
867     newaction.sa_handler = bnode_Int;
868     code = sigaction(SIGCHLD, &newaction, NULL);
869     if (code)
870         return errno;
871     code = sigaction(SIGQUIT, &newaction, NULL);
872     if (code)
873         return errno;
874     code = sigaction(SIGTERM, &newaction, NULL);
875     if (code)
876         return errno;
877     return code;
878 }
879
880 /* free token list returned by parseLine */
881 int
882 bnode_FreeTokens(struct bnode_token *alist)
883 {
884     struct bnode_token *nlist;
885     for (; alist; alist = nlist) {
886         nlist = alist->next;
887         free(alist->key);
888         free(alist);
889     }
890     return 0;
891 }
892
893 static int
894 space(int x)
895 {
896     if (x == 0 || x == ' ' || x == '\t' || x == '\n')
897         return 1;
898     else
899         return 0;
900 }
901
902 int
903 bnode_ParseLine(char *aline, struct bnode_token **alist)
904 {
905     char tbuffer[256];
906     char *tptr = NULL;
907     int inToken;
908     struct bnode_token *first, *last;
909     struct bnode_token *ttok;
910     int tc;
911
912     inToken = 0;                /* not copying token chars at start */
913     first = (struct bnode_token *)0;
914     last = (struct bnode_token *)0;
915     while (1) {
916         tc = *aline++;
917         if (tc == 0 || space(tc)) {     /* terminating null gets us in here, too */
918             if (inToken) {
919                 inToken = 0;    /* end of this token */
920                 *tptr++ = 0;
921                 ttok = malloc(sizeof(struct bnode_token));
922                 ttok->next = (struct bnode_token *)0;
923                 ttok->key = strdup(tbuffer);
924                 if (last) {
925                     last->next = ttok;
926                     last = ttok;
927                 } else
928                     last = ttok;
929                 if (!first)
930                     first = ttok;
931             }
932         } else {
933             /* an alpha character */
934             if (!inToken) {
935                 tptr = tbuffer;
936                 inToken = 1;
937             }
938             if (tptr - tbuffer >= sizeof(tbuffer))
939                 return -1;      /* token too long */
940             *tptr++ = tc;
941         }
942         if (tc == 0) {
943             /* last token flushed 'cause space(0) --> true */
944             if (last)
945                 last->next = (struct bnode_token *)0;
946             *alist = first;
947             return 0;
948         }
949     }
950 }
951
952 #define MAXVARGS            128
953 int
954 bnode_NewProc(struct bnode *abnode, char *aexecString, char *coreName,
955               struct bnode_proc **aproc)
956 {
957     struct bnode_token *tlist, *tt;
958     afs_int32 code;
959     struct bnode_proc *tp;
960     pid_t cpid;
961     char *argv[MAXVARGS];
962     int i;
963
964     code = bnode_ParseLine(aexecString, &tlist);        /* try parsing first */
965     if (code)
966         return code;
967     tp = calloc(1, sizeof(struct bnode_proc));
968     tp->next = allProcs;
969     tp->bnode = abnode;
970     tp->comLine = aexecString;
971     tp->coreName = coreName;    /* may be null */
972     abnode->procStartTime = FT_ApproxTime();
973     abnode->procStarts++;
974
975     /* convert linked list of tokens into argv structure */
976     for (tt = tlist, i = 0; i < (MAXVARGS - 1) && tt; tt = tt->next, i++) {
977         argv[i] = tt->key;
978     }
979     argv[i] = NULL;             /* null-terminated */
980
981     cpid = spawnprocve(argv[0], argv, environ, -1);
982     osi_audit(BOSSpawnProcEvent, 0, AUD_STR, aexecString, AUD_END);
983
984     if (cpid == (pid_t) - 1) {
985         bozo_Log("Failed to spawn process for bnode '%s'\n", abnode->name);
986         bnode_FreeTokens(tlist);
987         free(tp);
988         return errno;
989     }
990     bozo_Log("%s started pid %ld: %s\n", abnode->name, cpid, aexecString);
991
992     bnode_FreeTokens(tlist);
993     allProcs = tp;
994     *aproc = tp;
995     tp->pid = cpid;
996     tp->flags = BPROC_STARTED;
997     tp->flags &= ~BPROC_EXITED;
998     BOP_PROCSTARTED(abnode, tp);
999     bnode_Check(abnode);
1000     return 0;
1001 }
1002
1003 int
1004 bnode_StopProc(struct bnode_proc *aproc, int asignal)
1005 {
1006     int code;
1007     if (!(aproc->flags & BPROC_STARTED) || (aproc->flags & BPROC_EXITED))
1008         return BZNOTACTIVE;
1009
1010     osi_audit(BOSStopProcEvent, 0, AUD_STR, (aproc ? aproc->comLine : NULL),
1011               AUD_END);
1012
1013     code = kill(aproc->pid, asignal);
1014     bnode_Check(aproc->bnode);
1015     return code;
1016 }
1017
1018 int
1019 bnode_Deactivate(struct bnode *abnode)
1020 {
1021     struct bnode **pb, *tb;
1022     struct bnode *nb;
1023     if (!(abnode->flags & BNODE_ACTIVE))
1024         return BZNOTACTIVE;
1025     for (pb = &allBnodes, tb = *pb; tb; tb = nb) {
1026         nb = tb->next;
1027         if (tb == abnode) {
1028             *pb = nb;
1029             tb->flags &= ~BNODE_ACTIVE;
1030             return 0;
1031         }
1032     }
1033     return BZNOENT;
1034 }