fed0c76b2b88552cfc82fe079307e10378e7fca7
[openafs.git] / src / bozo / bnode.c
1 /*
2  * Copyright 2000, International Business Machines Corporation and others.
3  * All Rights Reserved.
4  * 
5  * This software has been released under the terms of the IBM Public
6  * License.  For details, see the LICENSE file in the top-level source
7  * directory or online at http://www.openafs.org/dl/license10.html
8  */
9
10 #include <afsconfig.h>
11 #include <afs/param.h>
12
13 RCSID
14     ("$Header$");
15
16 #include <stddef.h>
17 #include <stdlib.h>
18 #include <stdio.h>
19 #include <errno.h>
20 #include <sys/types.h>
21 #ifdef AFS_NT40_ENV
22 #include <io.h>
23 #else
24 #include <sys/file.h>
25 #include <sys/time.h>
26 #endif
27 #ifdef BOZO_SAVE_CORES
28 #include <time.h>
29 #endif
30 #include <sys/stat.h>
31 #include <string.h>
32
33 #include <afs/procmgmt.h>       /* signal(), kill(), wait(), etc. */
34 #include <lwp.h>
35 #include <afs/audit.h>
36 #include <afs/afsutil.h>
37 #include <afs/fileutil.h>
38 #include "bnode.h"
39 #include "bosprototypes.h"
40
41 #if defined(AFS_AIX_ENV) || defined(AFS_SUN4_ENV)
42 /* All known versions of AIX lack WCOREDUMP but this works */
43 #define WCOREDUMP(x) ((x) & 0x80)
44 #endif
45
46 #define BNODE_LWP_STACKSIZE     (16 * 1024)
47
48 int bnode_waiting = 0;
49 static PROCESS bproc_pid;       /* pid of waker-upper */
50 static struct bnode *allBnodes = 0;     /* list of all bnodes */
51 static struct bnode_proc *allProcs = 0; /* list of all processes for which we're waiting */
52 static struct bnode_type *allTypes = 0; /* list of registered type handlers */
53
54 static struct bnode_stats {
55     int weirdPids;
56 } bnode_stats;
57
58 #ifndef AFS_NT40_ENV
59 extern char **environ;          /* env structure */
60 #endif
61
62 /* Remember the name of the process, if any, that failed last */
63 static void
64 RememberProcName(register struct bnode_proc *ap)
65 {
66     register struct bnode *tbnodep;
67
68     tbnodep = ap->bnode;
69     if (tbnodep->lastErrorName) {
70         free(tbnodep->lastErrorName);
71         tbnodep->lastErrorName = NULL;
72     }
73     if (ap->coreName) {
74         tbnodep->lastErrorName = (char *)malloc(strlen(ap->coreName) + 1);
75         strcpy(tbnodep->lastErrorName, ap->coreName);
76     }
77 }
78
79 /* utility for use by BOP_HASCORE functions to determine where a core file might
80  * be stored.
81  */
82 int
83 bnode_CoreName(register struct bnode *abnode, char *acoreName, char *abuffer)
84 {
85     strcpy(abuffer, AFSDIR_SERVER_CORELOG_FILEPATH);
86     if (acoreName) {
87         strcat(abuffer, acoreName);
88         strcat(abuffer, ".");
89     }
90     strcat(abuffer, abnode->name);
91     return 0;
92 }
93
94 /* save core file, if any */
95 static void
96 SaveCore(register struct bnode *abnode, register struct bnode_proc
97          *aproc)
98 {
99     char tbuffer[256];
100     struct stat tstat;
101     register afs_int32 code;
102 #ifdef BOZO_SAVE_CORES
103     struct timeval Start;
104     struct tm *TimeFields;
105     char FileName[256];
106 #endif
107
108     code = stat(AFSDIR_SERVER_CORELOG_FILEPATH, &tstat);
109     if (code)
110         return;
111
112     bnode_CoreName(abnode, aproc->coreName, tbuffer);
113 #ifdef BOZO_SAVE_CORES
114     TM_GetTimeOfDay(&Start, 0);
115     TimeFields = localtime(&Start.tv_sec);
116     sprintf(FileName, "%s.%d%02d%02d%02d%02d%02d", tbuffer,
117             TimeFields->tm_year, TimeFields->tm_mon + 1, TimeFields->tm_mday,
118             TimeFields->tm_hour, TimeFields->tm_min, TimeFields->tm_sec);
119     strcpy(tbuffer, FileName);
120 #endif
121     code = renamefile(AFSDIR_SERVER_CORELOG_FILEPATH, tbuffer);
122 }
123
124 int
125 bnode_GetString(register struct bnode *abnode, register char *abuffer,
126                 register afs_int32 alen)
127 {
128     return BOP_GETSTRING(abnode, abuffer, alen);
129 }
130
131 int
132 bnode_GetParm(register struct bnode *abnode, register afs_int32 aindex,
133               register char *abuffer, afs_int32 alen)
134 {
135     return BOP_GETPARM(abnode, aindex, abuffer, alen);
136 }
137
138 int
139 bnode_GetStat(register struct bnode *abnode, register afs_int32 * astatus)
140 {
141     return BOP_GETSTAT(abnode, astatus);
142 }
143
144 int
145 bnode_RestartP(register struct bnode *abnode)
146 {
147     return BOP_RESTARTP(abnode);
148 }
149
150 static int
151 bnode_Check(register struct bnode *abnode)
152 {
153     if (abnode->flags & BNODE_WAIT) {
154         abnode->flags &= ~BNODE_WAIT;
155         LWP_NoYieldSignal(abnode);
156     }
157     return 0;
158 }
159
160 /* tell if an instance has a core file */
161 int
162 bnode_HasCore(register struct bnode *abnode)
163 {
164     return BOP_HASCORE(abnode);
165 }
166
167 /* wait for all bnodes to stabilize */
168 int
169 bnode_WaitAll()
170 {
171     register struct bnode *tb;
172     register afs_int32 code;
173     afs_int32 stat;
174
175   retry:
176     for (tb = allBnodes; tb; tb = tb->next) {
177         bnode_Hold(tb);
178         code = BOP_GETSTAT(tb, &stat);
179         if (code) {
180             bnode_Release(tb);
181             return code;
182         }
183         if (stat != tb->goal) {
184             tb->flags |= BNODE_WAIT;
185             LWP_WaitProcess(tb);
186             bnode_Release(tb);
187             goto retry;
188         }
189         bnode_Release(tb);
190     }
191     return 0;
192 }
193
194 /* wait until bnode status is correct */
195 int
196 bnode_WaitStatus(register struct bnode *abnode, int astatus)
197 {
198     register afs_int32 code;
199     afs_int32 stat;
200
201     bnode_Hold(abnode);
202     while (1) {
203         /* get the status */
204         code = BOP_GETSTAT(abnode, &stat);
205         if (code)
206             return code;
207
208         /* otherwise, check if we're done */
209         if (stat == astatus) {
210             bnode_Release(abnode);
211             return 0;           /* done */
212         }
213         if (astatus != abnode->goal) {
214             bnode_Release(abnode);
215             return -1;          /* no longer our goal, don't keep waiting */
216         }
217         /* otherwise, block */
218         abnode->flags |= BNODE_WAIT;
219         LWP_WaitProcess(abnode);
220     }
221 }
222
223 int
224 bnode_SetStat(register struct bnode *abnode, register int agoal)
225 {
226     abnode->goal = agoal;
227     bnode_Check(abnode);
228     BOP_SETSTAT(abnode, agoal);
229     abnode->flags &= ~BNODE_ERRORSTOP;
230     return 0;
231 }
232
233 int
234 bnode_SetGoal(register struct bnode *abnode, register int agoal)
235 {
236     abnode->goal = agoal;
237     bnode_Check(abnode);
238     return 0;
239 }
240
241 int
242 bnode_SetFileGoal(register struct bnode *abnode, register int agoal)
243 {
244     if (abnode->fileGoal == agoal)
245         return 0;               /* already done */
246     abnode->fileGoal = agoal;
247     WriteBozoFile(0);
248     return 0;
249 }
250
251 /* apply a function to all bnodes in the system */
252 int
253 bnode_ApplyInstance(int (*aproc) (), char *arock)
254 {
255     register struct bnode *tb, *nb;
256     register afs_int32 code;
257
258     for (tb = allBnodes; tb; tb = nb) {
259         nb = tb->next;
260         code = (*aproc) (tb, arock);
261         if (code)
262             return code;
263     }
264     return 0;
265 }
266
267 struct bnode *
268 bnode_FindInstance(register char *aname)
269 {
270     register struct bnode *tb;
271
272     for (tb = allBnodes; tb; tb = tb->next) {
273         if (!strcmp(tb->name, aname))
274             return tb;
275     }
276     return NULL;
277 }
278
279 static struct bnode_type *
280 FindType(register char *aname)
281 {
282     register struct bnode_type *tt;
283
284     for (tt = allTypes; tt; tt = tt->next) {
285         if (!strcmp(tt->name, aname))
286             return tt;
287     }
288     return (struct bnode_type *)0;
289 }
290
291 int
292 bnode_Register(char *atype, struct bnode_ops *aprocs, int anparms)
293 {
294     register struct bnode_type *tt;
295
296     for (tt = allTypes; tt; tt = tt->next) {
297         if (!strcmp(tt->name, atype))
298             break;
299     }
300     if (!tt) {
301         tt = (struct bnode_type *)malloc(sizeof(struct bnode_type));
302         memset(tt, 0, sizeof(struct bnode_type));
303         tt->next = allTypes;
304         allTypes = tt;
305         tt->name = atype;
306     }
307     tt->ops = aprocs;
308     return 0;
309 }
310
311 afs_int32
312 bnode_Create(char *atype, char *ainstance, struct bnode ** abp, char *ap1,
313              char *ap2, char *ap3, char *ap4, char *ap5, char *notifier,
314              int fileGoal, int rewritefile)
315 {
316     struct bnode_type *type;
317     struct bnode *tb;
318     char *notifierpath = NULL;
319     struct stat tstat;
320
321     if (bnode_FindInstance(ainstance))
322         return BZEXISTS;
323     type = FindType(atype);
324     if (!type)
325         return BZBADTYPE;
326
327     if (notifier && strcmp(notifier, NONOTIFIER)) {
328         /* construct local path from canonical (wire-format) path */
329         if (ConstructLocalBinPath(notifier, &notifierpath)) {
330             bozo_Log("BNODE-Create: Notifier program path invalid '%s'\n",
331                      notifier);
332             return BZNOCREATE;
333         }
334
335         if (stat(notifierpath, &tstat)) {
336             bozo_Log("BNODE-Create: Notifier program '%s' not found\n",
337                      notifierpath);
338             free(notifierpath);
339             return BZNOCREATE;
340         }
341     }
342     tb = (*type->ops->create) (ainstance, ap1, ap2, ap3, ap4, ap5);
343     if (!tb) {
344         free(notifierpath);
345         return BZNOCREATE;
346     }
347     tb->notifier = notifierpath;
348     *abp = tb;
349     tb->type = type;
350
351     /* The fs_create above calls bnode_InitBnode() which always sets the 
352      ** fileGoal to BSTAT_NORMAL .... overwrite it with whatever is passed into
353      ** this function as a parameter... */
354     tb->fileGoal = fileGoal;
355
356     bnode_SetStat(tb, tb->goal);        /* nudge it once */
357
358     if (rewritefile != 0)
359         WriteBozoFile(0);
360
361     return 0;
362 }
363
364 int
365 bnode_DeleteName(char *ainstance)
366 {
367     register struct bnode *tb;
368
369     tb = bnode_FindInstance(ainstance);
370     if (!tb)
371         return BZNOENT;
372
373     return bnode_Delete(tb);
374 }
375
376 int
377 bnode_Hold(register struct bnode *abnode)
378 {
379     abnode->refCount++;
380     return 0;
381 }
382
383 int
384 bnode_Release(register struct bnode *abnode)
385 {
386     abnode->refCount--;
387     if (abnode->refCount == 0 && abnode->flags & BNODE_DELETE) {
388         abnode->flags &= ~BNODE_DELETE; /* we're going for it */
389         bnode_Delete(abnode);
390     }
391     return 0;
392 }
393
394 int
395 bnode_Delete(register struct bnode *abnode)
396 {
397     register afs_int32 code;
398     register struct bnode **lb, *ub;
399     afs_int32 temp;
400
401     if (abnode->refCount != 0) {
402         abnode->flags |= BNODE_DELETE;
403         return 0;
404     }
405
406     /* make sure the bnode is idle before zapping */
407     bnode_Hold(abnode);
408     code = BOP_GETSTAT(abnode, &temp);
409     bnode_Release(abnode);
410     if (code)
411         return code;
412     if (temp != BSTAT_SHUTDOWN)
413         return BZBUSY;
414
415     /* all clear to zap */
416     for (lb = &allBnodes, ub = *lb; ub; lb = &ub->next, ub = *lb) {
417         if (ub == abnode) {
418             /* unthread it from the list */
419             *lb = ub->next;
420             break;
421         }
422     }
423     free(abnode->name);         /* do this first, since bnode fields may be bad after BOP_DELETE */
424     code = BOP_DELETE(abnode);  /* don't play games like holding over this one */
425     WriteBozoFile(0);
426     return code;
427 }
428
429 /* function to tell if there's a timeout coming up */
430 int
431 bnode_PendingTimeout(register struct bnode *abnode)
432 {
433     return (abnode->flags & BNODE_NEEDTIMEOUT);
434 }
435
436 /* function called to set / clear periodic bnode wakeup times */
437 int
438 bnode_SetTimeout(register struct bnode *abnode, afs_int32 atimeout)
439 {
440     if (atimeout != 0) {
441         abnode->nextTimeout = FT_ApproxTime() + atimeout;
442         abnode->flags |= BNODE_NEEDTIMEOUT;
443         abnode->period = atimeout;
444         IOMGR_Cancel(bproc_pid);
445     } else {
446         abnode->flags &= ~BNODE_NEEDTIMEOUT;
447     }
448     return 0;
449 }
450
451 /* used by new bnode creation code to format bnode header */
452 int
453 bnode_InitBnode(register struct bnode *abnode, struct bnode_ops *abnodeops,
454                 char *aname)
455 {
456     struct bnode **lb, *nb;
457
458     /* format the bnode properly */
459     memset(abnode, 0, sizeof(struct bnode));
460     abnode->ops = abnodeops;
461     abnode->name = (char *)malloc(strlen(aname) + 1);
462     if (!abnode->name)
463         return ENOMEM;
464     strcpy(abnode->name, aname);
465     abnode->flags = BNODE_ACTIVE;
466     abnode->fileGoal = BSTAT_NORMAL;
467     abnode->goal = BSTAT_SHUTDOWN;
468
469     /* put the bnode at the end of the list so we write bnode file in same order */
470     for (lb = &allBnodes, nb = *lb; nb; lb = &nb->next, nb = *lb);
471     *lb = abnode;
472
473     return 0;
474 }
475
476 static int
477 DeleteProc(register struct bnode_proc *abproc)
478 {
479     register struct bnode_proc **pb, *tb;
480     struct bnode_proc *nb;
481
482     for (pb = &allProcs, tb = *pb; tb; pb = &tb->next, tb = nb) {
483         nb = tb->next;
484         if (tb == abproc) {
485             *pb = nb;
486             free(tb);
487             return 0;
488         }
489     }
490     return BZNOENT;
491 }
492
493 /* bnode lwp executes this code repeatedly */
494 static void *
495 bproc(void *unused)
496 {
497     register afs_int32 code;
498     register struct bnode *tb;
499     register afs_int32 temp;
500     register struct bnode_proc *tp;
501     struct bnode *nb;
502     int options;                /* must not be register */
503     struct timeval tv;
504     int setAny;
505     int status;
506
507     while (1) {
508         /* first figure out how long to sleep for */
509         temp = 0x7fffffff;      /* afs_int32 time; maxint doesn't work in select */
510         setAny = 0;
511         for (tb = allBnodes; tb; tb = tb->next) {
512             if (tb->flags & BNODE_NEEDTIMEOUT) {
513                 if (tb->nextTimeout < temp) {
514                     setAny = 1;
515                     temp = tb->nextTimeout;
516                 }
517             }
518         }
519         /* now temp has the time at which we should wakeup next */
520
521         /* sleep */
522         if (setAny)
523             temp -= FT_ApproxTime();    /* how many seconds until next event */
524         else
525             temp = 999999;
526         if (temp > 0) {
527             tv.tv_sec = temp;
528             tv.tv_usec = 0;
529             code = IOMGR_Select(0, 0, 0, 0, &tv);
530         } else
531             code = 0;           /* fake timeout code */
532
533         /* figure out why we woke up; child exit or timeouts */
534         FT_GetTimeOfDay(&tv, 0);        /* must do the real gettimeofday once and a while */
535         temp = tv.tv_sec;
536
537         /* check all bnodes to see which ones need timeout events */
538         for (tb = allBnodes; tb; tb = nb) {
539             if ((tb->flags & BNODE_NEEDTIMEOUT) && temp > tb->nextTimeout) {
540                 bnode_Hold(tb);
541                 BOP_TIMEOUT(tb);
542                 bnode_Check(tb);
543                 if (tb->flags & BNODE_NEEDTIMEOUT) {    /* check again, BOP_TIMEOUT could change */
544                     tb->nextTimeout = FT_ApproxTime() + tb->period;
545                 }
546                 nb = tb->next;
547                 bnode_Release(tb);      /* delete may occur here */
548             } else
549                 nb = tb->next;
550         }
551
552         if (code < 0) {
553             /* signalled, probably by incoming signal */
554             while (1) {
555                 options = WNOHANG;
556                 bnode_waiting = options | 0x800000;
557                 code = waitpid((pid_t) - 1, &status, options);
558                 bnode_waiting = 0;
559                 if (code == 0 || code == -1)
560                     break;      /* all done */
561                 /* otherwise code has a process id, which we now search for */
562                 for (tp = allProcs; tp; tp = tp->next)
563                     if (tp->pid == code)
564                         break;
565                 if (tp) {
566                     /* found the pid */
567                     tb = tp->bnode;
568                     bnode_Hold(tb);
569
570                     /* count restarts in last 10 seconds */
571                     if (temp > tb->rsTime + 30) {
572                         /* it's been 10 seconds we've been counting */
573                         tb->rsTime = temp;
574                         tb->rsCount = 0;
575                     }
576
577                     if (WIFSIGNALED(status) == 0) {
578                         /* exited, not signalled */
579                         tp->lastExit = WEXITSTATUS(status);
580                         tp->lastSignal = 0;
581                         if (tp->lastExit) {
582                             tb->errorCode = tp->lastExit;
583                             tb->lastErrorExit = FT_ApproxTime();
584                             RememberProcName(tp);
585                             tb->errorSignal = 0;
586                         }
587                         if (tp->coreName)
588                             bozo_Log("%s:%s exited with code %d\n", tb->name,
589                                      tp->coreName, tp->lastExit);
590                         else
591                             bozo_Log("%s exited with code %d\n", tb->name,
592                                      tp->lastExit);
593                     } else {
594                         /* Signal occurred, perhaps spurious due to shutdown request.
595                          * If due to a shutdown request, don't overwrite last error
596                          * information.
597                          */
598                         tp->lastSignal = WTERMSIG(status);
599                         tp->lastExit = 0;
600                         if (tp->lastSignal != SIGQUIT
601                             && tp->lastSignal != SIGTERM
602                             && tp->lastSignal != SIGKILL) {
603                             tb->errorSignal = tp->lastSignal;
604                             tb->lastErrorExit = FT_ApproxTime();
605                             RememberProcName(tp);
606                         }
607                         if (tp->coreName)
608                             bozo_Log("%s:%s exited on signal %d%s\n",
609                                      tb->name, tp->coreName, tp->lastSignal,
610                                      WCOREDUMP(status) ? " (core dumped)" :
611                                      "");
612                         else
613                             bozo_Log("%s exited on signal %d%s\n", tb->name,
614                                      tp->lastSignal,
615                                      WCOREDUMP(status) ? " (core dumped)" :
616                                      "");
617                         SaveCore(tb, tp);
618                     }
619                     tb->lastAnyExit = FT_ApproxTime();
620
621                     if (tb->notifier) {
622                         bozo_Log("BNODE: Notifier %s will be called\n",
623                                  tb->notifier);
624                         hdl_notifier(tp);
625                     }
626                     BOP_PROCEXIT(tb, tp);
627
628                     bnode_Check(tb);
629                     if (tb->rsCount++ > 10) {
630                         /* 10 in 10 seconds */
631                         tb->flags |= BNODE_ERRORSTOP;
632                         bnode_SetGoal(tb, BSTAT_SHUTDOWN);
633                         bozo_Log
634                             ("BNODE '%s' repeatedly failed to start, perhaps missing executable.\n",
635                              tb->name);
636                     }
637                     bnode_Release(tb);  /* bnode delete can happen here */
638                     DeleteProc(tp);
639                 } else
640                     bnode_stats.weirdPids++;
641             }
642         }
643     }
644     return NULL;
645 }
646
647 static afs_int32
648 SendNotifierData(register int fd, register struct bnode_proc *tp)
649 {
650     register struct bnode *tb = tp->bnode;
651     char buffer[1000], *bufp = buffer, *buf1;
652     register int len;
653
654     /*
655      * First sent out the bnode_proc struct
656      */
657     (void)sprintf(bufp, "BEGIN bnode_proc\n");
658     bufp += strlen(bufp);
659     (void)sprintf(bufp, "comLine: %s\n", tp->comLine);
660     bufp += strlen(bufp);
661     if (!(buf1 = tp->coreName))
662         buf1 = "(null)";
663     (void)sprintf(bufp, "coreName: %s\n", buf1);
664     bufp += strlen(bufp);
665     (void)sprintf(bufp, "pid: %ld\n", tp->pid);
666     bufp += strlen(bufp);
667     (void)sprintf(bufp, "lastExit: %ld\n", tp->lastExit);
668     bufp += strlen(bufp);
669 #ifdef notdef
670     (void)sprintf(bufp, "lastSignal: %ld\n", tp->lastSignal);
671     bufp += strlen(bufp);
672 #endif
673     (void)sprintf(bufp, "flags: %ld\n", tp->flags);
674     bufp += strlen(bufp);
675     (void)sprintf(bufp, "END bnode_proc\n");
676     bufp += strlen(bufp);
677     len = (int)(bufp - buffer);
678     if (write(fd, buffer, len) < 0) {
679         return -1;
680     }
681
682     /*
683      * Now sent out the bnode struct
684      */
685     bufp = buffer;
686     (void)sprintf(bufp, "BEGIN bnode\n");
687     bufp += strlen(bufp);
688     (void)sprintf(bufp, "name: %s\n", tb->name);
689     bufp += strlen(bufp);
690     (void)sprintf(bufp, "rsTime: %ld\n", tb->rsTime);
691     bufp += strlen(bufp);
692     (void)sprintf(bufp, "rsCount: %ld\n", tb->rsCount);
693     bufp += strlen(bufp);
694     (void)sprintf(bufp, "procStartTime: %ld\n", tb->procStartTime);
695     bufp += strlen(bufp);
696     (void)sprintf(bufp, "procStarts: %ld\n", tb->procStarts);
697     bufp += strlen(bufp);
698     (void)sprintf(bufp, "lastAnyExit: %ld\n", tb->lastAnyExit);
699     bufp += strlen(bufp);
700     (void)sprintf(bufp, "lastErrorExit: %ld\n", tb->lastErrorExit);
701     bufp += strlen(bufp);
702     (void)sprintf(bufp, "errorCode: %ld\n", tb->errorCode);
703     bufp += strlen(bufp);
704     (void)sprintf(bufp, "errorSignal: %ld\n", tb->errorSignal);
705     bufp += strlen(bufp);
706 /*
707     (void) sprintf(bufp, "lastErrorName: %s\n", tb->lastErrorName);
708     bufp += strlen(bufp);
709 */
710     (void)sprintf(bufp, "goal: %d\n", tb->goal);
711     bufp += strlen(bufp);
712     (void)sprintf(bufp, "END bnode\n");
713     bufp += strlen(bufp);
714     len = (int)(bufp - buffer);
715     if (write(fd, buffer, len) < 0) {
716         return -1;
717     }
718 }
719
720 int
721 hdl_notifier(struct bnode_proc *tp)
722 {
723 #ifndef AFS_NT40_ENV            /* NT notifier callout not yet implemented */
724     int code, pid, status;
725     struct stat tstat;
726
727     if (stat(tp->bnode->notifier, &tstat)) {
728         bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
729                  tp->bnode->notifier);
730         return (1);
731     }
732     if ((pid = fork()) == 0) {
733         FILE *fout;
734         struct bnode *tb = tp->bnode;
735         int ec;
736
737 #if defined(AFS_HPUX_ENV) || defined(AFS_SUN5_ENV) || defined(AFS_SGI51_ENV)
738         ec = setsid();
739 #elif defined(AFS_DARWIN90_ENV)
740         ec = setpgid(0, 0);
741 #elif defined(AFS_LINUX20_ENV) || defined(AFS_AIX_ENV)  
742         ec = setpgrp();
743 #else
744         ec = setpgrp(0, 0);
745 #endif
746         fout = popen(tb->notifier, "w");
747         if (fout == NULL) {
748             bozo_Log("BNODE: Failed to find notifier '%s'; ignored\n",
749                      tb->notifier);
750             perror(tb->notifier);
751             exit(1);
752         }
753         code = SendNotifierData(fileno(fout), tp);
754         pclose(fout);
755         exit(0);
756     } else if (pid < 0) {
757         bozo_Log("Failed to fork creating process to handle notifier '%s'\n",
758                  tp->bnode->notifier);
759         return -1;
760     }
761 #endif /* AFS_NT40_ENV */
762     return (0);
763 }
764
765 /* Called by IOMGR at low priority on IOMGR's stack shortly after a SIGCHLD
766  * occurs.  Wakes up bproc do redo things */
767 void *
768 bnode_SoftInt(void *param)
769 {
770     /* int asignal = (int) param; */
771
772     IOMGR_Cancel(bproc_pid);
773     return 0;
774 }
775
776 /* Called at signal interrupt level; queues function to be called
777  * when IOMGR runs again.
778  */
779 void
780 bnode_Int(int asignal)
781 {
782     if (asignal == SIGQUIT) {
783         IOMGR_SoftSig(bozo_ShutdownAndExit, (void *) asignal);
784     } else {
785         IOMGR_SoftSig(bnode_SoftInt, (void *) asignal);
786     }
787 }
788
789
790 /* intialize the whole system */
791 int
792 bnode_Init()
793 {
794     PROCESS junk;
795     register afs_int32 code;
796     struct sigaction newaction;
797     static initDone = 0;
798
799     if (initDone)
800         return 0;
801     initDone = 1;
802     memset(&bnode_stats, 0, sizeof(bnode_stats));
803     LWP_InitializeProcessSupport(1, &junk);     /* just in case */
804     IOMGR_Initialize();
805     code = LWP_CreateProcess(bproc, BNODE_LWP_STACKSIZE,
806                              /* priority */ 1, (void *) /* parm */ 0,
807                              "bnode-manager", &bproc_pid);
808     if (code)
809         return code;
810     memset((char *)&newaction, 0, sizeof(newaction));
811     newaction.sa_handler = bnode_Int;
812     code = sigaction(SIGCHLD, &newaction, NULL);
813     if (code)
814         return errno;
815     code = sigaction(SIGQUIT, &newaction, NULL);
816     if (code)
817         return errno;
818     return code;
819 }
820
821 /* free token list returned by parseLine */
822 int
823 bnode_FreeTokens(register struct bnode_token *alist)
824 {
825     register struct bnode_token *nlist;
826     for (; alist; alist = nlist) {
827         nlist = alist->next;
828         free(alist->key);
829         free(alist);
830     }
831     return 0;
832 }
833
834 static int
835 space(int x)
836 {
837     if (x == 0 || x == ' ' || x == '\t' || x == '\n')
838         return 1;
839     else
840         return 0;
841 }
842
843 int
844 bnode_ParseLine(char *aline, struct bnode_token **alist)
845 {
846     char tbuffer[256];
847     register char *tptr;
848     int inToken;
849     struct bnode_token *first, *last;
850     register struct bnode_token *ttok;
851     register int tc;
852
853     inToken = 0;                /* not copying token chars at start */
854     first = (struct bnode_token *)0;
855     last = (struct bnode_token *)0;
856     while (1) {
857         tc = *aline++;
858         if (tc == 0 || space(tc)) {     /* terminating null gets us in here, too */
859             if (inToken) {
860                 inToken = 0;    /* end of this token */
861                 *tptr++ = 0;
862                 ttok =
863                     (struct bnode_token *)malloc(sizeof(struct bnode_token));
864                 ttok->next = (struct bnode_token *)0;
865                 ttok->key = (char *)malloc(strlen(tbuffer) + 1);
866                 strcpy(ttok->key, tbuffer);
867                 if (last) {
868                     last->next = ttok;
869                     last = ttok;
870                 } else
871                     last = ttok;
872                 if (!first)
873                     first = ttok;
874             }
875         } else {
876             /* an alpha character */
877             if (!inToken) {
878                 tptr = tbuffer;
879                 inToken = 1;
880             }
881             if (tptr - tbuffer >= sizeof(tbuffer))
882                 return -1;      /* token too long */
883             *tptr++ = tc;
884         }
885         if (tc == 0) {
886             /* last token flushed 'cause space(0) --> true */
887             if (last)
888                 last->next = (struct bnode_token *)0;
889             *alist = first;
890             return 0;
891         }
892     }
893 }
894
895 #define MAXVARGS            128
896 int
897 bnode_NewProc(struct bnode *abnode, char *aexecString, char *coreName,
898               struct bnode_proc **aproc)
899 {
900     struct bnode_token *tlist, *tt;
901     afs_int32 code;
902     struct bnode_proc *tp;
903     pid_t cpid;
904     char *argv[MAXVARGS];
905     int i;
906
907     code = bnode_ParseLine(aexecString, &tlist);        /* try parsing first */
908     if (code)
909         return code;
910     tp = (struct bnode_proc *)malloc(sizeof(struct bnode_proc));
911     memset(tp, 0, sizeof(struct bnode_proc));
912     tp->next = allProcs;
913     tp->bnode = abnode;
914     tp->comLine = aexecString;
915     tp->coreName = coreName;    /* may be null */
916     abnode->procStartTime = FT_ApproxTime();
917     abnode->procStarts++;
918
919     /* convert linked list of tokens into argv structure */
920     for (tt = tlist, i = 0; i < (MAXVARGS - 1) && tt; tt = tt->next, i++) {
921         argv[i] = tt->key;
922     }
923     argv[i] = NULL;             /* null-terminated */
924
925     cpid = spawnprocve(argv[0], argv, environ, -1);
926     osi_audit(BOSSpawnProcEvent, 0, AUD_STR, aexecString, AUD_END);
927
928     if (cpid == (pid_t) - 1) {
929         bozo_Log("Failed to spawn process for bnode '%s'\n", abnode->name);
930         bnode_FreeTokens(tlist);
931         free(tp);
932         return errno;
933     }
934
935     bnode_FreeTokens(tlist);
936     allProcs = tp;
937     *aproc = tp;
938     tp->pid = cpid;
939     tp->flags = BPROC_STARTED;
940     tp->flags &= ~BPROC_EXITED;
941     bnode_Check(abnode);
942     return 0;
943 }
944
945 int
946 bnode_StopProc(register struct bnode_proc *aproc, int asignal)
947 {
948     register int code;
949     if (!(aproc->flags & BPROC_STARTED) || (aproc->flags & BPROC_EXITED))
950         return BZNOTACTIVE;
951
952     osi_audit(BOSStopProcEvent, 0, AUD_STR, (aproc ? aproc->comLine : NULL),
953               AUD_END);
954
955     code = kill(aproc->pid, asignal);
956     bnode_Check(aproc->bnode);
957     return code;
958 }
959
960 int
961 bnode_Deactivate(register struct bnode *abnode)
962 {
963     register struct bnode **pb, *tb;
964     struct bnode *nb;
965     if (!(abnode->flags & BNODE_ACTIVE))
966         return BZNOTACTIVE;
967     for (pb = &allBnodes, tb = *pb; tb; tb = nb) {
968         nb = tb->next;
969         if (tb == abnode) {
970             *pb = nb;
971             tb->flags &= ~BNODE_ACTIVE;
972             return 0;
973         }
974     }
975     return BZNOENT;
976 }