Remove NoAuth procedures from Admin Guide
[openafs.git] / doc / xml / AdminGuide / auagd008.xml
1 <?xml version="1.0" encoding="UTF-8"?>
2 <chapter id="HDRWQ80">
3   <title>Administering Server Machines</title>
4
5   <para>
6   <indexterm>
7     <primary>server machine</primary>
8
9     <secondary>administering</secondary>
10   </indexterm>
11
12   <indexterm>
13     <primary>administering</primary>
14
15     <secondary>server machine</secondary>
16   </indexterm>
17
18   This chapter describes how to administer an AFS server machine. It describes the following configuration information and
19   administrative tasks: <itemizedlist>
20       <listitem>
21         <para>The binary and configuration files that must reside in the subdirectories of the <emphasis
22         role="bold">/usr/afs</emphasis> directory on every server machine's local disk; see <link linkend="HDRWQ83">Local Disk Files
23         on a Server Machine</link>.</para>
24       </listitem>
25
26       <listitem>
27         <para>The various <emphasis>roles</emphasis> or functions that an AFS server machine can perform, and how to determine which
28         machines are taking a role; see <link linkend="HDRWQ90">The Four Roles for File Server Machines</link>.</para>
29       </listitem>
30
31       <listitem>
32         <para>How to maintain database server machines; see <link linkend="HDRWQ101">Administering Database Server
33         Machines</link>.</para>
34       </listitem>
35
36       <listitem>
37         <para>How to maintain the list of database server machines in the <emphasis role="bold">/usr/afs/etc/CellServDB</emphasis>
38         file; see <link linkend="HDRWQ118">Maintaining the Server CellServDB File</link>.</para>
39       </listitem>
40
41       <listitem>
42         <para>How to control authorization checking on a server machine; see <link linkend="HDRWQ123">Managing Authentication and
43         Authorization Requirements</link>.</para>
44       </listitem>
45
46       <listitem>
47         <para>How to install new disks or partitions on a file server machine; see <link linkend="HDRWQ130">Adding or Removing Disks
48         and Partitions</link>.</para>
49       </listitem>
50
51       <listitem>
52         <para>How to change a server machine's IP addresses and manager VLDB server entries; see <link linkend="HDRWQ138">Managing
53         Server IP Addresses and VLDB Server Entries</link>.</para>
54       </listitem>
55
56       <listitem>
57         <para>How to reboot a file server machine; see <link linkend="HDRWQ139">Rebooting a Server Machine</link>.</para>
58       </listitem>
59     </itemizedlist></para>
60
61   <para>To learn how to install and configure a new server machine, see the <emphasis>OpenAFS Quick Beginnings</emphasis>.</para>
62
63   <para>To learn how to administer the server processes themselves, see <link linkend="HDRWQ142">Monitoring and Controlling Server
64   Processes</link>.</para>
65
66   <para>To learn how to administer volumes, see <link linkend="HDRWQ174">Managing Volumes</link>.</para>
67
68   <sect1 id="HDRWQ81">
69     <title>Summary of Instructions</title>
70
71     <para>This chapter explains how to perform the following tasks by using the indicated commands:</para>
72
73     <informaltable frame="none">
74       <tgroup cols="2">
75         <colspec colwidth="70*" />
76
77         <colspec colwidth="30*" />
78
79         <tbody>
80           <row>
81             <entry>Install new binaries</entry>
82
83             <entry><emphasis role="bold">bos install</emphasis></entry>
84           </row>
85
86           <row>
87             <entry>Examine binary check-and-restart time</entry>
88
89             <entry><emphasis role="bold">bos getrestart</emphasis></entry>
90           </row>
91
92           <row>
93             <entry>Set binary check-and-restart time</entry>
94
95             <entry><emphasis role="bold">bos setrestart</emphasis></entry>
96           </row>
97
98           <row>
99             <entry>Examine compilation dates on binary files</entry>
100
101             <entry><emphasis role="bold">bos getdate</emphasis></entry>
102           </row>
103
104           <row>
105             <entry>Restart a process to use new binaries</entry>
106
107             <entry><emphasis role="bold">bos restart</emphasis></entry>
108           </row>
109
110           <row>
111             <entry>Revert to old version of binaries</entry>
112
113             <entry><emphasis role="bold">bos uninstall</emphasis></entry>
114           </row>
115
116           <row>
117             <entry>Remove obsolete <emphasis role="bold">.BAK</emphasis> and <emphasis role="bold">.OLD</emphasis> versions</entry>
118
119             <entry><emphasis role="bold">bos prune</emphasis></entry>
120           </row>
121
122           <row>
123             <entry>List partitions on a file server machine</entry>
124
125             <entry><emphasis role="bold">vos listpart</emphasis></entry>
126           </row>
127
128           <row>
129             <entry>Shutdown AFS server processes</entry>
130
131             <entry><emphasis role="bold">bos shutdown</emphasis></entry>
132           </row>
133
134           <row>
135             <entry>List volumes on a partition</entry>
136
137             <entry><emphasis role="bold">vos listvldb</emphasis></entry>
138           </row>
139
140           <row>
141             <entry>Move read/write volumes</entry>
142
143             <entry><emphasis role="bold">vos move</emphasis></entry>
144           </row>
145
146           <row>
147             <entry>List a cell's database server machines</entry>
148
149             <entry><emphasis role="bold">bos listhosts</emphasis></entry>
150           </row>
151
152           <row>
153             <entry>Add a database server machine to server <emphasis role="bold">CellServDB</emphasis> file</entry>
154
155             <entry><emphasis role="bold">bos addhost</emphasis></entry>
156           </row>
157
158           <row>
159             <entry>Remove a database server machine from server <emphasis role="bold">CellServDB</emphasis> file</entry>
160
161             <entry><emphasis role="bold">bos removehost</emphasis></entry>
162           </row>
163
164           <row>
165             <entry>Set authorization checking requirements</entry>
166
167             <entry><emphasis role="bold">bos setauth</emphasis></entry>
168           </row>
169
170           <row>
171             <entry>Prevent authentication for <emphasis role="bold">bos</emphasis>, <emphasis role="bold">pts</emphasis>, and
172             <emphasis role="bold">vos</emphasis> commands</entry>
173
174             <entry>Include <emphasis role="bold">-noauth</emphasis> flag</entry>
175           </row>
176
177           <row>
178             <entry>Prevent authentication for kas commands</entry>
179
180             <entry>Include <emphasis role="bold">-noauth</emphasis> flag on some commands or issue <emphasis
181             role="bold">noauthentication</emphasis> while in interactive mode</entry>
182           </row>
183
184           <row>
185             <entry>Display all VLDB server entries</entry>
186
187             <entry><emphasis role="bold">vos listaddrs</emphasis></entry>
188           </row>
189
190           <row>
191             <entry>Remove a VLDB server entry</entry>
192
193             <entry><emphasis role="bold">vos changeaddr</emphasis></entry>
194           </row>
195
196           <row>
197             <entry>Reboot a server machine remotely</entry>
198
199             <entry><emphasis role="bold">bos exec</emphasis> <emphasis>reboot_command</emphasis></entry>
200           </row>
201         </tbody>
202       </tgroup>
203     </informaltable>
204   </sect1>
205
206   <sect1 id="HDRWQ83">
207     <title>Local Disk Files on a Server Machine</title>
208
209     <para>Several types of files must reside in the subdirectories of the <emphasis role="bold">/usr/afs</emphasis> directory on an
210     AFS server machine's local disk. They include binaries, configuration files, the administrative database files (on database
211     server machines), log files, and volume header files.</para>
212
213     <para><emphasis role="bold">Note for Windows users:</emphasis> Some files described in this document possibly do not exist on
214     machines that run a Windows operating system. Also, Windows uses a backslash (<emphasis role="bold">\</emphasis>) rather than a
215     forward slash (<emphasis role="bold">/</emphasis>) to separate the elements in a pathname.</para>
216
217     <indexterm>
218       <primary>usr/afs/bin directory on server machines</primary>
219
220       <secondary>contents listed</secondary>
221     </indexterm>
222
223     <indexterm>
224       <primary>directory</primary>
225
226       <secondary>/usr/afs/bin on server machines</secondary>
227     </indexterm>
228
229     <indexterm>
230       <primary>server process binaries</primary>
231
232       <secondary>in /usr/afs/bin</secondary>
233     </indexterm>
234
235     <sect2 id="HDRWQ84">
236       <title>Binaries in the /usr/afs/bin Directory</title>
237
238       <para>The <emphasis role="bold">/usr/afs/bin</emphasis> directory stores the AFS server process and command suite binaries
239       appropriate for the machine's system (CPU and operating system) type. If a process has both a server portion and a client
240       portion (as with the Update Server) or if it has separate components (as with the <emphasis role="bold">fs</emphasis>
241       process), each component resides in a separate file.</para>
242
243       <para>To ensure predictable system performance, all file server machines must run the same AFS build version of a given
244       process. To maintain consistency easily, use the Update Server process to distribute binaries from a binary distribution
245       machine of each system type, as described further in <link linkend="HDRWQ93">Binary Distribution Machines</link>.</para>
246
247       <para>It is best to keep the binaries for all processes in the <emphasis role="bold">/usr/afs/bin</emphasis> directory, even
248       if you do not run the process actively on the machine. It simplifies the process of reconfiguring machines (for example,
249       adding database server functionality to an existing file server machine). Similarly, it is best to keep the command suite
250       binaries in the directory, even if you do not often issue commands while working on the server machine. It enables you to
251       issue commands during recovery from server and machine outages.</para>
252
253       <para>The following lists the binary files in the <emphasis role="bold">/usr/afs/bin</emphasis> directory that are directly
254       related to the AFS server processes or command suites. Other binaries (for example, for the <emphasis
255       role="bold">klog</emphasis> command) sometimes appear in this directory on a particular file server machine's disk or in an
256       AFS distribution. <variablelist>
257           <indexterm>
258             <primary>files</primary>
259
260             <secondary>backup command binary</secondary>
261           </indexterm>
262
263           <indexterm>
264             <primary>backup commands</primary>
265
266             <secondary>binary in /usr/afs/bin</secondary>
267           </indexterm>
268
269           <varlistentry>
270             <term><emphasis role="bold">backup</emphasis></term>
271
272             <listitem>
273               <para>The command suite for the AFS Backup System (the binary for the Backup Server is <emphasis
274               role="bold">buserver</emphasis>).</para>
275
276               <indexterm>
277                 <primary>files</primary>
278
279                 <secondary>bos command binary</secondary>
280               </indexterm>
281
282               <indexterm>
283                 <primary>bos commands</primary>
284
285                 <secondary>binary in /usr/afs/bin</secondary>
286               </indexterm>
287             </listitem>
288           </varlistentry>
289
290           <varlistentry>
291             <term><emphasis role="bold">bos</emphasis></term>
292
293             <listitem>
294               <para>The command suite for communicating with the Basic OverSeer (BOS) Server (the binary for the BOS Server is
295               <emphasis role="bold">bosserver</emphasis>).</para>
296
297               <indexterm>
298                 <primary>bosserver</primary>
299
300                 <secondary>binary in /usr/afs/bin</secondary>
301               </indexterm>
302
303               <indexterm>
304                 <primary>bosserver</primary>
305
306                 <secondary></secondary>
307
308                 <see>BOS Server</see>
309               </indexterm>
310
311               <indexterm>
312                 <primary>files</primary>
313
314                 <secondary>bosserver binary</secondary>
315               </indexterm>
316
317               <indexterm>
318                 <primary>programs</primary>
319
320                 <secondary>bosserver</secondary>
321               </indexterm>
322
323               <indexterm>
324                 <primary>processes</primary>
325
326                 <secondary>BOS Server, binary in /usr/afs/bin</secondary>
327               </indexterm>
328
329               <indexterm>
330                 <primary>BOS Server</primary>
331
332                 <secondary>binary in /usr/afs/bin</secondary>
333               </indexterm>
334             </listitem>
335           </varlistentry>
336
337           <varlistentry>
338             <term><emphasis role="bold">bosserver</emphasis></term>
339
340             <listitem>
341               <para>The binary for the Basic OverSeer (BOS) Server process.</para>
342
343               <indexterm>
344                 <primary>buserver</primary>
345
346                 <secondary>binary in /usr/afs/bin</secondary>
347               </indexterm>
348
349               <indexterm>
350                 <primary>buserver</primary>
351
352                 <secondary></secondary>
353
354                 <see>Backup Server</see>
355               </indexterm>
356
357               <indexterm>
358                 <primary>files</primary>
359
360                 <secondary>buserver</secondary>
361               </indexterm>
362
363               <indexterm>
364                 <primary>programs</primary>
365
366                 <secondary>buserver</secondary>
367               </indexterm>
368
369               <indexterm>
370                 <primary>processes</primary>
371
372                 <secondary>Backup Server, binary in /usr/afs/bin</secondary>
373               </indexterm>
374
375               <indexterm>
376                 <primary>Backup Server</primary>
377
378                 <secondary>binary in /usr/afs/bin</secondary>
379               </indexterm>
380             </listitem>
381           </varlistentry>
382
383           <varlistentry>
384             <term><emphasis role="bold">buserver</emphasis></term>
385
386             <listitem>
387               <para>The binary for the Backup Server process.</para>
388
389               <indexterm>
390                 <primary>fileserver</primary>
391
392                 <secondary>binary in /usr/afs/bin</secondary>
393               </indexterm>
394
395               <indexterm>
396                 <primary>fileserver</primary>
397
398                 <secondary></secondary>
399
400                 <see>File Server</see>
401               </indexterm>
402
403               <indexterm>
404                 <primary>files</primary>
405
406                 <secondary>fileserver</secondary>
407               </indexterm>
408
409               <indexterm>
410                 <primary>programs</primary>
411
412                 <secondary>fileserver</secondary>
413               </indexterm>
414
415               <indexterm>
416                 <primary>processes</primary>
417
418                 <secondary>File Server, binary in /usr/afs/bin</secondary>
419               </indexterm>
420
421               <indexterm>
422                 <primary>File Server</primary>
423
424                 <secondary>binary in /usr/afs/bin</secondary>
425               </indexterm>
426             </listitem>
427           </varlistentry>
428
429           <varlistentry>
430             <term><emphasis role="bold">fileserver</emphasis></term>
431
432             <listitem>
433               <para>The binary for the File Server component of the <emphasis role="bold">fs</emphasis> process.</para>
434
435               <indexterm>
436                 <primary>files</primary>
437
438                 <secondary>kas command binary</secondary>
439               </indexterm>
440
441               <indexterm>
442                 <primary>kas commands</primary>
443
444                 <secondary>binary in /usr/afs/bin</secondary>
445               </indexterm>
446             </listitem>
447           </varlistentry>
448
449           <varlistentry>
450             <term><emphasis role="bold">kas</emphasis></term>
451
452             <listitem>
453               <para>The command suite for communicating with the Authentication Server (the binary for the Authentication Server is
454               <emphasis role="bold">kaserver</emphasis>).</para>
455
456               <indexterm>
457                 <primary>kaserver process</primary>
458
459                 <secondary>binary in /usr/afs/bin</secondary>
460               </indexterm>
461
462               <indexterm>
463                 <primary>kaserver process</primary>
464
465                 <secondary></secondary>
466
467                 <see>Authentication Server</see>
468               </indexterm>
469
470               <indexterm>
471                 <primary>files</primary>
472
473                 <secondary>kaserver binary file</secondary>
474               </indexterm>
475
476               <indexterm>
477                 <primary>programs</primary>
478
479                 <secondary>kaserver</secondary>
480               </indexterm>
481
482               <indexterm>
483                 <primary>processes</primary>
484
485                 <secondary>Authentication Server, binary in /usr/afs/bin</secondary>
486               </indexterm>
487
488               <indexterm>
489                 <primary>Authentication Server</primary>
490
491                 <secondary>binary in /usr/afs/bin</secondary>
492               </indexterm>
493             </listitem>
494           </varlistentry>
495
496           <varlistentry>
497             <term><emphasis role="bold">kaserver</emphasis></term>
498
499             <listitem>
500               <para>The binary for the Authentication Server process.</para>
501
502               <indexterm>
503                 <primary>files</primary>
504
505                 <secondary>pts command binary</secondary>
506               </indexterm>
507
508               <indexterm>
509                 <primary>pts commands</primary>
510
511                 <secondary>binary in /usr/afs/bin</secondary>
512               </indexterm>
513             </listitem>
514           </varlistentry>
515
516           <varlistentry>
517             <term><emphasis role="bold">pts</emphasis></term>
518
519             <listitem>
520               <para>The command suite for communicating with the Protection Server process (the binary for the Protection Server is
521               <emphasis role="bold">ptserver</emphasis>).</para>
522
523               <indexterm>
524                 <primary>ptserver process</primary>
525
526                 <secondary>binary in /usr/afs/bin</secondary>
527               </indexterm>
528
529               <indexterm>
530                 <primary>ptserver process</primary>
531
532                 <secondary></secondary>
533
534                 <see>Protection Server</see>
535               </indexterm>
536
537               <indexterm>
538                 <primary>files</primary>
539
540                 <secondary>ptserver binary</secondary>
541               </indexterm>
542
543               <indexterm>
544                 <primary>programs</primary>
545
546                 <secondary>ptserver</secondary>
547               </indexterm>
548
549               <indexterm>
550                 <primary>processes</primary>
551
552                 <secondary>Protection Server, binary in /usr/afs/bin</secondary>
553               </indexterm>
554
555               <indexterm>
556                 <primary>Protection Server</primary>
557
558                 <secondary>binary in /usr/afs/bin</secondary>
559               </indexterm>
560             </listitem>
561           </varlistentry>
562
563           <varlistentry>
564             <term><emphasis role="bold">ptserver</emphasis></term>
565
566             <listitem>
567               <para>The binary for the Protection Server process.</para>
568
569               <indexterm>
570                 <primary>Salvager</primary>
571
572                 <secondary>binary in /usr/afs/bin</secondary>
573               </indexterm>
574
575               <indexterm>
576                 <primary>Salvager</primary>
577
578                 <secondary></secondary>
579
580                 <see>Salvager</see>
581               </indexterm>
582
583               <indexterm>
584                 <primary>files</primary>
585
586                 <secondary>salvager</secondary>
587               </indexterm>
588
589               <indexterm>
590                 <primary>programs</primary>
591
592                 <secondary>salvager</secondary>
593               </indexterm>
594
595               <indexterm>
596                 <primary>processes</primary>
597
598                 <secondary>Salvager, binary in /usr/afs/bin</secondary>
599               </indexterm>
600             </listitem>
601           </varlistentry>
602
603           <varlistentry>
604             <term><emphasis role="bold">salvager</emphasis></term>
605
606             <listitem>
607               <para>The binary for the Salvager component of the <emphasis role="bold">fs</emphasis> process.</para>
608
609               <indexterm>
610                 <primary>udebug</primary>
611
612                 <secondary>binary in /usr/afs/bin</secondary>
613               </indexterm>
614
615               <indexterm>
616                 <primary>files</primary>
617
618                 <secondary>udebug</secondary>
619               </indexterm>
620
621               <indexterm>
622                 <primary>commands</primary>
623
624                 <secondary>udebug</secondary>
625               </indexterm>
626
627               <indexterm>
628                 <primary>programs</primary>
629
630                 <secondary>udebug</secondary>
631               </indexterm>
632             </listitem>
633           </varlistentry>
634
635           <varlistentry>
636             <term><emphasis role="bold">udebug</emphasis></term>
637
638             <listitem>
639               <para>The binary for a program that reports the status of AFS's distributed database technology, Ubik.</para>
640
641               <indexterm>
642                 <primary>upclient</primary>
643
644                 <secondary>binary in /usr/afs/bin</secondary>
645               </indexterm>
646
647               <indexterm>
648                 <primary>upclient</primary>
649
650                 <secondary></secondary>
651
652                 <see>Update Server</see>
653               </indexterm>
654
655               <indexterm>
656                 <primary>files</primary>
657
658                 <secondary>upclient</secondary>
659               </indexterm>
660
661               <indexterm>
662                 <primary>programs</primary>
663
664                 <secondary>upclient</secondary>
665               </indexterm>
666
667               <indexterm>
668                 <primary>processes</primary>
669
670                 <secondary>Update Server, binaries in /usr/afs/bin</secondary>
671               </indexterm>
672
673               <indexterm>
674                 <primary>Update Server</primary>
675
676                 <secondary>binaries in /usr/afs/bin</secondary>
677               </indexterm>
678             </listitem>
679           </varlistentry>
680
681           <varlistentry>
682             <term><emphasis role="bold">upclient</emphasis></term>
683
684             <listitem>
685               <para>The binary for the client portion of the Update Server process.</para>
686
687               <indexterm>
688                 <primary>upserver</primary>
689
690                 <secondary>binary in /usr/afs/bin</secondary>
691               </indexterm>
692
693               <indexterm>
694                 <primary>upserver</primary>
695
696                 <secondary></secondary>
697
698                 <see>Update Server</see>
699               </indexterm>
700
701               <indexterm>
702                 <primary>files</primary>
703
704                 <secondary>upserver</secondary>
705               </indexterm>
706
707               <indexterm>
708                 <primary>programs</primary>
709
710                 <secondary>upserver</secondary>
711               </indexterm>
712             </listitem>
713           </varlistentry>
714
715           <varlistentry>
716             <term><emphasis role="bold">upserver</emphasis></term>
717
718             <listitem>
719               <para>The binary for the server portion of the Update Server process.</para>
720
721               <indexterm>
722                 <primary>vlserver</primary>
723
724                 <secondary>binary in /usr/afs/bin</secondary>
725               </indexterm>
726
727               <indexterm>
728                 <primary>vlserver</primary>
729
730                 <secondary></secondary>
731
732                 <see>VL Server</see>
733               </indexterm>
734
735               <indexterm>
736                 <primary>files</primary>
737
738                 <secondary>vlserver</secondary>
739               </indexterm>
740
741               <indexterm>
742                 <primary>programs</primary>
743
744                 <secondary>vlserver</secondary>
745               </indexterm>
746
747               <indexterm>
748                 <primary>processes</primary>
749
750                 <secondary>VL Server, binary in /usr/afs/bin</secondary>
751               </indexterm>
752
753               <indexterm>
754                 <primary>VL Server</primary>
755
756                 <secondary>binary in /usr/afs/bin</secondary>
757               </indexterm>
758
759               <indexterm>
760                 <primary>Volume Location Server</primary>
761
762                 <secondary></secondary>
763
764                 <see>VL Server</see>
765               </indexterm>
766             </listitem>
767           </varlistentry>
768
769           <varlistentry>
770             <term><emphasis role="bold">vlserver</emphasis></term>
771
772             <listitem>
773               <para>The binary for the Volume Location (VL) Server process.</para>
774
775               <indexterm>
776                 <primary>volserver</primary>
777
778                 <secondary>binary in /usr/afs/bin</secondary>
779               </indexterm>
780
781               <indexterm>
782                 <primary>volserver</primary>
783
784                 <secondary></secondary>
785
786                 <see>Volume Server</see>
787               </indexterm>
788
789               <indexterm>
790                 <primary>files</primary>
791
792                 <secondary>volserver</secondary>
793               </indexterm>
794
795               <indexterm>
796                 <primary>programs</primary>
797
798                 <secondary>volserver</secondary>
799               </indexterm>
800
801               <indexterm>
802                 <primary>processes</primary>
803
804                 <secondary>Volume Server, binary in /usr/afs/bin</secondary>
805               </indexterm>
806
807               <indexterm>
808                 <primary>Volume Server</primary>
809
810                 <secondary>binary in /usr/afs/bin</secondary>
811               </indexterm>
812             </listitem>
813           </varlistentry>
814
815           <varlistentry>
816             <term><emphasis role="bold">volserver</emphasis></term>
817
818             <listitem>
819               <para>The binary for the Volume Server component of the <emphasis role="bold">fs</emphasis> process.</para>
820
821               <indexterm>
822                 <primary>files</primary>
823
824                 <secondary>vos command binary</secondary>
825               </indexterm>
826
827               <indexterm>
828                 <primary>vos commands</primary>
829
830                 <secondary>binary in /usr/afs/bin</secondary>
831               </indexterm>
832             </listitem>
833           </varlistentry>
834
835           <varlistentry>
836             <term><emphasis role="bold">vos</emphasis></term>
837
838             <listitem>
839               <para>The command suite for communicating with the Volume and VL Server processes (the binaries for the servers are
840               <emphasis role="bold">volserver</emphasis> and <emphasis role="bold">vlserver</emphasis>, respectively).</para>
841             </listitem>
842           </varlistentry>
843         </variablelist></para>
844
845       <indexterm>
846         <primary>usr/afs/etc directory on server machines</primary>
847
848         <secondary>contents listed</secondary>
849       </indexterm>
850
851       <indexterm>
852         <primary>directory</primary>
853
854         <secondary>/usr/afs/etc</secondary>
855       </indexterm>
856
857       <indexterm>
858         <primary>files</primary>
859
860         <secondary>server configuration, in /usr/afs/etc directory</secondary>
861       </indexterm>
862
863       <indexterm>
864         <primary>common configuration files (server)</primary>
865       </indexterm>
866
867       <indexterm>
868         <primary>server machine</primary>
869
870         <secondary>configuration files in /usr/afs/etc</secondary>
871       </indexterm>
872     </sect2>
873
874     <sect2 id="HDRWQ85">
875       <title>Common Configuration Files in the /usr/afs/etc Directory</title>
876
877       <para>The directory <emphasis role="bold">/usr/afs/etc</emphasis> on every file server machine's local disk contains
878       configuration files in ASCII and machine-independent binary format. For predictable AFS performance throughout a cell, all
879       server machines must have the same version of each configuration file: <itemizedlist>
880           <indexterm>
881             <primary>Update Server</primary>
882
883             <secondary>distributing server configuration files</secondary>
884           </indexterm>
885
886           <listitem>
887             <para>Cells conventionally use the Update Server to distribute a common
888             version of each file from the cell's system control machine to other server machines (for more on the system control
889             machine, see <link linkend="HDRWQ94">The System Control Machine</link>). Run the Update Server's server portion on the
890             system control machine, and the client portion on all other server machines. Update the files on the system control
891             machine only, except as directed by instructions for dealing with emergencies.</para>
892           </listitem>
893         </itemizedlist></para>
894
895       <para>Never directly edit any of the files in the <emphasis role="bold">/usr/afs/etc</emphasis> directory, except as directed
896       by instructions for dealing with emergencies. In normal circumstances, use the appropriate <emphasis
897       role="bold">bos</emphasis> commands to change the files. The following list includes pointers to instructions.</para>
898
899       <para>The files in this directory include: <variablelist>
900           <indexterm>
901             <primary>CellServDB file (server)</primary>
902
903             <secondary>about</secondary>
904           </indexterm>
905
906           <indexterm>
907             <primary>files</primary>
908
909             <secondary>CellServDB (server)</secondary>
910           </indexterm>
911
912           <varlistentry>
913             <term><emphasis role="bold">CellServDB</emphasis></term>
914
915             <listitem>
916               <para>An ASCII file that names the cell's database server machines, which run the Authentication, Backup, Protection,
917               and VL Server processes. You create the initial version of this file by issuing the <emphasis role="bold">bos
918               setcellname</emphasis> command while installing your cell's first server machine. It is very important to update this
919               file when you change the identity of your cell's database server machines.</para>
920
921               <para>The server <emphasis role="bold">CellServDB</emphasis> file is not the same as the <emphasis
922               role="bold">CellServDB</emphasis> file stored in the <emphasis role="bold">/usr/vice/etc</emphasis> directory on
923               client machines. The client version lists the database server machines for every AFS cell that you choose to make
924               accessible from the client machine. The server <emphasis role="bold">CellServDB</emphasis> file lists only the local
925               cell's database server machines, because server processes never contact processes in other cells.</para>
926
927               <para>For instructions on maintaining this file, see <link linkend="HDRWQ118">Maintaining the Server CellServDB
928               File</link>.</para>
929
930               <indexterm>
931                 <primary>KeyFile file</primary>
932
933                 <secondary>function of</secondary>
934               </indexterm>
935
936               <indexterm>
937                 <primary>files</primary>
938
939                 <secondary>KeyFile</secondary>
940               </indexterm>
941
942               <indexterm>
943                 <primary>server encryption key</primary>
944               </indexterm>
945             </listitem>
946           </varlistentry>
947
948           <varlistentry>
949             <term><emphasis role="bold">KeyFile</emphasis></term>
950
951             <listitem>
952               <para>A machine-independent, binary-format file that lists the server encryption keys the AFS server processes use to
953               encrypt and decrypt tickets. The information in this file is the basis for secure communication in the cell, and so is
954               extremely sensitive. The file is specially protected so that only privileged users can read or change it.</para>
955
956               <para>For instructions on maintaining this file, see <link linkend="HDRWQ355">Managing Server Encryption
957               Keys</link>.</para>
958
959               <indexterm>
960                 <primary>ThisCell file (server)</primary>
961               </indexterm>
962
963               <indexterm>
964                 <primary>files</primary>
965
966                 <secondary>ThisCell (server)</secondary>
967               </indexterm>
968             </listitem>
969           </varlistentry>
970
971           <varlistentry>
972             <term><emphasis role="bold">ThisCell</emphasis></term>
973
974             <listitem>
975               <para>An ASCII file that consists of a single line defining the complete Internet domain-style name of the cell (such
976               as <computeroutput>example.com</computeroutput>). You create this file with the <emphasis role="bold">bos
977               setcellname</emphasis> command during the installation of your cell's first file server machine, as instructed in the
978               <emphasis>OpenAFS Quick Beginnings</emphasis>.</para>
979
980               <para>Note that changing this file is only one step in changing your cell's name. For discussion, see <link
981               linkend="HDRWQ34">Choosing a Cell Name</link>.</para>
982
983               <indexterm>
984                 <primary>UserList file</primary>
985               </indexterm>
986
987               <indexterm>
988                 <primary>files</primary>
989
990                 <secondary>UserList</secondary>
991               </indexterm>
992             </listitem>
993           </varlistentry>
994
995           <varlistentry>
996             <term><emphasis role="bold">UserList</emphasis></term>
997
998             <listitem>
999               <para>An ASCII file that lists the usernames of the system administrators authorized to issue privileged <emphasis
1000               role="bold">bos</emphasis>, <emphasis role="bold">vos</emphasis>, and <emphasis role="bold">backup</emphasis>
1001               commands. For instructions on maintaining the file, see <link linkend="HDRWQ592">Administering the UserList
1002               File</link>.</para>
1003             </listitem>
1004           </varlistentry>
1005         </variablelist></para>
1006
1007       <indexterm>
1008         <primary>usr/afs/local directory on server machines</primary>
1009
1010         <secondary>contents listed</secondary>
1011       </indexterm>
1012
1013       <indexterm>
1014         <primary>directory</primary>
1015
1016         <secondary>/usr/afs/local on server machines</secondary>
1017       </indexterm>
1018
1019       <indexterm>
1020         <primary>local configuration files (server)</primary>
1021       </indexterm>
1022
1023       <indexterm>
1024         <primary>file server machine</primary>
1025
1026         <secondary>configuration files in /usr/afs/local</secondary>
1027       </indexterm>
1028     </sect2>
1029
1030     <sect2 id="HDRWQ86">
1031       <title>Local Configuration Files in the /usr/afs/local Directory</title>
1032
1033       <para>The directory <emphasis role="bold">/usr/afs/local</emphasis> contains configuration files that are different for each
1034       file server machine in a cell. Thus, they are not updated automatically from a central source like the files in <emphasis
1035       role="bold">/usr/afs/bin</emphasis> and <emphasis role="bold">/usr/afs/etc</emphasis> directories. The most important file is
1036       the <emphasis role="bold">BosConfig</emphasis> file; it defines which server processes are to run on that machine.</para>
1037
1038       <para>As with the common configuration files in <emphasis role="bold">/usr/afs/etc</emphasis>, you must not edit these files
1039       directly. Use commands from the <emphasis role="bold">bos</emphasis> command suite where appropriate; some files never need to
1040       be altered.</para>
1041
1042       <para>The files in this directory include the following: <variablelist>
1043           <indexterm>
1044             <primary>BosConfig file</primary>
1045           </indexterm>
1046
1047           <indexterm>
1048             <primary>files</primary>
1049
1050             <secondary>BosConfig</secondary>
1051           </indexterm>
1052
1053           <varlistentry>
1054             <term><emphasis role="bold">BosConfig</emphasis></term>
1055
1056             <listitem>
1057               <para>This file lists the server processes to run on the server machine, by defining which processes the BOS Server
1058               monitors and what it does if the process fails. It also defines the times at which the BOS Server automatically
1059               restarts processes for maintenance purposes.</para>
1060
1061               <para>As you create server processes during a file server machine's installation, their entries are defined in this
1062               file automatically. The <emphasis>OpenAFS Quick Beginnings</emphasis> outlines the <emphasis
1063               role="bold">bos</emphasis> commands to use. For a more complete description of the file, and instructions for
1064               controlling process status by editing the file with commands from the <emphasis role="bold">bos</emphasis> suite, see
1065               <link linkend="HDRWQ142">Monitoring and Controlling Server Processes</link>.</para>
1066
1067               <indexterm>
1068                 <primary>NetInfo file (server version)</primary>
1069               </indexterm>
1070
1071               <indexterm>
1072                 <primary>files</primary>
1073
1074                 <secondary>NetInfo (server version)</secondary>
1075               </indexterm>
1076             </listitem>
1077           </varlistentry>
1078
1079           <varlistentry>
1080             <term><emphasis role="bold">NetInfo</emphasis></term>
1081
1082             <listitem>
1083               <para>This optional ASCII file lists one or more of the network interface addresses on the server machine. If it
1084               exists when the File Server initializes, the File Server uses it as the basis for the list of interfaces that it
1085               registers in its Volume Location Database (VLDB) server entry. See <link linkend="HDRWQ138">Managing Server IP
1086               Addresses and VLDB Server Entries</link>.</para>
1087
1088               <indexterm>
1089                 <primary>NetRestrict file (server version)</primary>
1090               </indexterm>
1091
1092               <indexterm>
1093                 <primary>files</primary>
1094
1095                 <secondary>NetRestrict (server version)</secondary>
1096               </indexterm>
1097             </listitem>
1098           </varlistentry>
1099
1100           <varlistentry>
1101             <term><emphasis role="bold">NetRestrict</emphasis></term>
1102
1103             <listitem>
1104               <para>This optional ASCII file lists one or more network interface addresses. If it exists when the File Server
1105               initializes, the File Server removes the specified addresses from the list of interfaces that it registers in its VLDB
1106               server entry. See <link linkend="HDRWQ138">Managing Server IP Addresses and VLDB Server Entries</link>.</para>
1107
1108               <indexterm>
1109                 <primary>NoAuth file</primary>
1110               </indexterm>
1111
1112               <indexterm>
1113                 <primary>files</primary>
1114
1115                 <secondary>NoAuth</secondary>
1116               </indexterm>
1117             </listitem>
1118           </varlistentry>
1119
1120           <varlistentry>
1121             <term><emphasis role="bold">NoAuth</emphasis></term>
1122
1123             <listitem>
1124               <para>This zero-length file instructs all AFS server processes running on the machine not to perform authorization
1125               checking. Thus, they perform any action for any user, even <emphasis role="bold">anonymous</emphasis>. This very
1126               insecure state was once a part of the initial installation
1127 procedure, but is no longer needed.  It should not be used.</para>
1128
1129               <para>The file is created automatically when you start the initial <emphasis role="bold">bosserver</emphasis> process
1130               with the <emphasis role="bold">-noauth</emphasis> flag, or issue the <emphasis role="bold">bos setauth</emphasis>
1131               command to turn off authentication requirements. When you use the <emphasis role="bold">bos setauth</emphasis> command
1132               to turn on authentication, the BOS Server removes this file. For more information, see <link
1133               linkend="HDRWQ123">Managing Authentication and Authorization Requirements</link>.</para>
1134
1135               <indexterm>
1136                 <primary>SALVAGE.fs file</primary>
1137               </indexterm>
1138
1139               <indexterm>
1140                 <primary>files</primary>
1141
1142                 <secondary>SALVAGE.fs</secondary>
1143               </indexterm>
1144             </listitem>
1145           </varlistentry>
1146
1147           <varlistentry>
1148             <term><emphasis role="bold">SALVAGE.fs</emphasis></term>
1149
1150             <listitem>
1151               <para>This zero-length file controls how the BOS Server handles a crash of the File Server component of the <emphasis
1152               role="bold">fs</emphasis> process. The BOS Server creates this file each time it starts or restarts the <emphasis
1153               role="bold">fs</emphasis> process. If the file is present when the File Server crashes, then the BOS Server runs the
1154               Salvager before restarting the File Server and Volume Server again. When the File Server exits normally, the BOS
1155               Server removes the file so that the Salvager does not run.</para>
1156
1157               <para>Do not create or remove this file yourself; the BOS Server does so automatically. If necessary, you can salvage
1158               a volume or partition by using the <emphasis role="bold">bos salvage</emphasis> command; see <link
1159               linkend="HDRWQ232">Salvaging Volumes</link>.</para>
1160
1161               <indexterm>
1162                 <primary>salvage.lock file</primary>
1163               </indexterm>
1164
1165               <indexterm>
1166                 <primary>files</primary>
1167
1168                 <secondary>salvage.lock</secondary>
1169               </indexterm>
1170             </listitem>
1171           </varlistentry>
1172
1173           <varlistentry>
1174             <term><emphasis role="bold">salvage.lock</emphasis></term>
1175
1176             <listitem>
1177               <para>This file guarantees that only one Salvager process runs on a file server machine at a time (the single process
1178               can fork multiple subprocesses to salvage multiple partitions in parallel). As the Salvager initiates (when invoked by
1179               the BOS Server or by issue of the <emphasis role="bold">bos salvage</emphasis> command), it creates this zero-length
1180               file and issues the <emphasis role="bold">flock</emphasis> system call on it. It removes the file when it completes
1181               the salvage operation. Because the Salvager must lock the file in order to run, only one Salvager can run at a
1182               time.</para>
1183
1184               <indexterm>
1185                 <primary>sysid file</primary>
1186               </indexterm>
1187
1188               <indexterm>
1189                 <primary>files</primary>
1190
1191                 <secondary>sysid</secondary>
1192               </indexterm>
1193
1194               <indexterm>
1195                 <primary>File Server</primary>
1196
1197                 <secondary>interfaces registered in VLDB</secondary>
1198
1199                 <tertiary>listed in sysid file</tertiary>
1200               </indexterm>
1201
1202               <indexterm>
1203                 <primary>VLDB</primary>
1204
1205                 <secondary>server machine interfaces registered</secondary>
1206
1207                 <tertiary>listed in sysid file</tertiary>
1208               </indexterm>
1209             </listitem>
1210           </varlistentry>
1211
1212           <varlistentry>
1213             <term><emphasis role="bold">sysid</emphasis></term>
1214
1215             <listitem>
1216               <para>This file records the network interface addresses that the File Server (<emphasis
1217               role="bold">fileserver</emphasis> process) registers in its VLDB server entry. When the Cache Manager requests volume
1218               location information, the Volume Location (VL) Server provides all of the interfaces registered for each server
1219               machine that houses the volume. This enables the Cache Manager to make use of multiple addresses when accessing AFS
1220               data stored on a multihomed file server machine. For further information, see <link linkend="HDRWQ138">Managing Server
1221               IP Addresses and VLDB Server Entries</link>.</para>
1222             </listitem>
1223           </varlistentry>
1224         </variablelist></para>
1225
1226       <indexterm>
1227         <primary>usr/afs/db directory on server machines</primary>
1228
1229         <secondary>contents listed</secondary>
1230       </indexterm>
1231
1232       <indexterm>
1233         <primary>directory</primary>
1234
1235         <secondary>/usr/afs/db on server machines</secondary>
1236       </indexterm>
1237
1238       <indexterm>
1239         <primary>database files</primary>
1240       </indexterm>
1241
1242       <indexterm>
1243         <primary>replicated database files</primary>
1244       </indexterm>
1245
1246       <indexterm>
1247         <primary>log files</primary>
1248
1249         <secondary>for replicated databases</secondary>
1250       </indexterm>
1251
1252       <indexterm>
1253         <primary>file server machine</primary>
1254
1255         <secondary>database files in /usr/afs/db</secondary>
1256       </indexterm>
1257     </sect2>
1258
1259     <sect2 id="HDRWQ87">
1260       <title>Replicated Database Files in the /usr/afs/db Directory</title>
1261
1262       <para>The directory <emphasis role="bold">/usr/afs/db</emphasis> contains two types of files pertaining to the four replicated
1263       databases in the cell--the Authentication Database, Backup Database, Protection Database, and Volume Location Database (VLDB):
1264       <itemizedlist>
1265           <listitem>
1266             <para>A file that contains each database, with a <emphasis role="bold">.DB0</emphasis> extension.</para>
1267           </listitem>
1268
1269           <listitem>
1270             <para>A log file for each database, with a <emphasis role="bold">.DBSYS1</emphasis> extension. The database server
1271             process logs each database operation in this file before performing it. If the operation is interrupted, the process
1272             consults this file to learn how to finish it.</para>
1273           </listitem>
1274         </itemizedlist></para>
1275
1276       <para>Each database server process (Authentication, Backup, Protection, or VL Server) maintains its own database and log
1277       files. The database files are in binary format, so you must always access or alter them using commands from the <emphasis
1278       role="bold">kas</emphasis> suite (for the Authentication Database), <emphasis role="bold">backup</emphasis> suite (for the
1279       Backup Database), <emphasis role="bold">pts</emphasis> suite (for the Protection Database), or <emphasis
1280       role="bold">vos</emphasis> suite (for the VLDB).</para>
1281
1282       <para>If a cell runs more than one database server machine, each database server process keeps its own copy of its database on
1283       its machine's hard disk. However, it is important that all the copies of a given database are the same. To synchronize them,
1284       the database server processes call on AFS's distributed database technology, Ubik, as described in <link
1285       linkend="HDRWQ102">Replicating the OpenAFS Administrative Databases</link>.</para>
1286
1287       <para>The files listed here appear in this directory only on database server machines. On non-database server machines, this
1288       directory is empty. <variablelist>
1289           <indexterm>
1290             <primary>files</primary>
1291
1292             <secondary>bdb.DB0</secondary>
1293           </indexterm>
1294
1295           <indexterm>
1296             <primary>bdb.DB0 file</primary>
1297           </indexterm>
1298
1299           <varlistentry>
1300             <term><emphasis role="bold">bdb.DB0</emphasis></term>
1301
1302             <listitem>
1303               <para>The Backup Database file.</para>
1304
1305               <indexterm>
1306                 <primary>files</primary>
1307
1308                 <secondary>bdb.DBSYS1</secondary>
1309               </indexterm>
1310
1311               <indexterm>
1312                 <primary>bdb.DBSYS1 file</primary>
1313               </indexterm>
1314             </listitem>
1315           </varlistentry>
1316
1317           <varlistentry>
1318             <term><emphasis role="bold">bdb.DBSYS1</emphasis></term>
1319
1320             <listitem>
1321               <para>The Backup Database log file.</para>
1322
1323               <indexterm>
1324                 <primary>files</primary>
1325
1326                 <secondary>kaserver.DB0</secondary>
1327               </indexterm>
1328
1329               <indexterm>
1330                 <primary>kaserver.DB0 file</primary>
1331               </indexterm>
1332             </listitem>
1333           </varlistentry>
1334
1335           <varlistentry>
1336             <term><emphasis role="bold">kaserver.DB0</emphasis></term>
1337
1338             <listitem>
1339               <para>The Authentication Database file.</para>
1340
1341               <indexterm>
1342                 <primary>files</primary>
1343
1344                 <secondary>kaserver.DBSYS1</secondary>
1345               </indexterm>
1346
1347               <indexterm>
1348                 <primary>kaserver.DBSYS1 file</primary>
1349               </indexterm>
1350             </listitem>
1351           </varlistentry>
1352
1353           <varlistentry>
1354             <term><emphasis role="bold">kaserver.DBSYS1</emphasis></term>
1355
1356             <listitem>
1357               <para>The Authentication Database log file.</para>
1358
1359               <indexterm>
1360                 <primary>files</primary>
1361
1362                 <secondary>prdb.DB0</secondary>
1363               </indexterm>
1364
1365               <indexterm>
1366                 <primary>prdb.DB0 file</primary>
1367               </indexterm>
1368             </listitem>
1369           </varlistentry>
1370
1371           <varlistentry>
1372             <term><emphasis role="bold">prdb.DB0</emphasis></term>
1373
1374             <listitem>
1375               <para>The Protection Database file.</para>
1376
1377               <indexterm>
1378                 <primary>files</primary>
1379
1380                 <secondary>prdb.DBSYS1</secondary>
1381               </indexterm>
1382
1383               <indexterm>
1384                 <primary>prdb.DBSYS1 file</primary>
1385               </indexterm>
1386             </listitem>
1387           </varlistentry>
1388
1389           <varlistentry>
1390             <term><emphasis role="bold">prdb.DBSYS1</emphasis></term>
1391
1392             <listitem>
1393               <para>The Protection Database log file.</para>
1394
1395               <indexterm>
1396                 <primary>files</primary>
1397
1398                 <secondary>vldb.DB0</secondary>
1399               </indexterm>
1400
1401               <indexterm>
1402                 <primary>vldb.DB0 file</primary>
1403               </indexterm>
1404             </listitem>
1405           </varlistentry>
1406
1407           <varlistentry>
1408             <term><emphasis role="bold">vldb.DB0</emphasis></term>
1409
1410             <listitem>
1411               <para>The Volume Location Database file.</para>
1412
1413               <indexterm>
1414                 <primary>files</primary>
1415
1416                 <secondary>vldb.DBSYS1</secondary>
1417               </indexterm>
1418
1419               <indexterm>
1420                 <primary>vldb.DBSYS1 file</primary>
1421               </indexterm>
1422             </listitem>
1423           </varlistentry>
1424
1425           <varlistentry>
1426             <term><emphasis role="bold">vldb.DBSYS1</emphasis></term>
1427
1428             <listitem>
1429               <para>The Volume Location Database log file.</para>
1430             </listitem>
1431           </varlistentry>
1432         </variablelist></para>
1433
1434       <indexterm>
1435         <primary>usr/afs/logs directory on server machines</primary>
1436
1437         <secondary>contents listed</secondary>
1438       </indexterm>
1439
1440       <indexterm>
1441         <primary>directory</primary>
1442
1443         <secondary>/usr/afs/logs on server machines</secondary>
1444       </indexterm>
1445
1446       <indexterm>
1447         <primary>file server machine</primary>
1448
1449         <secondary>core files in /usr/afs/logs</secondary>
1450       </indexterm>
1451
1452       <indexterm>
1453         <primary>file server machine</primary>
1454
1455         <secondary>log files in /usr/afs/logs</secondary>
1456       </indexterm>
1457
1458       <indexterm>
1459         <primary>log files</primary>
1460
1461         <secondary>for server processes</secondary>
1462       </indexterm>
1463
1464       <indexterm>
1465         <primary>core files</primary>
1466
1467         <secondary>for server processes</secondary>
1468       </indexterm>
1469     </sect2>
1470
1471     <sect2 id="HDRWQ88">
1472       <title>Log Files in the /usr/afs/logs Directory</title>
1473
1474       <para>The <emphasis role="bold">/usr/afs/logs</emphasis> directory contains log files from various server processes. The files
1475       detail interesting events that occur during normal operations. For instance, the Volume Server can record volume moves in the
1476       <emphasis role="bold">VolserLog</emphasis> file. Events are recorded at completion, so the server processes do not use these
1477       files to reconstruct failed operations unlike the ones in the <emphasis role="bold">/usr/afs/db</emphasis> directory.</para>
1478
1479       <para>The information in log files can be very useful as you evaluate process failures and other problems. For instance, if
1480       you receive a timeout message when you try to access a volume, checking the <emphasis role="bold">FileLog</emphasis> file
1481       possibly provides an explanation, showing that the File Server was unable to attach the volume. To examine a log file
1482       remotely, use the <emphasis role="bold">bos getlog</emphasis> command as described in <link linkend="HDRWQ173">Displaying
1483       Server Process Log Files</link>.</para>
1484
1485       <para>This directory also contains the core image files generated if a process being monitored by the BOS Server crashes. The
1486       BOS Server attempts to add an extension to the standard <emphasis role="bold">core</emphasis> name to indicate which process
1487       generated the core file (for example, naming a core file generated by the Protection Server <emphasis
1488       role="bold">core.ptserver</emphasis>). The BOS Server cannot always assign the correct extension if two processes fail at
1489       about the same time, so it is not guaranteed to be correct.</para>
1490
1491       <para>The directory contains the following files: <variablelist>
1492           <indexterm>
1493             <primary>AuthLog file</primary>
1494           </indexterm>
1495
1496           <indexterm>
1497             <primary>files</primary>
1498
1499             <secondary>AuthLog</secondary>
1500           </indexterm>
1501
1502           <varlistentry>
1503             <term><emphasis role="bold">AuthLog</emphasis></term>
1504
1505             <listitem>
1506               <para>The Authentication Server's log file.</para>
1507
1508               <indexterm>
1509                 <primary>BackupLog file</primary>
1510               </indexterm>
1511
1512               <indexterm>
1513                 <primary>files</primary>
1514
1515                 <secondary>BackupLog</secondary>
1516               </indexterm>
1517             </listitem>
1518           </varlistentry>
1519
1520           <varlistentry>
1521             <term><emphasis role="bold">BackupLog</emphasis></term>
1522
1523             <listitem>
1524               <para>The Backup Server's log file.</para>
1525
1526               <indexterm>
1527                 <primary>BosLog file</primary>
1528               </indexterm>
1529
1530               <indexterm>
1531                 <primary>files</primary>
1532
1533                 <secondary>BosLog</secondary>
1534               </indexterm>
1535             </listitem>
1536           </varlistentry>
1537
1538           <varlistentry>
1539             <term><emphasis role="bold">BosLog</emphasis></term>
1540
1541             <listitem>
1542               <para>The BOS Server's log file.</para>
1543
1544               <indexterm>
1545                 <primary>files</primary>
1546
1547                 <secondary>FileLog</secondary>
1548               </indexterm>
1549
1550               <indexterm>
1551                 <primary>FileLog file</primary>
1552               </indexterm>
1553             </listitem>
1554           </varlistentry>
1555
1556           <varlistentry>
1557             <term><emphasis role="bold">FileLog</emphasis></term>
1558
1559             <listitem>
1560               <para>The File Server's log file.</para>
1561
1562               <indexterm>
1563                 <primary>files</primary>
1564
1565                 <secondary>SalvageLog</secondary>
1566               </indexterm>
1567
1568               <indexterm>
1569                 <primary>SalvageLog file</primary>
1570               </indexterm>
1571             </listitem>
1572           </varlistentry>
1573
1574           <varlistentry>
1575             <term><emphasis role="bold">SalvageLog</emphasis></term>
1576
1577             <listitem>
1578               <para>The Salvager's log file.</para>
1579
1580               <indexterm>
1581                 <primary>VLLog file</primary>
1582               </indexterm>
1583
1584               <indexterm>
1585                 <primary>files</primary>
1586
1587                 <secondary>VLLog</secondary>
1588               </indexterm>
1589             </listitem>
1590           </varlistentry>
1591
1592           <varlistentry>
1593             <term><emphasis role="bold">VLLog</emphasis></term>
1594
1595             <listitem>
1596               <para>The Volume Location (VL) Server's log file.</para>
1597
1598               <indexterm>
1599                 <primary>VolserLog file</primary>
1600               </indexterm>
1601
1602               <indexterm>
1603                 <primary>files</primary>
1604
1605                 <secondary>VolserLog</secondary>
1606               </indexterm>
1607             </listitem>
1608           </varlistentry>
1609
1610           <varlistentry>
1611             <term><emphasis role="bold">VolserLog</emphasis></term>
1612
1613             <listitem>
1614               <para>The Volume Server's log file.</para>
1615             </listitem>
1616           </varlistentry>
1617
1618           <varlistentry>
1619             <term><emphasis role="bold">core.process</emphasis></term>
1620
1621             <listitem>
1622               <para>If present, a core image file produced as an AFS server process on the machine crashed (probably the process
1623               named by process).</para>
1624             </listitem>
1625           </varlistentry>
1626         </variablelist></para>
1627
1628       <note>
1629         <para>To prevent log files from growing unmanageably large, restart the server processes periodically, particularly the
1630         database server processes. To avoid restarting the processes, use the UNIX <emphasis role="bold">rm</emphasis> command to
1631         remove the file as the process runs; it re-creates it automatically.</para>
1632       </note>
1633
1634       <indexterm>
1635         <primary>vicep directory on server machines</primary>
1636
1637         <secondary>contents listed</secondary>
1638       </indexterm>
1639
1640       <indexterm>
1641         <primary>directory</primary>
1642
1643         <secondary>/vicep on server machines</secondary>
1644       </indexterm>
1645
1646       <indexterm>
1647         <primary>volume header</primary>
1648
1649         <secondary>in /vicep directories</secondary>
1650       </indexterm>
1651
1652       <indexterm>
1653         <primary>partition</primary>
1654
1655         <secondary>housing AFS volumes</secondary>
1656       </indexterm>
1657
1658       <indexterm>
1659         <primary>file server machine</primary>
1660
1661         <secondary>partitions, naming</secondary>
1662       </indexterm>
1663     </sect2>
1664
1665     <sect2 id="HDRWQ89">
1666       <title>Volume Headers on Server Partitions</title>
1667
1668       <para>A partition that houses AFS volumes must be mounted at a subdirectory of the machine's root ( / ) directory (not, for
1669       instance under the <emphasis role="bold">/usr</emphasis> directory). The file server machine's file system registry file
1670       (<emphasis role="bold">/etc/fstab</emphasis> or equivalent) must correctly map the directory name and the partition's device
1671       name. The directory name is of the form <emphasis role="bold">/vicep</emphasis>index, where each index is one or two lowercase
1672       letters. By convention, the first AFS partition on a machine is mounted at <emphasis role="bold">/vicepa</emphasis>, the
1673       second at <emphasis role="bold">/vicepb</emphasis>, and so on. If there are more than 26 partitions, continue with <emphasis
1674       role="bold">/vicepaa</emphasis>, <emphasis role="bold">/vicepab</emphasis> and so on. The <emphasis>OpenAFS Release
1675       Notes</emphasis> specifies the number of supported partitions per server machine.</para>
1676
1677       <para>Do not store non-AFS files on AFS partitions. The File Server and Volume Server expect to have available all of the
1678       space on the partition.</para>
1679
1680       <para>The <emphasis role="bold">/vicep</emphasis> directories contain two types of files: <variablelist>
1681           <indexterm>
1682             <primary>V.<emphasis>vol_ID</emphasis>.vol file</primary>
1683           </indexterm>
1684
1685           <indexterm>
1686             <primary>files</primary>
1687
1688             <secondary>V.<emphasis>vol_ID</emphasis>.vol</secondary>
1689           </indexterm>
1690
1691           <varlistentry>
1692             <term><emphasis role="bold">Vvol_ID.vol</emphasis></term>
1693
1694             <listitem>
1695               <para>Each such file is a volume header. The vol_ID corresponds to the volume ID number displayed in the output from
1696               the <emphasis role="bold">vos examine</emphasis>, <emphasis role="bold">vos listvldb</emphasis>, and <emphasis
1697               role="bold">vos listvol</emphasis> commands.</para>
1698
1699               <indexterm>
1700                 <primary>FORCESALVAGE file</primary>
1701               </indexterm>
1702
1703               <indexterm>
1704                 <primary>files</primary>
1705
1706                 <secondary>FORCESALVAGE</secondary>
1707               </indexterm>
1708             </listitem>
1709           </varlistentry>
1710
1711           <varlistentry>
1712             <term><emphasis role="bold">FORCESALVAGE</emphasis></term>
1713
1714             <listitem>
1715               <para>This zero-length file triggers the Salvager to salvage the entire partition. The AFS-modified version of the
1716               <emphasis role="bold">fsck</emphasis> program creates this file if it discovers corruption.</para>
1717             </listitem>
1718           </varlistentry>
1719         </variablelist></para>
1720
1721       <note>
1722         <para>For most system types, it is important never to run the standard <emphasis role="bold">fsck</emphasis> program
1723         provided with the operating system on an AFS file server machine. It removes all AFS volume data from server partitions
1724         because it does not recognize their format.</para>
1725       </note>
1726
1727       <indexterm>
1728         <primary>roles for server machine</primary>
1729       </indexterm>
1730
1731       <indexterm>
1732         <primary>server machine</primary>
1733
1734         <secondary>roles summarized</secondary>
1735       </indexterm>
1736     </sect2>
1737   </sect1>
1738
1739   <sect1 id="HDRWQ90">
1740     <title>The Four Roles for File Server Machines</title>
1741
1742     <para>In cells that have more than one server machine, not all server machines have to perform exactly the same functions. The
1743     are four possible <emphasis>roles</emphasis> a machine can assume, determined by which server processes it is running. A machine
1744     can assume more than one role by running all of the relevant processes. The following list summarizes the four roles, which are
1745     described more completely in subsequent sections. <itemizedlist>
1746         <listitem>
1747           <para>A <emphasis>simple file server</emphasis> machine runs only the processes that store and deliver AFS files to client
1748           machines. You can run as many simple file server machines as you need to satisfy your cell's performance and disk space
1749           requirements.</para>
1750         </listitem>
1751
1752         <listitem>
1753           <para>A <emphasis>database server machine</emphasis> runs the four database server processes that maintain AFS's
1754           replicated administrative databases: the Authentication, Backup, Protection, and Volume Location (VL) Server
1755           processes.</para>
1756         </listitem>
1757
1758         <listitem>
1759           <para>A <emphasis>binary distribution machine</emphasis> distributes the AFS server binaries for its system type to all
1760           other server machines of that system type.</para>
1761         </listitem>
1762
1763         <listitem>
1764           <para>The single <emphasis>system control machine</emphasis> distributes common server configuration files to all other
1765           server machines in the cell.</para>
1766         </listitem>
1767       </itemizedlist></para>
1768
1769     <para>If a cell has a single server machine, it assumes the simple file server and database server roles. The instructions in
1770     the <emphasis>OpenAFS Quick Beginnings</emphasis> also have you configure it as the system control machine and binary
1771     distribution machine for its system type, but it does not actually perform those functions until you install another server
1772     machine.</para>
1773
1774     <para>It is best to keep the binaries for all of the AFS server processes in the <emphasis role="bold">/usr/afs/bin</emphasis>
1775     directory, even if not all processes are running. You can then change which roles a machine assumes simply by starting or
1776     stopping the processes that define the role.</para>
1777
1778     <indexterm>
1779       <primary>simple file server machine</primary>
1780     </indexterm>
1781
1782     <indexterm>
1783       <primary>server machine</primary>
1784
1785       <secondary>simple file server role</secondary>
1786     </indexterm>
1787
1788     <sect2 id="HDRWQ91">
1789       <title>Simple File Server Machines</title>
1790
1791       <para>A <emphasis>simple file server machine</emphasis> runs only the server processes that store and deliver AFS files to
1792       client machines, monitor process status, and pick up binaries and configuration files from the cell's binary distribution and
1793       system control machines.</para>
1794
1795       <para>In general, only cells with more than three server machines need to run simple file server machines. In cells with three
1796       or fewer machines, all of them are usually database server machines (to benefit from replicating the administrative
1797       databases); see <link linkend="HDRWQ92">Database Server Machines</link>.</para>
1798
1799       <para>The following processes run on a simple file server machine: <itemizedlist>
1800           <listitem>
1801             <para>The BOS Server (<emphasis role="bold">bosserver</emphasis> process)</para>
1802           </listitem>
1803
1804           <listitem>
1805             <para>The <emphasis role="bold">fs</emphasis> process, which combines the File Server, Volume Server, and Salvager
1806             processes so that they can coordinate their operations on the data in volumes and avoid the inconsistencies that can
1807             result from multiple simultaneous operations on the same data</para>
1808           </listitem>
1809
1810           <listitem>
1811             <para>A client portion of the Update Server that picks up binary files from the binary distribution machine of its AFS
1812             system type (the <emphasis role="bold">upclientbin</emphasis> process)</para>
1813           </listitem>
1814
1815           <listitem>
1816             <para>A client portion of the Update Server that picks up common configuration files from the system control machine
1817             (the <emphasis role="bold">upclientetc</emphasis> process)</para>
1818           </listitem>
1819         </itemizedlist></para>
1820
1821       <indexterm>
1822         <primary>database server machine</primary>
1823
1824         <secondary>defined</secondary>
1825       </indexterm>
1826
1827       <indexterm>
1828         <primary>server machine</primary>
1829
1830         <secondary>database server role</secondary>
1831       </indexterm>
1832
1833       <indexterm>
1834         <primary>Backup Server</primary>
1835
1836         <secondary>runs on database server machine</secondary>
1837       </indexterm>
1838
1839       <indexterm>
1840         <primary>Authentication Server</primary>
1841
1842         <secondary>runs on database server machine</secondary>
1843       </indexterm>
1844
1845       <indexterm>
1846         <primary>Protection Server</primary>
1847
1848         <secondary>runs on database server machine</secondary>
1849       </indexterm>
1850
1851       <indexterm>
1852         <primary>VL Server</primary>
1853
1854         <secondary>runs on database server machine</secondary>
1855       </indexterm>
1856     </sect2>
1857
1858     <sect2 id="HDRWQ92">
1859       <title>Database Server Machines</title>
1860
1861       <para>A <emphasis>database server machine</emphasis> runs the four processes that maintain the AFS replicated administrative
1862       databases: the Authentication Server, Backup Server, Protection Server, and Volume Location (VL) Server, which maintain the
1863       Authentication Database, Backup Database, Protection Database, and Volume Location Database (VLDB), respectively. To review
1864       the functions of these server processes and their databases, see <link linkend="HDRWQ17">AFS Server Processes and the Cache
1865       Manager</link>.</para>
1866
1867       <para>If a cell has more than one server machine, it is best to run more than one database server machine, but more than three
1868       are rarely necessary. Replicating the databases in this way yields the same benefits as replicating volumes: increased
1869       availability and reliability of information. If one database server machine or process goes down, the information in the
1870       database is still available from others. The load of requests for database information is spread across multiple machines,
1871       preventing any one from becoming overloaded.</para>
1872
1873       <para>Unlike replicated volumes, however, replicated databases do change frequently. Consistent system performance demands
1874       that all copies of the database always be identical, so it is not possible to record changes in only some of them. To
1875       synchronize the copies of a database, the database server processes use AFS's distributed database technology, Ubik. See <link
1876       linkend="HDRWQ102">Replicating the OpenAFS Administrative Databases</link>.</para>
1877
1878       <para>It is critical that the AFS server processes on every server machine in a cell know which machines are the database
1879       server machines. The database server processes in particular must maintain constant contact with their peers in order to
1880       coordinate the copies of the database. The other server processes often need information from the databases. Every file server
1881       machine keeps a list of its cell's database server machines in its local <emphasis
1882       role="bold">/usr/afs/etc/CellServDB</emphasis> file. Cells that use the States edition of AFS can use the system control
1883       machine to distribute this file (see <link linkend="HDRWQ94">The System Control Machine</link>).</para>
1884
1885       <para>The following processes define a database server machine: <itemizedlist>
1886           <listitem>
1887             <para>The Authentication Server (<emphasis role="bold">kaserver</emphasis> process)</para>
1888           </listitem>
1889
1890           <listitem>
1891             <para>The Backup Server (<emphasis role="bold">buserver</emphasis> process)</para>
1892           </listitem>
1893
1894           <listitem>
1895             <para>The Protection Server (<emphasis role="bold">ptserver</emphasis> process)</para>
1896           </listitem>
1897
1898           <listitem>
1899             <para>The VL Server (<emphasis role="bold">vlserver</emphasis> process)</para>
1900           </listitem>
1901         </itemizedlist></para>
1902
1903       <para>Database server machines can also run the processes that define a simple file server machine, as listed in <link
1904       linkend="HDRWQ91">Simple File Server Machines</link>. One database server machine can act as the cell's system control
1905       machine, and any database server machine can serve as the binary distribution machine for its system type; see <link
1906       linkend="HDRWQ94">The System Control Machine</link> and <link linkend="HDRWQ93">Binary Distribution Machines</link>.</para>
1907
1908       <indexterm>
1909         <primary>binary distribution machine</primary>
1910
1911         <secondary>defined</secondary>
1912       </indexterm>
1913
1914       <indexterm>
1915         <primary>server machine</primary>
1916
1917         <secondary>binary distribution role</secondary>
1918       </indexterm>
1919
1920       <indexterm>
1921         <primary>Update Server</primary>
1922
1923         <secondary>server portion</secondary>
1924
1925         <tertiary>on binary distribution machine</tertiary>
1926       </indexterm>
1927
1928       <indexterm>
1929         <primary>Update Server</primary>
1930
1931         <secondary>client portion</secondary>
1932
1933         <tertiary>for binaries</tertiary>
1934       </indexterm>
1935     </sect2>
1936
1937     <sect2 id="HDRWQ93">
1938       <title>Binary Distribution Machines</title>
1939
1940       <para>A <emphasis>binary distribution machine</emphasis> stores and distributes the binary files for the AFS processes and
1941       command suites to all other server machines of its system type. Each file server machine keeps its own copy of AFS server
1942       process binaries on its local disk, by convention in the <emphasis role="bold">/usr/afs/bin</emphasis> directory. For
1943       consistent system performance, however, all server machines must run the same version (build level) of a process. For
1944       instructions for checking a binary's build level, see <link linkend="HDRWQ117">Displaying A Binary File's Build Level</link>.
1945       The easiest way to keep the binaries consistent is to have a binary distribution machine of each system type distribute them
1946       to its system-type peers.</para>
1947
1948       <para>The process that defines a binary distribution machine is the server portion of the Update Server (<emphasis
1949       role="bold">upserver</emphasis> process). The client portion of the Update Server (<emphasis
1950       role="bold">upclientbin</emphasis> process) runs on the other server machines of that system type and references the binary
1951       distribution machine.</para>
1952
1953       <para>Binary distribution machines usually also run the processes that define a simple file server machine, as listed in <link
1954       linkend="HDRWQ91">Simple File Server Machines</link>. One binary distribution machine can act as the cell's system control
1955       machine, and any binary distribution machine can serve as a database server machine; see <link linkend="HDRWQ94">The System
1956       Control Machine</link> and <link linkend="HDRWQ92">Database Server Machines</link>.</para>
1957
1958       <indexterm>
1959         <primary>system control machine</primary>
1960       </indexterm>
1961
1962       <indexterm>
1963         <primary>configuration files</primary>
1964
1965         <secondary>server machine, common</secondary>
1966       </indexterm>
1967
1968       <indexterm>
1969         <primary>server machine</primary>
1970
1971         <secondary>system control role</secondary>
1972       </indexterm>
1973     </sect2>
1974
1975     <sect2 id="HDRWQ94">
1976       <title>The System Control Machine</title>
1977
1978       <para>The <emphasis>system control machine</emphasis> stores and
1979       distributes system configuration files shared by all of the server machines in the cell. Each file server machine keeps its
1980       own copy of the configuration files on its local disk, by convention in the <emphasis role="bold">/usr/afs/etc</emphasis>
1981       directory. For consistent system performance, however, all server machines must use the same files. The easiest way to keep
1982       the files consistent is to have the system control machine distribute them. You make changes only to the copy stored on the
1983       system control machine, as directed by the instructions in this document.</para>
1984
1985       <para>For a list of the configuration files stored in the <emphasis role="bold">/usr/afs/etc</emphasis> directory, see <link
1986       linkend="HDRWQ85">Common Configuration Files in the /usr/afs/etc Directory</link>.</para>
1987
1988       <para>The <emphasis>OpenAFS Quick Beginnings</emphasis> configures a cell's first server machine as the system control
1989       machine. If you wish, you can reassign the role to a different machine that you install later, but you must then change the
1990       client portion of the Update Server (<emphasis role="bold">upclientetc</emphasis>) process running on all other server
1991       machines to refer to the new system control machine.</para>
1992
1993       <para>The following processes define the system control machine: <itemizedlist>
1994           <indexterm>
1995             <primary>Update Server</primary>
1996
1997             <secondary>server portion</secondary>
1998
1999             <tertiary>on system control machine</tertiary>
2000           </indexterm>
2001
2002           <indexterm>
2003             <primary>Update Server</primary>
2004
2005             <secondary>client portion</secondary>
2006
2007             <tertiary>for configuration files</tertiary>
2008           </indexterm>
2009
2010           <listitem>
2011             <para>The server portion of the Update Server (<emphasis role="bold">upserver</emphasis>) process
2012             The client portion of the Update Server (<emphasis role="bold">upclientetc</emphasis>
2013             process) runs on the other server machines and references the system control machine.</para>
2014           </listitem>
2015         </itemizedlist></para>
2016
2017       <para>The system control machine can also run the processes that define a simple file server machine, as listed in <link
2018       linkend="HDRWQ91">Simple File Server Machines</link>. It can also server as a database server machine, and by convention acts
2019       as the binary distribution machine for its system type. A single <emphasis role="bold">upserver</emphasis> process can
2020       distribute both configuration files and binaries. See <link linkend="HDRWQ92">Database Server Machines</link> and <link
2021       linkend="HDRWQ93">Binary Distribution Machines</link>.</para>
2022
2023       <indexterm>
2024         <primary>determining</primary>
2025
2026         <secondary>roles taken by server machine</secondary>
2027       </indexterm>
2028
2029       <indexterm>
2030         <primary>identifying</primary>
2031
2032         <secondary>roles taken by server machine</secondary>
2033       </indexterm>
2034
2035       <indexterm>
2036         <primary>server machine</primary>
2037
2038         <secondary>determining roles</secondary>
2039       </indexterm>
2040
2041       <indexterm>
2042         <primary>roles for server machine</primary>
2043
2044         <secondary>determining</secondary>
2045       </indexterm>
2046
2047       <indexterm>
2048         <primary>database server machine</primary>
2049
2050         <secondary>identifying with bos status</secondary>
2051       </indexterm>
2052
2053       <indexterm>
2054         <primary>determining</primary>
2055
2056         <secondary>identity of database server machines</secondary>
2057       </indexterm>
2058
2059       <indexterm>
2060         <primary>identifying</primary>
2061
2062         <secondary>database server machine</secondary>
2063       </indexterm>
2064     </sect2>
2065
2066     <sect2 id="HDRWQ95">
2067       <title>To locate database server machines</title>
2068
2069       <orderedlist>
2070         <listitem>
2071           <para>Issue the <emphasis role="bold">bos listhosts</emphasis> command. <programlisting>
2072    % <emphasis role="bold">bos listhosts</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
2073 </programlisting></para>
2074
2075           <para>The machines listed in the output are the cell's database server machines. For complete instructions and example
2076           output, see <link linkend="HDRWQ120">To display a cell's database server machines</link>.</para>
2077         </listitem>
2078
2079         <listitem>
2080           <para><emphasis role="bold">(Optional)</emphasis> Issue the <emphasis role="bold">bos status</emphasis> command to verify
2081           that a machine listed in the output of the <emphasis role="bold">bos listhosts</emphasis> command is actually running the
2082           processes that define it as a database server machine. For complete instructions, see <link linkend="HDRWQ158">Displaying
2083           Process Status and Information from the BosConfig File</link>. <programlisting>
2084    % <emphasis role="bold">bos status</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">buserver kaserver ptserver vlserver</emphasis>
2085 </programlisting></para>
2086
2087           <para>If the specified machine is a database server machine, the output from the <emphasis role="bold">bos
2088           status</emphasis> command includes the following lines:</para>
2089
2090           <programlisting>
2091    Instance buserver, currently running normally.
2092    Instance kaserver, currently running normally.
2093    Instance ptserver, currently running normally.
2094    Instance vlserver, currently running normally.
2095 </programlisting>
2096         </listitem>
2097       </orderedlist>
2098
2099       <indexterm>
2100         <primary>system control machine</primary>
2101
2102         <secondary>identifying with bos status</secondary>
2103       </indexterm>
2104
2105       <indexterm>
2106         <primary>determining</primary>
2107
2108         <secondary>identity of system control machine</secondary>
2109       </indexterm>
2110
2111       <indexterm>
2112         <primary>identifying</primary>
2113
2114         <secondary>system control machine</secondary>
2115       </indexterm>
2116     </sect2>
2117
2118     <sect2 id="HDRWQ96">
2119       <title>To locate the system control machine</title>
2120
2121       <orderedlist>
2122         <listitem>
2123           <para>Issue the <emphasis role="bold">bos status</emphasis> command for any server machine. Complete instructions appear
2124           in <link linkend="HDRWQ158">Displaying Process Status and Information from the BosConfig File</link>. <programlisting>
2125    % <emphasis role="bold">bos status</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">upserver upclientbin upclientetc</emphasis> <emphasis
2126                 role="bold">-long</emphasis>
2127 </programlisting></para>
2128
2129           <para>The output you see depends on the machine you have contacted: a simple file server machine, the system control
2130           machine, or a binary distribution machine. See <link linkend="HDRWQ98">Interpreting the Output from the bos status
2131           Command</link>.</para>
2132         </listitem>
2133       </orderedlist>
2134
2135       <indexterm>
2136         <primary>binary distribution machine</primary>
2137
2138         <secondary>identifying with bos status</secondary>
2139       </indexterm>
2140
2141       <indexterm>
2142         <primary>determining</primary>
2143
2144         <secondary>identity of binary distribution machine</secondary>
2145       </indexterm>
2146
2147       <indexterm>
2148         <primary>identifying</primary>
2149
2150         <secondary>binary distribution machine</secondary>
2151       </indexterm>
2152     </sect2>
2153
2154     <sect2 id="HDRWQ97">
2155       <title>To locate the binary distribution machine for a system type</title>
2156
2157       <orderedlist>
2158         <listitem>
2159           <para>Issue the <emphasis role="bold">bos status</emphasis> command for a file server machine of the system type you are
2160           checking (to determine a machine's system type, issue the <emphasis role="bold">fs sysname</emphasis> or <emphasis
2161           role="bold">sys</emphasis> command as described in <link linkend="HDRWQ417">Displaying and Setting the System Type
2162           Name</link>. Complete instructions for the <emphasis role="bold">bos status</emphasis> command appear in <link
2163           linkend="HDRWQ158">Displaying Process Status and Information from the BosConfig File</link>. <programlisting>
2164    % <emphasis role="bold">bos status</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">upserver upclientbin upclientetc -long</emphasis>
2165 </programlisting></para>
2166
2167           <para>The output you see depends on the machine you have contacted: a simple file server machine, the system control
2168           machine, or a binary distribution machine. See <link linkend="HDRWQ98">Interpreting the Output from the bos status
2169           Command</link>.</para>
2170         </listitem>
2171       </orderedlist>
2172
2173       <indexterm>
2174         <primary>simple file server machine</primary>
2175
2176         <secondary>identifying with bos status</secondary>
2177       </indexterm>
2178
2179       <indexterm>
2180         <primary>determining</primary>
2181
2182         <secondary>identity of:</secondary>
2183
2184         <tertiary>simple file server machines</tertiary>
2185       </indexterm>
2186
2187       <indexterm>
2188         <primary>identifying</primary>
2189
2190         <secondary>simple file server machine</secondary>
2191       </indexterm>
2192     </sect2>
2193
2194     <sect2 id="HDRWQ98">
2195       <title>Interpreting the Output from the bos status Command</title>
2196
2197       <para>Interpreting the output of the <emphasis role="bold">bos status</emphasis> command is most straightforward for a simple
2198       file server machine. There is no <emphasis role="bold">upserver</emphasis> process, so the output includes the following
2199       message:</para>
2200
2201       <programlisting>
2202    bos: failed to get instance info for 'upserver' (no such entity)
2203 </programlisting>
2204
2205       <para>A simple file server machine runs the <emphasis role="bold">upclientbin</emphasis> process, so the output includes a
2206       message like the following. It indicates that <emphasis role="bold">fs7.example.com</emphasis> is the binary distribution machine
2207       for this system type.</para>
2208
2209       <programlisting>
2210    Instance upclientbin, (type is simple) currently running normally.
2211    Process last started at Wed Mar 10  23:37:09 1999 (1 proc start)
2212    Command 1 is '/usr/afs/bin/upclient fs7.example.com -t 60 /usr/afs/bin'
2213 </programlisting>
2214
2215       <para>A simple file server machine also runs the <emphasis
2216       role="bold">upclientetc</emphasis> process, so the output includes a message like the following. It indicates that <emphasis
2217       role="bold">fs1.example.com</emphasis> is the system control machine.</para>
2218
2219       <programlisting>
2220    Instance upclientetc, (type is simple) currently running normally.
2221    Process last started at Mon Mar 22  05:23:49 1999 (1 proc start)
2222    Command 1 is '/usr/afs/bin/upclient fs1.example.com -t 60 /usr/afs/etc'
2223 </programlisting>
2224
2225       <sect3 id="HDRWQ99">
2226         <title>The Output on the System Control Machine</title>
2227
2228         <para>If you have issued the <emphasis role="bold">bos status</emphasis> command
2229         for the system control machine, the output includes an entry for the <emphasis role="bold">upserver</emphasis> process
2230         similar to the following:</para>
2231
2232         <programlisting>
2233    Instance upserver, (type is simple) currently running normally.
2234    Process last started at Mon Mar 22 05:23:54 1999 (1 proc start)
2235    Command 1 is '/usr/afs/bin/upserver'
2236 </programlisting>
2237
2238         <para>If you are using the default configuration recommended in the <emphasis>OpenAFS Quick Beginnings</emphasis>, the
2239         system control machine is also the binary distribution machine for its system type, and a single <emphasis
2240         role="bold">upserver</emphasis> process distributes both kinds of updates. In that case, the output includes the following
2241         messages:</para>
2242
2243         <programlisting>
2244    bos: failed to get instance info for 'upclientbin' (no such entity)
2245    bos: failed to get instance info for 'upclientetc' (no such entity)
2246 </programlisting>
2247
2248         <para>If the system control machine is not a binary distribution machine, the output includes an error message for the
2249         <emphasis role="bold">upclientetc</emphasis> process, but a complete a listing for the <emphasis
2250         role="bold">upclientbin</emphasis> process (in this case it refers to the machine <emphasis
2251         role="bold">fs5.example.com</emphasis> as the binary distribution machine):</para>
2252
2253         <programlisting>
2254    Instance upclientbin, (type is simple) currently running normally.
2255    Process last started at Mon Mar 22  05:23:49 1999 (1 proc start)
2256    Command 1 is '/usr/afs/bin/upclient fs5.example.com -t 60 /usr/afs/bin'
2257    bos: failed to get instance info for 'upclientetc' (no such entity)
2258 </programlisting>
2259       </sect3>
2260
2261       <sect3 id="HDRWQ100">
2262         <title>The Output on a Binary Distribution Machine</title>
2263
2264         <para>If you have issued the <emphasis role="bold">bos status</emphasis> command for a binary distribution machine, the
2265         output includes an entry for the <emphasis role="bold">upserver</emphasis> process similar to the following and error
2266         message for the <emphasis role="bold">upclientbin</emphasis> process:</para>
2267
2268         <programlisting>
2269    Instance upserver, (type is simple) currently running normally.
2270    Process last started at Mon Apr 5 05:23:54 1999 (1 proc start)
2271    Command 1 is '/usr/afs/bin/upserver'
2272    bos: failed to get instance info for 'upclientbin' (no such entity)
2273 </programlisting>
2274
2275         <para>Unless this machine also happens to be the system control machine, a message like the following references the system
2276         control machine (in this case, <emphasis role="bold">fs3.example.com</emphasis>):</para>
2277
2278         <programlisting>
2279    Instance upclientetc, (type is simple) currently running normally.
2280    Process last started at Mon Apr 5 05:23:49 1999 (1 proc start)
2281    Command 1 is '/usr/afs/bin/upclient fs3.example.com -t 60 /usr/afs/etc'
2282 </programlisting>
2283       </sect3>
2284     </sect2>
2285   </sect1>
2286
2287   <sect1 id="HDRWQ101">
2288     <title>Administering Database Server Machines</title>
2289
2290     <para>This section explains how to administer database server machines. For installation instructions, see the <emphasis>OpenAFS
2291     Quick Beginnings</emphasis>.</para>
2292
2293     <indexterm>
2294       <primary>distribution</primary>
2295
2296       <secondary>of databases</secondary>
2297     </indexterm>
2298
2299     <indexterm>
2300       <primary>database, distributed</primary>
2301
2302       <secondary></secondary>
2303
2304       <see>administrative database</see>
2305     </indexterm>
2306
2307     <indexterm>
2308       <primary>distributed database</primary>
2309
2310       <secondary></secondary>
2311
2312       <see>administrative database</see>
2313     </indexterm>
2314
2315     <indexterm>
2316       <primary>administrative database</primary>
2317
2318       <secondary>about replicating</secondary>
2319     </indexterm>
2320
2321     <indexterm>
2322       <primary>database server machine</primary>
2323
2324       <secondary>maintaining</secondary>
2325     </indexterm>
2326
2327     <indexterm>
2328       <primary>Ubik</primary>
2329
2330       <secondary>operation described</secondary>
2331     </indexterm>
2332
2333     <indexterm>
2334       <primary>synchronization site (Ubik)</primary>
2335
2336       <secondary>defined</secondary>
2337     </indexterm>
2338
2339     <indexterm>
2340       <primary>secondary site (Ubik)</primary>
2341     </indexterm>
2342
2343     <indexterm>
2344       <primary>coordinator (Ubik)</primary>
2345
2346       <secondary>defined</secondary>
2347     </indexterm>
2348
2349     <indexterm>
2350       <primary>Ubik</primary>
2351
2352       <secondary>automatic updates</secondary>
2353     </indexterm>
2354
2355     <indexterm>
2356       <primary>automatic</primary>
2357
2358       <secondary>update to admin. databases by Ubik</secondary>
2359     </indexterm>
2360
2361     <sect2 id="HDRWQ102">
2362       <title>Replicating the OpenAFS Administrative Databases</title>
2363
2364       <para>There are several benefits to replicating the AFS administrative databases (the Authentication, Backup, Protection, and
2365       Volume Location Databases), as discussed in <link linkend="HDRWQ52">Replicating the OpenAFS Administrative Databases</link>. For
2366       correct cell functioning, the copies of each database must be identical at all times. To keep the databases synchronized, AFS
2367       uses library of utilities called <emphasis>Ubik</emphasis>. Each database server process runs an associated lightweight Ubik
2368       process, and client-side programs call Ubik's client-side subroutines when they submit requests to read and change the
2369       databases.</para>
2370
2371       <para>Ubik is designed to work with minimal administrator intervention, but there are several configuration requirements, as
2372       detailed in <link linkend="HDRWQ103">Configuring the Cell for Proper Ubik Operation</link>. The following brief overview of
2373       Ubik's operation is helpful for understanding the requirements. For more details, see <link linkend="HDRWQ104">How Ubik
2374       Operates Automatically</link>.</para>
2375
2376       <para>Ubik is designed to distribute changes made in an AFS administrative database to all copies as quickly as possible. Only
2377       one copy of the database, the <emphasis>synchronization site</emphasis>, accepts change requests from clients; the lightweight
2378       Ubik process running there is the <emphasis>Ubik coordinator</emphasis>. To maintain maximum availability, there is a separate
2379       Ubik coordinator for each database, and the synchronization site for each of the four databases can be on a different machine.
2380       The synchronization site for a database can also move from machine to machine in response to process, machine, or network
2381       outages.</para>
2382
2383       <para>The other copies of a database, and the Ubik processes that maintain them, are termed <emphasis>secondary</emphasis>.
2384       The secondary sites do not accept database changes directly from client-side programs, but only from the synchronization
2385       site.</para>
2386
2387       <para>After the Ubik coordinator records a change in its copy of a database, it immediately sends the change to the secondary
2388       sites. During the brief distribution period, clients cannot access any of the copies of the database, even for reading. If the
2389       coordinator cannot reach a majority of the secondary sites, it halts the distribution and informs the client that the
2390       attempted change failed.</para>
2391
2392       <para>To avoid distribution failures, the Ubik processes maintain constant contact by exchanging time-stamped messages. As
2393       long as a majority of the secondary sites respond to the coordinator's messages, there is a <emphasis>quorum</emphasis> of
2394       sites that are synchronized with the coordinator. If a process, machine, or network outage breaks the quorum, the Ubik
2395       processes attempt to elect a new coordinator in order to establish a new quorum among the highest possible number of sites.
2396       See <link linkend="HDRWQ106">A Flexible Coordinator Boosts Availability</link>.</para>
2397
2398       <indexterm>
2399         <primary>Ubik</primary>
2400
2401         <secondary>requirements summarized</secondary>
2402       </indexterm>
2403
2404       <indexterm>
2405         <primary>database server process</primary>
2406
2407         <secondary>need to run all on every database server machine</secondary>
2408       </indexterm>
2409
2410       <indexterm>
2411         <primary>CellServDB file (server)</primary>
2412
2413         <secondary>importance to Ubik operation</secondary>
2414       </indexterm>
2415
2416       <sect3 id="HDRWQ103">
2417         <title>Configuring the Cell for Proper Ubik Operation</title>
2418
2419         <para>This section describes how to configure your cell to maintain proper Ubik operation. <itemizedlist>
2420             <listitem>
2421               <para>Run all four database server processes--Authentication Server, Backup Server, Protection Server, and VL
2422               Server--on all database server machines.</para>
2423
2424               <para>Both the client and server portions of Ubik expect that all the database server machines listed in the <emphasis
2425               role="bold">CellServDB</emphasis> file are running all of the database server processes. There is no mechanism for
2426               indicating that only some database server processes are running on a machine.</para>
2427             </listitem>
2428
2429             <listitem>
2430               <para>Maintain correct information in the <emphasis role="bold">/usr/afs/etc/CellServDB</emphasis> file at all
2431               times.</para>
2432
2433               <para>Ubik consults the <emphasis role="bold">/usr/afs/etc/CellServDB</emphasis> file to determine the sites with
2434               which to establish and maintain a quorum. Incorrect information can result in unsynchronized databases or election of
2435               a coordinator in each of several subgroups of machines, because the Ubik processes on various machines do not agree on
2436               which machines need to participate in the quorum.</para>
2437
2438               <para>If you use the Update Server, it is simplest to maintain the <emphasis
2439               role="bold">/usr/afs/etc/CellServDB</emphasis> file on the system control machine, which distributes its copy to all
2440               other server machines. The <emphasis>OpenAFS Quick Beginnings</emphasis> explains how to configure the Update Server.
2441               </para>
2442
2443               <para>The only reason to alter the file is when configuring or decommissioning a database server machine. Use the
2444               appropriate <emphasis role="bold">bos</emphasis> commands rather than editing the file by hand. For instructions, see
2445               <link linkend="HDRWQ118">Maintaining the Server CellServDB File</link>. The instructions in <link
2446               linkend="HDRWQ142">Monitoring and Controlling Server Processes</link> for stopping and starting processes remind you
2447               to alter the <emphasis role="bold">CellServDB</emphasis> file when appropriate, as do the instructions in the
2448               <emphasis>OpenAFS Quick Beginnings</emphasis> for installing or decommissioning a database server machine.</para>
2449
2450               <para>(Client processes and the server processes that do not maintain databases also rely on correct information in
2451               the <emphasis role="bold">CellServDB</emphasis> file for proper operation, but their use of the information does not
2452               affect Ubik's operation. See <link linkend="HDRWQ118">Maintaining the Server CellServDB File</link> and <link
2453               linkend="HDRWQ406">Maintaining Knowledge of Database Server Machines</link>.)</para>
2454
2455               <indexterm>
2456                 <primary>clocks</primary>
2457
2458                 <secondary>need to synchronize for Ubik</secondary>
2459               </indexterm>
2460             </listitem>
2461
2462             <listitem>
2463               <para>Keep the clocks synchronized on all machines in the cell, especially the database server machines.</para>
2464
2465               <para>Keeping clocks synchronized is important because the Ubik processes at a database's sites timestamp the messages
2466               which they exchange to maintain constant contact. Timestamping the messages is necessary because in a networked
2467               environment it is not safe to assume that a message reaches its destination instantly. Ubik compares the timestamp on
2468               an incoming message with the current time. If the difference is too great, it is possible that an outage is preventing
2469               reliable communication between the Ubik sites, which can possibly result in unsynchronized databases. Ubik considers
2470               the message invalid, which can prompt it to attempt election of a different coordinator.</para>
2471
2472               <para>Electing a new coordinator is appropriate if a timestamped message is expired due to actual interruption of
2473               communication, but not if a message appears expired only because the sender and recipient do not share the same time.
2474               For detailed examples of how unsynchronized clocks can destabilize Ubik operation, see <link linkend="HDRWQ105">How
2475               Ubik Uses Timestamped Messages</link>.</para>
2476             </listitem>
2477           </itemizedlist></para>
2478
2479         <indexterm>
2480           <primary>Ubik</primary>
2481
2482           <secondary>features summarized</secondary>
2483         </indexterm>
2484
2485         <indexterm>
2486           <primary>process</primary>
2487
2488           <secondary>lightweight Ubik</secondary>
2489         </indexterm>
2490
2491         <indexterm>
2492           <primary>Ubik</primary>
2493
2494           <secondary>server and client portions</secondary>
2495         </indexterm>
2496       </sect3>
2497
2498       <sect3 id="HDRWQ104">
2499         <title>How Ubik Operates Automatically</title>
2500
2501         <para>The following Ubik features help keep its maintenance requirements to a minimum: <itemizedlist>
2502             <listitem>
2503               <para>Ubik's server and client portions operate automatically.</para>
2504
2505               <para>Each database server process runs a lightweight process to call on the server portion of the Ubik library. It is
2506               common to refer to this lightweight process itself as Ubik. Because it is lightweight, the Ubik process does not
2507               appear in process listings such as those generated by the UNIX <emphasis role="bold">ps</emphasis> command.
2508               Client-side programs that need to read and change the databases directly call the subroutines in the Ubik library's
2509               client portion, rather than running a separate lightweight process. Examples of such programs are the <emphasis
2510               role="bold">klog</emphasis> command and the commands in the <emphasis role="bold">pts</emphasis> suite.</para>
2511             </listitem>
2512
2513             <listitem>
2514               <para>Ubik tracks database version numbers.</para>
2515
2516               <para>As the coordinator records a change to a database, it increments the database's version number. The version
2517               number makes it easy for the coordinator to determine if a site has the most recent version or not. The version number
2518               speeds the return to normal functioning after election of a new coordinator or when communication is restored after an
2519               outage, because it makes it easy to determine which site has the most current database and which need to be
2520               updated.</para>
2521             </listitem>
2522
2523             <listitem>
2524               <para>Ubik's use of timestamped messages guarantees that database copies are always synchronized during normal
2525               operation.</para>
2526
2527               <para>Replicating a database to increase data availability is pointless if all copies of the database are not the
2528               same. Inconsistent performance can result if clients receive different information depending on which copy of the
2529               database they access. As previously noted, Ubik sites constantly track the status of their peers by exchanging
2530               timestamped messages. For a detailed description, see <link linkend="HDRWQ105">How Ubik Uses Timestamped
2531               Messages</link>.</para>
2532             </listitem>
2533
2534             <listitem>
2535               <para>The ability to move the coordinator maximizes database availability.</para>
2536
2537               <para>Suppose, for example, that in a cell with three database server machines a network partition separates the two
2538               secondary sites from the coordinator. The coordinator retires because it is no longer in contact with a majority of
2539               the sites listed in the <emphasis role="bold">CellServDB</emphasis> file. The two sites on the other side of the
2540               partition can elect a new coordinator among themselves, and it can then accept database changes from clients. If the
2541               coordinator cannot move in this way, the database has to be read-only until the network partition is repaired. For a
2542               detailed description of Ubik's election procedure, see <link linkend="HDRWQ106">A Flexible Coordinator Boosts
2543               Availability</link>.</para>
2544             </listitem>
2545           </itemizedlist></para>
2546
2547         <indexterm>
2548           <primary>consistency guarantees</primary>
2549
2550           <secondary>administrative databases</secondary>
2551         </indexterm>
2552
2553         <indexterm>
2554           <primary>Ubik</primary>
2555
2556           <secondary>consistency guarantees</secondary>
2557         </indexterm>
2558
2559         <sect4 id="HDRWQ105">
2560           <title>How Ubik Uses Timestamped Messages</title>
2561
2562           <para>Ubik synchronizes the copies of a database by maintaining constant contact between the synchronization site and the
2563           secondary sites. The Ubik coordinator frequently sends a time-stamped <emphasis>guarantee</emphasis> message to each of
2564           the secondary sites. When the secondary site receives the message, it concludes that it is in contact with the
2565           coordinator. It considers its copy of the database to be valid until time <emphasis>T</emphasis>, which is usually 60
2566           seconds from the time the coordinator sent the message. In response, the secondary site returns a
2567           <emphasis>vote</emphasis> message that acknowledges the coordinator as valid until a certain time X, which is usually 120
2568           seconds in the future.</para>
2569
2570           <para>The coordinator sends guarantee messages more frequently than every <emphasis>T</emphasis> seconds, so that the
2571           expiration periods overlap. There is no danger of expiration unless a network partition or other outage actually
2572           interrupts communication. If the guarantee expires, the secondary site's copy of the database it not necessarily current.
2573           Nonetheless, the database server continues to service client requests. It is considered better for overall cell
2574           functioning that a secondary site remains accessible even if the information it is distributing is possibly out of date.
2575           Most of the AFS administrative databases do not change that frequently, in any case, and making a database inaccessible
2576           causes a timeout for clients that happen to access that copy.</para>
2577
2578           <para>As previously mentioned, Ubik's use of timestamped messages makes it vital to synchronize the clocks on database
2579           server machines. There are two ways that skewed clocks can interrupt normal Ubik functioning, depending on which clock is
2580           ahead of the others.</para>
2581
2582           <para>Suppose, for example, that the Ubik coordinator's clock is ahead of the secondary sites: the coordinator's clock
2583           says 9:35:30, but the secondary clocks say 9:31:30. The secondary sites send votes messages that acknowledge the
2584           coordinator as valid until 9:33:30. This is two minutes in the future according to the secondary clocks, but is already in
2585           the past from the coordinator's perspective. The coordinator concludes that it no longer has enough support to remain
2586           coordinator and forces election of a new coordinator. Election takes about three minutes, during which time no copy of the
2587           database accepts changes.</para>
2588
2589           <para>The opposite possibility is that a secondary site's clock (14:50:00) is ahead of the coordinator's (14:46:30). When
2590           the coordinator sends a guarantee message good until 14:47:30), it has already expired according to the secondary clock.
2591           Believing that it is out of contact with the coordinator, the secondary site stops sending votes for the coordinator and
2592           tries get itself elected as coordinator. This is appropriate if the coordinator has actually failed, but is inappropriate
2593           when there is no actual outage.</para>
2594
2595           <para>The attempt of a single secondary site to get elected as the new coordinator usually does not affect the performance
2596           of the other sites. As long as their clocks agree with the coordinator's, they ignore the other secondary site's request
2597           for votes and continue voting for the current coordinator. However, if enough of the secondary sites's clocks get ahead of
2598           the coordinator's, they can force election of a new coordinator even though the current one is actually working
2599           fine.</para>
2600
2601           <indexterm>
2602             <primary>Ubik</primary>
2603
2604             <secondary>election of coordinator</secondary>
2605           </indexterm>
2606
2607           <indexterm>
2608             <primary>coordinator (Ubik)</primary>
2609
2610             <secondary>election procedure described</secondary>
2611           </indexterm>
2612
2613           <indexterm>
2614             <primary>election of Ubik coordinator</primary>
2615           </indexterm>
2616
2617           <indexterm>
2618             <primary>flexible synchronization site (Ubik)</primary>
2619           </indexterm>
2620
2621           <indexterm>
2622             <primary>synchronization site (Ubik)</primary>
2623
2624             <secondary>flexibility</secondary>
2625           </indexterm>
2626
2627           <indexterm>
2628             <primary>Ubik</primary>
2629
2630             <secondary>majority defined</secondary>
2631           </indexterm>
2632
2633           <indexterm>
2634             <primary>majority</primary>
2635
2636             <secondary>defined for Ubik</secondary>
2637           </indexterm>
2638
2639           <indexterm>
2640             <primary>outages</primary>
2641
2642             <secondary>due to Ubik election</secondary>
2643           </indexterm>
2644
2645           <indexterm>
2646             <primary>system outages</primary>
2647
2648             <secondary>due to Ubik election</secondary>
2649           </indexterm>
2650         </sect4>
2651
2652         <sect4 id="HDRWQ106">
2653           <title>A Flexible Coordinator Boosts Availability</title>
2654
2655           <para>Ubik uses timestamped messages to determine when coordinator election is necessary, just as it does to keep the
2656           database copies synchronized. As long as the coordinator receives vote messages from a majority of the sites (it
2657           implicitly votes for itself), it is appropriate for it to continue as coordinator because it is successfully distributing
2658           database changes. A majority is defined as more than 50% of all database sites when there are an odd number of sites; with
2659           an even number of sites, the site with the lowest Internet address has an extra vote for breaking ties as necessary.If the
2660           coordinator is not receiving sufficient votes, it retires and the Ubik sites elect a new coordinator. This does not happen
2661           spontaneously, but only when the coordinator really fails or stops receiving a majority of the votes. The secondary sites
2662           have a built-in bias to continue voting for an existing coordinator, which prevents undue elections.</para>
2663
2664           <para>The election of the new coordinator is by majority vote. The Ubik subprocesses have a bias to vote for the site with
2665           the lowest Internet address, which helps it gather the necessary majority quicker than if all the sites were competing to
2666           receive votes themselves. During the election (which normally lasts less than three minutes), clients can read information
2667           from the database, but cannot make any changes.</para>
2668
2669           <para>Ubik's election procedure makes it possible for each database server process's coordinator to be on a different
2670           machine. For example, if the Ubik coordinators for all four processes start out on machine A and the Protection Server on
2671           machine A fails for some reason, then a different site (say machine B) must be elected as the new Protection Database Ubik
2672           coordinator. Machine B remains the coordinator for the Protection Database even after the Protection Server on machine A
2673           is working again. The failure of the Protection Server has no effect on the Authentication, Backup, or VL Servers, so
2674           their coordinators remain on machine A.</para>
2675         </sect4>
2676       </sect3>
2677     </sect2>
2678
2679     <sect2 id="HDRWQ107">
2680       <title>Backing Up and Restoring the Administrative Databases</title>
2681
2682       <para>The AFS administrative databases store information that is critical for AFS operation in your cell. If a database
2683       becomes corrupted due to a hardware failure or other problem on a database server machine, it likely to be difficult and
2684       time-consuming to recreate all of the information from scratch. To protect yourself against loss of data, back up the
2685       administrative databases to a permanent media, such as tape, on a regular basis. The recommended method is to use a standard
2686       local disk backup utility such as the UNIX <emphasis role="bold">tar</emphasis> command.</para>
2687
2688       <para>When deciding how often to back up a database, consider the amount of data that you are willing to recreate by hand if
2689       it becomes necessary to restore the database from a backup copy. In most cells, the databases differ quite a bit in how often
2690       and how much they change. Changes to the Authentication Database are probably the least frequent, and consist mostly of
2691       changed user passwords. Protection Database and VLDB changes are probably more frequent, as users add or delete groups and
2692       change group memberships, and as you and other administrators create or move volumes. The number and frequency of changes is
2693       probably greatest in the Backup Database, particularly if you perform backups every day.</para>
2694
2695       <para>The ease with which you can recapture lost changes also differs for the different databases: <itemizedlist>
2696           <listitem>
2697             <para>If regular users make a large proportion of the changes to the Authentication Database and Protection Database in
2698             your cell, then recovering them possibly requires a large amount of detective work and interviewing of users, assuming
2699             that they can even remember what changes they made at what time.</para>
2700           </listitem>
2701
2702           <listitem>
2703             <para>Recovering lost changes to the VLDB is more straightforward, because you can use the <emphasis role="bold">vos
2704             syncserv</emphasis> and <emphasis role="bold">vos syncvldb</emphasis> commands to correct any discrepancies between the
2705             VLDB and the actual state of volumes on server machines. Running these commands can be time-consuming, however.</para>
2706           </listitem>
2707
2708           <listitem>
2709             <para>The configuration information in the Backup Database (Tape Coordinator port offsets, volume sets and entries, the
2710             dump hierarchy, and so on) probably does not change that often, in which case it is not that hard to recover a few
2711             recent changes. In contrast, there are likely to be a large number of new dump records resulting from dump operations.
2712             You can recover these records by using the <emphasis role="bold">-dbadd</emphasis> argument to the <emphasis
2713             role="bold">backup scantape</emphasis> command, reading in information from the backup tapes themselves. This can take a
2714             long time and require numerous tape changes, however, depending on how much data you back up in your cell and how you
2715             append dumps. Furthermore, the <emphasis role="bold">backup scantape</emphasis> command is subject to several
2716             restrictions. The most basic is that it halts if it finds that an existing dump record in the database has the same dump
2717             ID number as a dump on the tape it is scanning. If you want to continue with the scanning operation, you must locate and
2718             remove the existing record from the database. For further discussion, see the <emphasis role="bold">backup
2719             scantape</emphasis> command's reference page in the <emphasis>OpenAFS Administration Reference</emphasis>.</para>
2720           </listitem>
2721         </itemizedlist></para>
2722
2723       <para>These differences between the databases possibly suggest backing up the database at different frequencies, ranging from
2724       every few days or weekly for the Backup Database to every few weeks for the Authentication Database. On the other hand, it is
2725       probably simpler from a logistical standpoint to back them all up at the same time (and frequently), particularly if tape
2726       consumption is not a major concern. Also, it is not generally necessary to keep backup copies of the databases for a long
2727       time, so you can recycle the tapes fairly frequently.</para>
2728
2729       <indexterm>
2730         <primary>administrative database</primary>
2731
2732         <secondary>backing up</secondary>
2733       </indexterm>
2734
2735       <indexterm>
2736         <primary>backing up</primary>
2737
2738         <secondary>administrative databases</secondary>
2739       </indexterm>
2740     </sect2>
2741
2742     <sect2 id="HDRWQ108">
2743       <title>To back up the administrative databases</title>
2744
2745       <orderedlist>
2746         <listitem>
2747           <para>Log in as the local superuser <emphasis role="bold">root</emphasis> on a database server machine that is not the
2748           synchronization site. The machine with the highest IP address is normally the best choice, since it is least likely to
2749           become the synchronization site in an election.</para>
2750         </listitem>
2751
2752         <listitem id="LIDBBK_SHUTDOWN">
2753           <para>Issue the <emphasis role="bold">bos shutdown</emphasis> command to shut down the
2754           relevant server process on the local machine. For a complete description of the command, see <link linkend="HDRWQ168">To
2755           stop processes temporarily</link>.</para>
2756
2757           <para>For the <emphasis role="bold">-instance</emphasis> argument, specify one or more database server process names
2758           (<emphasis role="bold">buserver</emphasis> for the Backup Server, <emphasis role="bold">kaserver</emphasis> for the
2759           Authentication Server, <emphasis role="bold">ptserver</emphasis> for the Protection Server, or <emphasis
2760           role="bold">vlserver</emphasis> for the Volume Location Server. Include the <emphasis role="bold">-localauth</emphasis>
2761           flag because you are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have
2762           administrative tokens.</para>
2763
2764           <programlisting>
2765    # <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-instance</emphasis> &lt;<replaceable>instances</replaceable>&gt;+ <emphasis
2766               role="bold">-localauth</emphasis> [<emphasis role="bold">-wait</emphasis>]
2767 </programlisting>
2768         </listitem>
2769
2770         <listitem>
2771           <para>Use a local disk backup utility, such as the UNIX <emphasis role="bold">tar</emphasis> command, to transfer one or
2772           more database files to tape. If the local database server machine does not have a tape device attached, use a remote copy
2773           command to transfer the file to a machine with a tape device, then use the <emphasis role="bold">tar</emphasis> command
2774           there.</para>
2775
2776           <para>The following command sequence backs up the complete contents of the <emphasis role="bold">/usr/afs/db</emphasis>
2777           directory</para>
2778
2779           <programlisting>
2780    # <emphasis role="bold">cd /usr/afs/db</emphasis>
2781    # <emphasis role="bold">tar cvf</emphasis>  tape_device <emphasis role="bold">.</emphasis>
2782 </programlisting>
2783
2784           <para>To back up individual database files, substitute their names for the period in the preceding <emphasis
2785           role="bold">tar</emphasis> command: <itemizedlist>
2786               <listitem>
2787                 <para><emphasis role="bold">bdb.DB0</emphasis> for the Backup Database</para>
2788               </listitem>
2789
2790               <listitem>
2791                 <para><emphasis role="bold">kaserver.DB0</emphasis> for the Authentication Database</para>
2792               </listitem>
2793
2794               <listitem>
2795                 <para><emphasis role="bold">prdb.DB0</emphasis> for the Protection Database</para>
2796               </listitem>
2797
2798               <listitem>
2799                 <para><emphasis role="bold">vldb.DB0</emphasis> for the VLDB</para>
2800               </listitem>
2801             </itemizedlist></para>
2802         </listitem>
2803
2804         <listitem>
2805           <para>Issue the <emphasis role="bold">bos start</emphasis> command to restart the server processes on the local machine.
2806           For a complete description of the command, see <link linkend="HDRWQ166">To start processes by changing their status flags
2807           to Run</link>. Provide the same values for the <emphasis role="bold">-instance</emphasis> argument as in Step <link
2808           linkend="LIDBBK_SHUTDOWN">2</link>, and the <emphasis role="bold">-localauth</emphasis> flag for the same reason.
2809           <programlisting>
2810    # <emphasis role="bold">bos start</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-instance</emphasis> &lt;<replaceable>server process name</replaceable>&gt;+ <emphasis
2811                 role="bold">-localauth</emphasis>
2812 </programlisting></para>
2813         </listitem>
2814       </orderedlist>
2815
2816       <indexterm>
2817         <primary>administrative database</primary>
2818
2819         <secondary>restoring</secondary>
2820       </indexterm>
2821
2822       <indexterm>
2823         <primary>restoring</primary>
2824
2825         <secondary>administrative databases</secondary>
2826       </indexterm>
2827     </sect2>
2828
2829     <sect2 id="HDRWQ109">
2830       <title>To restore an administrative database</title>
2831
2832       <orderedlist>
2833         <listitem>
2834           <para>Log in as the local superuser <emphasis role="bold">root</emphasis> on each database server machine in the
2835           cell.</para>
2836         </listitem>
2837
2838         <listitem id="LIDBREST_SHUTDOWN">
2839           <para>Working on one of the machines, issue the <emphasis role="bold">bos
2840           shutdown</emphasis> command once for each database server machine, to shut down the relevant server process on all of
2841           them. For a complete description of the command, see <link linkend="HDRWQ168">To stop processes temporarily</link>.</para>
2842
2843           <para>For the <emphasis role="bold">-instance</emphasis> argument, specify one or more database server process names
2844           (<emphasis role="bold">buserver</emphasis> for the Backup Server, <emphasis role="bold">kaserver</emphasis> for the
2845           Authentication Server, <emphasis role="bold">ptserver</emphasis> for the Protection Server, or <emphasis
2846           role="bold">vlserver</emphasis> for the Volume Location Server. Include the <emphasis role="bold">-localauth</emphasis>
2847           flag because you are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have
2848           administrative tokens.</para>
2849
2850           <programlisting>
2851    # <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-instance</emphasis> &lt;<replaceable>instances</replaceable>&gt;+ <emphasis
2852               role="bold">-localauth</emphasis> [<emphasis role="bold">-wait</emphasis>]
2853 </programlisting>
2854         </listitem>
2855
2856         <listitem>
2857           <para>Remove the database from each database server machine, by issuing the following commands on each one.
2858           <programlisting>
2859    # <emphasis role="bold">cd /usr/afs/db</emphasis>
2860 </programlisting></para>
2861
2862           <para>For the Backup Database:</para>
2863
2864           <programlisting>
2865    # <emphasis role="bold">rm bdb.DB0</emphasis>
2866    # <emphasis role="bold">rm bdb.DBSYS1</emphasis>
2867 </programlisting>
2868
2869           <para>For the Authentication Database:</para>
2870
2871           <programlisting>
2872    # <emphasis role="bold">rm kaserver.DB0</emphasis>
2873    # <emphasis role="bold">rm kaserver.DBSYS1</emphasis>
2874 </programlisting>
2875
2876           <para>For the Protection Database:</para>
2877
2878           <programlisting>
2879    # <emphasis role="bold">rm prdb.DB0</emphasis>
2880    # <emphasis role="bold">rm prdb.DBSYS1</emphasis>
2881 </programlisting>
2882
2883           <para>For the VLDB:</para>
2884
2885           <programlisting>
2886    # <emphasis role="bold">rm vldb.DB0</emphasis>
2887    # <emphasis role="bold">rm vldb.DBSYS1</emphasis>
2888 </programlisting>
2889         </listitem>
2890
2891         <listitem>
2892           <para>Using the local disk backup utility that you used to back up the database, copy the most recently backed-up version
2893           of it to the appropriate file on the database server machine with the lowest IP address. The following is an appropriate
2894           <emphasis role="bold">tar</emphasis> command if the synchronization site has a tape device attached: <programlisting>
2895    # <emphasis role="bold">cd /usr/afs/db</emphasis>
2896    # <emphasis role="bold">tar xvf</emphasis> tape_device  database_file
2897 </programlisting></para>
2898
2899           <para>where <emphasis>database_file</emphasis> is one of the following: <itemizedlist>
2900               <listitem>
2901                 <para><emphasis role="bold">bdb.DB0</emphasis> for the Backup Database</para>
2902               </listitem>
2903
2904               <listitem>
2905                 <para><emphasis role="bold">kaserver.DB0</emphasis> for the Authentication Database</para>
2906               </listitem>
2907
2908               <listitem>
2909                 <para><emphasis role="bold">prdb.DB0</emphasis> for the Protection Database</para>
2910               </listitem>
2911
2912               <listitem>
2913                 <para><emphasis role="bold">vldb.DB0</emphasis> for the VLDB</para>
2914               </listitem>
2915             </itemizedlist></para>
2916         </listitem>
2917
2918         <listitem>
2919           <para>Working on one of the machines, issue the <emphasis role="bold">bos start</emphasis> command to restart the server
2920           process on each of the database server machines in turn. Start with the machine with the lowest IP address, which becomes
2921           the synchronization site for the Backup Database. Wait for it to establish itself as the synchronization site before
2922           repeating the command to restart the process on the other database server machines. For a complete description of the
2923           command, see <link linkend="HDRWQ166">To start processes by changing their status flags to Run</link>. Provide the same
2924           values for the <emphasis role="bold">-instance</emphasis> argument as in Step <link linkend="LIDBREST_SHUTDOWN">2</link>,
2925           and the <emphasis role="bold">-localauth</emphasis> flag for the same reason. <programlisting>
2926    # <emphasis role="bold">bos start</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-instance</emphasis>  &lt;<replaceable>server process name</replaceable>&gt;+  <emphasis
2927                 role="bold">-localauth</emphasis>
2928 </programlisting></para>
2929         </listitem>
2930
2931         <listitem>
2932           <para>If the database has changed since you last backed it up, issue the appropriate commands from the instructions in the
2933           indicated sections to recreate the information in the restored database. If issuing <emphasis role="bold">pts</emphasis>
2934           commands, you must first obtain administrative tokens. The <emphasis role="bold">backup</emphasis> and <emphasis
2935           role="bold">vos</emphasis> commands accept the <emphasis role="bold">-localauth</emphasis> flag if you are logged in as
2936           the local superuser <emphasis role="bold">root</emphasis>, so you do not need administrative tokens. The Authentication
2937           Server always performs a separate authentication anyway, so you only need to include the <emphasis
2938           role="bold">-admin</emphasis> argument if issuing <emphasis role="bold">kas</emphasis> commands. <itemizedlist>
2939               <listitem>
2940                 <para>To define or remove volume sets and volume entries in the Backup Database, see <link
2941                 linkend="HDRWQ265">Defining and Displaying Volume Sets and Volume Entries</link>.</para>
2942               </listitem>
2943
2944               <listitem>
2945                 <para>To edit the dump hierarchy in the Backup Database, see <link linkend="HDRWQ267">Defining and Displaying the
2946                 Dump Hierarchy</link>.</para>
2947               </listitem>
2948
2949               <listitem>
2950                 <para>To define or remove Tape Coordinator port offset entries in the Backup Database, see <link
2951                 linkend="HDRWQ261">Configuring Tape Coordinator Machines and Tape Devices</link>.</para>
2952               </listitem>
2953
2954               <listitem>
2955                 <para>To restore dump records in the Backup Database, see <link linkend="HDRWQ305">To scan the contents of a
2956                 tape</link>.</para>
2957               </listitem>
2958
2959               <listitem>
2960                 <para>To recreate Authentication Database entries or password changes for users, see the appropriate section of
2961                 <link linkend="HDRWQ491">Administering User Accounts</link>.</para>
2962               </listitem>
2963
2964               <listitem>
2965                 <para>To recreate Protection Database entries or group membership information, see the appropriate section of <link
2966                 linkend="HDRWQ531">Administering the Protection Database</link>.</para>
2967               </listitem>
2968
2969               <listitem>
2970                 <para>To synchronize the VLDB with volume headers, see <link linkend="HDRWQ227">Synchronizing the VLDB and Volume
2971                 Headers</link>.</para>
2972               </listitem>
2973             </itemizedlist></para>
2974         </listitem>
2975       </orderedlist>
2976
2977       <indexterm>
2978         <primary>installing</primary>
2979
2980         <secondary>server process binaries, about</secondary>
2981       </indexterm>
2982
2983       <indexterm>
2984         <primary>server process binaries</primary>
2985
2986         <secondary>installing</secondary>
2987       </indexterm>
2988
2989       <indexterm>
2990         <primary>BOS Server</primary>
2991
2992         <secondary>maintainer of server process binaries</secondary>
2993       </indexterm>
2994
2995       <indexterm>
2996         <primary>server process</primary>
2997
2998         <secondary>binaries</secondary>
2999
3000         <see>server process binaries</see>
3001       </indexterm>
3002
3003       <indexterm>
3004         <primary>directories (server)</primary>
3005
3006         <secondary>/usr/afs/bin</secondary>
3007       </indexterm>
3008
3009       <indexterm>
3010         <primary>server machine</primary>
3011
3012         <secondary>need for consistent version of software</secondary>
3013       </indexterm>
3014     </sect2>
3015   </sect1>
3016
3017   <sect1 id="HDRWQ110">
3018     <title>Installing Server Process Software</title>
3019
3020     <para>This section explains how to install new server process binaries on file server machines, how to revert to a previous
3021     version if the current version is not working properly, and how to install new disks to house AFS volumes on a file server
3022     machine.</para>
3023
3024     <para>The most frequent reason to replace a server process's binaries is to upgrade AFS to a new version. In general,
3025     installation instructions accompany the updated software, but this chapter provides an additional reference.</para>
3026
3027     <para>Each AFS server machine must store the server process binaries in a local disk directory, called <emphasis
3028     role="bold">/usr/afs/bin</emphasis> by convention. For predictable system performance, it is best that all server machines run
3029     the same build level, or at least the same version, of the server software. For instructions on checking AFS build level, see
3030     <link linkend="HDRWQ117">Displaying A Binary File's Build Level</link>.</para>
3031
3032     <para>The Update Server makes it easy to distribute a consistent version of software to all server machines. You designate one
3033     server machine of each system type as the <emphasis>binary distribution machine</emphasis> by running the server portion of the
3034     Update Server (<emphasis role="bold">upserver</emphasis> process) on it. All other server machines of that system type run the
3035     client portion of the Update Server (<emphasis role="bold">upclientbin</emphasis> process) to retrieve updated software from the
3036     binary distribution machine. The <emphasis>OpenAFS Quick Beginnings</emphasis> explains how to install the appropriate
3037     processes. For more on binary distribution machines, see <link linkend="HDRWQ93">Binary Distribution Machines</link>.</para>
3038
3039     <para>When you use the Update Server, you install new binaries on binary distribution machines only. If you install binaries
3040     directly on a machine that is running the <emphasis role="bold">upclientbin</emphasis> process, they are overwritten the next
3041     time the process compares the contents of the local <emphasis role="bold">/usr/afs/bin</emphasis> directory to the contents on
3042     the system control machine, by default within five minutes.</para>
3043
3044     <para>The following instructions explain how to use the appropriate commands from the <emphasis role="bold">bos</emphasis> suite
3045     to install and uninstall server binaries.</para>
3046
3047     <indexterm>
3048       <primary>installing</primary>
3049
3050       <secondary>server binaries</secondary>
3051     </indexterm>
3052
3053     <indexterm>
3054       <primary>server process binaries</primary>
3055
3056       <secondary>installing</secondary>
3057     </indexterm>
3058
3059     <indexterm>
3060       <primary>command suite</primary>
3061
3062       <secondary>binaries</secondary>
3063
3064       <tertiary>installing</tertiary>
3065     </indexterm>
3066
3067     <indexterm>
3068       <primary>file server machine</primary>
3069
3070       <secondary>installing command and process binaries</secondary>
3071     </indexterm>
3072
3073     <indexterm>
3074       <primary>server process</primary>
3075
3076       <secondary>restarting for changed binaries</secondary>
3077     </indexterm>
3078
3079     <sect2 id="HDRWQ111">
3080       <title>Installing New Binaries</title>
3081
3082       <para>An AFS server process does not automatically switch to a new process binary file as soon as it is installed in the
3083       <emphasis role="bold">/usr/afs/bin</emphasis> directory. The process continues to use the previous version of the binary file
3084       until it (the process) next restarts. By default, the BOS Server restarts processes for which there are new binary files every
3085       day at 5:00 a.m., as specified in the <emphasis role="bold">/usr/afs/local/BosConfig</emphasis> file. To display or change
3086       this <emphasis>binary restart time</emphasis>, use the <emphasis role="bold">bos getrestart</emphasis> and <emphasis
3087       role="bold">bos setrestart</emphasis> commands, as described in <link linkend="HDRWQ171">Setting the BOS Server's Restart
3088       Times</link>.</para>
3089
3090       <para>You can force the server machine to start using new server process binaries immediately by issuing the <emphasis
3091       role="bold">bos restart</emphasis> command as described in the following instructions.</para>
3092
3093       <para>You do not need to restart processes when you install new command suite binaries. The new binary is invoked
3094       automatically the next time a command from the suite is issued.</para>
3095
3096       <indexterm>
3097         <primary>file extension</primary>
3098
3099         <secondary>.BAK</secondary>
3100       </indexterm>
3101
3102       <indexterm>
3103         <primary>file extension</primary>
3104
3105         <secondary>.OLD</secondary>
3106       </indexterm>
3107
3108       <indexterm>
3109         <primary>BAK version of binary file</primary>
3110
3111         <secondary>created by bos install command</secondary>
3112       </indexterm>
3113
3114       <indexterm>
3115         <primary>OLD version of binary file</primary>
3116
3117         <secondary>created by bos install command</secondary>
3118       </indexterm>
3119
3120       <indexterm>
3121         <primary>saving</primary>
3122
3123         <secondary>previous version of server binaries</secondary>
3124       </indexterm>
3125
3126       <para>When you use the <emphasis role="bold">bos install</emphasis> command, the BOS Server automatically saves the current
3127       version of a binary file by adding a <emphasis role="bold">.BAK</emphasis> extension to its name. It renames the current
3128       <emphasis role="bold">.BAK</emphasis> version, if any, to the <emphasis role="bold">.OLD</emphasis> version, if there is no
3129       <emphasis role="bold">.OLD</emphasis> version already. If there is a current <emphasis role="bold">.OLD</emphasis> version,
3130       the current <emphasis role="bold">.BAK</emphasis> version must be at least seven days old to replace it.</para>
3131
3132       <para>It is best to store AFS binaries in the <emphasis role="bold">/usr/afs/bin</emphasis> directory, because that is the
3133       only directory the BOS Server automatically checks for new binaries. You can, however, use the <emphasis role="bold">bos
3134       install</emphasis> command's <emphasis role="bold">-dir</emphasis> argument to install non-AFS binaries into other directories
3135       on a server machine's local disk. See the command's reference page in the <emphasis>OpenAFS Administration
3136       Reference</emphasis> for further information.</para>
3137
3138       <indexterm>
3139         <primary>bos commands</primary>
3140
3141         <secondary>install</secondary>
3142       </indexterm>
3143
3144       <indexterm>
3145         <primary>commands</primary>
3146
3147         <secondary>bos install</secondary>
3148       </indexterm>
3149     </sect2>
3150
3151     <sect2 id="Header_130">
3152       <title>To install new server binaries</title>
3153
3154       <orderedlist>
3155         <listitem>
3156           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
3157           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
3158           display the users in the UserList file</link>. <programlisting>
3159    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
3160 </programlisting></para>
3161         </listitem>
3162
3163         <listitem>
3164           <para>Verify that the binaries are available in the source directory from which you are installing them. If the machine is
3165           also an AFS client, you can retrieve the binaries from a central directory in AFS. Otherwise, you can obtain them directly
3166           from the AFS distribution media, from a local disk directory where you previously installed them, or from a remote machine
3167           using a transfer utility such as the <emphasis role="bold">ftp</emphasis> command.</para>
3168         </listitem>
3169
3170         <listitem id="LIWQ112">
3171           <para>Issue the <emphasis role="bold">bos install</emphasis> command for the binary distribution
3172           machine. (If you have forgotten which machine is performing that role, see <link linkend="HDRWQ97">To locate the binary
3173           distribution machine for a system type</link>.) <programlisting>
3174    % <emphasis role="bold">bos install</emphasis> &lt;<replaceable>machine name</replaceable>&gt; &lt;<replaceable>files to install</replaceable>&gt;+
3175 </programlisting></para>
3176
3177           <para>where <variablelist>
3178               <varlistentry>
3179                 <term><emphasis role="bold">i</emphasis></term>
3180
3181                 <listitem>
3182                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">install</emphasis>.</para>
3183                 </listitem>
3184               </varlistentry>
3185
3186               <varlistentry>
3187                 <term><emphasis role="bold">machine name</emphasis></term>
3188
3189                 <listitem>
3190                   <para>Names the binary distribution machine.</para>
3191                 </listitem>
3192               </varlistentry>
3193
3194               <varlistentry>
3195                 <term><emphasis role="bold">files to install</emphasis></term>
3196
3197                 <listitem>
3198                   <para>Names each binary file to install into the local <emphasis role="bold">/usr/afs/bin</emphasis> directory.
3199                   Partial pathnames are interpreted relative to the current working directory. The last element in each pathname
3200                   (the filename itself) matches the name of the file it is replacing, such as <emphasis
3201                   role="bold">bosserver</emphasis> or <emphasis role="bold">volserver</emphasis> for server processes, <emphasis
3202                   role="bold">bos</emphasis> or <emphasis role="bold">vos</emphasis> for commands.</para>
3203
3204                   <para>Each AFS server process other than the <emphasis role="bold">fs</emphasis> process uses a single binary
3205                   file. The <emphasis role="bold">fs</emphasis> process uses three binary files: <emphasis
3206                   role="bold">fileserver</emphasis>, <emphasis role="bold">volserver</emphasis>, and <emphasis
3207                   role="bold">salvager</emphasis>. Installing a new version of one component does not necessarily mean that you need
3208                   to replace all three.</para>
3209                 </listitem>
3210               </varlistentry>
3211             </variablelist></para>
3212         </listitem>
3213
3214         <listitem>
3215           <para>Repeat Step <link linkend="LIWQ112">3</link> for each binary distribution machine.</para>
3216         </listitem>
3217
3218         <listitem>
3219           <para><emphasis role="bold">(Optional)</emphasis> If you want to restart processes to use the new binaries immediately,
3220           wait until the <emphasis role="bold">upclientbin</emphasis> process retrieves them from the binary distribution machine.
3221           You can verify the timestamps on binary files by using the <emphasis role="bold">bos getdate</emphasis> command as
3222           described in <link linkend="HDRWQ115">Displaying Binary Version Dates</link>. When the binary files are available on each
3223           server machine, issue the <emphasis role="bold">bos restart</emphasis> command, for which complete instructions appear in
3224           <link linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.</para>
3225
3226           <para>If you are working on an AFS client machine, it is a wise precaution to have a copy of the <emphasis
3227           role="bold">bos</emphasis> command suite binaries on the local disk before restarting server processes. In the
3228           conventional configuration, the <emphasis role="bold">/usr/afsws/bin</emphasis> directory that houses the <emphasis
3229           role="bold">bos</emphasis> command binary on client machines is a symbolic link into AFS, which conserves local disk
3230           space. However, restarting certain processes (particularly the database server processes) can make the AFS filespace
3231           inaccessible, particularly if a problem arises during the restart. Having a local copy of the <emphasis
3232           role="bold">bos</emphasis> binary enables you to uninstall or reinstall process binaries or restart processes even in this
3233           case. Use the <emphasis role="bold">cp</emphasis> command to copy the <emphasis role="bold">bos</emphasis> command binary
3234           from the <emphasis role="bold">/usr/afsws/bin</emphasis> directory to a local directory such as <emphasis
3235           role="bold">/tmp</emphasis>.</para>
3236
3237           <para>Restarting a process causes a service outage. It is best to perform the restart at times of low system usage if
3238           possible.</para>
3239
3240           <programlisting>
3241    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; &lt;<replaceable>instances</replaceable>&gt;+
3242 </programlisting>
3243         </listitem>
3244       </orderedlist>
3245
3246       <indexterm>
3247         <primary>uninstalling</primary>
3248
3249         <secondary>server process and command suite binaries</secondary>
3250       </indexterm>
3251
3252       <indexterm>
3253         <primary>reverting</primary>
3254
3255         <secondary>to old version of server process and command binaries</secondary>
3256       </indexterm>
3257
3258       <indexterm>
3259         <primary>server process binaries</primary>
3260
3261         <secondary>uninstalling</secondary>
3262       </indexterm>
3263
3264       <indexterm>
3265         <primary>server process binaries</primary>
3266
3267         <secondary>reverting to old version</secondary>
3268       </indexterm>
3269
3270       <indexterm>
3271         <primary>command suite</primary>
3272
3273         <secondary>binaries</secondary>
3274
3275         <tertiary>uninstalling</tertiary>
3276       </indexterm>
3277
3278       <indexterm>
3279         <primary>server machine</primary>
3280
3281         <secondary>uninstalling command &amp; process binaries</secondary>
3282       </indexterm>
3283
3284       <indexterm>
3285         <primary>BAK version of binary file</primary>
3286
3287         <secondary>used by bos uninstall command</secondary>
3288       </indexterm>
3289
3290       <indexterm>
3291         <primary>OLD version of binary file</primary>
3292
3293         <secondary>used by bos uninstall command</secondary>
3294       </indexterm>
3295     </sect2>
3296
3297     <sect2 id="HDRWQ113">
3298       <title>Reverting to the Previous Version of Binaries</title>
3299
3300       <para>In rare cases, installing a new binary can cause problems serious enough to require reverting to the previous version.
3301       Just as with installing binaries, consistent system performance requires reverting every server machine back to the same
3302       version. Issue the <emphasis role="bold">bos uninstall</emphasis> command described here on each binary distribution
3303       machine.</para>
3304
3305       <para>When you use the <emphasis role="bold">bos uninstall</emphasis> command, the BOS Server discards the current version of
3306       a binary file and promotes the <emphasis role="bold">.BAK</emphasis> version of the file by removing the extension. It renames
3307       the current <emphasis role="bold">.OLD</emphasis> version, if any, to <emphasis role="bold">.BAK</emphasis>.</para>
3308
3309       <para>If there is no current <emphasis role="bold">.BAK</emphasis> version, the <emphasis role="bold">bos uninstall</emphasis>
3310       command operation fails and generates an error message. If a <emphasis role="bold">.OLD</emphasis> version still exists, issue
3311       the <emphasis role="bold">mv</emphasis> command to rename it to <emphasis role="bold">.BAK</emphasis> before reissuing the
3312       <emphasis role="bold">bos uninstall</emphasis> command.</para>
3313
3314       <para>Just as when you install new binaries, the server processes do not start using a reverted version immediately.
3315       Presumably you are reverting because the current binaries do not work, so the following instructions have you restart the
3316       relevant processes.</para>
3317
3318       <indexterm>
3319         <primary>bos commands</primary>
3320
3321         <secondary>uninstall</secondary>
3322       </indexterm>
3323
3324       <indexterm>
3325         <primary>commands</primary>
3326
3327         <secondary>bos install</secondary>
3328       </indexterm>
3329     </sect2>
3330
3331     <sect2 id="Header_132">
3332       <title>To revert to the previous version of binaries</title>
3333
3334       <orderedlist>
3335         <listitem>
3336           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
3337           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
3338           display the users in the UserList file</link>. <programlisting>
3339    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
3340 </programlisting></para>
3341         </listitem>
3342
3343         <listitem>
3344           <para>Verify that the <emphasis role="bold">.BAK</emphasis> version of each relevant binary is available in the <emphasis
3345           role="bold">/usr/afs/bin</emphasis> directory on each binary distribution machine. If necessary, you can use the <emphasis
3346           role="bold">bos getdate</emphasis> command as described in <link linkend="HDRWQ115">Displaying Binary Version
3347           Dates</link>. If necessary, rename the <emphasis role="bold">.OLD</emphasis> version to <emphasis
3348           role="bold">.BAK</emphasis></para>
3349         </listitem>
3350
3351         <listitem id="LIWQ114">
3352           <para>Issue the <emphasis role="bold">bos uninstall</emphasis> command for a binary distribution
3353           machine. (If you have forgotten which machine is performing that role, see <link linkend="HDRWQ97">To locate the binary
3354           distribution machine for a system type</link>.) <programlisting>
3355    % <emphasis role="bold">bos uninstall</emphasis> &lt;<replaceable>machine name</replaceable>&gt; &lt;<replaceable>files to uninstall</replaceable>&gt;+
3356 </programlisting></para>
3357
3358           <para>where <variablelist>
3359               <varlistentry>
3360                 <term><emphasis role="bold">u</emphasis></term>
3361
3362                 <listitem>
3363                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">uninstall</emphasis>.</para>
3364                 </listitem>
3365               </varlistentry>
3366
3367               <varlistentry>
3368                 <term><emphasis role="bold">machine name</emphasis></term>
3369
3370                 <listitem>
3371                   <para>Names the binary distribution machine.</para>
3372                 </listitem>
3373               </varlistentry>
3374
3375               <varlistentry>
3376                 <term><emphasis role="bold">files to uninstall</emphasis></term>
3377
3378                 <listitem>
3379                   <para>Names each binary file in the <emphasis role="bold">/usr/afs/bin</emphasis> directory to replace with its
3380                   <emphasis role="bold">.BAK</emphasis> version. The file name alone is sufficient, because the <emphasis
3381                   role="bold">/usr/afs/bin</emphasis> directory is assumed.</para>
3382                 </listitem>
3383               </varlistentry>
3384             </variablelist></para>
3385         </listitem>
3386
3387         <listitem>
3388           <para>Repeat Step <link linkend="LIWQ114">3</link> for each binary distribution machine.</para>
3389         </listitem>
3390
3391         <listitem>
3392           <para>Wait until the <emphasis role="bold">upclientbin</emphasis> process on each server machine retrieves the reverted
3393           from the binary distribution machine. You can verify the timestamps on binary files by using the <emphasis role="bold">bos
3394           getdate</emphasis> command as described in <link linkend="HDRWQ115">Displaying Binary Version Dates</link>. When the
3395           binary files are available on each server machine, issue the <emphasis role="bold">bos restart</emphasis> command, for
3396           which complete instructions appear in <link linkend="HDRWQ170">Stopping and Immediately Restarting
3397           Processes</link>.</para>
3398
3399           <para>If you are working on an AFS client machine, it is a wise precaution to have a copy of the <emphasis
3400           role="bold">bos</emphasis> command suite binaries on the local disk before restarting server processes. In the
3401           conventional configuration, the <emphasis role="bold">/usr/afsws/bin</emphasis> directory that houses the <emphasis
3402           role="bold">bos</emphasis> command binary on client machines is a symbolic link into AFS, which conserves local disk
3403           space. However, restarting certain processes (particularly the database server processes) can make the AFS filespace
3404           inaccessible, particularly if a problem arises during the restart. Having a local copy of the <emphasis
3405           role="bold">bos</emphasis> binary enables you to uninstall or reinstall process binaries or restart processes even in this
3406           case. Use the <emphasis role="bold">cp</emphasis> command to copy the <emphasis role="bold">bos</emphasis> command binary
3407           from the <emphasis role="bold">/usr/afsws/bin</emphasis> directory to a local directory such as <emphasis
3408           role="bold">/tmp</emphasis>.</para>
3409
3410           <programlisting>
3411    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; &lt;<replaceable>instances</replaceable>&gt;+
3412 </programlisting>
3413         </listitem>
3414       </orderedlist>
3415
3416       <indexterm>
3417         <primary>server process binaries</primary>
3418
3419         <secondary>displaying time stamp</secondary>
3420       </indexterm>
3421
3422       <indexterm>
3423         <primary>command suite</primary>
3424
3425         <secondary>binaries</secondary>
3426
3427         <tertiary>displaying time stamp</tertiary>
3428       </indexterm>
3429
3430       <indexterm>
3431         <primary>time stamp</primary>
3432
3433         <secondary>on binary file, listing</secondary>
3434       </indexterm>
3435
3436       <indexterm>
3437         <primary>date</primary>
3438
3439         <secondary>on binary file, listing</secondary>
3440       </indexterm>
3441
3442       <indexterm>
3443         <primary>compilation</primary>
3444
3445         <secondary>date of, listing on binary file</secondary>
3446       </indexterm>
3447
3448       <indexterm>
3449         <primary>displaying</primary>
3450
3451         <secondary>time stamp on binary file</secondary>
3452       </indexterm>
3453     </sect2>
3454
3455     <sect2 id="HDRWQ115">
3456       <title>Displaying Binary Version Dates</title>
3457
3458       <para>You can check the compilation dates for all three versions of a binary file in the <emphasis
3459       role="bold">/usr/afs/bin</emphasis> directory--the current, <emphasis role="bold">.BAK</emphasis> and .<emphasis
3460       role="bold">OLD</emphasis> versions. This is useful for verifying that new binaries have been copied to a file server machine
3461       from its binary distribution machine before restarting a server process to use the new binaries.</para>
3462
3463       <para>To check dates on binaries in a directory other than <emphasis role="bold">/usr/afs/bin</emphasis>, add the <emphasis
3464       role="bold">-dir</emphasis> argument. See the <emphasis>OpenAFS Administration Reference</emphasis>.</para>
3465
3466       <indexterm>
3467         <primary>bos commands</primary>
3468
3469         <secondary>getdate</secondary>
3470       </indexterm>
3471
3472       <indexterm>
3473         <primary>commands</primary>
3474
3475         <secondary>bos getdate</secondary>
3476       </indexterm>
3477     </sect2>
3478
3479     <sect2 id="Header_134">
3480       <title>To display binary version dates</title>
3481
3482       <orderedlist>
3483         <listitem>
3484           <para>Issue the <emphasis role="bold">bos getdate</emphasis> command. <programlisting>
3485    % <emphasis role="bold">bos getdate</emphasis> &lt;<replaceable>machine name</replaceable>&gt; &lt;<replaceable>files to check</replaceable>&gt;+
3486 </programlisting></para>
3487
3488           <para>where <variablelist>
3489               <varlistentry>
3490                 <term><emphasis role="bold">getd</emphasis></term>
3491
3492                 <listitem>
3493                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">getdate</emphasis>.</para>
3494                 </listitem>
3495               </varlistentry>
3496
3497               <varlistentry>
3498                 <term><emphasis role="bold">machine name</emphasis></term>
3499
3500                 <listitem>
3501                   <para>Name the file server machine for which to display binary dates.</para>
3502                 </listitem>
3503               </varlistentry>
3504
3505               <varlistentry>
3506                 <term><emphasis role="bold">files to check</emphasis></term>
3507
3508                 <listitem>
3509                   <para>Names each binary file to display.</para>
3510                 </listitem>
3511               </varlistentry>
3512             </variablelist></para>
3513         </listitem>
3514       </orderedlist>
3515
3516       <indexterm>
3517         <primary>BAK version of binary file</primary>
3518
3519         <secondary>removing obsolete</secondary>
3520       </indexterm>
3521
3522       <indexterm>
3523         <primary>OLD version of binary file</primary>
3524
3525         <secondary>removing obsolete</secondary>
3526       </indexterm>
3527
3528       <indexterm>
3529         <primary>removing</primary>
3530
3531         <secondary>obsolete .BAK and .OLD version of binaries</secondary>
3532       </indexterm>
3533
3534       <indexterm>
3535         <primary>server process binaries</primary>
3536
3537         <secondary>removing obsolete</secondary>
3538       </indexterm>
3539
3540       <indexterm>
3541         <primary>command suite</primary>
3542
3543         <secondary>binaries</secondary>
3544
3545         <tertiary>removing obsolete</tertiary>
3546       </indexterm>
3547
3548       <indexterm>
3549         <primary>removing</primary>
3550
3551         <secondary>core files from /usr/afs/logs</secondary>
3552       </indexterm>
3553
3554       <indexterm>
3555         <primary>core files</primary>
3556
3557         <secondary>removing from /usr/afs/logs directory</secondary>
3558       </indexterm>
3559
3560       <indexterm>
3561         <primary>usr/afs/bin directory</primary>
3562
3563         <secondary>removing obsolete .BAK and .OLD files</secondary>
3564       </indexterm>
3565     </sect2>
3566
3567     <sect2 id="HDRWQ116">
3568       <title>Removing Obsolete Binary Files</title>
3569
3570       <para>When processes with new binaries have been running without problems for a number of days, it is generally safe to remove
3571       the <emphasis role="bold">.BAK</emphasis> and <emphasis role="bold">.OLD</emphasis> versions from the <emphasis
3572       role="bold">/usr/afs/bin</emphasis> directory, both to reduce clutter and to free space on the file server machine's local
3573       disk.</para>
3574
3575       <para>You can use the <emphasis role="bold">bos prune</emphasis> command's flags to remove the following types of files:
3576       <itemizedlist>
3577           <listitem>
3578             <para>To remove files in the <emphasis role="bold">/usr/afs/bin</emphasis> directory with a <emphasis
3579             role="bold">.BAK</emphasis> extension, use the <emphasis role="bold">-bak</emphasis> flag.</para>
3580           </listitem>
3581
3582           <listitem>
3583             <para>To remove files in the <emphasis role="bold">/usr/afs/bin</emphasis> directory with a <emphasis
3584             role="bold">.OLD</emphasis> extension, use the <emphasis role="bold">-old</emphasis> flag.</para>
3585           </listitem>
3586
3587           <listitem>
3588             <para>To remove files in the <emphasis role="bold">/usr/afs/logs</emphasis> directory called <emphasis
3589             role="bold">core</emphasis>, with any extension, use the <emphasis role="bold">-core</emphasis> flag.</para>
3590           </listitem>
3591
3592           <listitem>
3593             <para>To remove all three types of files, use the <emphasis role="bold">-all</emphasis> flag.</para>
3594           </listitem>
3595         </itemizedlist></para>
3596
3597       <indexterm>
3598         <primary>commands</primary>
3599
3600         <secondary>bos prune</secondary>
3601       </indexterm>
3602
3603       <indexterm>
3604         <primary>bos commands</primary>
3605
3606         <secondary>prune</secondary>
3607       </indexterm>
3608     </sect2>
3609
3610     <sect2 id="Header_136">
3611       <title>To remove obsolete binaries</title>
3612
3613       <orderedlist>
3614         <listitem>
3615           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
3616           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
3617           display the users in the UserList file</link>. <programlisting>
3618    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
3619 </programlisting></para>
3620         </listitem>
3621
3622         <listitem>
3623           <para>Issue the <emphasis role="bold">bos prune</emphasis> command with one or more of its flags. <programlisting>
3624    % <emphasis role="bold">bos prune</emphasis> &lt;<replaceable>machine name</replaceable>&gt; [<emphasis role="bold">-bak</emphasis>] [<emphasis
3625                 role="bold">-old</emphasis>] [<emphasis role="bold">-core</emphasis>] [<emphasis role="bold">-all</emphasis>]
3626 </programlisting></para>
3627
3628           <para>where <variablelist>
3629               <varlistentry>
3630                 <term><emphasis role="bold">p</emphasis></term>
3631
3632                 <listitem>
3633                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">prune</emphasis>.</para>
3634                 </listitem>
3635               </varlistentry>
3636
3637               <varlistentry>
3638                 <term><emphasis role="bold">machine name</emphasis></term>
3639
3640                 <listitem>
3641                   <para>Names the file server machine on which to remove obsolete files.</para>
3642                 </listitem>
3643               </varlistentry>
3644
3645               <varlistentry>
3646                 <term><emphasis role="bold">-bak</emphasis></term>
3647
3648                 <listitem>
3649                   <para>Removes all the files with a <emphasis role="bold">.BAK</emphasis> extension from the <emphasis
3650                   role="bold">/usr/afs/bin</emphasis> directory. Do not combine this flag with the <emphasis
3651                   role="bold">-all</emphasis> flag.</para>
3652                 </listitem>
3653               </varlistentry>
3654
3655               <varlistentry>
3656                 <term><emphasis role="bold">-old</emphasis></term>
3657
3658                 <listitem>
3659                   <para>Removes all the files a .<emphasis role="bold">OLD</emphasis> extension from the <emphasis
3660                   role="bold">/usr/afs/bin</emphasis> directory. Do not combine this flag with the <emphasis
3661                   role="bold">-all</emphasis> flag.</para>
3662                 </listitem>
3663               </varlistentry>
3664
3665               <varlistentry>
3666                 <term><emphasis role="bold">-core</emphasis></term>
3667
3668                 <listitem>
3669                   <para>Removes all core files from the <emphasis role="bold">/usr/afs/logs</emphasis> directory. Do not combine
3670                   this flag with the <emphasis role="bold">-all</emphasis> flag</para>
3671                 </listitem>
3672               </varlistentry>
3673
3674               <varlistentry>
3675                 <term><emphasis role="bold">-all</emphasis></term>
3676
3677                 <listitem>
3678                   <para>Combines the effect of the other three flags. Do not combine it with the other three flags.</para>
3679                 </listitem>
3680               </varlistentry>
3681             </variablelist></para>
3682         </listitem>
3683       </orderedlist>
3684     </sect2>
3685
3686     <sect2 id="HDRWQ117">
3687       <title>Displaying A Binary File's Build Level</title>
3688
3689       <para>For the most consistent performance on a server machine, and cell-wide, it is best for all server processes to come from
3690       the same AFS distribution. Every AFS binary includes an ASCII string that specifies its version, or <emphasis>build
3691       level</emphasis>. To display it, use the <emphasis role="bold">strings</emphasis> and <emphasis role="bold">grep</emphasis>
3692       commands, which are included in most UNIX distributions.</para>
3693
3694       <indexterm>
3695         <primary>commands</primary>
3696
3697         <secondary>which</secondary>
3698       </indexterm>
3699
3700       <indexterm>
3701         <primary>commands</primary>
3702
3703         <secondary>strings</secondary>
3704       </indexterm>
3705
3706       <indexterm>
3707         <primary>strings command</primary>
3708       </indexterm>
3709
3710       <indexterm>
3711         <primary>which command</primary>
3712       </indexterm>
3713     </sect2>
3714
3715     <sect2 id="Header_138">
3716       <title>To display an AFS binary's build level</title>
3717
3718       <orderedlist>
3719         <listitem>
3720           <para>Change to the directory that houses the binary file . If you are not sure where the binary resides, issue the
3721           <emphasis role="bold">which</emphasis> command. <programlisting>
3722    % <emphasis role="bold">which</emphasis> binary_file
3723    /bin_dir_path/binary_file
3724    % <emphasis role="bold">cd</emphasis> bin_dir_path
3725 </programlisting></para>
3726         </listitem>
3727
3728         <listitem>
3729           <para>Issue the <emphasis role="bold">strings</emphasis> command to extract all ASCII strings from the binary file. Pipe
3730           the output to the <emphasis role="bold">grep</emphasis> command to locate the relevant line. <programlisting>
3731    % <emphasis role="bold">strings ./</emphasis>binary_file <emphasis role="bold">| grep Base</emphasis>
3732 </programlisting></para>
3733
3734           <para>The output reports the AFS build level in a format like the following:</para>
3735
3736           <programlisting>
3737    @(#)Base configuration afsversion  build_level
3738 </programlisting>
3739
3740           <para>For example, the following string indicates the binary is from AFS M.m build 3.0:</para>
3741
3742           <programlisting>
3743    @(#)Base configuration afsM.m 3.0
3744 </programlisting>
3745         </listitem>
3746       </orderedlist>
3747
3748       <indexterm>
3749         <primary>CellServDB file (server)</primary>
3750
3751         <secondary>maintaining</secondary>
3752       </indexterm>
3753
3754       <indexterm>
3755         <primary>files</primary>
3756
3757         <secondary>CellServDB (server)</secondary>
3758       </indexterm>
3759
3760       <indexterm>
3761         <primary>database server process</primary>
3762
3763         <secondary>use of CellServDB file</secondary>
3764       </indexterm>
3765
3766       <indexterm>
3767         <primary>Ubik</primary>
3768
3769         <secondary>use of CellServDB file</secondary>
3770       </indexterm>
3771
3772       <indexterm>
3773         <primary>server process</primary>
3774
3775         <secondary>use of CellServDB file</secondary>
3776       </indexterm>
3777     </sect2>
3778   </sect1>
3779
3780   <sect1 id="HDRWQ118">
3781     <title>Maintaining the Server CellServDB File</title>
3782
3783     <para>Every file server machine maintains a list of its home cell's database server machines in the local disk file <emphasis
3784     role="bold">/usr/afs/etc/CellServDB</emphasis> on its local disk. Both database server processes and non-database server
3785     processes consult the file: <itemizedlist>
3786         <listitem>
3787           <para>The database server processes (the Authentication, Backup, Protection, and Volume Location Servers) maintain
3788           constant contact with their peers in order to keep their copies of the replicated administrative databases
3789           synchronized.</para>
3790
3791           <para>As detailed in <link linkend="HDRWQ102">Replicating the OpenAFS Administrative Databases</link>, the database server
3792           processes use the Ubik utility to synchronize the information in the databases they maintain. The Ubik coordinator at the
3793           synchronization site for each database maintains the single read/write copy of the database and distributes changes to the
3794           secondary sites as necessary. It must maintain contact with a majority of the secondary sites to remain the coordinator,
3795           and consults the <emphasis role="bold">CellServDB</emphasis> file to learn how many peers it has and on which machines
3796           they are running.</para>
3797
3798           <para>If the coordinator loses contact with the majority of its peers, they all cooperate to elect a new coordinator by
3799           majority vote. During the election, all of the Ubik processes consult the <emphasis role="bold">CellServDB</emphasis> file
3800           to learn where to send their votes, and what number constitutes a majority.</para>
3801         </listitem>
3802
3803         <listitem>
3804           <para>The non-database server processes must know which machines are running the database server processes in order to
3805           retrieve information from the databases. For example, the first time that a user accesses an AFS file, the File Server
3806           that houses it contacts the Protection Server to obtain a list of the user's group memberships (the list is called a
3807           current protection subgroup, or CPS). The File Server uses the CPS as it determines if the access control list (ACL)
3808           protecting the file grants the required permissions to the user (for more details, see <link linkend="HDRWQ534">About the
3809           Protection Database</link>).</para>
3810         </listitem>
3811       </itemizedlist></para>
3812
3813     <indexterm>
3814       <primary>CellServDB file (server)</primary>
3815
3816       <secondary>effect of wrong information in</secondary>
3817     </indexterm>
3818
3819     <para>The consequences of missing or incorrect information in the <emphasis role="bold">CellServDB</emphasis> file are as
3820     follows: <itemizedlist>
3821         <listitem>
3822           <para>If the file does not list a machine, then it is effectively not a database server machine even if the database
3823           server processes are running. The Ubik coordinator does not send it database updates or include it in the count that
3824           establishes a majority. It does not participate in Ubik elections, and so refuses to distribute database information to
3825           any client machines that happen to contact it (which they can do if their <emphasis
3826           role="bold">/usr/vice/etc/CellServDB</emphasis> file lists it). Users of the client machine must wait for a timeout before
3827           they can contact a correctly functioning database server machine.</para>
3828         </listitem>
3829
3830         <listitem>
3831           <para>If the file lists a machine that is not running the database server processes, the consequences can be serious. The
3832           Ubik coordinator cannot send it database updates, but includes it in the count that establishes a majority. If valid
3833           secondary sites go down and stop sending their votes to the coordinator, it can wrongly appear that the coordinator no
3834           longer has the majority it needs. The resulting election of a new coordinator causes a service outage during which
3835           information from the database becomes unavailable. Furthermore, the lack of a vote from the incorrectly listed site can
3836           disturb the election, if it makes the other sites believe that a majority of sites are not voting for the new
3837           coordinator.</para>
3838
3839           <para>A more minor consequence is that non-database server processes attempt to contact the database server processes on
3840           the machine. They experience a timeout delay because the processes are not running.</para>
3841         </listitem>
3842       </itemizedlist></para>
3843
3844     <para>Note that the <emphasis role="bold">/usr/afs/etc/CellServDB</emphasis> file on a server machine is not the same as the
3845     <emphasis role="bold">/usr/vice/etc/CellServDB</emphasis> file on client machine. The client version includes entries for
3846     foreign cells as well as the local cell. However, it is important to update both versions of the file whenever you change your
3847     cell's database server machines. A server machine that is also a client needs to have both files, and you need to update them
3848     both. For more information on maintaining the client version of the <emphasis role="bold">CellServDB</emphasis> file, see <link
3849     linkend="HDRWQ406">Maintaining Knowledge of Database Server Machines</link>.</para>
3850
3851     <indexterm>
3852       <primary>system control machine</primary>
3853
3854       <secondary>CellServDB file, distributing to server machines</secondary>
3855     </indexterm>
3856
3857     <indexterm>
3858       <primary>distribution</primary>
3859
3860       <secondary>of CellServDB file (server)</secondary>
3861     </indexterm>
3862
3863     <indexterm>
3864       <primary>Update Server</primary>
3865
3866       <secondary>CellServDB file (server), distributing</secondary>
3867     </indexterm>
3868
3869     <sect2 id="HDRWQ119">
3870       <title>Distributing the Server CellServDB File</title>
3871
3872       <para>To avoid the negative consequences of incorrect information in the <emphasis
3873       role="bold">/usr/afs/etc/CellServDB</emphasis> file, you must update it on all of your cell's server machines every time you
3874       add or remove a database server machine. The <emphasis>OpenAFS Quick Beginnings</emphasis> provides complete instructions for
3875       installing or removing a database server machine and for updating the <emphasis role="bold">CellServDB</emphasis> file in that
3876       context. This section explains how to distribute the file to your server machines and how to make other cells aware of the
3877       changes if you participate in the AFS global name space.</para>
3878
3879       <para>If you use the Update Server to distribute the central copy of the server
3880       <emphasis role="bold">CellServDB</emphasis> file stored on the cell's system control machine. 
3881       For instructions on configuring the Update Server, see the <emphasis>OpenAFS Quick Beginnings</emphasis>.</para>
3882
3883       <para>To avoid formatting errors that can cause errors, always use the <emphasis role="bold">bos addhost</emphasis> and
3884       <emphasis role="bold">bos removehost</emphasis> commands, rather than editing the file directly. You must also restart the
3885       database server processes running on the machine, to initiate a coordinator election among the new set of database server
3886       machines. This step is included in the instructions that appear in <link linkend="HDRWQ121">To add a database server machine
3887       to the CellServDB file</link> and <link linkend="HDRWQ122">To remove a database server machine from the CellServDB
3888       file</link>. For instructions on displaying the contents of the file, see <link linkend="HDRWQ120">To display a cell's
3889       database server machines</link>.</para>
3890
3891       <para>If you make your cell accessible to foreign users as part of the AFS global name space, you also need to inform other
3892       cells when you change your cell's database server machines. The AFS Support group maintains a <emphasis
3893       role="bold">CellServDB</emphasis> file that lists all cells that participate in the AFS global name space, and can change your
3894       cell's entry at your request. For further details, see <link linkend="HDRWQ38">Making Your Cell Visible to
3895       Others</link>.</para>
3896
3897       <para>Another way to advertise your cell's database server machines is to maintain a copy of the file at the conventional
3898       location in your AFS filespace, <emphasis role="bold">/afs/</emphasis><emphasis>cellname</emphasis><emphasis
3899       role="bold">/service/etc/CellServDB.local</emphasis>. For further discussion, see <link linkend="HDRWQ43">The Third
3900       Level</link>.</para>
3901
3902       <indexterm>
3903         <primary>bos commands</primary>
3904
3905         <secondary>listhosts</secondary>
3906       </indexterm>
3907
3908       <indexterm>
3909         <primary>commands</primary>
3910
3911         <secondary>bos listhosts</secondary>
3912       </indexterm>
3913
3914       <indexterm>
3915         <primary>CellServDB file (server)</primary>
3916
3917         <secondary>displaying</secondary>
3918       </indexterm>
3919
3920       <indexterm>
3921         <primary>displaying</primary>
3922
3923         <secondary>CellServDB file (server)</secondary>
3924       </indexterm>
3925
3926       <indexterm>
3927         <primary>database server machine</primary>
3928
3929         <secondary>displaying list in server CellServDB file</secondary>
3930       </indexterm>
3931
3932       <indexterm>
3933         <primary>displaying</primary>
3934
3935         <secondary>database server machines in server CellServDB file</secondary>
3936       </indexterm>
3937     </sect2>
3938
3939     <sect2 id="HDRWQ120">
3940       <title>To display a cell's database server machines</title>
3941
3942       <orderedlist>
3943         <listitem>
3944           <para>Issue the <emphasis role="bold">bos listhosts</emphasis> command. If you have maintained the file properly, the
3945           output is the same on every server machine, but the <emphasis>machine name</emphasis> argument enables you to check
3946           various machines if you wish. <programlisting>
3947    % <emphasis role="bold">bos listhosts</emphasis> &lt;<replaceable>machine name</replaceable>&gt; [&lt;<replaceable>cell name</replaceable>&gt;]
3948 </programlisting></para>
3949
3950           <para>where <variablelist>
3951               <varlistentry>
3952                 <term><emphasis role="bold">listh</emphasis></term>
3953
3954                 <listitem>
3955                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">listhosts</emphasis>.</para>
3956                 </listitem>
3957               </varlistentry>
3958
3959               <varlistentry>
3960                 <term><emphasis role="bold">machine name</emphasis></term>
3961
3962                 <listitem>
3963                   <para>Specifies the server machine from which to display the <emphasis
3964                   role="bold">/usr/afs/etc/CellServDB</emphasis> file.</para>
3965                 </listitem>
3966               </varlistentry>
3967
3968               <varlistentry>
3969                 <term><emphasis role="bold">cell name</emphasis></term>
3970
3971                 <listitem>
3972                   <para>Specifies the complete Internet domain name of a foreign cell. You must already know the name of at least
3973                   one server machine in the cell, to provide as the <emphasis role="bold">machine name</emphasis> argument.</para>
3974                 </listitem>
3975               </varlistentry>
3976             </variablelist></para>
3977         </listitem>
3978       </orderedlist>
3979
3980       <para>The output lists the machines in the order they appear in the <emphasis role="bold">CellServDB</emphasis> file on the
3981       specified server machine. It assigns each one a <computeroutput>Host</computeroutput> index number, as in the following
3982       example. There is no implied relationship between the index and a machine's IP address, name, or role as Ubik coordinator or
3983       secondary site.</para>
3984
3985       <programlisting>
3986    % <emphasis role="bold">bos listhosts fs1.example.com</emphasis>
3987    Cell name is example.com
3988        Host 1 is fs1.example.com
3989        Host 2 is fs7.example.com
3990        Host 3 is fs4.example.com
3991 </programlisting>
3992
3993       <para>The output lists machines by name rather than IP address as long as the naming service (such as the Domain Name Service
3994       or local host table) is functioning properly. To display IP addresses, login to a server machine as the local superuser
3995       <emphasis role="bold">root</emphasis> and use a text editor or display command, such as the <emphasis
3996       role="bold">cat</emphasis> command, to view the <emphasis role="bold">/usr/afs/etc/CellServDB</emphasis> file.</para>
3997
3998       <indexterm>
3999         <primary>adding</primary>
4000
4001         <secondary>database server machine</secondary>
4002
4003         <tertiary>to server CellServDB file</tertiary>
4004       </indexterm>
4005
4006       <indexterm>
4007         <primary>database server machine</primary>
4008
4009         <secondary>adding</secondary>
4010
4011         <tertiary>to server CellServDB file</tertiary>
4012       </indexterm>
4013
4014       <indexterm>
4015         <primary>CellServDB file (server)</primary>
4016
4017         <secondary>adding database server machine</secondary>
4018       </indexterm>
4019
4020       <indexterm>
4021         <primary>adding</primary>
4022
4023         <secondary>CellServDB file (server) entry for database server machine</secondary>
4024       </indexterm>
4025
4026       <indexterm>
4027         <primary>database server machine</primary>
4028
4029         <secondary>CellServDB file (server) entry</secondary>
4030
4031         <tertiary>adding</tertiary>
4032       </indexterm>
4033
4034       <indexterm>
4035         <primary>database server process</primary>
4036
4037         <secondary>restarting after adding entry to server CellServDB file</secondary>
4038       </indexterm>
4039
4040       <indexterm>
4041         <primary>Protection Server</primary>
4042
4043         <secondary>restarting after adding entry to server CellServDB file</secondary>
4044       </indexterm>
4045
4046       <indexterm>
4047         <primary>Authentication Server</primary>
4048
4049         <secondary>restarting after adding entry to server CellServDB file</secondary>
4050       </indexterm>
4051
4052       <indexterm>
4053         <primary>VL Server</primary>
4054
4055         <secondary>restarting after adding entry to server CellServDB file</secondary>
4056       </indexterm>
4057
4058       <indexterm>
4059         <primary>Backup Server</primary>
4060
4061         <secondary>restarting after adding entry to server CellServDB file</secondary>
4062       </indexterm>
4063
4064       <indexterm>
4065         <primary>bos commands</primary>
4066
4067         <secondary>addhost</secondary>
4068       </indexterm>
4069
4070       <indexterm>
4071         <primary>commands</primary>
4072
4073         <secondary>bos addhost</secondary>
4074       </indexterm>
4075     </sect2>
4076
4077     <sect2 id="HDRWQ121">
4078       <title>To add a database server machine to the CellServDB file</title>
4079
4080       <orderedlist>
4081         <listitem>
4082           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
4083           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
4084           display the users in the UserList file</link>. <programlisting>
4085    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
4086 </programlisting></para>
4087         </listitem>
4088
4089         <listitem>
4090           <para>Issue the <emphasis role="bold">bos addhost</emphasis> command to add each new database server machine to the
4091           <emphasis role="bold">CellServDB</emphasis> file. Specify the system control
4092           machine as <emphasis>machine name</emphasis>. (If you have forgotten which machine is the system control machine, see
4093           <link linkend="HDRWQ99">The Output on the System Control Machine</link>.)
4094 <programlisting>
4095    % <emphasis role="bold">bos addhost</emphasis>  &lt;<replaceable>machine name</replaceable>&gt;  &lt;<replaceable>host name</replaceable>&gt;+
4096 </programlisting></para>
4097
4098           <para>where <variablelist>
4099               <varlistentry>
4100                 <term><emphasis role="bold">addh</emphasis></term>
4101
4102                 <listitem>
4103                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">addhost</emphasis>.</para>
4104                 </listitem>
4105               </varlistentry>
4106
4107               <varlistentry>
4108                 <term><emphasis role="bold">machine name</emphasis></term>
4109
4110                 <listitem>
4111                   <para>Names the system control machine</para>
4112                 </listitem>
4113               </varlistentry>
4114
4115               <varlistentry>
4116                 <term><emphasis role="bold">host name</emphasis></term>
4117
4118                 <listitem>
4119                   <para>Specifies the fully qualified hostname of each database server machine to add to the <emphasis
4120                   role="bold">CellServDB</emphasis> file (for example: <emphasis role="bold">fs4.example.com</emphasis>). The BOS Server
4121                   uses the <emphasis role="bold">gethostbyname()</emphasis> routine to obtain each machine's IP address and records
4122                   both the name and address automatically.</para>
4123                 </listitem>
4124               </varlistentry>
4125             </variablelist></para>
4126         </listitem>
4127
4128         <listitem>
4129           <para>Restart the Authentication Server, Backup Server, Protection Server, and VL Server on every database server machine,
4130           so that the new set of machines participate in the election of a new Ubik coordinator. The instruction uses the
4131           conventional names for the processes; make the appropriate substitution if you use different process names. For complete
4132           syntax, see <link linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.</para>
4133
4134           <para><emphasis role="bold">Important:</emphasis> Repeat the following command in quick succession on all of the database
4135           server machines.</para>
4136
4137           <programlisting>
4138    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">buserver kaserver ptserver vlserver</emphasis>
4139 </programlisting>
4140         </listitem>
4141
4142         <listitem>
4143           <para>Edit the <emphasis role="bold">/usr/vice/etc/CellServDB</emphasis> file on each of your cell's client machines. For
4144           instructions, see <link linkend="HDRWQ406">Maintaining Knowledge of Database Server Machines</link>.</para>
4145         </listitem>
4146
4147         <listitem>
4148           <para>If you participate in the AFS global name space, please have one of your cell's designated site contacts register
4149           the changes you have made with the AFS Product Support group.</para>
4150
4151           <para>If you maintain a central copy of your cell's server <emphasis role="bold">CellServDB</emphasis> file in the
4152           conventional location (<emphasis role="bold">/afs/</emphasis><emphasis>cellname</emphasis><emphasis
4153           role="bold">/service/etc/CellServDB.local</emphasis>), edit the file to reflect the change.</para>
4154         </listitem>
4155       </orderedlist>
4156
4157       <indexterm>
4158         <primary>removing</primary>
4159
4160         <secondary>database server machine</secondary>
4161
4162         <tertiary>from server CellServDB file</tertiary>
4163       </indexterm>
4164
4165       <indexterm>
4166         <primary>database server machine</primary>
4167
4168         <secondary>removing</secondary>
4169
4170         <tertiary>from server CellServDB file</tertiary>
4171       </indexterm>
4172
4173       <indexterm>
4174         <primary>CellServDB file (server)</primary>
4175
4176         <secondary>removing database server machine</secondary>
4177       </indexterm>
4178
4179       <indexterm>
4180         <primary>database server machine</primary>
4181
4182         <secondary>CellServDB file (server) entry</secondary>
4183
4184         <tertiary>removing</tertiary>
4185       </indexterm>
4186
4187       <indexterm>
4188         <primary>database server process</primary>
4189
4190         <secondary>restarting after removing entry from server CellServDB file</secondary>
4191       </indexterm>
4192
4193       <indexterm>
4194         <primary>Protection Server</primary>
4195
4196         <secondary>restarting after removing entry from server CellServDB file</secondary>
4197       </indexterm>
4198
4199       <indexterm>
4200         <primary>Authentication Server</primary>
4201
4202         <secondary>restarting after removing entry from server CellServDB file</secondary>
4203       </indexterm>
4204
4205       <indexterm>
4206         <primary>VL Server</primary>
4207
4208         <secondary>restarting after removing entry from server CellServDB file</secondary>
4209       </indexterm>
4210
4211       <indexterm>
4212         <primary>Backup Server</primary>
4213
4214         <secondary>restarting after removing entry from server CellServDB file</secondary>
4215       </indexterm>
4216
4217       <indexterm>
4218         <primary>bos commands</primary>
4219
4220         <secondary>removehost</secondary>
4221       </indexterm>
4222
4223       <indexterm>
4224         <primary>commands</primary>
4225
4226         <secondary>bos removehost</secondary>
4227       </indexterm>
4228     </sect2>
4229
4230     <sect2 id="HDRWQ122">
4231       <title>To remove a database server machine from the CellServDB file</title>
4232
4233       <orderedlist>
4234         <listitem>
4235           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
4236           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
4237           display the users in the UserList file</link>. <programlisting>
4238    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
4239 </programlisting></para>
4240         </listitem>
4241
4242         <listitem>
4243           <para>Issue the <emphasis role="bold">bos removehost</emphasis> command to remove each database server machine from the
4244           <emphasis role="bold">CellServDB</emphasis> file. Specify the system control
4245           machine as <emphasis>machine name</emphasis>. (If you have forgotten which machine is the system control machine, see
4246           <link linkend="HDRWQ99">The Output on the System Control Machine</link>.)
4247 <programlisting>
4248    % <emphasis role="bold">bos removehost</emphasis> &lt;<replaceable>machine name</replaceable>&gt;  &lt;<replaceable>host name</replaceable>&gt;+
4249 </programlisting></para>
4250
4251           <para>where <variablelist>
4252               <varlistentry>
4253                 <term><emphasis role="bold">removeh</emphasis></term>
4254
4255                 <listitem>
4256                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">removehost</emphasis>.</para>
4257                 </listitem>
4258               </varlistentry>
4259
4260               <varlistentry>
4261                 <term><emphasis role="bold">machine name</emphasis></term>
4262
4263                 <listitem>
4264                   <para>Names the system control machine.</para>
4265                 </listitem>
4266               </varlistentry>
4267
4268               <varlistentry>
4269                 <term><emphasis role="bold">host name</emphasis></term>
4270
4271                 <listitem>
4272                   <para>Specifies the fully qualified hostname of each database server machine to remove from the <emphasis
4273                   role="bold">CellServDB</emphasis> file (for example: <emphasis role="bold">fs4.example.com</emphasis>).</para>
4274                 </listitem>
4275               </varlistentry>
4276             </variablelist></para>
4277         </listitem>
4278
4279         <listitem>
4280           <para>Restart the Authentication Server, Backup Server, Protection Server, and VL Server on every database server machine,
4281           so that the new set of machines participate in the election of a new Ubik coordinator. The instruction uses the
4282           conventional names for the processes; make the appropriate substitution if you use different process names. For complete
4283           syntax, see <link linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.</para>
4284
4285           <para><emphasis role="bold">Important:</emphasis> Repeat the following command in quick succession on all of the database
4286           server machines.</para>
4287
4288           <programlisting>
4289    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">buserver kaserver ptserver vlserver</emphasis>
4290 </programlisting>
4291         </listitem>
4292
4293         <listitem>
4294           <para>Edit the <emphasis role="bold">/usr/vice/etc/CellServDB</emphasis> file on each of your cell's client machines. For
4295           instructions, see <link linkend="HDRWQ406">Maintaining Knowledge of Database Server Machines</link>.</para>
4296         </listitem>
4297
4298         <listitem>
4299           <para>If you participate in the AFS global name space, please have one of your cell's designated site contacts register
4300           the changes you have made with the AFS Product Support group.</para>
4301
4302           <para>If you maintain a central copy of your cell's server <emphasis role="bold">CellServDB</emphasis> file in the
4303           conventional location (<emphasis role="bold">/afs/</emphasis><emphasis>cellname</emphasis><emphasis
4304           role="bold">/service/etc/CellServDB.local</emphasis>), edit the file to reflect the change.</para>
4305         </listitem>
4306       </orderedlist>
4307     </sect2>
4308   </sect1>
4309
4310   <sect1 id="HDRWQ123">
4311     <title>Managing Authentication and Authorization Requirements</title>
4312
4313     <para>This section describes how the AFS server processes guarantee that only properly authorized users perform privileged
4314     commands, by checking authorization checking and mutually authenticating with their clients. It explains how you can control
4315     authorization checking requirements on a per-machine or per-cell basis, and how to bypass mutual authentication when issuing
4316     commands.</para>
4317
4318     <indexterm>
4319       <primary>authorization checking</primary>
4320
4321       <secondary>compared to authentication</secondary>
4322     </indexterm>
4323
4324     <indexterm>
4325       <primary>authentication</primary>
4326
4327       <secondary>compared to authorization checking</secondary>
4328     </indexterm>
4329
4330     <indexterm>
4331       <primary>privileged commands</primary>
4332     </indexterm>
4333
4334     <indexterm>
4335       <primary>commands</primary>
4336
4337       <secondary>privileged, defined</secondary>
4338     </indexterm>
4339
4340     <indexterm>
4341       <primary>anonymous user</primary>
4342
4343       <secondary>identity assigned to unauthenticated user</secondary>
4344     </indexterm>
4345
4346     <indexterm>
4347       <primary>authorization checking</primary>
4348
4349       <secondary>defined</secondary>
4350     </indexterm>
4351
4352     <sect2 id="HDRWQ124">
4353       <title>Authentication versus Authorization</title>
4354
4355       <para>Many AFS commands are <emphasis>privileged</emphasis> in that the AFS server process invoked by the command performs it
4356       only for a properly authorized user. The server process performs the following two tests to determine if someone is properly
4357       authorized: <itemizedlist>
4358           <listitem>
4359             <para>In the <emphasis>authentication</emphasis> test, the server process mutually authenticates with the command
4360             interpreter, Cache Manager, or other client process that is acting on behalf of a user or application. The goal of this
4361             test is to determine who is issuing the command. The server process verifies that the issuer really is who he or she
4362             claims to be, by examining the server ticket and other components of the issuer's token. (Secondarily, it allows the
4363             client process to verify that the server process is genuine.) If the issuer has no token or otherwise fails the test,
4364             the server process assigns him or her the identity <emphasis role="bold">anonymous</emphasis>, a completely unprivileged
4365             user. For a more complete description of mutual authentication, see <link linkend="HDRWQ75">A More Detailed Look at
4366             Mutual Authentication</link>.</para>
4367
4368             <para>Many individual commands enable you to bypass the authentication test by assuming the <emphasis
4369             role="bold">anonymous</emphasis> identity without even attempting to mutually authenticate. Note, however, that this is
4370             futile if the command is privileged and the server process is still performing the <emphasis>authorization</emphasis>
4371             test, because in that case the process refuses to execute privileged commands for the <emphasis
4372             role="bold">anonymous</emphasis> user.</para>
4373           </listitem>
4374
4375           <listitem>
4376             <para>In the authorization test, the server process determines if the issuer is authorized to use the command by
4377             consulting a list of privileged users. The goal of this test is to determine what the issuer is allowed to do. Different
4378             server processes consult different lists of users, as described in <link linkend="HDRWQ581">Managing Administrative
4379             Privilege</link>. The server process refuses to execute any privileged command for an unauthorized issuer. If a command
4380             has no privilege requirements, the server process skips this step and executes and immediately.</para>
4381
4382             <note>
4383               <para>Never place the <emphasis role="bold">anonymous</emphasis> user or the <emphasis
4384               role="bold">system:anyuser</emphasis> group on a privilege list; it makes authorization checking meaningless.</para>
4385
4386               <para>You can use the <emphasis role="bold">bos setauth</emphasis> command to control whether the server processes on
4387               a server machine check for authorization. Other server machines are not affected. Keep in mind that turning off
4388               authorization checking is a grave security risk, because the server processes on that machine perform any action for
4389               any user.</para>
4390             </note>
4391           </listitem>
4392         </itemizedlist></para>
4393
4394       <indexterm>
4395         <primary>controlling</primary>
4396
4397         <secondary>authorization checking for entire cell</secondary>
4398       </indexterm>
4399
4400       <indexterm>
4401         <primary>authorization checking</primary>
4402
4403         <secondary>controlling cell-wide</secondary>
4404       </indexterm>
4405
4406       <indexterm>
4407         <primary>restarting</primary>
4408
4409         <secondary>server process</secondary>
4410
4411         <tertiary>when changing authorization checking</tertiary>
4412       </indexterm>
4413
4414       <indexterm>
4415         <primary>authorization checking</primary>
4416
4417         <secondary>and restarting processes</secondary>
4418       </indexterm>
4419     </sect2>
4420
4421     <sect2 id="HDRWQ125">
4422       <title>Controlling Authorization Checking on a Server Machine</title>
4423
4424       <para>Disabling authorization checking is a serious breach of security because it means that the AFS server processes on a
4425       file server machine performs any action for any user, even the <emphasis role="bold">anonymous</emphasis> user.</para>
4426
4427       <para>The only time it is common to disable authorization checking is when installing a new file server machine (see the IBM
4428       AFS Quick Beginnings). It is necessary then because it is not possible to configure all of the necessary security mechanisms
4429       before performing other actions that normally make use of them. For greatest security, work at the console of the machine you
4430       are installing and enable authorization checking as soon as possible.</para>
4431
4432       <para>During normal operation, the only reason to disable authorization checking is if an error occurs with the server
4433       encryption keys, leaving the servers unable to authenticate users properly. For instructions on handling key-related
4434       emergencies, see <link linkend="HDRWQ370">Handling Server Encryption Key Emergencies</link>.</para>
4435
4436       <para>You control authorization checking on each file server machine separately; turning it on or off on one machine does not
4437       affect the others. Because client machines generally choose a server process at random, it is hard to predict what
4438       authorization checking conditions prevail for a given command unless you make the requirement the same on all machines. To
4439       turn authorization checking on or off for the entire cell, you must repeat the appropriate command on every file server
4440       machine.</para>
4441
4442       <para>The server processes constantly monitor the directory <emphasis role="bold">/usr/afs/local</emphasis> on their local
4443       disks to determine if they need to check for authorization. If the file called <emphasis role="bold">NoAuth</emphasis> appears
4444       in that directory, then the servers do not check for authorization. When it is not present (the usual case), they perform
4445       authorization checking.</para>
4446
4447       <indexterm>
4448         <primary>bos commands</primary>
4449
4450         <secondary>setauth</secondary>
4451       </indexterm>
4452
4453       <indexterm>
4454         <primary>commands</primary>
4455
4456         <secondary>bos setauth</secondary>
4457       </indexterm>
4458
4459       <indexterm>
4460         <primary>authorization checking</primary>
4461
4462         <secondary>disabling</secondary>
4463       </indexterm>
4464
4465       <indexterm>
4466         <primary>turning off authorization checking</primary>
4467       </indexterm>
4468
4469       <indexterm>
4470         <primary>disabling</primary>
4471
4472         <secondary>authorization checking</secondary>
4473       </indexterm>
4474     </sect2>
4475
4476     <sect2 id="HDRWQ126">
4477       <title>To disable authorization checking on a server machine</title>
4478
4479       <orderedlist>
4480         <listitem>
4481           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
4482           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
4483           display the users in the UserList file</link>. <programlisting>
4484    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
4485 </programlisting></para>
4486         </listitem>
4487
4488         <listitem>
4489           <para>Issue the <emphasis role="bold">bos setauth</emphasis> command to disable authorization checking. <programlisting>
4490    % <emphasis role="bold">bos setauth</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">off</emphasis>
4491 </programlisting></para>
4492
4493           <para>where <variablelist>
4494               <varlistentry>
4495                 <term><emphasis role="bold">seta</emphasis></term>
4496
4497                 <listitem>
4498                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">setauth</emphasis>.</para>
4499                 </listitem>
4500               </varlistentry>
4501
4502               <varlistentry>
4503                 <term><emphasis role="bold">machine name</emphasis></term>
4504
4505                 <listitem>
4506                   <para>Specifies the file server machine on which server processes do not check for authorization.</para>
4507                 </listitem>
4508               </varlistentry>
4509             </variablelist></para>
4510         </listitem>
4511       </orderedlist>
4512
4513       <indexterm>
4514         <primary>authorization checking</primary>
4515
4516         <secondary>enabling</secondary>
4517       </indexterm>
4518
4519       <indexterm>
4520         <primary>enabling authorization checking</primary>
4521       </indexterm>
4522
4523       <indexterm>
4524         <primary>turning on authorization checking</primary>
4525       </indexterm>
4526     </sect2>
4527
4528     <sect2 id="HDRWQ127">
4529       <title>To enable authorization checking on a server machine</title>
4530
4531       <orderedlist>
4532         <listitem>
4533           <para>Reenable authorization checking. (No privilege is required because the machine is not currently checking for
4534           authorization.) For detailed syntax information, see the preceding section. <programlisting>
4535    % <emphasis role="bold">bos setauth</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">on</emphasis>
4536 </programlisting></para>
4537         </listitem>
4538       </orderedlist>
4539
4540       <indexterm>
4541         <primary>mutual authentication</primary>
4542
4543         <secondary>preventing</secondary>
4544       </indexterm>
4545
4546       <indexterm>
4547         <primary>preventing</primary>
4548
4549         <secondary>mutual authentication</secondary>
4550       </indexterm>
4551     </sect2>
4552
4553     <sect2 id="HDRWQ128">
4554       <title>Bypassing Mutual Authentication for an Individual Command</title>
4555
4556       <para>Several of the server processes allow any user (not just system administrators) to disable mutual authentication when
4557       issuing a command. The server process treats the issuer as the unauthenticated user <emphasis
4558       role="bold">anonymous</emphasis>.</para>
4559
4560       <para>The facilities for preventing mutual authentication are provided for use in emergencies (such as the key emergency
4561       discussed in <link linkend="HDRWQ370">Handling Server Encryption Key Emergencies</link>). During normal circumstances,
4562       authorization checking is turned on, making it useless to prevent authentication: the server processes refuse to perform
4563       privileged commands for the user <emphasis role="bold">anonymous</emphasis>.</para>
4564
4565       <para>It can be useful to prevent authentication when authorization checking is turned off. The very act of trying to
4566       authenticate can cause problems if the server cannot understand a particular encryption key, as is likely to happen in a key
4567       emergency.</para>
4568
4569       <indexterm>
4570         <primary>bos commands</primary>
4571
4572         <secondary>mutual authentication, bypassing</secondary>
4573       </indexterm>
4574
4575       <indexterm>
4576         <primary>kas commands</primary>
4577
4578         <secondary>mutual authentication, bypassing</secondary>
4579       </indexterm>
4580
4581       <indexterm>
4582         <primary>pts commands</primary>
4583
4584         <secondary>mutual authentication, bypassing</secondary>
4585       </indexterm>
4586
4587       <indexterm>
4588         <primary>vos commands</primary>
4589
4590         <secondary>mutual authentication, bypassing</secondary>
4591       </indexterm>
4592
4593       <indexterm>
4594         <primary>kas commands</primary>
4595
4596         <secondary>interactive</secondary>
4597       </indexterm>
4598
4599       <indexterm>
4600         <primary>commands</primary>
4601
4602         <secondary>kas interactive</secondary>
4603       </indexterm>
4604
4605       <indexterm>
4606         <primary>entering</primary>
4607
4608         <secondary>kas interactive mode</secondary>
4609       </indexterm>
4610
4611       <indexterm>
4612         <primary>interactive mode (kas commands)</primary>
4613       </indexterm>
4614     </sect2>
4615
4616     <sect2 id="HDRWQ129">
4617       <title>To bypass mutual authentication for bos, kas, pts, and vos commands</title>
4618
4619       <para>Provide the <emphasis role="bold">-noauth</emphasis> flag which is available on many of the commands in the suites. To
4620       verify that a command accepts the flag, issue the <emphasis role="bold">help</emphasis> command in its suite, or consult the
4621       command's reference page in the <emphasis>OpenAFS Administration Reference</emphasis> (the reference page also specifies the
4622       shortest acceptable abbreviation for the flag on each command). The suites' <emphasis role="bold">apropos</emphasis> and
4623       <emphasis role="bold">help</emphasis> commands do not themselves accept the flag.</para>
4624
4625       <para>You can bypass mutual authentication for all <emphasis role="bold">kas</emphasis> commands issued during an interactive
4626       session by including the <emphasis role="bold">-noauth</emphasis> flag on the <emphasis role="bold">kas interactive</emphasis>
4627       command. If you have already entered interactive mode with an authenticated identity, issue the <emphasis role="bold">(kas)
4628       noauthentication</emphasis> command to assume the <emphasis role="bold">anonymous</emphasis> identity.</para>
4629
4630       <indexterm>
4631         <primary>fs commands</primary>
4632
4633         <secondary>mutual authentication, bypassing</secondary>
4634       </indexterm>
4635     </sect2>
4636
4637     <sect2 id="Header_151">
4638       <title>To bypass mutual authentication for fs commands</title>
4639
4640       <para>This is not possible, except by issuing the <emphasis role="bold">unlog</emphasis> command to discard your tokens before
4641       issuing the <emphasis role="bold">fs</emphasis> command.</para>
4642     </sect2>
4643   </sect1>
4644
4645   <sect1 id="HDRWQ130">
4646     <title>Adding or Removing Disks and Partitions</title>
4647
4648     <para>AFS makes it very easy to add storage space to your cell, just by adding disks to existing file server machines. This
4649     section explains how to install or remove a disk used to store AFS volumes. (Another way to add storage space is to install
4650     additional server machines, as instructed in the <emphasis>OpenAFS Quick Beginnings</emphasis>.)</para>
4651
4652     <para>Both adding and removing a disk cause at least a brief file system outage, because you must restart the <emphasis
4653     role="bold">fs</emphasis> process to have it recognize the new set of server partitions. Some operating systems require that you
4654     shut the machine off before adding or removing a disk, in which case you must shut down all of the AFS server processes first.
4655     Otherwise, the AFS-related aspects of adding or removing a disk are not complicated, so the duration of the outage depends
4656     mostly on how long it takes to install or remove the disk itself.</para>
4657
4658     <para>The following instructions for installing a new disk completely prepare it to house AFS volumes. You can then use the
4659     <emphasis role="bold">vos create</emphasis> command to create new volumes, or the <emphasis role="bold">vos move</emphasis>
4660     command to move existing ones from other partitions. For instructions, see <link linkend="HDRWQ185">Creating Read/write
4661     Volumes</link> and <link linkend="HDRWQ226">Moving Volumes</link>. The instructions for removing a disk are basically the
4662     reverse of the installation instructions, but include extra steps that protect against data loss.</para>
4663
4664     <para>A server machines can house 256 AFS server partitions, each one mounted at a directory with a name of the form <emphasis
4665     role="bold">/vicep</emphasis><emphasis>index</emphasis>, where <emphasis>index</emphasis> is one or two lowercase letters. By
4666     convention, the first partition on a machine is mounted at <emphasis role="bold">/vicepa</emphasis>, the second at <emphasis
4667     role="bold">/vicepb</emphasis>, and so on to the twenty-sixth at <emphasis role="bold">/vicepz</emphasis>. Additional partitions
4668     are mounted at <emphasis role="bold">/vicepaa</emphasis> through <emphasis role="bold">/vicepaz</emphasis> and so on up to
4669     <emphasis role="bold">/vicepiu</emphasis>. Using the letters consecutively is not required, but is simpler.</para>
4670
4671     <para>Mount each <emphasis role="bold">/vicep</emphasis> directory directly under the local file system's root directory (
4672     <emphasis role="bold">/</emphasis> ), not as a subdirectory of any other directory; for example, <emphasis
4673     role="bold">/usr/vicepa</emphasis> is not an acceptable location. You must also map the directory to the partition's device name
4674     in the file server machine's file systems registry file (<emphasis role="bold">/etc/fstab</emphasis> or equivalent).</para>
4675
4676     <para>These instructions assume that the machine's AFS initialization file includes the following command to restart the BOS
4677     Server after each reboot. The BOS Server starts the other AFS server processes listed in the local <emphasis
4678     role="bold">/usr/afs/local/BosConfig</emphasis> file. For information on the <emphasis role="bold">bosserver</emphasis>
4679     command's optional arguments, see its reference page in the <emphasis>OpenAFS Administration Reference</emphasis>.</para>
4680
4681     <programlisting>
4682    /usr/afs/bin/bosserver
4683 </programlisting>
4684
4685     <indexterm>
4686       <primary>adding</primary>
4687
4688       <secondary>disk to file server machine</secondary>
4689     </indexterm>
4690
4691     <indexterm>
4692       <primary>installing</primary>
4693
4694       <secondary>disk on file server machine</secondary>
4695     </indexterm>
4696
4697     <indexterm>
4698       <primary>disk</primary>
4699
4700       <secondary>file server machine</secondary>
4701
4702       <tertiary>adding/installing</tertiary>
4703     </indexterm>
4704
4705     <indexterm>
4706       <primary>file server machine</primary>
4707
4708       <secondary>disk</secondary>
4709
4710       <tertiary>adding/installing</tertiary>
4711     </indexterm>
4712
4713     <indexterm>
4714       <primary>mounting</primary>
4715
4716       <secondary>disk on file server machine</secondary>
4717     </indexterm>
4718
4719     <indexterm>
4720       <primary>commands</primary>
4721
4722       <secondary>vos listpart</secondary>
4723     </indexterm>
4724
4725     <indexterm>
4726       <primary>vos commands</primary>
4727
4728       <secondary>listpart</secondary>
4729     </indexterm>
4730
4731     <sect2 id="HDRWQ131">
4732       <title>To add and mount a new disk to house AFS volumes</title>
4733
4734       <orderedlist>
4735         <listitem>
4736           <para>Become the local superuser <emphasis role="bold">root</emphasis> on the machine, if you are not already, by issuing
4737           the <emphasis role="bold">su</emphasis> command. <programlisting>
4738    % <emphasis role="bold">su root</emphasis>
4739    Password: <replaceable>root_password</replaceable>
4740 </programlisting></para>
4741         </listitem>
4742
4743         <listitem>
4744           <para>Decide how many AFS partitions to divide the new disk into and the names of the directories at which to mount them
4745           (the introduction to this section describes the naming conventions). To display the names of the existing server
4746           partitions on the machine, issue the <emphasis role="bold">vos listpart</emphasis> command. Include the <emphasis
4747           role="bold">-localauth</emphasis> flag because you are logged in as the local superuser <emphasis
4748           role="bold">root</emphasis> but do not necessarily have administrative tokens. <programlisting>
4749    # <emphasis role="bold">vos listpart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-localauth</emphasis>
4750 </programlisting></para>
4751
4752           <para>where <variablelist>
4753               <varlistentry>
4754                 <term><emphasis role="bold">listp</emphasis></term>
4755
4756                 <listitem>
4757                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">listpart</emphasis>.</para>
4758                 </listitem>
4759               </varlistentry>
4760
4761               <varlistentry>
4762                 <term><emphasis role="bold">machine name</emphasis></term>
4763
4764                 <listitem>
4765                   <para>Names the local file server machine.</para>
4766                 </listitem>
4767               </varlistentry>
4768
4769               <varlistentry>
4770                 <term><emphasis role="bold">-localauth</emphasis></term>
4771
4772                 <listitem>
4773                   <para>Constructs a server ticket using a key from the local <emphasis role="bold">/usr/afs/etc/KeyFile</emphasis>
4774                   file. The <emphasis role="bold">bos</emphasis> command interpreter presents it to the BOS Server during mutual
4775                   authentication.</para>
4776                 </listitem>
4777               </varlistentry>
4778             </variablelist></para>
4779         </listitem>
4780
4781         <listitem>
4782           <para>Create each directory at which to mount a partition. <programlisting>
4783    # <emphasis role="bold">mkdir /vicep</emphasis><replaceable>x</replaceable>[<replaceable>x</replaceable>]
4784 </programlisting></para>
4785
4786           <indexterm>
4787             <primary>files</primary>
4788
4789             <secondary>file systems registry (fstab)</secondary>
4790           </indexterm>
4791
4792           <indexterm>
4793             <primary>file systems registry file</primary>
4794
4795             <secondary>adding new disk to file server machine</secondary>
4796           </indexterm>
4797
4798           <indexterm>
4799             <primary>etc/fstab file</primary>
4800
4801             <secondary></secondary>
4802
4803             <see>file systems registry file</see>
4804           </indexterm>
4805
4806           <indexterm>
4807             <primary>fstab file</primary>
4808
4809             <secondary></secondary>
4810
4811             <see>file systems registry file</see>
4812           </indexterm>
4813         </listitem>
4814
4815         <listitem id="LIWQ132">
4816           <para>Using a text editor, create an entry in the machine's file systems registry file (<emphasis
4817           role="bold">/etc/fstab</emphasis> or equivalent) for each new disk partition, mapping its device name to the directory you
4818           created in the previous step. Refer to existing entries in the file to learn the proper format, which varies for different
4819           operating systems.</para>
4820         </listitem>
4821
4822         <listitem id="LIWQ133">
4823           <para>If the operating system requires that you shut off the machine to install a new disk, issue
4824           the <emphasis role="bold">bos shutdown</emphasis> command to shut down all AFS server processes other than the BOS Server
4825           (it terminates safely when you shut off the machine). Include the <emphasis role="bold">-localauth</emphasis> flag because
4826           you are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have administrative
4827           tokens. For a complete description of the command, see <link linkend="HDRWQ168">To stop processes temporarily</link>.
4828           <programlisting>
4829    # <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-localauth</emphasis> [<emphasis
4830                 role="bold">-wait</emphasis>]
4831 </programlisting></para>
4832         </listitem>
4833
4834         <listitem id="LIWQ134">
4835           <para>If necessary, shut off the machine. Install and format the new disk according to the
4836           instructions provided by the disk and operating system vendors. If necessary, edit the disk's partition table to reflect
4837           the changes you made to the files system registry file in step <link linkend="LIWQ132">4</link>; consult the operating
4838           system documentation for instructions.</para>
4839         </listitem>
4840
4841         <listitem>
4842           <para>If you shut off the machine down in step <link linkend="LIWQ134">6</link>, turn it on. Otherwise, issue the
4843           <emphasis role="bold">bos restart</emphasis> command to restart the <emphasis role="bold">fs</emphasis> process, forcing
4844           it to recognize the new set of server partitions. Include the <emphasis role="bold">-localauth</emphasis> flag because you
4845           are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have administrative
4846           tokens. For complete instructions for the <emphasis role="bold">bos restart</emphasis> command, see <link
4847           linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>. <programlisting>
4848    # <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt;  <emphasis role="bold">fs -localauth</emphasis>
4849 </programlisting></para>
4850         </listitem>
4851
4852         <listitem>
4853           <para>Issue the <emphasis role="bold">bos status</emphasis> command to verify that all server processes are running
4854           correctly. For more detailed instructions, see <link linkend="HDRWQ158">Displaying Process Status and Information from the
4855           BosConfig File</link>. <programlisting>
4856    # <emphasis role="bold">bos status</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
4857 </programlisting></para>
4858         </listitem>
4859       </orderedlist>
4860
4861       <indexterm>
4862         <primary>removing</primary>
4863
4864         <secondary>disk from file server machine</secondary>
4865       </indexterm>
4866
4867       <indexterm>
4868         <primary>disk</primary>
4869
4870         <secondary>file server machine</secondary>
4871
4872         <tertiary>removing</tertiary>
4873       </indexterm>
4874
4875       <indexterm>
4876         <primary>file server machine</primary>
4877
4878         <secondary>disk</secondary>
4879
4880         <tertiary>removing</tertiary>
4881       </indexterm>
4882
4883       <indexterm>
4884         <primary>unmounting</primary>
4885
4886         <secondary>file server machine disk</secondary>
4887       </indexterm>
4888
4889       <indexterm>
4890         <primary>vos commands</primary>
4891
4892         <secondary>move</secondary>
4893
4894         <tertiary>when removing file server machine disk</tertiary>
4895       </indexterm>
4896     </sect2>
4897
4898     <sect2 id="HDRWQ135">
4899       <title>To unmount and remove a disk housing AFS volumes</title>
4900
4901       <orderedlist>
4902         <listitem>
4903           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
4904           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
4905           display the users in the UserList file</link>. <programlisting>
4906    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
4907 </programlisting></para>
4908         </listitem>
4909
4910         <listitem>
4911           <para>Issue the <emphasis role="bold">vos listvol</emphasis> command to list the volumes housed on each partition of each
4912           disk you are about to remove, in preparation for removing them or moving them to other partitions. For detailed
4913           instructions, see <link linkend="HDRWQ219">Displaying Volume Headers</link>. <programlisting>
4914    % <emphasis role="bold">vos listvol</emphasis> &lt;<replaceable>machine name</replaceable>&gt; [&lt;<replaceable>partition name</replaceable>&gt;]
4915 </programlisting></para>
4916         </listitem>
4917
4918         <listitem>
4919           <para>Move any volume you wish to retain in the file system to another partition. You can move only read/write volumes.
4920           For more detailed instructions, and for instructions on moving read-only and backup volumes, see <link
4921           linkend="HDRWQ226">Moving Volumes</link>. <programlisting>
4922    % <emphasis role="bold">vos move</emphasis>  &lt;<replaceable>volume name or ID</replaceable>&gt;  \
4923         &lt;<replaceable>machine name on source</replaceable>&gt; &lt;<replaceable>partition name on source</replaceable>&gt;  \
4924         &lt;<replaceable>machine name on destination</replaceable>&gt; &lt;<replaceable>partition name on destination</replaceable>&gt;
4925 </programlisting></para>
4926         </listitem>
4927
4928         <listitem>
4929           <para><emphasis role="bold">(Optional)</emphasis> If there are any volumes you do not wish to retain, back them up using
4930           the <emphasis role="bold">vos dump</emphasis> command or the AFS Backup System. See <link linkend="HDRWQ240">Dumping and
4931           Restoring Volumes</link> or <link linkend="HDRWQ296">Backing Up Data</link>, respectively.</para>
4932         </listitem>
4933
4934         <listitem>
4935           <para>Become the local superuser <emphasis role="bold">root</emphasis> on the machine, if you are not already, by issuing
4936           the <emphasis role="bold">su</emphasis> command. <programlisting>
4937    % <emphasis role="bold">su root</emphasis>
4938    Password: <replaceable>root_password</replaceable>
4939 </programlisting></para>
4940
4941           <indexterm>
4942             <primary>umount command</primary>
4943           </indexterm>
4944
4945           <indexterm>
4946             <primary>commands</primary>
4947
4948             <secondary>umount</secondary>
4949           </indexterm>
4950         </listitem>
4951
4952         <listitem>
4953           <para>Issue the <emphasis role="bold">umount</emphasis> command, repeating it for each partition on the disk to be
4954           removed. <programlisting>
4955    # <emphasis role="bold">cd /</emphasis>
4956    # <emphasis role="bold">umount /dev/</emphasis>&lt;<replaceable>partition_block_device_name</replaceable>&gt;
4957 </programlisting></para>
4958
4959           <indexterm>
4960             <primary>file systems registry file</primary>
4961
4962             <secondary>removing disk from file server machine</secondary>
4963           </indexterm>
4964         </listitem>
4965
4966         <listitem id="LIWQ136">
4967           <para>Using a text editor, remove or comment out each partition's entry from the machine's file
4968           systems registry file (<emphasis role="bold">/etc/fstab</emphasis> or equivalent).</para>
4969         </listitem>
4970
4971         <listitem>
4972           <para>Remove the <emphasis role="bold">/vicep</emphasis> directory associated with each partition. <programlisting>
4973    # <emphasis role="bold">rmdir /vicep</emphasis>xx
4974 </programlisting></para>
4975         </listitem>
4976
4977         <listitem>
4978           <para>If the operating system requires that you shut off the machine to remove a disk, issue the <emphasis role="bold">bos
4979           shutdown</emphasis> command to shut down all AFS server processes other than the BOS Server (it terminates safely when you
4980           shut off the machine). Include the <emphasis role="bold">-localauth</emphasis> flag because you are logged in as the local
4981           superuser <emphasis role="bold">root</emphasis> but do not necessarily have administrative tokens. For a complete
4982           description of the command, see <link linkend="HDRWQ168">To stop processes temporarily</link>. <programlisting>
4983    # <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-localauth</emphasis> [<emphasis
4984                 role="bold">-wait</emphasis>]
4985 </programlisting></para>
4986         </listitem>
4987
4988         <listitem id="LIWQ137">
4989           <para>If necessary, shut off the machine. Remove the disk according to the instructions provided by
4990           the disk and operating system vendors. If necessary, edit the disk's partition table to reflect the changes you made to
4991           the files system registry file in step <link linkend="LIWQ136">7</link>; consult the operating system documentation for
4992           instructions.</para>
4993         </listitem>
4994
4995         <listitem>
4996           <para>If you shut off the machine down in step <link linkend="LIWQ137">10</link>, turn it on. Otherwise, issue the
4997           <emphasis role="bold">bos restart</emphasis> command to restart the <emphasis role="bold">fs</emphasis> process, forcing
4998           it to recognize the new set of server partitions. Include the <emphasis role="bold">-localauth</emphasis> flag because you
4999           are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have administrative
5000           tokens. For complete instructions for the <emphasis role="bold">bos restart</emphasis> command, see <link
5001           linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>. <programlisting>
5002    # <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt;  <emphasis role="bold">fs -localauth</emphasis>
5003 </programlisting></para>
5004         </listitem>
5005
5006         <listitem>
5007           <para>Issue the <emphasis role="bold">bos status</emphasis> command to verify that all server processes are running
5008           correctly. For more detailed instructions, see <link linkend="HDRWQ158">Displaying Process Status and Information from the
5009           BosConfig File</link>. <programlisting>
5010    # <emphasis role="bold">bos status</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
5011 </programlisting></para>
5012         </listitem>
5013       </orderedlist>
5014
5015       <indexterm>
5016         <primary>File Server</primary>
5017
5018         <secondary>use of NetInfo file</secondary>
5019       </indexterm>
5020
5021       <indexterm>
5022         <primary>File Server</primary>
5023
5024         <secondary>use of NetRestrict file</secondary>
5025       </indexterm>
5026
5027       <indexterm>
5028         <primary>File Server</primary>
5029
5030         <secondary>use of sysid file</secondary>
5031       </indexterm>
5032
5033       <indexterm>
5034         <primary>Ubik</primary>
5035
5036         <secondary>use of NetInfo and NetRestrict files</secondary>
5037       </indexterm>
5038
5039       <indexterm>
5040         <primary>database server machine</primary>
5041
5042         <secondary>use of NetInfo and NetRestrict files</secondary>
5043       </indexterm>
5044
5045       <indexterm>
5046         <primary>File Server</primary>
5047
5048         <secondary>interfaces registered in VLDB server entry</secondary>
5049       </indexterm>
5050
5051       <indexterm>
5052         <primary>setting</primary>
5053
5054         <secondary>server machine interfaces registered in VLDB</secondary>
5055       </indexterm>
5056
5057       <indexterm>
5058         <primary>controlling</primary>
5059
5060         <secondary>server machine interfaces registered in VLDB</secondary>
5061       </indexterm>
5062
5063       <indexterm>
5064         <primary>displaying</primary>
5065
5066         <secondary>server entries from VLDB</secondary>
5067       </indexterm>
5068
5069       <indexterm>
5070         <primary>displaying</primary>
5071
5072         <secondary>VLDB server entries</secondary>
5073       </indexterm>
5074
5075       <indexterm>
5076         <primary>server entry in VLDB</primary>
5077       </indexterm>
5078     </sect2>
5079   </sect1>
5080
5081   <sect1 id="HDRWQ138">
5082     <title>Managing Server IP Addresses and VLDB Server Entries</title>
5083
5084     <para>The AFS support for multihomed file server machines is largely automatic. The File Server process records the IP addresses
5085     of its file server machine's network interfaces in the local <emphasis role="bold">/usr/afs/local/sysid</emphasis> file and also
5086     registers them in a <emphasis>server entry</emphasis> in the Volume Location Database (VLDB). The <emphasis
5087     role="bold">sysid</emphasis> file and server entry are identified by the same unique number, which creates an association
5088     between them.</para>
5089
5090     <para>When the Cache Manager requests volume location information, the Volume Location (VL) Server provides all of the
5091     interfaces registered for each server machine that houses the volume. This enables the Cache Manager to make use of multiple
5092     addresses when accessing AFS data stored on a multihomed file server machine.</para>
5093
5094     <para>If you wish, you can control which interfaces the File Server registers in its VLDB server entry by creating two files in
5095     the local <emphasis role="bold">/usr/afs/local</emphasis> directory: <emphasis role="bold">NetInfo</emphasis> and <emphasis
5096     role="bold">NetRestrict</emphasis>. Each time the File Server restarts, it builds a list of the local machine's interfaces by
5097     reading the <emphasis role="bold">NetInfo</emphasis> file, if it exists. If you do not create the file, the File Server uses the
5098     list of network interfaces configured with the operating system. It then removes from the list any addresses that appear in the
5099     <emphasis role="bold">NetRestrict</emphasis> file, if it exists. The File Server records the resulting list in the <emphasis
5100     role="bold">sysid</emphasis> file and registers the interfaces in the VLDB server entry that has the same unique
5101     identifier.</para>
5102
5103     <para>On database server machines, the <emphasis role="bold">NetInfo</emphasis> and <emphasis role="bold">NetRestrict</emphasis>
5104     files also determine which interfaces the Ubik database synchronization library uses when communicating with the database server
5105     processes running on other database server machines.</para>
5106
5107     <para>There is a maximum number of IP addresses in each server entry, as documented in the <emphasis>OpenAFS Release
5108     Notes</emphasis>. If a multihomed file server machine has more interfaces than the maximum, AFS simply ignores the excess ones.
5109     It is probably appropriate for such machines to use the <emphasis role="bold">NetInfo</emphasis> and <emphasis
5110     role="bold">NetRestrict</emphasis> files to control which interfaces are registered.</para>
5111
5112     <para>If for some reason the <emphasis role="bold">sysid</emphasis> file no longer exists, the File Server creates a new one
5113     with a new unique identifier. When the File Server registers the contents of the new file, the Volume Location (VL) Server
5114     normally recognizes automatically that the new file corresponds to an existing server entry, and overwrites the existing server
5115     entry with the new file contents and identifier. However, it is best not to remove the <emphasis role="bold">sysid</emphasis>
5116     file if that can be avoided.</para>
5117
5118     <para>Similarly, it is important not to copy the <emphasis role="bold">sysid</emphasis> file from one file server machine to
5119     another. If you commonly copy the contents of the <emphasis role="bold">/usr/afs</emphasis> directory from an existing machine
5120     as part of installing a new file server machine, be sure to remove the <emphasis role="bold">sysid</emphasis> file from the
5121     <emphasis role="bold">/usr/afs/local</emphasis> directory on the new machine before starting the File Server.</para>
5122
5123     <para>There are certain cases where the VL Server cannot determine whether it is appropriate to overwrite an existing server
5124     entry with a new <emphasis role="bold">sysid</emphasis> file's contents and identifier. It then refuses to allow the File Server
5125     to register the interfaces, which prevents the File Server from starting. This can happen if, for example, a new <emphasis
5126     role="bold">sysid</emphasis> file includes two interfaces that currently are registered by themselves in separate server
5127     entries. In such cases, error messages in the <emphasis role="bold">/usr/afs/log/VLLog</emphasis> file on the VL Server machine
5128     and in the <emphasis role="bold">/usr/afs/log/FileLog</emphasis> file on the file server machine indicate that you need to use
5129     the <emphasis role="bold">vos changeaddr</emphasis> command to resolve the problem. Contact the AFS Product Support group for
5130     instructions and assistance.</para>
5131
5132     <para>Except in this type of rare error case, the only appropriate use of the <emphasis role="bold">vos changeaddr</emphasis>
5133     command is to remove a VLDB server entry completely when you remove a file server machine from service. The VLDB can accommodate
5134     a maximum number of server entries, as specified in the <emphasis>OpenAFS Release Notes</emphasis>. Removing obsolete entries
5135     makes it possible to allocate server entries for new file server machines as required. See the instructions that follow.</para>
5136
5137     <para>Do not use the <emphasis role="bold">vos changeaddr</emphasis> command to change the list of interfaces registered in a
5138     VLDB server entry. To change a file server machine's IP addresses and server entry, see the instructions that follow.</para>
5139
5140     <indexterm>
5141       <primary>NetInfo file (server version)</primary>
5142
5143       <secondary>creating/editing</secondary>
5144     </indexterm>
5145
5146     <indexterm>
5147       <primary>creating</primary>
5148
5149       <secondary>NetInfo file (server version)</secondary>
5150     </indexterm>
5151
5152     <indexterm>
5153       <primary>editing</primary>
5154
5155       <secondary>NetInfo file (server version)</secondary>
5156     </indexterm>
5157
5158     <sect2 id="Header_156">
5159       <title>To create or edit the server NetInfo file</title>
5160
5161       <orderedlist>
5162         <listitem>
5163           <para>Become the local superuser <emphasis role="bold">root</emphasis> on the machine, if you are not already, by issuing
5164           the <emphasis role="bold">su</emphasis> command. <programlisting>
5165    % <emphasis role="bold">su root</emphasis>
5166    Password: <replaceable>root_password</replaceable>
5167 </programlisting></para>
5168         </listitem>
5169
5170         <listitem>
5171           <para>Using a text editor, open the <emphasis role="bold">/usr/afs/local/NetInfo</emphasis> file. Place one IP address in
5172           dotted decimal format (for example, <computeroutput>192.12.107.33</computeroutput>) on each line. The order of entries is
5173           not significant.</para>
5174         </listitem>
5175
5176         <listitem>
5177           <para>If you want the File Server to start using the revised list immediately, use the <emphasis role="bold">bos
5178           restart</emphasis> command to restart the <emphasis role="bold">fs</emphasis> process. For instructions, see <link
5179           linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.</para>
5180         </listitem>
5181       </orderedlist>
5182
5183       <indexterm>
5184         <primary>NetRestrict file (server version)</primary>
5185
5186         <secondary>creating/editing</secondary>
5187       </indexterm>
5188
5189       <indexterm>
5190         <primary>creating</primary>
5191
5192         <secondary>NetRestrict file (server version)</secondary>
5193       </indexterm>
5194
5195       <indexterm>
5196         <primary>editing</primary>
5197
5198         <secondary>NetRestrict file (server version)</secondary>
5199       </indexterm>
5200     </sect2>
5201
5202     <sect2 id="Header_157">
5203       <title>To create or edit the server NetRestrict file</title>
5204
5205       <orderedlist>
5206         <listitem>
5207           <para>Become the local superuser <emphasis role="bold">root</emphasis> on the machine, if you are not already, by issuing
5208           the <emphasis role="bold">su</emphasis> command. <programlisting>
5209    % <emphasis role="bold">su root</emphasis>
5210    Password: <replaceable>root_password</replaceable>
5211 </programlisting></para>
5212         </listitem>
5213
5214         <listitem>
5215           <para>Using a text editor, open the <emphasis role="bold">/usr/afs/local/NetRestrict</emphasis> file. Place one IP address
5216           in dotted decimal format on each line. The order of the addresses is not significant. Use a slash (<emphasis
5217           role="bold">/</emphasis>) followed by a subnet length to represent all possible addresses in a range. For example, the entry
5218           <computeroutput>192.12.105.0/24</computeroutput> indicates that the Cache Manager does not register any of the addresses in
5219           the 192.12.105 subnet.</para>
5220         </listitem>
5221
5222         <listitem>
5223           <para>If you want the File Server to start using the revised list immediately, use the <emphasis role="bold">bos
5224           restart</emphasis> command to restart the <emphasis role="bold">fs</emphasis> process. For instructions, see <link
5225           linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.</para>
5226         </listitem>
5227       </orderedlist>
5228
5229       <indexterm>
5230         <primary>vos commands</primary>
5231
5232         <secondary>listaddrs</secondary>
5233       </indexterm>
5234
5235       <indexterm>
5236         <primary>commands</primary>
5237
5238         <secondary>vos listaddrs</secondary>
5239       </indexterm>
5240     </sect2>
5241
5242     <sect2 id="Header_158">
5243       <title>To display all server entries from the VLDB</title>
5244
5245       <orderedlist>
5246         <listitem>
5247           <para>Issue the <emphasis role="bold">vos listaddrs</emphasis> command to display all server entries from the VLDB.
5248           <programlisting>
5249    % <emphasis role="bold">vos listaddrs</emphasis>
5250 </programlisting></para>
5251
5252           <para>where <emphasis role="bold">lista</emphasis> is the shortest acceptable abbreviation of <emphasis
5253           role="bold">listaddrs</emphasis>.</para>
5254
5255           <para>The output displays all server entries from the VLDB, each on its own line. If a file server machine is multihomed,
5256           all of its registered addresses appear on the line. The first one is the one reported as a volume's site in the output
5257           from the <emphasis role="bold">vos examine</emphasis> and <emphasis role="bold">vos listvldb</emphasis> commands.</para>
5258
5259           <para>VLDB server entries record IP addresses, and the command interpreter has the local name service (either a process
5260           like the Domain Name Service or a local host table) translate them to hostnames before displaying them. If an IP address
5261           appears in the output, it is not possible to translate it.</para>
5262
5263           <para>The existence of an entry does not necessarily indicate that the machine that is still an active file server
5264           machine. To remove obsolete server entries, see the following instructions.</para>
5265         </listitem>
5266       </orderedlist>
5267
5268       <indexterm>
5269         <primary>vos commands</primary>
5270
5271         <secondary>changeaddr</secondary>
5272       </indexterm>
5273
5274       <indexterm>
5275         <primary>commands</primary>
5276
5277         <secondary>vos changeaddr</secondary>
5278       </indexterm>
5279     </sect2>
5280
5281     <sect2 id="Header_159">
5282       <title>To remove obsolete server entries from the VLDB</title>
5283
5284       <orderedlist>
5285         <listitem>
5286           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
5287           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
5288           display the users in the UserList file</link>. <programlisting>
5289    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
5290 </programlisting></para>
5291         </listitem>
5292
5293         <listitem>
5294           <para>Issue the <emphasis role="bold">vos changeaddr</emphasis> command to remove a server entry from the VLDB.
5295           <programlisting>
5296    % <emphasis role="bold">vos changeaddr</emphasis> &lt;<replaceable>original IP address</replaceable>&gt; <emphasis role="bold">-remove</emphasis>
5297 </programlisting></para>
5298
5299           <para>where <variablelist>
5300               <varlistentry>
5301                 <term><emphasis role="bold">ch</emphasis></term>
5302
5303                 <listitem>
5304                   <para>Is the shortest acceptable abbreviation of <emphasis role="bold">changeaddr</emphasis>.</para>
5305                 </listitem>
5306               </varlistentry>
5307
5308               <varlistentry>
5309                 <term><emphasis role="bold">original IP address</emphasis></term>
5310
5311                 <listitem>
5312                   <para>Specifies one of the IP addresses currently registered for the file server machine in the VLDB. Any of a
5313                   multihomed file server machine's addresses are acceptable to identify it.</para>
5314                 </listitem>
5315               </varlistentry>
5316
5317               <varlistentry>
5318                 <term><emphasis role="bold">-remove</emphasis></term>
5319
5320                 <listitem>
5321                   <para>Removes the server entry.</para>
5322                 </listitem>
5323               </varlistentry>
5324             </variablelist></para>
5325         </listitem>
5326       </orderedlist>
5327     </sect2>
5328
5329     <sect2 id="Header_160">
5330       <title>To change a server machine's IP addresses</title>
5331
5332       <orderedlist>
5333         <listitem>
5334           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file. If necessary, issue
5335           the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in <link linkend="HDRWQ593">To
5336           display the users in the UserList file</link>. <programlisting>
5337    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
5338 </programlisting></para>
5339         </listitem>
5340
5341         <listitem>
5342           <para>If the machine is the system control machine or a binary distribution machine, and you are also changing its
5343           hostname, redefine all relevant <emphasis role="bold">upclient</emphasis> processes on other server machines to refer to
5344           the new hostname. Use the <emphasis role="bold">bos delete</emphasis> and <emphasis role="bold">bos create</emphasis>
5345           commands as instructed in <link linkend="HDRWQ161">Creating and Removing Processes</link>.</para>
5346         </listitem>
5347
5348         <listitem>
5349           <para>If the machine is a database server machine, edit its entry in the <emphasis
5350           role="bold">/usr/afs/etc/CellServDB</emphasis> file on every server machine in the cell to list one of the new IP
5351           addresses. You can edit the file on the system control machine and wait the
5352           required time (by default, five minutes) for the Update Server to distribute the changed file to all server
5353           machines.</para>
5354         </listitem>
5355
5356         <listitem>
5357           <para>If the machine is a database server machine, issue the <emphasis role="bold">bos shutdown</emphasis> command to stop
5358           all server processes. If the machine is also a file server, the volumes on it are inaccessible during this time. For a
5359           complete description of the command, see <link linkend="HDRWQ168">To stop processes temporarily</link>. <programlisting>
5360    % <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
5361 </programlisting></para>
5362         </listitem>
5363
5364         <listitem>
5365           <para>Use the utilities provided with the operating system to change one or more of the machine's IP addresses.</para>
5366         </listitem>
5367
5368         <listitem>
5369           <para>If appropriate, edit the <emphasis role="bold">/usr/afs/local/NetInfo</emphasis> file, the <emphasis
5370           role="bold">/usr/afs/local/NetRestrict</emphasis> file, or both, to reflect the changed addresses. Instructions appear
5371           earlier in this section.</para>
5372         </listitem>
5373
5374         <listitem>
5375           <para>If the machine is a database server machine, issue the <emphasis role="bold">bos restart</emphasis> command to
5376           restart all server processes on the machine. For complete instructions for the <emphasis role="bold">bos
5377           restart</emphasis> command, see <link linkend="HDRWQ170">Stopping and Immediately Restarting Processes</link>.
5378           <programlisting>
5379    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-all</emphasis>
5380 </programlisting></para>
5381
5382           <para>At the same time, issue the <emphasis role="bold">bos restart</emphasis> command on all other database server
5383           machines in the cell to restart the database server processes only (the Authentication, Backup, Protection, and Volume
5384           Location Servers). Issue the commands in quick succession so that all of the database server processes vote in the quorum
5385           election.</para>
5386
5387           <programlisting>
5388    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">kaserver buserver ptserver vlserver</emphasis>
5389 </programlisting>
5390
5391           <para>If you are changing IP addresses on every database server machine in the cell, you must also issue the <emphasis
5392           role="bold">bos restart</emphasis> command on every file server machine in the cell to restart the <emphasis
5393           role="bold">fs</emphasis> process.</para>
5394         </listitem>
5395
5396         <listitem>
5397           <para>If the machine is not a database server machine, issue the <emphasis role="bold">bos restart</emphasis> command to
5398           restart the <emphasis role="bold">fs</emphasis> process (if the machine is a database server, you already restarted the
5399           process in the previous step). The File Server automatically compiles a new list of interfaces, records them in the
5400           <emphasis role="bold">/usr/afs/local/sysid</emphasis> file, and registers them in its VLDB server entry. <programlisting>
5401    % <emphasis role="bold">bos restart</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">fs</emphasis>
5402 </programlisting></para>
5403         </listitem>
5404
5405         <listitem>
5406           <para>If the machine is a database server machine, edit its entry in the <emphasis
5407           role="bold">/usr/vice/etc/CellServDB</emphasis> file on every client machine in the cell to list one of the new IP
5408           addresses. Instructions appear in <link linkend="HDRWQ406">Maintaining Knowledge of Database Server
5409           Machines</link>.</para>
5410         </listitem>
5411
5412         <listitem>
5413           <para>If there are machine entries in the Protection Database for the machine's previous IP addresses, use the <emphasis
5414           role="bold">pts rename</emphasis> command to change them to the new addresses. For instructions, see <link
5415           linkend="HDRWQ556">Changing a Protection Database Entry's Name</link>.</para>
5416         </listitem>
5417       </orderedlist>
5418
5419       <indexterm>
5420         <primary>rebooting</primary>
5421
5422         <secondary>server machine, instructions</secondary>
5423       </indexterm>
5424
5425       <indexterm>
5426         <primary>server machine</primary>
5427
5428         <secondary>rebooting</secondary>
5429       </indexterm>
5430
5431       <indexterm>
5432         <primary>BOS Server</primary>
5433
5434         <secondary>role in reboot of server machine</secondary>
5435       </indexterm>
5436     </sect2>
5437   </sect1>
5438
5439   <sect1 id="HDRWQ139">
5440     <title>Rebooting a Server Machine</title>
5441
5442     <para>You can reboot a server machine either by typing the appropriate commands at its console or by issuing the <emphasis
5443     role="bold">bos exec</emphasis> command on a remote machine. Remote rebooting can be more convenient, because you do not need to
5444     leave your present location, but you cannot track the progress of the reboot as you can at the console. Remote rebooting is
5445     possible because the server machine's operating system recognizes the BOS Server, which executes the <emphasis role="bold">bos
5446     exec</emphasis> command, as the local superuser <emphasis role="bold">root</emphasis>.</para>
5447
5448     <para>Rebooting server machines is part of routine maintenance in some cells, and some instructions in the AFS documentation
5449     include it as a step. It is certainly not intended to be the standard method for recovering from AFS-related problems, however,
5450     but only a last resort when the machine is unresponsive and you have tried all other reasonable options.</para>
5451
5452     <para>Rebooting causes a service outage. If the machine stores volumes, they are all inaccessible until the reboot completes and
5453     the File Server reattaches them. If the machine is a database server machine, information from the databases can become
5454     unavailable during the reelection of the synchronization site for each database server process; the VL Server outage generally
5455     has the greatest impact, because the Cache Manager must be able to access the VLDB to fetch AFS data.</para>
5456
5457     <para>By convention, a server machine's AFS initialization file includes the following command to restart the BOS Server after
5458     each reboot. It starts the other AFS server processes listed in the local <emphasis
5459     role="bold">/usr/afs/local/BosConfig</emphasis> file. These instructions assume that the initialization file includes the
5460     command.</para>
5461
5462     <programlisting>
5463    /usr/afs/bin/bosserver
5464 </programlisting>
5465
5466     <sect2 id="HDRWQ140">
5467       <title>To reboot a file server machine from its console</title>
5468
5469       <orderedlist>
5470         <listitem>
5471           <para>Become the local superuser <emphasis role="bold">root</emphasis> on the machine, if you are not already, by issuing
5472           the <emphasis role="bold">su</emphasis> command. <programlisting>
5473    % <emphasis role="bold">su root</emphasis>
5474    Password: <replaceable>root_password</replaceable>
5475 </programlisting></para>
5476         </listitem>
5477
5478         <listitem>
5479           <para>Issue the <emphasis role="bold">bos shutdown</emphasis> command to shut down all AFS server processes other than the
5480           BOS Server, which terminates safely when you reboot the machine. Include the <emphasis role="bold">-localauth</emphasis>
5481           flag because you are logged in as the local superuser <emphasis role="bold">root</emphasis> but do not necessarily have
5482           administrative tokens. For a complete description of the command, see <link linkend="HDRWQ168">To stop processes
5483           temporarily</link>. <programlisting>
5484    # <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt; <emphasis role="bold">-localauth</emphasis> [<emphasis
5485                 role="bold">-wait</emphasis>]
5486 </programlisting></para>
5487         </listitem>
5488
5489         <listitem>
5490           <para>Reboot the machine. On many system types, the appropriate command is <emphasis role="bold">shutdown</emphasis>, but
5491           the appropriate options vary; consult your UNIX administrator's guide. <programlisting>
5492     # <emphasis role="bold">shutdown</emphasis>
5493 </programlisting></para>
5494         </listitem>
5495       </orderedlist>
5496
5497       <indexterm>
5498         <primary>commands</primary>
5499
5500         <secondary>bos exec</secondary>
5501       </indexterm>
5502
5503       <indexterm>
5504         <primary>bos commands</primary>
5505
5506         <secondary>exec</secondary>
5507       </indexterm>
5508     </sect2>
5509
5510     <sect2 id="HDRWQ141">
5511       <title>To reboot a file server machine remotely</title>
5512
5513       <orderedlist>
5514         <listitem>
5515           <para>Verify that you are listed in the <emphasis role="bold">/usr/afs/etc/UserList</emphasis> file on the machine you are
5516           rebooting. If necessary, issue the <emphasis role="bold">bos listusers</emphasis> command, which is fully described in
5517           <link linkend="HDRWQ593">To display the users in the UserList file</link>. <programlisting>
5518    % <emphasis role="bold">bos listusers</emphasis> &lt;<replaceable>machine name</replaceable>&gt;
5519 </programlisting></para>
5520         </listitem>
5521
5522         <listitem>
5523           <para>Issue the <emphasis role="bold">bos shutdown</emphasis> to halt AFS server processes other than the BOS Server,
5524           which terminates safely when you turn off the machine. For a complete description of the command, see <link
5525           linkend="HDRWQ168">To stop processes temporarily</link>. <programlisting>
5526    % <emphasis role="bold">bos shutdown</emphasis> &lt;<replaceable>machine name</replaceable>&gt;  [<emphasis role="bold">-wait</emphasis>]
5527 </programlisting></para>
5528         </listitem>
5529
5530         <listitem>
5531           <para>Issue the <emphasis role="bold">bos exec</emphasis> command to reboot the machine remotely. <programlisting>
5532    % <emphasis role="bold">bos exec</emphasis> &lt;<replaceable>machine name</replaceable>&gt; reboot_command
5533 </programlisting></para>
5534
5535           <para>where <variablelist>
5536               <varlistentry>
5537                 <term><emphasis role="bold">machine name</emphasis></term>
5538
5539                 <listitem>
5540                   <para>Names the file server machine to reboot.</para>
5541                 </listitem>
5542               </varlistentry>
5543
5544               <varlistentry>
5545                 <term><emphasis role="bold">reboot_command</emphasis></term>
5546
5547                 <listitem>
5548                   <para>Is the rebooting command for the machine's operating system. The <emphasis role="bold">shutdown</emphasis>
5549                   command is appropriate on many system types, but consult your operating system documentation.</para>
5550                 </listitem>
5551               </varlistentry>
5552             </variablelist></para>
5553         </listitem>
5554       </orderedlist>
5555     </sect2>
5556   </sect1>
5557 </chapter>