GAZ / WZ  vom 06.08.2005

Totalausfall

zurück

Merkwürdige Probleme mit Servern unter Windows2000 und Windows2003 haben bisher etliche Administratoren fast zur Verzweiflung gebracht.

Erste Merkwürdigkeiten tauchten am 27. Juli auf, die sich in unterschiedlichen Fehlermeldungen darstellten. Die Probleme zeigen sich allesamt nach einem geplanten oder auch ungeplantem Neustart der Server.
Entweder die Exchangedienste versagten, Managementsoftware im Netz startete nicht mehr und ein anmelden am Server selbst dauerte an der lokalen Konsole oft bis zu 3 Stunden.
Etliche Maschinen fuhren sogar nicht mehr im abgesicherten Modus hoch um Reparaturen vorzunehmen zu können. Die offensichtlich angezeigten Fehler
haben dazu beigetragen, an einer völlig falschen Stelle zu suchen.

Da zu erwarten ist dass längst nicht alle Administratoren ihre Server neu gestartet haben und auch dies wegen der Urlaubszeit wohl eher dem Stammpersonal obliegt, wird eine neue Welle von Hilferufen sicher in den nächsten Wochen auftauchen.
Als gemeinsame Ursache stellte sich letztendlich heraus, die vom Hersteller APC eingesetzte Stromversorgung »USV«, respektive die der Software beiliegenden Treiber verursachten das Problem. 
Der Hintergrund dabei ist der Umstand, dass APC die Javaruntimeumgebung »JRE« von Sun nutzt, deren Zertifikat, Lizensierung eben genau an dem Tag abgelaufen war. Durch den Start einer betroffenen Maschine erst wurde dieses nicht mehr gültige Zertifikat erkannt und die Dienste blockierten das ordentliche Hochfahren der Server, angefangen von NT4 bis zum modernen Windows2003.

Die beiden fehlerhaften Dienste der Powerchute Business Edition Version 6.xx
bleiben hängen und starten nicht. Diese lauten »ACP PBE Agent« und 
»ACP PBE Server« und verursachen diese Probleme.
Ist das Kind schon in den Brunnen gefallen, hilft nur ein hartes »abschießen«
der Dienste, oder den Starttyp in der Registrierung auf den Wert 4, deaktiviert zu setzen.
Bei Servern auf denen Exchange oder SQL ebenfalls läuft empfiehlt es sich nicht, der Anweisung bei APC zu folgen und den Powerschalter zu betätigen um die Server herunterzufahren, was bei den hängenden Diensten passieren wird.
Statt dessen lieber die beiden Dienste mittels »pskill« oder »taskkill« zu beenden. Der Server wird danach normal hochfahren und die fehlerhafte Software sollte umgehend deinstalliert werden. Es  ist wichtig - die alte Software zu deinstallieren, da nur ein Update auf die neue Version das Problem nicht behebt.
Die aktualisierte Version 7.04 [siehe Link] für Server mit W2K oder W2K3 steht bei APC zur Verfügung, für NT4 gibt es die Version 7.02.

Michael Bormann
http://www.apc.com/tools/download/software_comp.cfm?sw_sku=SFPCBE704