NAS, 1,5TB RAID1 und Begeisterung …

Vorige Woche hat ja unerwarteterweise mein Homeserver die Grätsche gemacht (eigentlich nur dessen Festplatte, aber das sei mal dahin gestellt). Das ich darüber nicht sonderlich erfreut war, das kann sich wohl jeder von euch denken :(. Was solls – es musste also was brauchbares neues her. Nachdem ich meine Auswahlliste (besser gesagt die unserer Lieferanten) durchgeklaubt hatte, blieben 5 NAS-Gehäuse übrig. Da ich aber auch nicht hinterm Mond lebe, habe ich natürlich nach allen Gehäusen gegoogelt und so herausgefunden, dass einige eine sehr bescheidene Performance haben, die anderen nicht ohne Spezialtreiber für Windows auskommen und wiederrum andere nicht mit den von mir ausgewählten Platten zusammen arbeiten wollten.

Übrig geblieben ist: Weiterlesen

Wartungsarbeiten, Zeitraffer und Video …

Einen Teil unserer Umbau- und Wartungsarbeiten konnten wir auf Video festhalten (danke Schoash):

Youtube Video:

Und als direkter Download im MP4-Format:

anexia_datacenter_rebuild_2009_01_24 (15,4MB, 2:45 Minuten)

PS: Das Video hat eine Originallänge von ca 8 Stunden und 20 Minuten. Die 2 Minuten 45 Sekunden sind also wirklich extreme Zeitraffer.

Wartungsarbeiten, Ausfall, Hardware und ein paar Nerven …

So, wie alle sehen können ist mein Blog nun endlich wieder online. Auch die Seiten einiger User, die ich noch hoste, sind wieder erreichbar. Der angekündigte Umzug innerhalb des Rechenzentrums und die Auflassung des alten Standorts liefen zu ca 98% ohne Fehler ab. Die restlichen 2% wurden von inkonsistenten RAID-Systemen, defekten Netzteilen und einem einzigen defekten Mainboard abgedeckt.

Ratet mal welches Mainboard einen Defekt hatte?! Richtig – das meines Hauptservers. Und wie es der Fehlerteufel so wollte, war es kein einfacher Defekt sondern eine recht beschissene bescheidene Angelegenheit, die ich persönlich noch nie bei einem Mainboard hatte: das CMOS war defekt. Auch ein Neuflashen des CMOS half nichts – heute habe ich das Board eingeschickt, nachdem ich bereits Ersatz erhalten habe und mein Server nun wieder läuft.

Die Aktion hat mich doch ein paar Nerven und einige graue Haare gekostet. Ich bin beruhigt, dass hier nun auch wieder alles läuft ;).

Wartungsarbeiten, Unterbrechung und viel Hardware …

Ich bin so frei und zitiere einfach mal die Mail, die wir vorige Woche auch an alle Kunden gesendet haben:

Sehr geehrter Kunde,
sehr geehrter Partner!

Aufgrund der stetigen Erweiterungs- und Anpassungsarbeiten im Bereich
unserer Infrastruktur freut es uns Ihnen folgendes mitteilen zu können:

Seit einigen Tagen ist ein weiterer Teil des ANEXIA Rechenzentrums #2
fertiggestellt und für den aktiven Betrieb bereit. In diesem Bereich werden wir in den nächsten Wochen und Monaten unsere gesamte Infrastruktur migrieren und damit auch einige Fehlerquellen beseitigen, die uns in letzter Zeit leider immer wieder kleinere Probleme bereitet haben.

Aus logistischen und technischen Gründen werden wir unseren neuen
Backbone auch in diesem Bereich des Rechenzentrums aufbauen. Für Sie
wird es in Zukunft also den gewohnten Standard geben:

#) Redundante Anbindung an unseren Backbone
#) Vollständige Redundanz wichtiger Routingknoten
#) Redundante Klimatisierung
#) Klimatisierter Doppelboden (min. 30cm hoch)
#) Getrennte Kabeltrassen für Strom- und Datenleitungen
#) Brand-Früh-Erkennung
#) Temperaturüberwachung
#) Drei von einander unabhängige USV-Phasen
#) Zwei von einander unabhängige Netz-Phasen
#) Biometrische Zugangskontrollen
#) Videoüberwachung

Leider ist es auch uns nicht möglich solche massiven Umbauarbeiten ohne
Ausfallszeiten abzuwickeln. Wir teilen Ihnen hiermit folgende
Wartungsfenster mit:

Samstag, 24.01.2009, Beginn: 00:00 Uhr
Samstag, 24.01.2009, Ende:   07:30 Uhr

Sonntag, 25.01.2009, Beginn: 00:00 Uhr
Sonntag, 25.01.2009, Ende:   07:30 Uhr

In dieser Zeit kann es zu partiellen Netz- und Systemausfällen kommen.
Aus Sicherheitsgründen bitten wir Sie bei kritischen Systemen eine
Datensicherung durchzuführen (sofern diese Systeme nicht von uns
verwaltet sind).

Sollten Sie bei uns einen dedizierten Windows-Server haben, bitten wir Sie dieses System vor dem jeweiligen Wartungsfenster herunter zu fahren. Ihr System wird nach den Wartungsfenster automatisch hochgefahren.

Bitte deaktivieren Sie für die oben angeführten Wartungsfenster auch sämtliche Cronjobs und Monitoringssysteme, um Datenverlust und Falschmeldungen zu verhindern.

Vielen Dank für Ihr Verständnis.

Was das für das Blog hier bedeutet sollte jedem klar sein: es wird ab heute Abend kurzfristig nicht zur Verfügung stehen ;).

Homeserver, RAID, Backup und Recovery …

Hachja. Ich bin gerade so richtig gut gelaunt. Naja, fast. Bei meinem Homeserver ist gestern eine Kernel Panic aufgetreten und ich hatte erst heute Zeit mir die Sache näher anzusehen. Tja, wie soll ich sagen:

sda: Current: sense key: Medium Error

Additional sense: Unrecovered read error – auto reallocate failed

[…]

end_request: I/O error, dev sda, sector 47077903

[…]

SCSI device sda: read seek error

[…]

SCSI device sda: spin down device

Jup, das war es also mit meiner letzten privaten WD Raptor 74GB mit 8MB Cache – ich hatte 4 davon, jede einzelne hat die Grätsche gemacht :(. 2 mit jeweils 16MB Cache laufen dafür wie am Schnürchen. Mal WD kontaktieren, ob die mir die Platte nochmal ersetzen. Achja: Datenverlust habe ich keinen erlitten, war nur die Bootplatte vom VMWare Hostsystem *puh*. Backup läuft trotzdem, Homeserver wird entweder durch ITX System (eventuell mit 4x 2,5″ Platten im RAID10) oder überhaupt durch ein kleines NAS ersetzt – muss ich zuerst durchrechnen :D.