|
|
Autor |
Nachricht |
Gast
|
Verfasst am:
04.04.2011, 11:22 EINE Partition oft nur rudimentär gemountet |
|
Einen angenehmen Frühlingstag dem Forum,
ich habe dzt. fünf Kunden mit Fujitsu-Servern und Ubuntu 8.04 LTS Server.
VIER davon zur vollsten Zufriedenheit aller (auch meiner eigenen ).
EINER jedoch schlägt aus der Reihe, dessen Problematik ich bis dato nicht lösen konnte (und Fujitsu trotz 3-Jahres-Serviceerweiterungspaket nicht lösen will) und die ich daher heute hier gerne vortragen möchte:
PROBLEM:
Ab und zu fehlen nach dem Neustart des Servers TEILE des /data-Volumes, /data wird also nicht korrekt gemountet.
Fünf Mal hintereinander klappt das mounten von /data, drei Mal dann wieder nicht (sind jetzt nur Hausnummern, aber die Größenordnung paßt). Auch das manuelle umounten/mounten nach dem Neustart ergibt manchmal korrekten, manchmal keinen Zugriff auf die Daten des Kunden.
Das Eigenartige dabei ist, daß von der Partition /data nur Teile fehlen, eigentlich immer genau die Daten des Kunden.
Auf /data gibt es die Ordner /data/Daten (Kundendaten), /data/Install und /data/Install.loc (für lokale Ubuntu-Software). Die Ordner Install und Install.loc enthalten immer ihre Daten, der Ordner /data/Daten ist im Fehlerfalle immer leer. Egal, ob ich den Server neu starte oder auch nur ein paar Mal /data umounte/neu mounte, ich vermag nicht zu sagen, WANN die Kundendaten wieder sichtbar sind ... mount alleine weiß das .
BISHERIGE PROBLEMLÖSUNGSVERSUCHE:
Ich habe natürlich auch im Internet gelesen, auch Artikel dazu gefunden und z.B. in der /etc/fstab von
# /dev/md6
UUID=edd6d313-03e9-4e88-9a78-642cb945abb1 /data ext3 relatime 0 2
korrigiert auf:
UUID=edd6d313-03e9-4e88-9a78-642cb945abb1 /data ext3 auto,defaults 0 0
Auch hat Marion bei einem Stammtischtreffen einen durchaus nachvollziehbaren Defekt im Hauptspeicher geäußert. Ich habe am vergangenen Wochenende alle 8GB getauscht, 10 Mal korrekt neu starten können, habe mich schon gefreut, dann wieder drei Mal hintereinander nicht korrekt, wieder keine /data/Daten gesehen.
HARDWARE:
- Fujitsu PRIMERGY TX 100 S1, 64-Bit
- Intel XEON X3220, 2.4GHZ
- 4x 2GB Memory, DDR2 SDRAM 800, PC2-6400, ECC
- 2x SATA-300-HDD, je 1TB
SOFTWARE/KONFIG:
- Onboard-RAID-Controller im BIOS deaktiviert
- Ubuntu 8.04 LTS Server Edition, x86, 64Bit (letztstandsgepatcht)
- Dzt. Kernel daher 2.6.24-28-server, vorher 2.6.24-26 (selbes Problem)
- VMware Server 2.0.2
- Software-RAID-1-Konfig:
.) swap: 12GB (ohne RAID)
.) /: 6GB Ext3 bootable
.) /var: 10GB Ext3
.) /usr: 10GB Ext3
.) /opt: 15GB Ext3
.) /home: 50GB XFS
.) /vm: 100GB XFS (für virtuelle Maschinen, ohne RAID)
.) /data: ca. 787GB (Rest) Ext3
.) und /tmp: 10GB XFS
DERZEITIGE /etc/fstab:
# /etc/fstab: static file system information.
#
# <file system> <mount point> <type> <options> <dump> <pass>
proc /proc proc defaults 0 0
# /dev/md0
UUID=5a25f1da-6cac-4513-bbd2-df3afe2cf7e5 / ext3 relatime,error
s=remount-ro 0 1
# /dev/md6
##: UUID=edd6d313-03e9-4e88-9a78-642cb945abb1 /data ext3 relatime
0 2
UUID=edd6d313-03e9-4e88-9a78-642cb945abb1 /data ext3 auto,defaults
0 0
# /dev/md5
UUID=78ba21ec-0910-491f-9f0f-400a6676b334 /home xfs relatime
0 2
# /dev/md3
UUID=3b6e8044-523c-468b-91df-9a2e2e0f3595 /opt ext3 relatime
0 2
# /dev/md4
UUID=4bacef57-3fb7-4421-8ede-461fa4e854c2 /tmp xfs relatime
0 2
# /dev/md1
UUID=6688ab48-37e1-4902-a5d9-97bd075df080 /usr ext3 relatime
0 2
# /dev/md2
UUID=4fe049f2-a9be-43b6-9b88-ae37e51f50a1 /var ext3 relatime
0 2
# /dev/sda10
UUID=bbfaa654-8190-461b-ae3a-909ea136edfe /vm xfs relatime
0 2
# /dev/sdb10
UUID=ac7de629-8631-420a-8a7c-c6cf68957c4a /vm2 xfs relatime
0 2
# /dev/sda1
UUID=aedae3ea-08cb-48d2-9f5c-b0b08c761a34 none swap sw
0 0
# /dev/sdb1
UUID=6f28bad1-e8f9-4030-b28f-a78d61885376 none swap sw
0 0
/dev/scd0 /media/cdrom0 udf,iso9660 user,noauto,exec,utf8 0 0
Ich bin für jeden weiteren Hinweis dankbar und zu jeder Schandtat bereit , diesem Phänomen auf die Schliche zu kommen.
Ich habe auch bei den anderen Kunden Software-RAID-1 im Einsatz mit der selben /data-Partition und -Struktur.
Einstweilen liebe Grüße, bis?
Erwin
Desktop: anderer
Version: 16.04
Hardware: Notebook
Architektur: 64Bit
|
|
|
|
Webbutterfly
Administrator
Geschlecht:
Alter: 68
Anmeldungsdatum: 24.06.2006
Beiträge: 6917
Wohnort: Wien 23
|
Verfasst am:
04.04.2011, 11:30 (Kein Titel) |
|
hmmm... ist natürlich schwierig...
Mir kommt jetzt spontan in den Sinn... Netzwerk, kann mir nicht vorstellen, dass es 3x funktioniert und einmal nicht und das am System liegt.
Netzwerkkabel defekt?
Marion
Desktop: Gnome-Shell 3.X
Version: 14.04 and 16.04
Hardware: Notebook
Architektur: 64Bit
_________________
|
|
|
|
Gast
|
Verfasst am:
04.04.2011, 12:07 (Kein Titel) |
|
Hallo Marion,
danke für Deine rasche Antwort, die mich in dieser Sache leider nicht sehr hoffen läßt ... ;-)
Auf Netzwerk wäre ich jetzt einmal nicht gekommen, vielleicht fehlen mir dazu aber auch relevante Zusammenhänge. Jedenfalls ist es so, daß dieser Server letztes WE wegen des Hauptspeicher-Umbaues bei mir im Büro war, also ein anderes Netzwerk. Und selbst wenn ich ihn ohne Netzwerkkabel starten würde, denke ich, daß das selbe Phänomen auftreten würde (hab's allerdings noch nicht versucht). Ansonsten gibt es im Betrieb auf Grund meiner Erfahrung keinen Anlaß, über Netzwerkprobleme zu klagen; auch die virtuellen Maschinen funktionieren einwandfrei.
Einmal in Betrieb funktioniert ohnedies alles bestens, nur das mounten von /data ist immer wieder ein Glücksspiel.
Wenn Dir vielleicht doch noch eine Möglichkeit einfallen sollte, die ich prüfen könnte, wäre ich natürlich sehr dankbar.
Bis dahin liebe Grüße,
Erwin
Desktop: anderer
Version: 16.04
Hardware: Notebook
Architektur: 64Bit
|
|
|
|
Webbutterfly
Administrator
Geschlecht:
Alter: 68
Anmeldungsdatum: 24.06.2006
Beiträge: 6917
Wohnort: Wien 23
|
Verfasst am:
04.04.2011, 14:14 (Kein Titel) |
|
Nun, dann würde ich auf Festplattenprobleme tippen...
Inode Tabelle.
Hast du schon ein "cfdisk" auf der gesammten Platte gemacht? Achtung, darf nur "ro" gemountet sein!
Am besten mit einer Live-CD.
Weiters könntest du ja mal /data plus Unterordner kopieren.. alten umbenennen und testen...
Dann liegen die Daten ja auf einem anderen Bereich der HD.
Kann mir nicht vorstellen das es am mount Befehl liegt...
Marion
PS: Mit einer Live-CD ab 10.04 kannst du sehr gut die HD auf Fehler überprüfen...
>System >Systemverwaltung >Laufwerksverwaltung
(vielleicht gibt es Fehlerhafte Sektoren... ist echt heimtückisch)
Anzeige der SMART-Werte der HD in obigen Programm.
Marion
Desktop: Gnome-Shell 3.X
Version: 14.04 and 16.04
Hardware: Notebook
Architektur: 64Bit
_________________
|
|
|
|
Gast
|
Verfasst am:
04.04.2011, 15:37 (Kein Titel) |
|
Ja, die HDDs waren auch mein nächster Verdacht, danke.
Nein, im Bezug auf die HDDs habe ich bisher gar nichts gemacht, Server ist mittlerweilen wieder beim Kunden, muß ich Vor-Ort machen.
Ich denke auch nicht, daß es am mount-Befehl selbst liegt, kann ich mir nicht vorstellen. Eher, daß mount irgendwie Probleme hat, und dieses gilt es eben zu eruieren.
Ich werde die HDDs als nächstes in Angriff und halte das Forum darüber auf dem Laufenden.
Danek einstweilen für Deine Bemühungen,
angenehmen Nachmittag,
liebe Grüße,
Erwin
Desktop: anderer
Version: 16.04
Hardware: Notebook
Architektur: 64Bit
|
|
|
|
|
1008050261051 Angriffe abgewehrt
Powered by Orion based on phpBB
© 2001, 2002 phpBB Group
CBACK Orion Style based on FI Theme
Alle Zeiten sind GMT + 2 Stunden
| |
|