Vraag Syslog produceert honderden regels


Ik ben onlangs "gepromoveerd" tot lab-beheerder, omdat ik de meeste ervaring met Linux heb. Mijn logcheck blijft mij e-mails sturen met honderden regels die afkomstig zijn van mijn syslog het dossier. Het herhaalt zichzelf opnieuw, met telkens kleine wijzigingen. Ik heb geen idee wat het me probeert te vertellen. Om het even welke ideeën? Hier een herhalend fragment:

Aug 23 15:02:30 157-london kernel: [8747161.509412] ------------[ cut here ]------------
Aug 23 15:02:30 157-london kernel: [8747161.509416] WARNING: at /build/buildd-linux-2.6_2.6.32-45-amd64-FcX7RM/linux-2.6-2.6.32/debian/build/source_amd64_none/fs/fs-writeback.c:588 writeback_inodes_wb+0x36b/0x4ff()
Aug 23 15:02:30 157-london kernel: [8747161.509419] Hardware name: Precision WorkStation 380  
Aug 23 15:02:30 157-london kernel: [8747161.509421] Modules linked in: nls_utf8 cifs xt_multiport nfsd nfs lockd fscache nfs_acl auth_rpcgss sunrpc xt_tcpudp iptable_filter ip_tables x_tables ext3 jbd mbcache raid456 async_raid6_recov async_pq raid6_pq async_xor xor async_memcpy async_tx quota_v2 quota_tree firewire_sbp2 loop md_mod nouveau ttm i2c_i801 drm_kms_helper drm i2c_algo_bit parport_pc i2c_core parport dcdbas snd_ctxfi snd_pcm rng_core pcspkr button evdev snd_timer psmouse snd soundcore snd_page_alloc processor serio_raw xfs exportfs usbhid hid sg sr_mod cdrom sd_mod crc_t10dif ata_generic uhci_hcd ehci_hcd firewire_ohci aic79xx thermal ahci ata_piix tg3 firewire_core crc_itu_t scsi_transport_spi floppy thermal_sys usbcore nls_base libata scsi_mod libphy [last unloaded: scsi_wait_scan]
Aug 23 15:02:30 157-london kernel: [8747161.509477] Pid: 22965, comm: flush-9:0 Tainted: G    W 2.6.32-5-amd64 #1
Aug 23 15:02:30 157-london kernel: [8747161.509479] Call Trace:
Aug 23 15:02:30 157-london kernel: [8747161.509482] [<ffffffff81109027>] ? writeback_inodes_wb+0x36b/0x4ff
Aug 23 15:02:30 157-london kernel: [8747161.509485] [<ffffffff81109027>] ? writeback_inodes_wb+0x36b/0x4ff
Aug 23 15:02:30 157-london kernel: [8747161.509489] [<ffffffff8104df40>] ? warn_slowpath_common+0x77/0xa3
Aug 23 15:02:30 157-london kernel: [8747161.509492] [<ffffffff81109027>] ? writeback_inodes_wb+0x36b/0x4ff
Aug 23 15:02:30 157-london kernel: [8747161.509496] [<ffffffff811092e7>] ? wb_writeback+0x12c/0x1ab
Aug 23 15:02:30 157-london kernel: [8747161.509499] [<ffffffff81109481>] ? wb_do_writeback+0x73/0x165
Aug 23 15:02:30 157-london kernel: [8747161.509516] [<ffffffff810c934c>] ? bdi_start_fn+0xbc/0xd0
Aug 23 15:02:30 157-london kernel: [8747161.509521] [<ffffffff810c9290>] ? bdi_start_fn+0x0/0xd0
Aug 23 15:02:30 157-london kernel: [8747161.509524] [<ffffffff81064d75>] ? kthread+0x79/0x81
Aug 23 15:02:30 157-london kernel: [8747161.509528] [<ffffffff81011baa>] ? child_rip+0xa/0x20
Aug 23 15:02:30 157-london kernel: [8747161.509531] [<ffffffff81064cfc>] ? kthread+0x0/0x81
Aug 23 15:02:30 157-london kernel: [8747161.509534] [<ffffffff81011ba0>] ? child_rip+0x0/0x20
Aug 23 15:02:30 157-london kernel: [8747161.509536] ---[ end trace 7157c19847c3ced3 ]---

6
2017-08-23 20:26


oorsprong


Hebt u de logische structuur van de schijf gecontroleerd met fsck?
De schijven controleren met fsck lijkt niet te werken. Van wat ik weet is er een RAID5-bestandssysteem (sda,sdb,sdc verzinnen md0), van welke schijven krijg ik de fout fsck: fsck.linux_raid_member: not found. Linux is geïnstalleerd op 'sdd' die is aangekoppeld en kan daarom niet worden gecontroleerd. Proberen te checken md0 het zegt dat ik het moet gebruiken xfs_check en xfs_repair. - Markus


antwoorden:


Wat u ziet, is een stacktracering. Het is een niet-afgehandelde fout van de kernel die het pad van uitvoering toont wanneer iets zo verdomd verkeerd gaat dat er niets anders te doen is dan alleen het probleem te loggen en te laten voor een mens om erachter te komen.

De oproep aan het hoofd is meestal de bepalende:

WARNING: at /build/buildd-linux-2.6_2.6.32-45-amd64-FcX7RM/linux-2.6-2.6.32/debian/build/source_amd64_none/fs/fs-writeback.c:588 writeback_inodes_wb+0x36b/0x4ff()

fs-writeback: dat schrijft naar een bestandssysteem. Zoals opgemerkt in een opmerking bij uw vraag, kunt u fouten op uw schijf hebben. Ik zou beginnen met het nemen van de machine naar single-user mode met een read-only mount en running fsck.


10
2017-08-23 20:39Aangezien de computer in kwestie onze bestandsserver is en momenteel in gebruik is, moet ik het onderhoud mogelijk uitstellen tot het weekend, als er hopelijk niemand gebruik van maakt. - Markus
@Markus-bestandssysteem verslechtering wordt nooit alleen beter, alleen slechter. Dit is een goed moment om ervoor te zorgen dat je goede back-ups hebt en je eetlust voor het systeem mogelijk onbeschikbaar vindt. - Jeff Ferland
je hebt gelijk. Ik zal met mijn lab partners praten om te zien of ik vanavond in onderhoud kan gaan. Gelukkig heb ik ons ​​back-upbestandssysteem heel recent gecontroleerd ... ik neem aan dat ik eerst de Linux-drive zou controleren? Vervolgens het RAID-bestandssysteem? - Markus
Ik zag dezelfde berichten op een van onze fileservers. Wat er uiteindelijk gebeurde, is dat bepaalde bestanden niet langer beschikbaar kwamen. In de console zouden ze rood knipperen en zou ik inode krijgen en fouten blokkeren om ze te lezen. Gelukkig heb je back-ups. :) - Alo
Oké, dus ik kon rennen fsck / xfs_check van live-cd en enkele problemen gevonden. xfs_repair repareerde de problemen en verplaatste wat spullen naar lost+found. Is er een manier om te weten waar deze gegevens vandaan komen? Is er een manier om te controleren of er nu bestanden "ontbreken"? Het systeem is zonder problemen opgestart, maar ik ben nog steeds nieuwsgierig naar die extra gegevens ... het grootste bestand hier is slechts ongeveer 1,5 miljoen. - Markus