Máy chủ HP DL580 chạy hệ điều hành CentOS 6.5 x86_64 bị lỗi lâu lâu thì treo máy, mình đã xem log và tìm google rồi nhưng chưa rõ là lỗi gì?
Xem var/log/mcelog
Code:
Hardware event. This is not a software error.
MCE 1
CPU 8 BANK 9
TIME 1393227192 Mon Feb 24 14:33:12 2014
MCG status:
MCi status:
Corrected error
Error enabled
MCA: MEMORY CONTROLLER GEN_CHANNELunspecified_ERR
Transaction: Generic undefined request
STATUS 900000400012008f MCGSTATUS 0
MCGCAP 1000c18 APICID 40 SOCKETID 1
CPUID Vendor Intel Family 6 Model 47
Chạy lệnh mcelog --client
Code:
Memory errors
SOCKET 1 CHANNEL any DIMM any
corrected memory errors:
681025 total
0 in 24h
uncorrected memory errors:
0 total
0 in 24h
Xem /var/log/messages
Code:
Feb 24 14:31:54 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:31:54 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:32:55 mail kernel: __ratelimit: 12277 callbacks suppressed
Feb 24 14:32:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:32:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:33:55 mail kernel: __ratelimit: 12020 callbacks suppressed
Feb 24 14:33:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:33:55 mail kernel: [Hardware Error]: Machine check events logged
Nhờ các bạn xem và giúp mình phân tích lỗi với, mình chỉ biết là nó bị lỗi phần cứng nhưng chưa dám khẳng định là bị lỗi ở đâu.