Shaman tự động reboot server liên tục
Vấn đề.
Tiến hành start server, nhưng dịch vụ shaman lại reboot server cứ sau một vài phút, tiến hành kiểm tra trong /var/log/messages thì có thông báo lỗi như sau:
Jul 18 08:18:47 pcsnode snmpd[4996]: Got trap from peer on fd 12
Jul 18 08:19:18 pcsnode snmpd[4996]: Got trap from peer on fd 12
Jul 18 06:20:25 pcsnode ntpd[7212]: synchronized to 10.201.100.4, stratum 2
Jul 18 06:20:25 pcsnode ntpd[7212]: time reset -7199.569514 s
Jul 18 06:20:25 pcsnode ntpd[7212]: kernel time sync status change 2001
Jul 18 06:23:51 pcsnode ntpd[7212]: synchronized to 10.201.100.3, stratum 2
Jul 18 06:46:37 pcsnode ntpd[7212]: synchronized to 10.201.100.4, stratum 2
Jul 18 07:00:17 pcsnode ntpd[7212]: synchronized to 10.201.100.3, stratum 2
Jul 18 07:01:01 pcsnode kernel: [ 2674.811847] ERST: NVRAM ERST Log Address
Nguyên nhân:
Vấn đề bên trên được xác định là do server chưa được đồng bộ thời gian với các node còn lại trên hệ thống trong quá trình khởi động.
Quá trình xảy ra lỗi bên trên như sau:
Node nhận thông tin giờ sớm hơn so với giờ thực tế.
Shaman sẽ lấy thông tin giờ này.
Ntpd ( dịch vụ quản lý về thời gian trên linux ) tiến hành đồng bộ thời gian với các server ntp do người dung quy định trước.
Lúc này shaman và ntpd nhận 2 thông tin giờ khác nhau, vấn đề sẽ xuất hiện tại đây và có thể xảy ra kernel panic.
Giải pháp:
Thứ 1: Vào single mode và tắt dịch vụ ntpd hoặc bỏ qua bước ntpd lấy thông tin giờ từ server trong lúc boot hệ thống.
Thứ 2: tiến hành cấu hình lại giờ cho chính xác.