Shaman service gặp tình trạng không thể start
Vấn đề:
Trong quá trình start shamand service, hệ thống thông báo lỗi như sau
# /etc/init.d/shamand start
Starting shamand-monitor: [ OK ]
Waiting 600 seconds for shaman-monitor to start : error 1[FAILED]
Shutting down shamand-monitor: [ OK ]
Kiểm tra log hệ thống theo đường dẫn /var/log/messages
May 27 17:13:53 node shamand-monitor[39249]: Monitor started May 27 17:13:53 node shamand-monitor[39251]: Starting /usr/sbin/shaman-monitor --quiet ... May 27 17:13:53 node shamand-monitor[39273]: /usr/sbin/shaman-monitor exited with code 2 May 27 17:13:58 node shamand-monitor[39280]: Will restart /usr/sbin/shaman-monitor May 27 17:13:58 node shamand-monitor[39281]: Starting /usr/sbin/shaman-monitor --quiet ... May 27 17:13:58 node shamand-monitor[39301]: /usr/sbin/shaman-monitor exited with code 2 May 27 17:14:03 node shamand-monitor[39318]: Will restart /usr/sbin/shaman-monitor May 27 17:14:03 node shamand-monitor[39319]: Starting /usr/sbin/shaman-monitor --quiet ... May 27 17:14:03 node shamand-monitor[39339]: /usr/sbin/shaman-monitor exited with code 2 May 27 17:14:08 node shamand-monitor[39345]: Will restart /usr/sbin/shaman-monitor
Nguyên nhân:
Trong trường hợp hiện tại là do sai host ID, kiểm tra theo các đường dẫn bên dưới sẽ không thấy thông tin host ID hoặc đã bị thay đổi.
# cat /etc/pstorage/host_id d9fe3759246544ab
# ls -1d /pstorage/pcscluster/.shaman/md*
/pstorage/pcscluster/.shaman/md.2369ab7eccfd42ce /pstorage/pcscluster/.shaman/md.64aab38d792545c6/ /pstorage/pcscluster/.shaman/md.a2371f582644408c/
Giải pháp:
Thực hiện 2 command bên dưới để khởi tạo lại ID cho host và start lại service shamand.
# shaman join <CLUSTER_NAME>
# service shamand start