Dịch vụ pdrs ( cấu thành nên shaman ) không hoạt động: “open(/pcs/.drs/memory.node_list) : No such file or directory”
Vấn đề
PDRS mode relocaltion không làm việc. các thông báo về lỗi có thể tìm thấy trong /var/log/pdrs.log
23-09-14 17:03:17.871 open(/pcs/.drs/memory.node_list) : No such file or directory
Nguyên nhân:
23-09-14 17:03:17.872 command failed with error '2'
Trong log /var/log/shaman.log
23-09-14 17:03:16.700 shaman-monitor(691656): Trying to evacuate the node 'md.cdf862e2e665320c' using the 'drs' mode...
23-09-14 17:03:17.872 shaman-monitor(691656): pdrs_schedule : command failed with error '2'
23-09-14 17:03:17.874 shaman-monitor(691656): /usr/share/shaman/pdrs_schedule exited with code 2
Nguyên nhân prds mode relocation không thể làm việc là do nó không tìm được file tại đường dẫn : /<pstorage-mount-point>/.drs/memory.node_list . Đây là file chứa thông tin về tất cả các node đã join vào shaman trong cluster, nó cũng chứa các thông tin về resource của các node. Vì thế đây là file quan trọng để pdrs có thể xác định tài nguyên node nào trên cluster đủ chứa các VPS trong trường hợp vấn đề xảy ra.
Giải pháp:
File này đươc khởi tạo bởi PRDS service với việc sử dụng giao thức SNMP hỗ trợ.
- Tiến hành kiểm tra các gói yêu cầu đã có đủ.
# yum install shaman pdrs rmond
- Đảm bảo các dịch vụ yêu cầu đã chạy.
# service snmpd status
# service pdrsd status
# service shamand status
- Kiểm tra iptables để đảm bảo SNMP không bị drop.
- Kiểm tra cấu hình của SNMP đảm bảo yêu cầu vấn đề.
Đường dẫn nằm tại /etc/snmp/snmpd.local.conf, các records nên tương tự thế này
rwcommunity parallels 127.0.0.1 .1.3.6.1.4.1.26171
rwcommunity parallels <IP_network/subnet_mask> .1.3.6.1.4.1.26171
- Tiến hành restart lại service snmpd, pdrsd, shamand nếu đã thay đổi snmpd.conf
# service snmpd restart
# service pdrsd restart