Chunk server gặp trình trạng không thể remove Chunk
Tình trạng:
Chunk không thể remove khi sử dụng command.
pstorage -c cluster rm-cs --wait 1010
Trong thời gian dài Cluster vẫn không thể remove Chunk 1010.
Nguyên nhân:
Nguyên nhân ở đây có thể do quá trình remove Chunk đã bị failed, tuy nhiên Chunk server không thông báo mã lỗi
Giải pháp:
Nêu Chunk server bị failed ( ví dụ do Disk gặp vấn đề về phần cứng ) và tình trạng thông báo tại CS trả lại là failed khi sử dụng command pstorage top, có thể xử lý bằng cách sử dụng option Force để drop CS này.
[root@pcs ~]# pstorage --force -c cluster rm-cs 1010 Connected to MDS#5 Dropping CS#1010 ...
Lưu ý: Các chunk khi sử dụng cách này đều sẽ mất toàn bộ dữ liệu ( không thể tiến hành replicas dữ liệu chứa trên CS này ), điều này có thể gây mất dữ liệu và corrupt data của VM/CT đang chạy.
Lưu ý thêm nếu quá trình replicas dữ liệu khi tiến hành xóa CS ở command bình thường ( không có option force ), tuy nhiên phía cluster thông báo vẫn có quá trình replicas thì nguyên nhân có thể do phía network giữa Chunk server và Master MDS có vấn đề.