Thông báo lỗi này xảy ra khi bạn cố gắng khởi động một máy ảo (VM) nhưng dịch vụ HA (High Availability) của VM đó đang trong trạng thái lỗi và cần được khắc phục trước khi có thể tiếp tục.
Cụ thể, thông báo này cho biết rằng máy ảo vm:113
đang ở trạng thái lỗi trong HA manager, và bạn cần phải vô hiệu hóa và sửa chữa nó trước khi có thể khởi động lại.
Bạn có thể kiểm tra trạng thái của VM trong HA bằng lệnh sau, tìm dòng liên quan đến vm:113
và xem trạng thái chi tiết.
shell> ha-manager status
quorum OK
master pve03 (active, Sun Aug 18 08:50:08 2024)
lrm pve01 (active, Sun Aug 18 08:50:08 2024)
lrm pve02 (active, Sun Aug 18 08:50:03 2024)
lrm pve03 (active, Sun Aug 18 08:50:09 2024)
lrm pve04 (idle, Sun Aug 18 08:50:04 2024)
lrm pve05 (idle, Sun Aug 18 08:50:07 2024)
lrm pvebk (idle, Sun Aug 18 08:50:10 2024)
service vm:100 (pve03, error)
service vm:106 (pve01, stopped)
service vm:108 (pve02, started)
service vm:113 (pve01, error)
Bạn cần vô hiệu hóa HA cho VM để sửa chữa lỗi:
ha-manager set vm:113 --state disabled
Xem log chi tiết để xác định nguyên nhân của lỗi:
journalctl -xe
hoặc
cat /var/log/syslog | grep -i "vm 113"
Dựa trên thông tin log, thực hiện các bước cần thiết để sửa chữa lỗi VM. Có thể bạn cần phải kiểm tra cấu hình máy ảo, cấu hình mạng, hoặc trạng thái của các đĩa VM.
Sau khi đã sửa lỗi, bạn có thể thử khởi động lại VM bằng cách:
shell> qm start 113
Requesting HA start for VM 113
service 'vm:113' in error state, must be disabled and fixed first
command 'ha-manager set vm:113 --state started' failed: exit code 255
Nếu bạn muốn bật lại HA cho VM sau khi sửa lỗi, bạn có thể sử dụng lệnh:
ha-manager set vm:113 --state started
Cuối cùng, kiểm tra lại trạng thái của HA manager để đảm bảo rằng VM đã được khởi động thành công và không còn ở trạng thái lỗi:
shell> ha-manager status
quorum OK
master pve03 (active, Sun Aug 18 09:30:29 2024)
lrm pve01 (active, Sun Aug 18 09:30:29 2024)
lrm pve02 (active, Sun Aug 18 09:30:33 2024)
lrm pve03 (active, Sun Aug 18 09:30:30 2024)
lrm pve04 (idle, Sun Aug 18 09:30:32 2024)
lrm pve05 (idle, Sun Aug 18 09:30:34 2024)
lrm pvebk (idle, Sun Aug 18 09:30:32 2024)
service vm:100 (pve03, started)
service vm:106 (pve01, stopped)
service vm:108 (pve02, started)
service vm:113 (pve01, started)
Nếu sau các bước này mà lỗi vẫn chưa được khắc phục, bạn có thể cần kiểm tra thêm các log chi tiết hơn hoặc xem xét cấu hình của cụm (cluster) để tìm ra nguyên nhân sâu xa.