Bài viết này sẽ nói về một thay đổi trong cách Ceph quản lý và xuất thông tin hiệu năng (perf counters) qua module Prometheus trong phiên bản Reef.
Perf counters không được xuất mặc định từ MGR:
- Từ phiên bản Reef, module Prometheus trên Ceph MGR (ceph-mgr) không còn xuất các perf counters (các thông số hiệu năng) theo mặc định.
- Các thông số này bao gồm:
ceph_osd_stat_bytes
: Tổng dung lượng lưu trữ của OSD.ceph_osd_stat_bytes_used
: Dung lượng đã sử dụng của OSD.
- Những thông số này rất quan trọng để tính toán cảnh báo, ví dụ như:
- NearFull: Cảnh báo khi OSD gần đầy.
- Các trạng thái khác liên quan đến sử dụng dung lượng lưu trữ.
Khôi phục thông số perf counters:
Xem giá trị hiện tại của perf counters
.
ceph config get mgr mgr/prometheus/exclude_perf_counters
Lệnh này kiểm tra xem các perf counters có đang bị loại trừ hay không.
Để bật lại việc xuất các perf counters, bạn cần thay đổi cấu hình:
ceph config set mgr mgr/prometheus/exclude_perf_counters false
Lệnh này tắt cài đặt exclude_perf_counters
, khiến các thông số perf counters xuất hiện trở lại.
Ví dụ về cách tính toán.
Giả sử bạn đang bật lại perf counters để giám sát trạng thái NearFull:
- Tổng dung lượng OSD (ceph_osd_stat_bytes): 10TB.
- Dung lượng đã sử dụng (ceph_osd_stat_bytes_used): 9.5TB.
- Ngưỡng NearFull: 85%.
Từ kết quả trên, kết luận OSD đang vượt ngưỡng NearFull và cần hành động ngay (mở rộng dung lượng hoặc phân phối lại dữ liệu).
Cảnh báo về perf counters:
- Theo tài liệu Ceph, việc thu thập perf counters từ một Prometheus exporter duy nhất (ceph-mgr) có thể giảm hiệu năng của ceph-mgr, đặc biệt trên các cụm (cluster) lớn.
- Để giải quyết vấn đề này, Ceph khuyến nghị sử dụng ceph-exporter daemons:
- Đây là các daemon được thiết kế để thu thập perf counters thay vì ceph-mgr.
- Ceph-exporters hiện được mặc định sử dụng, nhưng không được Proxmox triển khai tự động.
Ưu điểm và nhược điểm của cấu hình:
- Ưu điểm khi bật perf counters trên ceph-mgr:
- Thu thập lại được các thông số quan trọng như
ceph_osd_stat_bytes
vàceph_osd_stat_bytes_used
. - Hỗ trợ cảnh báo và giám sát dung lượng lưu trữ.
- Thu thập lại được các thông số quan trọng như
- Nhược điểm:
- Với các cluster lớn, việc bật perf counters trên ceph-mgr có thể:
- Gây giảm hiệu năng của ceph-mgr.
- Tăng thời gian phản hồi của Prometheus exporter.
- Với các cluster lớn, việc bật perf counters trên ceph-mgr có thể:
- Giải pháp thay thế:
- Ceph gợi ý sử dụng ceph-exporter daemons, nhưng:
- Proxmox không triển khai tự động và tài liệu không rõ ràng về cách cài đặt chúng.
- Ceph gợi ý sử dụng ceph-exporter daemons, nhưng:
Lời khuyên.
- Nếu cluster nhỏ hoặc trung bình:
- Có thể bật lại perf counters.
- Nếu cluster lớn:
- Nên tìm hiểu cách cài đặt ceph-exporter daemons để giảm tải cho ceph-mgr.
- Hoặc cân nhắc không bật lại perf counters nếu không thực sự cần thiết.
Tổng kết:
- Bài viết nhấn mạnh một thay đổi quan trọng trong Reef liên quan đến việc thu thập perf counters.
- Việc bật hoặc tắt perf counters phụ thuộc vào nhu cầu giám sát và kích thước cluster.
- Người dùng cần cân nhắc hiệu năng của ceph-mgr và tìm hiểu thêm về ceph-exporters nếu sử dụng cluster lớn.
Tham khảo https://forum.proxmox.com/threads/installing-ceph-exporter-daemon.147099/