Datadog - Công cụ giám sát, quản lý hệ thống

Datadog là một dịch vụ giám sát, tập hợp số liệu và sự kiện từ các máy chủ, cơ sở dữ liệu, các ứng dụng, các công cụ và dịch vụ để trình bày một quan điểm thống nhất của các cơ sở hạ tầng. Những khả năng này được cung cấp trên một nền tảng phân tích dữ liệu SaaS dựa trên phép Dev và Ops đội làm việc cộng tác trên cơ sở hạ tầng để tránh thời gian chết, giải quyết vấn đề hiệu suất và đảm bảo rằng các chu kỳ phát triển và triển khai hoàn thành đúng thời hạn.

1. Integrations

  • Datadog hỗ trợ, tích hợp rất nhiều những công nghệ phổ biến nhất hiện nay như Amazon EC2, Linux, Elasticsearch...
  • Có hỗ trợ thông qua API (tất nhiên sẽ chậm hơn so với sử dụng agent cài trực tiếp)
  • Có agent mã nguồn mở, nghĩa là mình có thể chọc ngoáy, tùy biến sử dụng

2. Infrastructure

Được hiển thị trong tab infrastructure list là danh sách các server của bạn đang được cài agent của datadog. Ở đây ta sẽ có một cái nhìn tổng quan về toàn bộ nguồn tài nguyên đang có, qua đó phát hiện được máy nào đang quá tải, máy nào đang rảnh or die. Lưu ý, những máy die sẽ không gửi dữ liệu lên datadog được và nó sẽ biến mất khỏi danh sách trên sau 24h. Khi cài xong và khởi động agent, bạn sẽ có ngay lập tức thông số về máy đó. Tìm hiểu thêm các thông tin về Infrastructure ở đây

3. Host Map

Được đặt bên trong tab Infrastructure, Host Map giúp cho:

  • Hình dung toàn bộ hệ thống của bạn cho dù bạn có 5, 500 hay 50K máy chủ
  • Xác định nhanh chóng ngoại biên
  • Phát hiện mẫu sử dụng
  • Tối ưu hóa nguồn tài nguyên

4. Events

Events Stream được thiết kế tương tự như một blog:

  • Có thể nhận xét(comments) được các event
  • Có thể filter theo: user, source, tag, host... giúp phân nhóm và duy trì được trọng tâm trong các lần cần phân tích, điều tra dữ liệu
  • Ngoài ra, khi sử dụng event để phát hiện các vấn đề thì nó còn có thể gửi email thông báo, claim tới những người mà mình muốn

5. Dashboards

Dashboards chứa đồ thị thời gian thực, giúp bạn control những trọng tâm trong toàn bộ hệ thống

6. Monitoring

Khá giống với event khi nó có khả năng thông báo, cánh báo qua email cho bạn nhưng nó chỉ xảy ra khi dữ liệu vượt qua một ngưỡng nào đó mà bạn đã đặt

7. Tổng kết

Mình vừa giới thiệu tới các bạn một công cụ khá hay về tracking dữ liệu, tài nguyên hệ thống và tất nhiên là bản có trả phí. Bạn cũng có thể dùng free với nhiều hạn chế. Hy vọng sẽ thêm cho các bạn một sự lựa chọn cho việc quản lý hệ thống.