Mô hình hóa dữ liệu thời gian thực giá tiền ảo với InfluxDB và Grafana
Bài đăng này đã không được cập nhật trong 5 năm
Dữ liệu thời gian thực hay time series hiện tại không hề xa lạ với các chuyên gia phân tích kinh tế, một trong những cơ sở dữ liệu phù hợp nhất để lưu trữ loại dữ liệu này chính là InfluxDB, cách cấu hình cơ bản cũng như hướng dẫn sử dụng cơ sở dữ liệu Influxdb các bạn có thể tham khảo qua bài viết trước đây của mình => Lưu trữ dữ liệu time series với InfluxDB cùng bài toán về dữ liệu chứng khoán
Bài viết lần này mình sẽ hướng dẫn cách thức mô hình hóa dữ liệu GUI thông qua ứng dụng Grafana bằng một ví dụ về dữ liệu của các đồng tiền ảo
Cài đặt Grafana
Tùy vào hệ điều hành mà các bạn có thể chọn các cách thức phù hợp hoặc có thể cài đặt thông qua docker. Các bạn có thể xem qua thông tin chi tiết cài đặt cho từng hệ điều hành tại đây . Trong lần này mình sẽ sử dụng hệ điều hành ubuntu nên sẽ hướng dẫn những lệnh cho hệ điều hành này, tuy nhiên tư tưởng thì vẫn hoàn toàn giống nhau giữa các hệ điệu hành.
Lần lượt cài các gói cần thiết như trong tài liệu
Sau khi đã cài đặt thành công thì chạy server host cho Grafana :
sudo service grafana-server start
Grafana sẽ lấy chạy tại port 3000, do đó các bạn vào đường dẫn để thao tác trực tiếp qua GUI để mô hình hóa thay vì những của Grafana. Truy cập đường dẫn http://localhost:3000 sẽ thầy màn hình đăng nhập :
Tài khoản mặc định có username và password cùng là admin, sau đó sẽ phải đặt lại password cho tài khoản admin.Sau đó màn hình Home :
Phần màn hình Home sẽ liệt kê các công việc cần làm để hoàn thành toàn bộ phần setup :
- Install
- Tạo một datasource
- Tạo một dashboard
- Thêm user (sharing)
- Exploring plugin repository (Phần này thì mình chưa rõ )
Phần này mình sẽ giới thiệu các bạn cách thức tạo datasource và mô hình hóa dữ liệu bằng giao diện , còn các phần khác sẽ dành cho các bạn tự vọc thêm nhé. =))
Tạo Datasource
Trên sidebar phía bên trái màn hình Home các bạn có thể chọn Configuration (Biểu tượng bánh răng ). Như mở đầu mình đã trình bày, dữ liệu lần này là dữ liệu thời gian thực và được lưu trữ bởi InfluxDB, do đó mình sẽ sử dụng Datasource là InfluxDB, để có thể thực hiện bước này các bạn cần có chút kiến thức về InfluxDB, những ai chưa có kiến thức về phần này thì có thể overview qua bài viết trước đó của mình :
Tiếp theo sẽ là config để có thể tương tác với Influx :
Các bạn cần chú ý những phần chính
- URL mình sẽ để là http://localhost:8086 - đây chính là hosting mặc định của InfluxDB, chạy ở port 8086
- Database mình sẽ để là database coin_api đã được mình khởi tạo (Nếu các bạn chưa có dữ liệu thì dưới đây mình sẽ hướng dẫn )
Do việc restore dữ liệu database từ một hosting này sang một hosting cũng khá nhiều bước do đó mình sẽ để nó là một đề mục
Import dữ liệu đã có
Đây là dữ liệu mình đã thu thập về giá của các đồng tiền ảo theo từng phút trong khoảng hơn 1 tuần, các bạn có thể download từ đường dẫn sau : dữ liệu tiền ảo .
Có dữ liệu đã được lưu về sẽ tồn tại trong folder coin/, mình lưu folder này tại Desktop do đó sẽ có dạng đường dẫn (c
/home/tmc/Desktop/coin
Sau đó mở terminal lên và gõ lệnh sau:
influxd restore -portable -db coin_api /home/tmc/Desktop/coin
Trước khi chạy lệnh các bạn cần kiểm tra chính xác rằng database coin_api
Có thể kiểm tra thông qua câu lệnh sau :
- Mở terminal và gõ lệnh
influx
để thao tác console của influxdb - Kiểm tra các databases hiện có :
SHOW DATABASES
Okay, vậy là nếu mọi thứ ổn thì hiện tại chúng ta sẽ có một cơ sở dữ liệu để thao tác. Để kiểm tra các measurements có trong csdl coin_api chúng ta sử dụng câu lệnh :
SHOW MEASUREMENTS
Trong mỗi measurement sẽ có 2 trường là time và price là thời gian và giá tiền tương ứng được quy đổi theo USD
Mô hình hóa dữ liệu
Sau các bước trên thì chúng ta đã config tương đổi ổn để có thể vizualizate dữ liệu, bước tiếp theo là tạo một Dashboard bằng cách click vào biểu tượng dấu Cộng phía sidebar bên trái, màn hình sẽ được thay đổi về giao diện giúp xây dựng Dashboard:
Các bạn sẽ thấy xuất hiện một sidebar mới hiển thị các trạng thái hiện tại của quá trình xây dựng Dashboard. Như trong màn hình thì chúng ta đang ở trạng thái chọn dạng biểu đồ hiển thị, với dữ liệu dạng này thì mình sẽ sử dụng sơ đồ dạng cột, cũng là sơ đồ default hiện tại (Được tô viền vàng như trong hình trên)
Sau khi chọn loại biểu đồ chúng ta sẽ thực hiện query để lấy ra dữ liệu - click vào button phía trên của trạng thái hiện tại ở sidebar. Tại đây chúng ta có các select option để xây dựng câu query hoặc có thể viết trực tiếp, mình sẽ chọn cách viết trực tiếp câu queryy (Bởi vì cái đó đối với mình đơn giản là cảm thấy trực quan hởi thôi còn các bạn có thể lựa chọn cách phù hợp với bản thân):
Câu query của mình khá đơn giản, chỉ là lấy toàn bộ dữ liệu đã store lại về giá của đồng bitcoin, dữ liệu đã được mô hình hóa một cách trực quan, các bạn có thể lựa chọn xem chi tiết từng mốc thời gian bằng cách quét chuột các mốc thời gian hoặc lựa chọn dựa trên dropdown phía góc phải màn hình, sức mạnh của Grafana ở việc có thể hiển thị giá trị tới từng giây.
Bên cạnh đó cũng có thể biểu diễn linh hoạt bằng các biểu đồ khác như sơ đồ quạt, table:
Kết luận
Trong bài viết lần này mình đã hướng dẫn các bạn một cách đơn giản có thể mô hình hóa dữ liệu thời gian thực với influxdb và grafana, có thể sẽ rất có ích đối với những bạn thiên hướng nghiên cứu về dữ liệu cũng như những bạn hiện đang học về kinh tế khi mà chưa có kinh nghiệm về lập trình
Tham khảo
All rights reserved