Trực quan hóa thuật toán Machine Leaning bằng Python
Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn labels là các biến độc lập mà chúng ta muốn dự đoán bằng thuật toán ML. Trong bài viết ngắn này, chúng ta sẽ trực quan hóa thuật toán ML với python:
Trực quan hóa thuật toán Machine Leaning bằng Python
Trực quan hóa thuật toán học máy có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán ML. Điều xảy ra là khi chúng ta đào tạo một mô hình ML bằng thuật toán, chúng ta cung cấp dữ liệu vào thuật toán, thuật toán sẽ tìm mối quan hệ giữa các features và labels.
Vì vậy, khi chúng ta trực quan hóa một thuật toán ML, nó sẽ hiển thị đường xu hướng của các giá trị của nhãn được dự đoán theo các features. Bây giờ, chúng ta sẽ đào tạo một thuật toán học máy đơn giản và trực quan hóa nó bằng Python. Ở đây, trước tiên chúng ta sẽ đào tạo một mô hình hồi quy tuyến tính để dự đoán doanh số bán sản phẩm dựa trên số tiền chi cho quảng cáo trên TV của sản phẩm đó, sau đó sẽ trực quan hóa các dự đoán của thuật toán hồi quy tuyến tính bằng cách sử dụng thư viện sơ đồ trong Python (các bạn có thể download dữ liệu tại đây: https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv)
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
data = pd.read_csv("https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv")
x = data["TV"].values.reshape(-1,1)
y = data["Sales"]
model = LinearRegression().fit(x, y)
x_range = np.linspace(x.min(), x.max(), 100)
y_range = model.predict(x_range.reshape(-1,1))
import plotly.graph_objects as go
import plotly.express as px
figure = px.scatter(data, x = "TV", y = "Sales", opacity = 0.5)
figure.add_trace(go.Scatter(x = x_range, y = y_range, name = "Linear Regression"))
figure.show()
Trong hình trên, đường màu đỏ là đường xu hướng hiển thị các dự đoán được đưa ra bởi thuật toán hồi quy tuyến tính, không gì khác ngoài mối quan hệ giữa số tiền chi cho quảng cáo trên truyền hình và doanh số bán sản phẩm.
print(y_range)
Thuật toán ML được sử dụng để tìm mối quan hệ giữa các features và labels. Trực quan hóa thuật toán ML có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán học máy.
All rights reserved