Iris Data Analysis và Machine Learning (Python)

Bài viết này sẽ hướng dẫn các bạn sử dụng Machine Learning để áp dụng các thuật toán classications lên tập dữ liệu mẫu Iris

Các bạn có thể download dataset Iris này từ trang web của UCI https://archive.ics.uci.edu/ml/datasets/iris Hoặc trong thư viện sklearn cũng có luôn bộ dữ liệu này rồi. Trong bài viết này mình sẽ dùng cách download chay các bạn nhé.

Lấy dữ liệu

Summary của dataset

Áp dụng các Classication model khác nhau

Import thư viện cần thiết Tách dữ liệu thành các biến độc lập và không độc lập Sau đó tách bộ dữ liệu thành 2 phần Training set và Test set Sử dụng Logistic Regression

Dùng thuật toán Naive Bayes, ta được độ chính xác 96,67% Dùng thuật toán SVC ta được độ chính xác 100% Dùng thuật toán K láng giềng gần nhất được độ chính xác 100% Dùng cây quyết định ta được độ chính xác 100%

Trên đây ta đã dùng bộ dữ liệu Iris để thử nghiệm một số thuật toán phân loại dữ liệu, kiến thức chỉ ở mức cơ bản thôi, từ đây, các bạn áp dụng lên một số bộ dữ liệu phức tạp hơn thử xem nhé.

Nguồn tham khảo: https://www.kaggle.com/adityabhat24/iris-data-analysis-and-machine-learning-python?fbclid=IwAR0PhbY4AB1ycGRZ4cajjjOpSbHIxtmzuIT1cMeZHB9VqYNTDl0FiMM56Sw