Iris Data Analysis và Machine Learning (Python)
Bài đăng này đã không được cập nhật trong 3 năm
Bài viết này sẽ hướng dẫn các bạn sử dụng Machine Learning để áp dụng các thuật toán classications lên tập dữ liệu mẫu Iris
Các bạn có thể download dataset Iris này từ trang web của UCI https://archive.ics.uci.edu/ml/datasets/iris Hoặc trong thư viện sklearn cũng có luôn bộ dữ liệu này rồi. Trong bài viết này mình sẽ dùng cách download chay các bạn nhé.
Lấy dữ liệu
Summary của dataset
Áp dụng các Classication model khác nhau
Import thư viện cần thiết
Tách dữ liệu thành các biến độc lập và không độc lập
Sau đó tách bộ dữ liệu thành 2 phần Training set và Test set
Sử dụng Logistic Regression
Dùng thuật toán Naive Bayes, ta được độ chính xác 96,67%
Dùng thuật toán SVC ta được độ chính xác 100%
Dùng thuật toán K láng giềng gần nhất được độ chính xác 100%
Dùng cây quyết định ta được độ chính xác 100%
Trên đây ta đã dùng bộ dữ liệu Iris để thử nghiệm một số thuật toán phân loại dữ liệu, kiến thức chỉ ở mức cơ bản thôi, từ đây, các bạn áp dụng lên một số bộ dữ liệu phức tạp hơn thử xem nhé.
Nguồn tham khảo: https://www.kaggle.com/adityabhat24/iris-data-analysis-and-machine-learning-python?fbclid=IwAR0PhbY4AB1ycGRZ4cajjjOpSbHIxtmzuIT1cMeZHB9VqYNTDl0FiMM56Sw
All rights reserved