+1

Chặng 1.1: Python và Data Manipulation

Chào anh em,

Theo mục tiêu của series bài chinh phục python, automation hôm trước, hôm nay chúng ta bắt đầu với chặng 1: nền tảng python. Với lộ trình được tư vấn bởi AI, tớ sẽ cần phải điểm qua và hoàn thành các items như sau:

Giai đoạn 1: Nền tảng Python và Data Manipulation

  • Mục tiêu: Làm quen với Python, xử lý dữ liệu cơ bản.
  • Kỹ năng cần học:
    • Python cơ bản: Syntax, OOP, exception handling.
    • Pandas:
      • Đọc/ghi file (CSV, Excel, JSON).
      • Xử lý dữ liệu: merge, filter, groupby.
      • Làm sạch dữ liệu (data cleaning).
    • Numpy: Xử lý dữ liệu dạng mảng, tính toán số học.
  • Tools/Libs:
    • Jupyter Notebook (làm việc với data trực quan).
    • Matplotlib/Seaborn (vẽ biểu đồ cơ bản).

💡 Thời gian: 2-4 tuần (với 2-3 tiếng/ngày).


Vì đã có kinh nghiệm nhất định, tuy chỉ mới vỡ lòng với python và pandas, nên tớ sẽ không mất thời gian đi "học" lại hay vọc lại mí bạn như syntax, hay OOP, vân vân mây mây nhé. Anh em có thể tra cứu tài liệu hoặc khóa học online tương ứng để nhanh chóng đạt mục tiêu hen. Tuy nhiên python có thể khác nhiều so với java, nên để tránh chủ quan, tớ sẽ làm review, làm các bài tests trước khi đi qua chặng mới. Đôi khi việc quá nôn nóng hoàn thành mục tiêu, hoặc đi quá nhanh có thể khiến chúng ta dễ dàng bỏ sót, bị hổng kiến thức, giống như hổng kiến thức Vật Lý lớp 7 mà vẫn cố thoi thóp để leo cho lên Vật Lý lớp 12 vậy, nên ở đây tớ chọn phương án chậm mà chắc nhé.

Phần review, tớ sẽ lập bảng checklist, làm tất cả các bài test liên quan tới các từ khóa thuộc hạng mục chặng 1 ở trên. Phần này tớ sẽ nhờ trợ lý AI hỗ trợ để có 1 bảng bài test nhanh chóng hiệu quả. Sau đó dựa trên kết quả test, và cải thiện tớ sẽ cập nhật cho anh em trong bài tiếp theo thuộc cùng series. Nếu các hạng mục trong bài test mà chưa đạt yêu cầu, dĩ nhiên tớ buộc phải dành nhiều thời gian hơn ở chặng 1 này.

Bảng TEST Python

Theo tư vấn ban đầu của AI, nếu đi làm hết tất cả các bài test online thì sẽ rất nhiều, và rất mất thời gian.

  • Ví dụ: chỉ riêng https://www.hackerrank.com/domains/python đã có hơn 100 bài tests với độ khó và và hạng mục (sub-domains) khác nhau rồi. Nên tớ sẽ không cố làm hết tất cả các bài tests theo cách này nhé.

image.png

  • Quá nhiều!!!!!! Và không bám sát mục tiêu đề ra.

.

Tiêu chí bài tests vì thế sẽ được thu hẹp gồm bài kiểm tra phức hợp với độ khó từ trung bình trở lên, tập trung vào các từ khóa và kỹ năng như mô tả trong Giai đoạn 1: "Nền tảng Python và Xử lý Dữ liệu". Như vậy sẽ nhanh chóng kiểm tra trình độ, và tiết kiệm thời gian hơn cho anh em rồi nhé. Dưới đây là bảng tổng hợp:

No. Từ khóa Liên kết bài kiểm tra Độ khó Độ phổ biến Ghi chú
1 Python OOP Classes: Dealing with Complex Numbers
Classes: Find the Torsional Angle
Trung bình 85% Các bài tập này giúp bạn rèn luyện kỹ năng lập trình hướng đối tượng trong Python.
2 Exception Handling Exceptions
Incorrect Regex
Trung bình 80% Luyện tập xử lý ngoại lệ trong Python, giúp chương trình của bạn trở nên robust hơn.
3 Pandas CSV/Excel Pandas Exercises
101 Pandas Exercises for Data Analysis
Trung bình 75% Các bài tập này giúp bạn làm quen với việc đọc/ghi và xử lý dữ liệu bằng Pandas.
4 Jupyter Notebook Data Analysis with Python: Zero to Pandas
Introduction to Jupyter
Trung bình 70% Hướng dẫn sử dụng Jupyter Notebook cho phân tích dữ liệu, giúp bạn làm việc với dữ liệu một cách trực quan.
5 Python Syntax Python If-Else
Arithmetic Operators
Trung bình 90% Củng cố kiến thức về cú pháp Python thông qua các bài tập điều kiện và toán tử.
6 Data Cleaning Data Cleaning Challenge
Handling Missing Data in Python
Trung bình 65% Thực hành làm sạch dữ liệu, một kỹ năng quan trọng trong phân tích dữ liệu.
7 NumPy Array Ops Arrays
Shape and Reshape
Trung bình 85% Luyện tập thao tác với mảng NumPy, cơ sở cho các tính toán số học trong Python.
8 Data Visualization Matplotlib Tutorial
Seaborn Tutorial
Trung bình 70% Học cách vẽ biểu đồ cơ bản với Matplotlib và Seaborn để trực quan hóa dữ liệu.
9 Python Functions Write a Function
Map and Lambda Function
Trung bình 80% Phát triển kỹ năng viết hàm và sử dụng biểu thức lambda trong Python.
10 File Handling File Operations in Python
Working with Files
Trung bình 75% Thực hành thao tác với tệp tin trong Python, bao gồm đọc và ghi dữ liệu.

.

Quá tuyệt vời, trợ lý AI đã giúp tớ tiết kiệm khối thời gian, và đã cho ra một bảng tổng hợp nhanh chóng nhìn cũng khá OK. Trong phần tiếp theo tớ sẽ đi sâu vào các bài test, hoàn thành nó, và sẵn review luôn coi AI có tổng hợp đúng như yêu cầu không. Trong phần này chúng ta chỉ tạm lướt xem bảng test có bám sát với mục tiêu không nhé?

  • Python cơ bản: Syntax, OOP, exception handling: Test 1, 2, 5: OK.
  • Pandas:
    • Đọc/ghi file (CSV, Excel, JSON): Test 3: OK.
    • Xử lý dữ liệu: merge, filter, groupby: Test 3? Không rõ lắm, cần check thêm: TODO.
    • Làm sạch dữ liệu (data cleaning): : Test 6: OK.
    • Numpy: Xử lý dữ liệu dạng mảng, tính toán số học: Test 7: OK.
  • Tools/Libs:
    • Jupyter Notebook (làm việc với data trực quan): Test 4: OK.
    • Matplotlib/Seaborn (vẽ biểu đồ cơ bản): Test 8: OK.

Như vậy bảng tổng hợp khá bám sát mục tiêu, trợ lý AI còn "tự ý" bổ sung thêm 2 bài Test 9, 10, nên có lẽ nó cũng quan trọng. Mục tiêu đã rõ cho chặng 1, có tất cả 10 bài tests/challenges cần hoàn thành, và sẽ được cập nhật trong bài tiếp theo. Anh em nào nhanh chân, làm thử 10 bài test ở trên, có gì thú vị, hoặc phát hiện AI chém gió, thì cho tớ biết với nhé.

Hẹn gặp lại trong bài tiếp theo.


All Rights Reserved

Viblo
Let's register a Viblo Account to get more interesting posts.