Làm sao để có tư duy phân tích dữ liệu tốt?
Nhiều người thường bảo làm DA ko phải chỉ biết dùng tool mà cần có tư duy logic, tư duy phân tích insight.... bla bla. Vậy thì cái tư duy ấy là gì? Với vài năm kn thì mình xin chia sẻ góc nhìn, làm rõ vấn đề này.
Sai lầm có lẽ các bạn DA sẽ hay gặp phải đó là không hiểu yêu cầu của doanh nghiệp hoặc của khách, sai từ bước ban đầu dẫn đến kết quả báo cáo của mình không đưa ra những thông tin có giá trị với họ. Do vậy các bạn khi làm nghề cần hiểu và xác định được yêu cầu và mục tiêu phân tích dữ liệu của doanh nghiệp hoặc của khách hàng. Ko phải tự nhiên mà những bạn background kinh tế có lợi thế hơn trong nghề DA, và các công ty ưu tiên tuyển người có domain trong lĩnh vực của cty.
Vậy ngay ở bước xác định yêu cầu phân tích, làm thế nào để đảm bảo có hướng giải quyết bài toán đúng? Mình xin chia sẻ kinh nghiệm làm mà mình đã học hỏi đc và hay áp dụng trong việc phân tích dữ liệu
🔴 Khi mới phân tích tại 1 tổ chức doanh nghiệp, cần nắm được mô hình kinh doanh và vẽ quy trình nghiệp vụ Khi mới vào phân tích dữ liệu ở 1 công ty, sẽ có bạn bị bị bối rối, không hiểu các số liệu của công ty, không biết lấy dữ liệu từ đâu. Do đó, trước hết các bạn cần hiểu được mô hình kinh doanh của công ty và vẽ ra quy trình nghiệp vụ của công ty đó.
Ví dụ như trong trung tâm Tiếng Anh, mô hình hoạt động của họ là kết nối với giáo viên, mở các lớp dạy tiếng Anh (sản phẩm) và tuyển sinh học viên (khách hàng). Hiện đang có 2 lớp IELTS for newbie, giờ sếp muốn mở thêm 3 lớp đấy, muốn bạn phân tích để tính ra được KPI mà marekting và sales cần đạt được để tuyển sinh đủ lớp.
➡️ Vậy thì bạn cần nắm được cả quy trình tuyển sinh (bán hàng) của họ, thì mới biết hướng phân tích từ đâu (lấy chỉ số từ sales tính ra KPI cho marketing hay ngược lại?) và hiểu tất chỉ số mà họ quy ước (ví dụ: L1 là kh mới đăng ký, L2 là đã sale đã gọi, L3 là khách hàng có quan tâm, L4 là khách muốn học, L5 là khách đã chốt hợp đồng), biết liên hệ với bộ phận nào để khai thác thông tin mình cần.
🔴 Tư duy phân tích dữ liệu đa chiều Phân tích đa chiều là gì? Cùng 1 chủ điểm phân tích, chúng ta sẽ xem xét dưới nhiều góc nhìn khác nhau (doanh số chi tiết theo từng sản phẩm là bao nhiêu, theo từng khu vực, từng quý là bao nhiêu,..., hoặc chi tiết hơn nữa vd như chi tiết doanh thu theo doàng sản phẩm A trong quý 2 là bao nhiều). Khi chúng ta có thể trả lời những câu hỏi đấy 1 cách nhanh chóng theo thời gian thực bằng dashboard hoặc các phân tích BI, thì đấy gọi là phân tích đa chiều. Các bước phân tích đầu bài với phương pháp phân tích đa chiều
✔️Bước 1: Xác định Dim - Fact
Trước hết, Fact là các chủ điểm phân tích dữ liệu từ yêu cầu, ví dụ yêu cầu phân tích doanh số và sản lượng bán ra trong năm nay, thì doanh số và sản lượng chính là Fact.
Dimension là các khía cạnh phân tích. Ví dụ phân tích doanh số, chúng ta có thể xem xét theo chiều thời gian (theo quý, theo tháng), theo khu vực (các chi nhánh), theo danh mục loại sản phẩm, theo nhân viên bán hàng,...
✔️Bước 2: Cần liệt kê các giá trị trong Dimension.
Ví dụ theo dimension Thời gian thì ta có các giá trị trong đó là: Tháng 1, Tháng 2, Tháng 3,... (Hoặc quý 1, quý 2,...)
Theo dimension sản phẩm thì ta có giá trị trong đó là: Sản phẩm A, Sản phẩm B, Sản phẩm C,...
Theo dimension khu vực thì trong đó ta có: Hà Nội, Hồ Chí Minh, Đà Nẵng,...
✔️Bước 3: vẽ mô hình dữ liệu cho hệ thống phân tích dữ liệu
Bên tay phải có Fact (chủ điểm phân tích), và bên tay trái là Dim (chiều dữ liệu). Trong mô hình này, chúng ta hệ thống lại các chiều dữ liệu và các cấp nhỏ hơn của mỗi chiều. Cùng với đó là sự liên hệ với các chủ điểm phân tích trong hệ thống dữ liệu.
⚪ Ví dụ khi phân tích dòng sản phẩm A và ở thị trường quốc gia VN, thì chúng ta có thể phân tích về doanh số, lượng tồn kho,...
⚪ Ví dụ phân tích về giá, chúng ta không phân tích theo cửa hàng mà phân tích theo dòng sản phẩm và theo thời gian (năm, quý). Phân tích về sức mua (purchase amount) thì sẽ phân tích theo khu vực, theo dòng sản phẩm và theo thời gian, chứ không phải theo khách hàng
❓ Tại sao cần vẽ Data Model dạng này? Mô hình này giúp dễ dàng xác định các nhu cầu phân tích, nhu cầu làm báo cáo và xây dựng chủ điểm phân tích dễ dàng hơn.
Bên cạnh đó nó giúp hình dung các chiều dữ liệu rõ ràng hơn.
Nếu bạn chỉ cần làm 1 báo cáo nhanh bằng Excel thì việc xây dựng Data Model kiểu này giúp bạn nắm được tổng thể các chiều dữ liệu và sự liên kết trong các dữ liệu. Việc kéo thả vào pivot table, kéo thả các bar chart trong BI trở nên dễ dàng hơn. Giúp quá trình xây dựng dash tổng thể và khoa học hơn rất nhiều
Nếu bạn cần xây dựng dashboard phức tạp trên Power BI, thì mô hình này giống như 1 bản mô phỏng, giúp bạn xây dựng Data Model đầy đủ và chuẩn xác hơn
=> Những kiến thức này mình đã học ở đây, blog này cũng có nhiều bài kiến thức hay, các bạn có thể tham khảo thêm: https://blog.cole.vn/khoa-hoc-data-analyst-voi-excel-va-power-query-chia-khoa-thanh-cong/
All rights reserved