Data Analytics cho người mới bắt đầu như mình (Part cuối cho Beginners)
Kết thúc khóa học Data analytics cho người mới bắt đầu, bài viết này của mình sẽ bao gồm 2 nội dung chính: Phương pháp luận trong Data Science và Data Analytics trong các lĩnh vực khác nhau sẽ có hiệu quả thế nào. Cùng mình trao đổi nhé
Data Science methodology
Phương pháp luận trong Data Science là phương pháp khoa học dữ liệu để thúc đẩy những thông tin, hiểu biết có ý nghĩa hơn. Bản chất thì đây là một phương pháp lặp đi lặp lại đơn giản nhưng mạnh mẽ.
Bất kể công nghệ, mô hình dữ liệu hay cách tiếp cận nào, các nhà khoa học cũng cần 1 phương pháp nền tảng để đưa ra 1 chiến lược kinh doanh. Điều quan trọng là cần có sự hiểu biết rõ ràng, sắc nét về nhu cầu kinh doanh, đó sẽ là động lực chính cho sự thành công.
Phương pháp này gồm các giai đoạn khác nhau, tạo thành 1 quá trình lặp để sử dụng dữ liệu với mục đích khám phá những hiểu biết, thông tin hữu ích bên trong nó. Các bạn có thể quan sát hình vẽ bên dứoi để hình dung được các giai đoạn này
Business understanding -> Analytics approach
- Xác định vấn đề, mục tiêu dự án và giải pháp yêu cầu từ góc độ kinh doanh:
- Nhà tài trợ kinh doanh chính là ai?
- Ai cần giải pháp phân tích?
- Doanh nghiệp cần gì?
- Khách hàng cần gì?
- Những lợi ích mà dự án hướng tới?
- Phương pháp phân tích được chọn sẽ không chỉ xác định các yêu cầu kinh doanh, mà còn cả những yêu cầu về dữ liệu.
Requirements -> Collection
- Có nhiều giai đoạn phụ:
- Thu thập dữ liệu
- Sắp xếp dữ liệu
- Phân tích dữ liệu
- Mô hình hóa dữ liệu
- Dữ liệu đầu vào chất lượng tốt là điều bắt buộc để có đầu ra tốt, do đó đây là bước đệm nền tảng cho việc triển khai giải pháp
- Các nhà khoa học dữ liệu phải đánh giá khối lượng và tính chất của dữ liệu cũng như sự phân bố của mỗi thuộc tính.
Understanding -> Preparation
- Sử dụng thống kê mô tả và trực quan hóa để hiểu nội dung dữ liệu, chất lượng dữ liệu và khám phá những hiểu biết sơ khai về dữ liệu
- Giai đoạn chuẩn bị dữ liệu bao gồm tất cả các hoạt động để xây dựng một tập dữ liệu sử dụng cho giai đoạn mô hình hóa dữ liệu
- Chuẩn bị dữ liệu có thể kể tới 1 số việc như làm sạch dữ liệu, xử lý dữ liệu bị thiếu hoặc không hợp lệ, trùng lặp, định dạng dữ liệu, transform dữ liệu, ...
- Đây là bước tốn nhiều thời gian nhất trong 1 dự án Khoa học dữ liệu
Modeling -> Evaluation
- Modeling: quá trình tập trung vào phát triển mô hình dự đoán cho dữ liệu, tìm tham số tốt nhất cho model
- Về bản chất, quá trình modeling lặp đi lặp lại giúp các tổ chức đạt được hiểu biết và xu hướng trong tương lai để có các chiến lược phù hợp
- Evaluation: Đánh giá mô hình để biết chất lượng của nó và đảm bảo nó giải quyết được vấn đề kinh doanh
- Đối với giai đonạ này, cần đáp ứng một số tiêu chí:
- Xem xét lại toàn bộ quá trình đánh giá
- Tóm tắt các hoạt động có thể đã bị bỏ sót
- Xem xét liệu mô hình có được xây dựng chính xác hay không
- Từ đánh giá để xem xét về quy trình xây dựng mô hình hiện tại, và kế hoạch tinh chỉnh mô hình nếu có
Deployment -> Feedback
- Khi một mô hình thỏa mãn yêu cầu đã được phát triển, nó cần được triển khai vào môi trường sản phẩm, đó là một điều đương nhiên
- Việc triển khai có thể đơn giản như tạo một báo cáo với các đề xuất hoặc tích hợp mô hình vào trong 1 quy trình làm việc phức tạp
- Việc triển khai một mô hình vào quy trình kinh doanh thường bao gồm nhiều nhóm, kỹ năng và công nghệ. Nó đòi hỏi việc lập kế hoạch về cách mà kiến thức hay thông tin sẽ được phổ biến tới người dùng thế nào, và kết quả mô hình sẽ được triển khai thế nào.
- Sau khi mô hình đc triển khai, nó cần được theo dõi và duy trì. Trong giai đoạn này, cần xác định
- Những gì có thể thay đổi trong môi trường?
- Độ chính xác sẽ được theo dõi và đánh giá như nào?
- Khi nào nên dừng việc cho mô hình khai thác dữ liệu?
- Các mục tiêu kinh doanh sẽ thay đổi theo thời gian như nào? Có ảnh hưởng tới mô hình hiện tại không?
- Giai đoạn cuối cùng này cần rà soát lại toàn bộ framework bằng cách trao đổi với những người tham gia vào dự án, phỏng vấn, khảo sát người dùng cuối và xác định những gì có thể cải thiện tốt hơn cho dự án.
Data Analytics trong các lĩnh vực khác nhau sẽ có hiệu quả thế nào?
Trong phần này, chúng ta sẽ cùng thảo luận tới một số ứng dụng hàng ngày của Data Analytics trong Sản phẩm dịch vụ, Google, LinkedIn, ... như nào nhé
Data Analytics trong sản phẩm, dịch vụ
- DA phân tích sản phẩm để hiểu cách người dùng tương tác với sản phẩm của họ, phân tích người dùng thích hay không thích sản phẩm và những gì thu hút họ
- Cách người dùng tương tác với sản phẩm giúp doanh nghiệp phân tích dữ liệu, thấy được những gì người tiêu dùng mong muốn từ đó cung cấp cơ hội để phát triển sản phẩm phù hợp với nhu cầu người dùng
- Khi khách hàng nhận được những gì họ muốn, không chỉ sung sướng mà còn mua thêm. Ví dụ bán 1 chiếc áo thun, thì việc gợi ý mua combo thêm 1 chiếc quần jeans sẽ giảm giá 10%, điều này vừa làm người dùng ưa thích vì chương trình giảm giá, vừa giúp người dùng không cần phải suy nghĩ nhiều về cách phối đồ với chiếc áo thun kia sao cho đẹp nữa.
- Vẫn là câu nói mình được nghe rất nhiều: đôi khi người dùng không chắc chắn hoặc không định hình được điều họ muốn, DA phân tích và xác định các nhu cầu sâu bên trong người dùng.
Google sử dụng Analytics như thế nào?
- Google sử dụng công cụ và kỹ thuật phân tích dữ liệu để hiểu yêu cầu người dùng dựa trên một số tham số, như thu thập tất cả dữ liệu liên quan đến tần suất các trang web đã truy cập, thời gian, từ khóa tìm kiếm, … Google sử dụng dữ liệu đó để phù hợp hóa tìm kiếm của mình.
- Các doanh nghiệp đang sử dụng Phân tích dữ liệu thông qua Google Ads: Khi người dùng lướt web, nó sẽ tìm hiểu sở thích của người dùng, dựa vào điều này, Google hiển thị cho họ 1 số sản phẩm hoặc dịch vụ mà người dùng có thể quan tâm. Đó là lí do cho việc tại sao mình mới mở 1 tab xem thử chiếc macbook thì mở Facebook lên đã ngập tràn các trang bán Macbook từ cũ đến mới, nhưng khi mình lướt xem một (có khi là vài) chiếc ô tô hạng trung đến sang, thì cũng không thấy quảng cáo gì, vì Google biết mình xem chơi chơi chứ mình chưa đủ tài chính để quan tâm việc mua ô tô =))))
LinkedIn sử dụng Analytics như thế nào
- Nhân viên LinkedIn phân tích dữ liệu để cải tiến danh sách công việc, những người xem hồ sơ cá nhân và bài đăng của bạn
- LinkedIn cho biết bạn nên kết nối với ai, nơi để xem các bài đăng và công việc của bạn, các kỹ năng của bạn cạnh tranh ra sao với những người khác trên con đường tìm kiếm công việc của bạn
Amazon sử dụng Analytics như thế nào
- Amazon thu thập dữ liệu khách hàng khi họ sử dụng trang web, theo dõi những gì bạn mua, bạn xem và địa chỉ giao hàng của bạn
- Amazon so sánh các sản phẩm bạn đã thêm giỏ hàng và mua với việc mua của hàng triệu khách hàng khác trên toàn cầu. Bằng cách này, Amazon xây dựng lên hồ sơ của bạn và sử dụng hồ sơ này để dự đoán các sản phẩm phù hợp với bạn. Điều này đã tạo ra sự khuyến khích mua hàng của bạn
- Dễ hiểu hơn, dựa trên những thông tin thu thập được từ bạn, Amazon xây dựng hình ảnh về con người bạn và cung cấp cho bạn những sản phẩm mà những người có hồ sơ tương tự như bạn đã mua với giả thiết rằng nhữngsản phẩm đã mua của những người mua tương tự bạn có thể hữu ích với bạn
Data analytics trong y tế:
- Nền công nghiệp ý tế là một trong những lĩnh vực hứa hẹn nhất rằng DA có thể áp dụng để tạo ra thay đổi tích cực
- DA có thể giúp giảm chi phí điều trị, dự đoán sự bùng phát của dịch bệnh và tránh các loại bệnh có thể phòng ngừa đc, từ đó cải thiện cuộc sống
- DA cũng giúp các bác sĩ đưa ra quyết định dựa trên dữ liệu 1 cách nhanh chóng và cải thiện việc đi lại của bệnh nhân nếu có thể
Kết bài
3 phần mình đã trình bày dựa trên khóa học "Introduction fo Data Analytics" của Simplilearn đã tóm gọn cũng như giải thích các nội dung, kiến thức của khóa học. Mong rằng 3 bài viết của mình sẽ cho bạn đọc một cái nhìn tổng quan về Data Analytics, trước khi bước vào các kiến thức sâu hơn. Mọi góp ý vui lòng cho mình biết thêm dưới comment nhé! À nếu thấy bổ ích cho mình 1 Upvote nhé ^^ Cảm ơn mọi người!!
All rights reserved