LÀM SAO LẤY DỮ LIỆU TỪ WEBSITE CÓ SỬ DỤNG AJAX BẰNG NODEJS
Hôm nay em có một vấn đề muốn hỏi các pác là: em sử dụng Nodejs muốn lấy dữ liệu từ website khác, nhưng có vấn đề là website em muốn lấy nó load hình ảnh, dữ liệu bằng ajax. Vậy thì em phải làm sao lấy được dữ liệu khi trang load ajax, các anh có cách nào giúp em với nhé. em xin chia sẻ thêm là em đang muốn lấy dữ liệu của chi tiết sản phảm của Tmall, trong trang này có phần chi tiết hình ảnh họ sử dụng lazy load để load hỉnh ảnh ra. em đang tính viết ứng dụng để lấy hết hình ảnh về bằng Nodejs. anh giúp em với. Đây là trang demo: https://brickset.com/
2 CÂU TRẢ LỜI
Bình thường bạn chỉ có thể crawler các trang website server-side rendering thôi. Bạn muốn lấy dữ liệu được load ajax thì cần sử dụng một cái Headless browser ví dụ như: puppeteer (nó là thằng chrome nhưng không có giao diện), PhantomJS... bạn có thể hiểu nó là một cái trình duyệt web nhưng không có giao diện đồ họa, vẫn có thể thao tác bình thường bằng code.