Yêu cầu thg 5 28, 2020 1:00 SA 248 0 2
  • 248 0 2
0

LÀM SAO LẤY DỮ LIỆU TỪ WEBSITE CÓ SỬ DỤNG AJAX BẰNG NODEJS

Chia sẻ
  • 248 0 2

Hôm nay em có một vấn đề muốn hỏi các pác là: em sử dụng Nodejs muốn lấy dữ liệu từ website khác, nhưng có vấn đề là website em muốn lấy nó load hình ảnh, dữ liệu bằng ajax. Vậy thì em phải làm sao lấy được dữ liệu khi trang load ajax, các anh có cách nào giúp em với nhé. em xin chia sẻ thêm là em đang muốn lấy dữ liệu của chi tiết sản phảm của Tmall, trong trang này có phần chi tiết hình ảnh họ sử dụng lazy load để load hỉnh ảnh ra. em đang tính viết ứng dụng để lấy hết hình ảnh về bằng Nodejs. anh giúp em với. Đây là trang demo: https://brickset.com/

2 CÂU TRẢ LỜI


Đã trả lời thg 5 28, 2020 1:31 SA
+3

với Nodejs thì bạn tham khảo thử thằng này nhé https://github.com/puppeteer/puppeteer

Chia sẻ
Đã trả lời thg 5 28, 2020 2:14 SA
+3

Bình thường bạn chỉ có thể crawler các trang website server-side rendering thôi. Bạn muốn lấy dữ liệu được load ajax thì cần sử dụng một cái Headless browser ví dụ như: puppeteer (nó là thằng chrome nhưng không có giao diện), PhantomJS... bạn có thể hiểu nó là một cái trình duyệt web nhưng không có giao diện đồ họa, vẫn có thể thao tác bình thường bằng code.

Chia sẻ
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí