Tổng kết để dễ hiểu thì : Forward Proxy có lợi cho phía Client ( ẩn IP, chặn content độc hại,... ), còn Reverse Proxy có lợi cho phía Server ( load balancing, Increased Security,.... )
Bổ sung 1 chút là việc sử dụng Data Lake hay Data Warehouse sẽ quyết định khá nhiều việc cần lựa chọn kiểu pipeline sẽ được thiết kế là ELT (Extract, Load, Transform: toàn bộ dữ liệu sẽ được lưu trong Data Lake và được lấy ra để transform khi sử dụng) hay ETL (Extract, Transform, Load: dữ liệu được transform ngay khi được thu thập từ nguồn dữ liệu). Cũng do đặt quá trình Transform ở thời điểm ngay sau khi Extract từ nguồn nên Schema của dữ liệu trong Data Warehouse sẽ được xác định trước khi dữ liệu được lưu trữ, điều này thì trái ngược với cách ta lưu trữ dữ liệu trong Data Lake khi mà Schema sẽ được xác định sau khi dữ liệu được lưu trữ.
Cuối cùng thì các nền tảng Cloud thường có các bộ giải pháp đi kèm để triển khai Data Lake và Data Warehouse. Với các nền tảng này Data Lake thường sử dụng các dịch vụ lưu trữ dạng S3 làm xương sống cho toàn bộ hệ thống và điều này cũng có thể thấy ở lakeFS một giải pháp Data Lake dạng Git khá được chú ý trong thời gian gần đây. Cách hoạt động của Open Source này khá giống DVC, chỉ trừ việc có vẻ DVC hoạt động kém hiệu quả với số lượng file lớn :v
THẢO LUẬN
team sun blockchain còn hoạt động hông anh, em tưởng dead rồi hoá ra vẫn active
Phần phép trừ hai số nguyên lớn của chuỗi cái dòng d = (a[i] - '0') - (a[i] - '0') - carry; phải là d = (a[i] - '0') - (b[i] - '0') - carry; nha ad ><
Series rất hay và bổ ích. Đã lâu không thấy tác giả viết thêm bài mới?
Tổng kết để dễ hiểu thì : Forward Proxy có lợi cho phía Client ( ẩn IP, chặn content độc hại,... ), còn Reverse Proxy có lợi cho phía Server ( load balancing, Increased Security,.... )
thank
thank
@viet111 chưa bị đuổi à bạn, thấy bảo đuổi hết rồi mà
https://baobiankhangbn.com/ các bác vào đây xem thêm cho vui nhé
@duynghia Thanks mình add lại rồi. Cảm ơn nhé.
@HQuang tôi thì học ở https://www.coursera.org/professional-certificates/ibm-data-engineer ông khóc với Coursera xong đợi 2 tuần là có đó :v
cái này học ở đâu thế ông
bài viết tâm huyết quá ạ
👋
cái này là tất cả luôn chứ không phải mỗi MYSQL
mình đang ngồi test API, mở làm được luôn hè, cảm ơn tác giả.
Hay quá bạn ơi, phần data pipeline t cũng đang học. Cảm ơn bạn đã bổ sung kiến thức vô cùng bổ ích và dễ hiểu nha bravo!
Đỉnh quá bạn ơi.
Bổ sung 1 chút là việc sử dụng Data Lake hay Data Warehouse sẽ quyết định khá nhiều việc cần lựa chọn kiểu pipeline sẽ được thiết kế là ELT (Extract, Load, Transform: toàn bộ dữ liệu sẽ được lưu trong Data Lake và được lấy ra để transform khi sử dụng) hay ETL (Extract, Transform, Load: dữ liệu được transform ngay khi được thu thập từ nguồn dữ liệu). Cũng do đặt quá trình Transform ở thời điểm ngay sau khi Extract từ nguồn nên Schema của dữ liệu trong Data Warehouse sẽ được xác định trước khi dữ liệu được lưu trữ, điều này thì trái ngược với cách ta lưu trữ dữ liệu trong Data Lake khi mà Schema sẽ được xác định sau khi dữ liệu được lưu trữ.
Tiếp đó thì Data Lake và Data Warehouse thường được sử dụng để bổ trợ cho nhau khi mà Data lakes were born out of the need to harness big data and benefit from the raw, granular structured and unstructured data for machine learning, but there is still a need to create data warehouses for analytics use by business users. Data Lake vẫn cần thiết để lưu trữ dữ liệu thô, đặc biệt là các dữ liệu không thể tái hiện vì ta khó có thể chắc chắn rằng loại dữ liệu nào sẽ được sử dụng trong tương lai. Trong khi đó việc triển khai Data Warehouse là cần thiết nhằm đáp ứng các yêu cầu chẳng hạn như về tốc độ xử lý của các OLAP.
Cuối cùng thì các nền tảng Cloud thường có các bộ giải pháp đi kèm để triển khai Data Lake và Data Warehouse. Với các nền tảng này Data Lake thường sử dụng các dịch vụ lưu trữ dạng S3 làm xương sống cho toàn bộ hệ thống và điều này cũng có thể thấy ở lakeFS một giải pháp Data Lake dạng Git khá được chú ý trong thời gian gần đây. Cách hoạt động của Open Source này khá giống DVC, chỉ trừ việc có vẻ DVC hoạt động kém hiệu quả với số lượng file lớn :v
!quá hay viết bài
Rất hay, rất bổ ích!