Tìm hiểu về Amazon S3 (lý thuyết) P1

Bài đăng này đã không được cập nhật trong 5 năm

Ở phần này, trước tiên mình cùng mọi người tìm hiểu về amazon s3 là gì và những câu hỏi trường gặp nhé

Amazon S3 là gì?

Amazon Simple Storage Service (Amazon S3) là một dịch vụ lưu trữ đối tượng cung cấp khả năng thay đổi theo quy mô, tính khả dụng của dữ liệu, bảo mật và hiệu năng hàng đầu trong lĩnh vực. Điều này có nghĩa là khách hàng thuộc mọi quy mô và lĩnh vực có thể sử dụng dịch vụ này để lưu trữ và bảo vệ bất kỳ lượng dữ liệu nào cho nhiều trường hợp sử dụng khác nhau, chẳng hạn như trang web, ứng dụng di động, sao lưu và khôi phục, lưu trữ, ứng dụng doanh nghiệp, thiết bị IoT và phân tích dữ liệu hớn. Amazon S3 cung cấp các tính năng quản lý dễ sử dụng, nhờ đó, bạn có thể tổ chức dữ liệu và cấu hình các kiểm soát truy cập được tinh chỉnh để đáp ứng yêu cầu cụ thể của doanh nghiệp, tổ chức và yêu cầu về tuân thủ. Amazon S3 được thiết kế để đảm bảo độ bền 99,999999999% (11 9's) và lưu trữ dữ liệu của hàng triệu ứng dụng cho các công ty trên toàn thế giới. Đó là lý thuyết, đối với ae technical thì amazon s3 là nơi để ae chứa data trên đó, có thể truy xuất dữ liệu (vậy cho dễ hiểu )

Chúng ta có thể làm những gì với Amazon S3?

Amazon S3 cung cấp một giao diện web đơn giản, cho phép bạn sử dụng để lưu trữ và truy xuất dữ liệu với khối lượng bất kỳ, vào bất cứ thời điểm nào, từ bất cứ nơi nào trên web. Sử dụng dịch vụ web này, bạn có thể dễ dàng xây dựng những ứng dụng tận dụng được khả năng lưu trữ trên Internet. Do Amazon S3 có khả năng mở rộng cao và bạn chỉ phải trả tiền cho những gì bạn dùng, bạn có thể bắt đầu từ quy mô nhỏ và phát triển các ứng dụng bạn muốn mà không phải hy sinh về hiệu năng hoặc độ tin cậy.

Amazon S3 cũng được thiết kế có độ linh hoạt cao. Lưu bất kỳ loại và khối lượng dữ liệu nào bạn muốn; đọc cùng một đoạn dữ liệu cả triệu lần hoặc chỉ để khắc phục sự cố khẩn cấp; xây dựng một ứng dụng FTP đơn giản hoặc một ứng dụng web phức tạp chẳng hạn như trang web bán lẻ Amazon.com. Amazon S3 cho phép các nhà phát triển tự do tập trung vào đổi mới thay vì phải lo tìm cách lưu trữ dữ liệu của mình.

Chúng ta có thể lưu trữ loại dữ liệu nào trên Amazon S3?

Chúng ta có thể lưu trữ bất kỳ loại dữ liệu nào và định dạng nào.

Amazon S3 khả dụng ở những nơi nào trên thế giới?

Amazon S3 khả dụng ở các Khu vực AWS trên toàn thế giới và bạn có thể sử dụng Amazon S3 cho dù bạn ở đâu. Bạn chỉ cần quyết định (các) Khu vực AWS bạn muốn lưu trữ dữ liệu Amazon S3 của bạn. Hiện tại sẽ khả dụng ở 21 khu vực, có thể truy cập vào link này để hiểu rõ hơn

Amazon S3 có mức phí bao nhiêu?

Nói nôm na dễ hiểu thì S3 bạn dùng bao nhiêu sẽ trả bấy nhiêu, để hiểu rõ hơn về mức chi phí theo từng bậc bạn có thể tham khảo thêm ở link sau nhé

Dữ liệu của chúng ta được bảo mật đến mức độ nào trên Amazon S3?

Mặc định, Amazon S3 có tính bảo mật. Khi tạo tài nguyên, chỉ chủ sở hữu tài nguyên có quyền truy cập vào tài nguyên Amazon S3 mà họ tạo ra. Amazon S3 hỗ trợ xác thực người dùng để kiểm soát truy cập dữ liệu. Bạn có thể sử dụng cơ chế kiểm soát truy cập như các chính sách về bộ chứa và Danh sách kiểm soát truy cập (ACL) để phân quyền có lựa chọn cho người dùng và các nhóm người dùng. Bảng điều khiển Amazon S3 hiển thị các bộ chứa có thể truy cập công khai của bạn, biểu thị nguồn truy cập công khai, đồng thời cũng cảnh báo bạn nếu các thay đổi đối với chính sách về bộ chứa hoặc ACL của bộ chứa làm cho bộ chứa của bạn có thể truy cập công khai. Bạn nên bật tính năng Block Public Access cho tất cả các tài khoản và bộ chứa mà bạn không muốn truy cập công khai.

Bạn có thể tải lên/tải xuống dữ liệu của bạn một cách an toàn lên Amazon S3 qua các điểm cuối SSL bằng giao thức HTTPS. Nếu bạn cần bảo mật thêm, bạn có thể sử dụng tùy chọn Mã hóa phía máy chủ (SSE) để mã hóa dữ liệu đã được lưu trữ và không còn hoạt động nữa. Bạn có thể cấu hình các bộ chứa Amazon S3 của bạn tự động mã hóa đối tượng trước khi lưu trữ chúng nếu yêu cầu lưu trữ gửi đến không có bất kỳ thông tin mã hóa nào. Hoặc, bạn có thể sử dụng thư viện mã hóa của chính bạn để mã hóa dữ liệu trước khi lưu trữ trên Amazon S3.

Làm thế nào chúng ta có thể kiểm soát truy cập đến dữ liệu của chúng ta được lưu trữ trên Amazon S3?

Khách hàng có thể sử dụng bốn cơ chế kiểm soát truy cập đến các tài nguyên Amazon S3: Chính sách Identity and Access Management (IAM), chính sách về bộ chứa, Danh sách kiểm soát truy cập (ACL) và Xác thực chuỗi ký tự truy vấn. IAM cho phép các tổ chức có số lượng nhân viên lớn tạo và quản lý nhiều người dùng bằng một tài khoản AWS. Với chính sách IAM, khách hàng có thể cấp cho người dùng IAM quyền kiểm soát rất chính xác đối với Amazon S3 bộ chứa hoặc đối tượng nhưng vẫn duy trì quyền kiểm soát đầy đủ đối với mọi hoạt động người dùng thực hiện. Với chính sách về bộ chứa, khách hàng có thể lập ra các quy tắc và áp dụng chúng với toàn bộ các yêu cầu truy cập tài nguyên Amazon S3, chẳng hạn như cấp đặc quyền ghi đối với một tập tài nguyên con trên Amazon S3. Khách hàng cũng có thể hạn chế quyền truy cập theo một khía cạnh yêu cầu nào đó, chẳng hạn như thông tin lịch sử truy vấn HTTP và địa chỉ IP. Với ACL, khách hàng có thể cấp phân quyền xác định (ví dụ: ĐỌC, GHI, KIỂM SOÁT_ĐẦY ĐỦ) cho người dùng cụ thể đối với một bộ chứa hoặc đối tượng riêng lẻ. Với Xác thực chuỗi ký tự truy vấn, khách hàng có thể tạo một URL trỏ đến một đối tượng Amazon S3, đối tượng này chỉ có hiệu lực trong một khoảng thời gian hữu hạn. Để biết thêm thông tin về các chính sách kiểm soát quyền truy cập khác nhau có trên Amazon S3

Amazon S3 có hỗ trợ kiểm tra truy cập dữ liệu không?

Có, khách hàng có thể cấu hình bộ chứa trên Amazon S3 theo ý mình để tạo bản ghi nhật ký truy cập đối với toàn bộ các yêu cầu truy cập

Amazon S3 có độ bền như thế nào?

Amazon S3 Tiêu chuẩn, S3 Standard–IA, S3 One Zone-IA, S3 Glacier, và S3 Glacier Deep Archive đều được thiết kế để đảm bảo độ bền 99,999999999% cho đối tượng trong vòng một năm cụ thể. Độ bền này tương ứng với mức tổn thất trung bình năm của đối tượng bằng 0,000000001%. Ví dụ: nếu lưu trữ 10.000.000 đối tượng bằng Amazon S3, dự kiến bạn có thể bị mất trung bình một đối tượng sau mỗi 10.000 năm. S3 trên Outposts được thiết kế để lưu trữ dữ liệu dự phòng và bền lâu trên nhiều thiết bị và máy chủ trên Outpost của bạn. Ngoài ra, Amazon S3 Tiêu chuẩn, S3 Standard-IA, S3 Glacier, và S3 Glacier Deep Archive đều được thiết kế để duy trì dữ liệu trong trường hợp tổn thất toàn bộ Vùng sẵn sàng S3.

Đối với bất kỳ môi trường nào, cách tốt nhất là tạo một bản sao lưu và áp dụng các biện pháp bảo vệ ngăn chặn thao tác xóa vô tình hay độc hại. Đối với dữ liệu S3, các phương án tốt nhất bao gồm phân quyền truy cập có bảo mật, Sao chép liên vùng, căn cứ theo phiên bản, và có một bản sao lưu dự phòng còn hoạt động tốt và thường xuyên được kiểm tra.

Điểm truy cập Amazon S3 là gì?

Hiện nay, khách hàng quản lý quyền truy cập vào bộ chứa S3 của họ bằng một chính sách bộ chứa giúp kiểm soát quyền truy cập cho hàng trăm ứng dụng với nhiều cấp độ quyền khác nhau.

Điểm truy cập Amazon S3 giúp đơn giản hóa việc quản lý quyền truy cập dữ liệu ở quy mô lớn cho các ứng dụng sử dụng bộ dữ liệu được chia sẻ trên S3. Với Điểm truy cập S3, giờ bạn có thể dễ dàng tạo hàng trăm điểm truy cập cho mỗi bộ chứa, mở ra cách cung cấp quyền truy cập mới vào các bộ dữ liệu được chia sẻ. Điểm truy cập cung cấp một đường dẫn tùy chỉnh vào bộ chứa, với tên máy chủ riêng và chính sách truy cập thực thi các quyền và biện pháp kiểm soát mạng cụ thể cho mọi yêu cầu được thực hiện qua điểm truy cập đó.

Điểm truy cập S3 hoạt động như thế nào?

Mỗi Điểm truy cập S3 được đặt cấu hình với chính sách truy cập dành riêng cho trường hợp sử dụng hoặc ứng dụng và một bộ chứa có thể có hàng trăm điểm truy cập. Ví dụ: Bạn có thể tạo một điểm truy cập cho bộ chứa S3. Điểm truy cập này sẽ cấp quyền truy cập vào kho dữ liệu của bạn cho các nhóm người dùng hoặc ứng dụng. Điểm truy cập có thể hỗ trợ một người dùng hoặc ứng dụng hay nhiều nhóm người dùng hoặc ứng dụng, đồng thời cho phép quản lý riêng từng điểm truy cập. Mỗi điểm truy cập liên kết với một bộ chứa, bao gồm một kiểm soát gốc mạng và một kiểm soát Block Public Access. Ví dụ: Bạn có thể tạo một điểm truy cập với một kiểm soát gốc mạng chỉ cho phép truy cập vào ổ lưu trữ từ Virtual Private Cloud của bạn, đây là phần bị cô lập theo logic của Đám mây AWS. Bạn cũng có thể tạo một điểm truy cập với chính sách điểm truy cập được đặt cấu hình để chỉ cho phép truy cập vào các đối tượng có tiền tố đã xác định, chẳng hạn như “tài chính”.

Vì mỗi điểm truy cập sẽ chứa một tên DNS riêng nên hiện bạn có thể đặt cho các bộ chứa mới và hiện có bất cứ tên nào mình thích và không trùng lặp trong tài khoản hoặc khu vực AWS. Khi sử dụng các điểm truy cập chỉ cho phép truy cập vào VPC, hiện bạn có một cách dễ dàng và có thể kiểm tra để đảm bảo dữ liệu S3 luôn nằm trong VPC của mình. Ngoài ra, hiện bạn cũng có thể dùng Chính sách kiểm soát dịch vụ AWS để yêu cầu bất kỳ điểm truy cập mới nào trong tổ chức chỉ được truy cập vào VPC.

Chi phí sử dụng Điểm truy cập Amazon S3?

không tính thêm phí cho các điểm truy cập hoặc bộ chứa sử dụng các điểm truy cập. Chỉ áp dụng mức giá thông thường của Amazon S3.

Tóm lại

Trên đây là một số khái niệm và câu hỏi thường được hỏi đối với amazon s3, bài này mình chỉ dừng lại ở việc lý thuyết, phần tới mình sẽ bắt đầu hướng dẫn các bạn cách tạo tk, tạo bucket s3 và connect được với s3 đối với ngôn ngữ Ruby, cảm ơn các bạn đã đọc. các bạn có thể tham khảo thêm ở link này

Amazon S3