Big Data là gì? 5 Vs của Big Data là gì? Tại sao nó quan trọng?
Bài đăng này đã không được cập nhật trong 5 năm
Nếu các bạn làm việc trong ngành công nghệ thông tin hay là những tổ chức lớn như Y Tế, Ngân Hàng.. chắc rằng các bạn đã từng nghe qua cụm từ “Big Data” hay còn được biết đến với cái tên Dữ Liệu Lớn. Vậy Big Data là gì? Và tầm quan trọng của nó như thế nào?
Big Data là gì?
Big Data là một thuật ngữ rộng cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Bao gồm các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan hóa, truy vấn và tính riêng tư. Thuật ngữ Big Data thường được hiểu đơn giản là sử dụng để phân tích dự đoán hoặc là một số phương pháp tiên tiến khác rõ ràng để trích xuất giá trị từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu. Độ chính xác trong Big Data có thể dẫn tới ra quyết định đúng đắng hơn, và những quyết định tốt hơn có thể đưa đến kết quả hoạt động tốt hơn như giảm chi phí và rủi ro.
5 Vs của Big Data là gì?
Để có được những khái niệm đúng nhất, những nhà nghiên cứu đã dùng 5Vs để miêu tả về những gì Big Data có thể làm được và hoạt động mạnh như thế nào. 5Vs đấy bao gồm:
Volume (Tổng dung lượng lưu trữ) Nói về số lượng dữ liệu được tạo và lưu trữ. Kích thước của dữ liệu sẽ được đánh giá là có giá trị và có tiềm năng hay không, và để xem xét liệu nó có thể được coi là dữ liệu lớn hay không.
Với số lượng lớn thông tin hàng ngày liên tục được update trên Internet, vd như: Facebook nhận được gần 350 triệu hình ảnh, hơn 4.5 tỷ lượt like, và gần 10 tỷ tin nhắn, comment mỗi ngày. Vì lý do đó, những kiểu lưu trữ và phân tích dữ liệu truyền thống không cách nào có thể làm được. Nhưng với công nghệ chúng ta đang nói tới đây, nó có thể dễ dàng xử lý và lưu trữ tất cả những thông tin trên các hệ thống chi nhánh nhỏ tách biệt.
Variety (Đa dạng kiểu dữ liệu) Khái niệm này nói về type of data (kiểu dữ liệu) và nature of data (tính chất của dữ liệu). Điều này giúp những người phân tích nó sử dụng hiệu quả thông tin chi tiết về kết quả. Chúng được tập hợp từ những text (văn bản), image (hình ảnh), sound (âm thanh), video; cộng với nó hoàn thành phần còn thiếu thông qua những thuật toán tổng hợp dữ liệu.
Velocity (Khả năng xử lý tốc độ cao) Trong thời đại ngày nay, tốc độ dữ liệu được tạo ra và xử lý để đáp ứng nhu cầu và thách thức nằm trong con đường tăng trưởng và phát triển. Dữ liệu lớn thường có sẵn trong thời gian thực.
Tốc độ của một data (dữ liệu) được tạo ra và rồi được chuyển từ nơi này sang nơi khác hiện tại đã đạt đến mức kinh ngạc. Như việc mọi người có thể chat với nhau trên facebook với tốc độ nhanh chóng trong môi trường mạng hiện nay. Big Data cho phép chúng ta có thể phân tích các thông số của một dữ liệu được tạo ra mà không cần phải lưu chúng xuống database.
Variability (Độ chính xác) Vì đa dạng về các kiểu dữ liệu, nên sự không thống nhất của tập dữ liệu có thể cản trở các quy trình để xử lý và quản lý nó. Do đó, độ chính xác của công nghệ này có thể đảm bảo giúp cho việc giảm bớt sự sai lệch đáng tiếc có thể xảy ra.
Value (Mức độ giá trị của thông tin) Chất lượng dữ liệu của những dữ liệu lấy được có thể thay đổi rất nhiều, điều này sẽ ảnh hưởng rất mạnh đến việc phân tích chính xác những đấy. Ta có thể xem đây là tính chất cũng là khái niệm mà những doanh nghiệp hay nhà nghiên cứu muốn sử dụng và khai thác Big Data phải nắm giữ và am hiểu nó đầu tiên.
Tại sao nó quan trọng?
Tầm quan trọng của Big Data hiện không xoay quanh việc bạn có bao nhiêu dữ liệu, nhưng bạn làm gì với nó. Bạn có thể lấy dữ liệu từ bất kỳ nguồn nào và phân tích nó để tìm câu trả lời cho phép 1) giảm chi phí, 2) giảm thời gian, 3) phát triển sản phẩm mới và cung cấp tối ưu hóa và 4) đưa ra quyết định thông minh. Khi bạn kết hợp dữ liệu lớn với các phân tích mạnh mẽ, bạn có thể thực hiện các tác vụ liên quan đến kinh doanh như:
- Xác định nguyên nhân gốc rễ của sự thất bại, vấn đề và khiếm khuyết trong thời gian gần như thực.
- Tạo phiếu giảm giá tại điểm bán hàng dựa trên thói quen mua hàng của khách hàng.
- Tính toán lại toàn bộ danh mục rủi ro trong vài phút.
- Phát hiện hành vi gian lận trước khi nó ảnh hưởng đến tổ chức của bạn.
**Tham khảo: ** https://www.sas.com/en_us/insights/big-data/what-is-big-data.html
All rights reserved