Đã đăng vào thg 3 19, 5:01 CH 6 phút đọc

Agentic Storage Là Gì? Giải Quyết Vấn Đề Stateless Của LLM Trong Agentic AI

Nếu bạn đang xây dựng AI agent tự động (không chỉ là chatbot), bạn sẽ nhanh chóng gặp phải một vấn đề lớn: agent “quên sạch” mọi thứ sau mỗi session. Video mới nhất từ IBM Technology (Martin Keen) giải thích rõ ràng khái niệm Agentic Storage – một lớp lưu trữ được thiết kế đặc biệt cho agent, kết hợp RAG + MCP (Model Context Protocol) và các lớp bảo mật thông minh. Bài blog này sẽ phân tích sâu kỹ thuật, phù hợp cho developer muốn implement agentic workflow thực tế.

1. Agentic AI không phải chatbot – Và vấn đề stateless của nó

Agentic AI là hệ thống LLM có khả năng thực thi hành động autonomously: viết code, remediate incident, tạo playbook, gọi API…
Nhưng LLM bản chất là stateless:

Toàn bộ “bộ nhớ” nằm trong context window (giống như RAM – volatile).
Khi session kết thúc hoặc context đầy → agent quên hết những gì đã làm.
Kết quả: agent không thể tiếp tục công việc từ session trước, không lưu được output lâu dài.

Đây chính là lý do nhiều dự án agent thất bại ở production.

2. RAG chỉ giải quyết một nửa vấn đề (input side)

Retrieval-Augmented Generation (RAG) giúp agent “nhớ” thông tin đầu vào:

Kết nối LLM với vector database (chứa document, policy, historical data).
Agent thực hiện semantic search → pull relevant context vào prompt.

Hạn chế lớn: RAG là read-only.
Nó giải quyết “input problem” (đưa dữ liệu vào model) nhưng không giải quyết output problem.

Ví dụ:

Agent viết xong một Python script hoặc remediation playbook → lưu ở đâu?
Không có nơi nào để lưu persistent work product → agent không thể reuse hoặc audit sau này.

3. Agentic Storage – “Hard drive” dành riêng cho AI agent

Agentic Storage không chỉ là storage thông thường. Nó là lớp lưu trữ aware of autonomous agents, cho phép agent:

Lưu output lâu dài giữa các session.
Đọc/ghi file, snapshot, version một cách chuẩn hóa.
Hoạt động an toàn mà không cần custom integration cho từng loại storage (object storage, block storage, NAS…).

Thay vì viết riêng API cho mỗi hệ thống storage (vừa tốn công, vừa không scale), ngành đang hội tụ về một chuẩn duy nhất: Model Context Protocol (MCP).

4. MCP (Model Context Protocol) – “Universal adapter” cho agent

MCP được giới thiệu bởi Anthropic và nhanh chóng được IBM cũng như cộng đồng adopt. Kiến trúc cơ bản:

MCP Host (AI application chạy agent)
       ↓ (JSON-RPC)
MCP Server (lớp storage – object/block/NAS đều được)

Đặc điểm nổi bật:

Sử dụng JSON-RPC làm giao thức.
Expose 2 loại primitives chính:

a. Resources (passive data objects)
- File contents, database records…
- Tương tự RAG nhưng được chuẩn hóa, agent request resource một cách thống nhất.
b. Tools (executable functions)
- list_directory, read_file, write_file, create_snapshot, rollback_version…
- Agent gọi tool → MCP Server tự translate xuống storage backend (agent không cần biết backend là gì).

Kết quả: agent chỉ cần biết 1 giao thức duy nhất, dù bạn đang dùng IBM Storage, S3, Ceph hay local filesystem.

5. Ba lớp bảo mật bắt buộc – Vì agent có thể “hallucinate”

Cho agent quyền ghi vào storage là cực kỳ nguy hiểm (hallucination, misinterpretation, confused deputy problem). Agentic Storage tích hợp sẵn 3 safety layer:

Immutable Versioning
- Mọi write đều tạo new version thay vì overwrite.
- Agent không thể xóa thật sự → chỉ archive.
- Audit trail hoàn chỉnh + rollback bất kỳ lúc nào.
- Developer lợi ích: dễ dàng debug “agent đã làm gì sai ở version nào”.
Sandboxing
- Agent chỉ được phép truy cập specific directories và specific operations.
- Ví dụ: agent quản lý application logs → không có path đến /etc/systemd hoặc binary hệ thống.
- Ngăn chặn hoàn toàn confused deputy problem.
Intent Validation (lớp thứ 3)
- Trước khi thực thi tool, hệ thống kiểm tra xem hành động có phù hợp với intent của user/task không.
- Thêm một lớp “human-in-the-loop” hoặc policy engine để reject hành động nguy hiểm.

6. Developer nên implement Agentic Storage như thế nào?

Bước thực tế bạn có thể làm ngay:

Chọn MCP Server sẵn có
- IBM vừa open-source IBM Storage Insights MCP Server (xem community.ibm.com).
- Hoặc tự build MCP Server đơn giản với JSON-RPC (có spec public từ Anthropic).

Tích hợp vào agent framework (LangGraph, CrewAI, AutoGen…):

# Pseudocode MCP tool call
tool_call = {
    "jsonrpc": "2.0",
    "method": "write_file",
    "params": {
        "path": "/agents/playbooks/incident-123.md",
        "content": playbook_content,
        "version": "v2"
    }
}
response = mcp_server.call(tool_call)

Kết hợp với RAG + Vector DB
- RAG để đọc context.
- Agentic Storage (MCP) để lưu output + version.
Best practices:
- Luôn bật immutable versioning.
- Thiết kế sandbox policy theo least-privilege.
- Log mọi MCP call để audit (đặc biệt khi agent tự hành động).
- Test với “adversarial prompts” để kiểm tra safety layer.

7. Lợi ích thực tế khi áp dụng

Agent có thể tiếp tục công việc sau khi restart hoặc scale ngang.
Work product (code, playbook, report) trở thành first-class citizen trong hệ thống.
Giảm đáng kể chi phí context window (không cần nhét hết history vào prompt).
Tăng tính auditability & compliance – cực kỳ quan trọng cho enterprise.

Kết luận & Tài liệu tham khảo

Agentic Storage + MCP chính là bước tiến lớn giúp AI agent từ “thông minh nhưng hay quên” trở thành “thông minh và đáng tin cậy”. Nếu bạn đang build production-grade agentic system, đây là công nghệ bạn không thể bỏ qua năm 2026.

Nguồn chính: Video “What Is Agentic Storage? Solving AI’s Limits with LLMs & MCP” – IBM Technology (Martin Keen).
Link xem video: https://www.youtube.com/watch?v=TjvT9sI5mLE
Tìm hiểu thêm:

IBM Agentic AI: https://ibm.biz/BdpBks
IBM Storage Insights MCP Server (open-source)