0

9Router là gì? - LLM Gateway hoàn hảo cho AI coding tools?

9Router - LLM Gateway cho AI coding tools

image.png

Nếu bạn đang dùng Claude Code, Cursor hay bất kỳ AI coding tool nào, chắc chắn đã từng gặp cảnh này: đang code ngon lành, bỗng dưng màn hình báo "quota exceeded" hay "rate limit". Phải chờ reset, phải đổi account, hoặc tệ hơn là phải trả thêm tiền cho một provider khác.

9Router sinh ra để giải quyết đúng cái bài toán đó — tự động fallback qua các AI provider khác nhau, tối ưu chi phí tối đa và không để bạn bị gián đoạn công việc.


9Router là gì?

9Router là một local proxy server chạy trên máy của bạn, đóng vai trò trung gian giữa các AI coding tool (Claude Code, Cursor, Cline...) và các AI provider (Anthropic, OpenAI, Gemini, GLM...).

Thay vì gọi thẳng tới một provider duy nhất, bạn trỏ tool của mình vào http://localhost:20128/v1 — 9Router sẽ lo phần còn lại: dịch format, track quota, và tự động chuyển sang provider tiếp theo khi cần.

┌─────────────────┐
│  Claude Code /  │
│  Cursor / Cline │
└────────┬────────┘
         │ http://localhost:20128/v1
         ▼
┌────────────────────────────────────┐
│          9Router                   │
│  • Format translation              │
│  • Quota tracking                  │
│  • Auto token refresh              │
└────────┬───────────────────────────┘
         │
         ├──▶ [Tier 1] Claude Code / Codex / Gemini CLI (subscription)
         │         ↓ quota hết
         ├──▶ [Tier 2] GLM ($0.6/1M), MiniMax ($0.2/1M)
         │         ↓ budget limit
         └──▶ [Tier 3] iFlow, Qwen, Kiro (miễn phí, không giới hạn)

Cơ chế 3-tier fallback này là điểm cốt lõi của 9Router — đảm bảo bạn never stop coding.


Các khái niệm chính

Provider

Là các nhà cung cấp AI model — Anthropic, OpenAI, Google Gemini, GLM, iFlow, Qwen... 9Router hỗ trợ 40+ providers100+ models. Mỗi provider có thể được xác thực theo 3 cách:

  • OAuth (Claude Code, Codex, Gemini CLI, GitHub Copilot, Antigravity): đăng nhập một lần, 9Router tự refresh token.
  • API Key (OpenAI, Anthropic, DeepSeek, Groq, GLM, MiniMax...): nhập key vào dashboard là xong.
  • Free providers (iFlow, Qwen, Kiro): đăng nhập bằng tài khoản của provider đó, dùng không giới hạn, không tốn tiền.

Combo

Combo là tập hợp các model theo thứ tự ưu tiên, tạo thành một fallback chain. Khi model đầu tiên hết quota hoặc lỗi, 9Router tự động chuyển sang model tiếp theo.

Ví dụ một combo thực tế:

Combo: "my-stack"
  1. cc/claude-opus-4-6        ← subscription, chất lượng cao nhất
  2. glm/glm-4.7               ← rẻ, $0.6/1M token, reset hàng ngày
  3. if/kimi-k2-thinking       ← miễn phí, không giới hạn

Bạn chỉ cần set model là my-stack trong tool của mình — mọi thứ còn lại là tự động.

Quota Tracking

9Router theo dõi lượng token đã dùng theo từng provider, hiển thị trực tiếp trên dashboard kèm countdown đến lần reset tiếp theo (5 giờ, hàng ngày, hàng tuần tùy provider). Rất hữu ích để maximize giá trị subscription thay vì để quota "chết" cuối tháng.

Format Translation

Các provider dùng format API khác nhau — OpenAI dùng chuẩn riêng, Anthropic (Claude) cũng vậy, Gemini cũng khác. 9Router dịch tự động giữa các format này, nên tool của bạn chỉ cần nói một "ngôn ngữ" (OpenAI-compatible) là đủ.


Cài đặt

Yêu cầu

  • Node.js 20+
  • npm

Cài nhanh bằng npm (khuyến nghị)

npm install -g 9router
9router

Dashboard sẽ tự mở tại http://localhost:20128. Mật khẩu mặc định: 123456 (nhớ đổi ngay nếu deploy lên server).

Chạy từ source

git clone https://github.com/decolua/9router.git
cd 9router
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

Production build:

npm run build
PORT=20128 HOSTNAME=0.0.0.0 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run start

Chạy bằng Docker

# Build image
docker build -t 9router .

# Run
docker run -d \
  --name 9router \
  -p 20128:20128 \
  --env-file ./.env \
  -v 9router-data:/app/data \
  9router

Sau khi chạy:

  • Dashboard: http://localhost:20128/dashboard
  • API endpoint: http://localhost:20128/v1

Kết nối Provider

image.png

Antigravity (miễn phí — nên làm đầu tiên)

Đây là provider có các model xịn xò từ Claude (Opus 4.6, Sonet 4.6) và model Gemini có quota khá dư dả.

  1. Dashboard → ProvidersConnect Gemini CLI
  2. Đăng nhập Google OAuth
  3. Models có thể dùng ngay: ag/gemini-3-flash-preview, ag/gemini-2.5-pro, ag/claude-opus-4-6-thinking, ag/claude-sonnet-4-6.

Claude Code (nếu đang dùng Claude Pro/Max)

  1. Dashboard → ProvidersConnect Claude Code
  2. OAuth login
  3. Models: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

iFlow (miễn phí, không giới hạn)

  1. Dashboard → Connect iFlow
  2. OAuth login với tài khoản iFlow
  3. Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/deepseek-r1...

GLM (rẻ, backup tốt)

  1. Đăng ký tại open.bigmodel.cn — chọn Coding Plan
  2. Lấy API key
  3. Dashboard → Add API Key → Provider: glm → Paste key

Model: glm/glm-4.7 — $0.6/1M token, reset quota lúc 10:00 sáng hàng ngày.


Tạo Combo

image.png

Sau khi có ít nhất 2 providers, tạo combo để có fallback:

  1. Dashboard → CombosCreate New
  2. Đặt tên (ví dụ: free-combo hoặc premium-stack)
  3. Thêm models theo thứ tự ưu tiên

Combo zero cost (hoàn toàn miễn phí):

Name: free-forever
Models:
  1. gc/gemini-3-flash-preview   (Quota lớn)
  2. if/kimi-k2-thinking         (không giới hạn)
  3. qw/qwen3-coder-plus         (không giới hạn)

Combo maximize subscription:

Name: premium-coding
Models:
  1. cc/claude-opus-4-6          (subscription - chất nhất)
  2. glm/glm-4.7                 ($0.6/1M - backup)
  3. if/kimi-k2-thinking         (miễn phí - safety net)

Tích hợp với AI Tools

Tùy thuộc vào công cụ bạn muốn sử dụng với 9router sẽ có các cách khác nhau để kích hoạt.

VÍ dụ với Antigravity hay Copilot 9Router sẽ cần gắn thêm DNS record vào /etc/hosts để chuyển hướng request đi qua LLM Gateway này

Tuy nhiên đối với Claude Code hay Claude Cowork thì sẽ cần kích hoạt tính năng Tunnel và 9Router sẽ thay đổi LLM Gateway các công cụ này chạy qua endpoint của tunnel này.

image.png

image.png

Đối với từng công cụ ta có thể chọn Combo hoặc model cụ thể để ghi đè lên các lựa chọn có trong công cụ

Một số câu hỏi thường gặp

Dashboard hiển thị cost $200-300 nhưng mình dùng iFlow (miễn phí) — có bị charge không?

Không. Con số đó chỉ là "savings tracker" — cho thấy bạn đã tiết kiệm được bao nhiêu so với dùng paid API trực tiếp. 9Router không bao giờ charge bạn bất cứ thứ gì.

Token tự refresh không? Có cần login lại không?

Với OAuth providers (Claude Code, Codex, Gemini...), 9Router tự động refresh token trước khi hết hạn. Trường hợp có vấn đề: Dashboard → Provider → Reconnect.

Deploy lên VPS để dùng chung được không?

Được. Đặt HOSTNAME=0.0.0.0, JWT_SECRET mạnh, INITIAL_PASSWORD mới, và bật REQUIRE_API_KEY=true nếu expose ra internet. Nên dùng thêm reverse proxy (nginx) với HTTPS.


Kết

9Router giúp bạn tận dụng tất cả quota từ các provider để tiết kiệm tối đa chi phí, rất phù hợp cho các anh em sinh viên hay đang vọc vạch làm quen với AI.

Tuy nhiên trong quá trình sử dụng thì mình vẫn gặp một vài vấn đề như model phản hồi chậm hay 9Router liên tục sử dụng tài khoản đã hết quota. Đây là các lỗi vẫn còn tồn tại ở 9Router, mình tin các lỗi này sẽ sớm được khắc phục trong tương lai gần với các cập nhật liên tục gần đây.

Dù sao 9Router vẫn là một công cụ rất đáng để thử!


Tham khảo


All rights reserved

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí