1.2K 28 49

Đã đăng vào thg 5 22, 5:10 SA

trong

20 phút đọc

457

Gemini Spark: Agent AI cá nhân chạy 24/7 của Google - Phân tích toàn diện

MayFest2026

Gemini Spark, ra mắt tại Google I/O ngày 19/5/2026, là agent AI cá nhân đầu tiên chạy liên tục 24/7 trên máy chủ Google Cloud và tiếp tục thực hiện tác vụ ngay cả khi bạn tắt máy tính hoặc khóa điện thoại. Infinity News tổng hợp toàn bộ thông tin từ I/O 2026 và tài liệu kỹ thuật của Google, cho thấy Spark đại diện cho một mô hình tín nhiệm hoàn toàn khác với chatbot: thay vì bạn mở, hỏi và đóng, bạn cấp quyền truy cập thường trực và agent tự làm việc.

Tóm tắt các điểm chính

Gemini Spark chạy trên Gemini 3.5 Flash và hệ thống điều phối Antigravity, kết nối Gmail, Docs, Calendar qua giao diện lập trình chính thức thay vì đọc màn hình theo từng điểm ảnh như nhiều agent khác
Ba nhóm tính năng cốt lõi: tác vụ lặp lại theo lịch hoặc điều kiện kích hoạt, kỹ năng có thể dạy và lưu lại, và chuỗi workflow nhiều bước xuyên nhiều ứng dụng
Spark yêu cầu gói Google AI Ultra 100 USD/tháng và hiện chỉ có tại Mỹ dạng beta; Claude Max và ChatGPT Pro cùng mức giá nhưng đã phát hành rộng rãi
Quyền riêng tư là vấn đề thực chất, không phải cảnh báo xã giao: agent này cần quyền truy cập thường trực vào hộp thư và lịch của bạn để làm việc
Tại launch, Spark kết nối bên ngoài Google với ba ứng dụng: Canva, OpenTable và Instacart; nhiều đối tác hơn đang được thêm vào

Infinity News phân tích từng khía cạnh dưới đây theo bối cảnh cuộc cạnh tranh agent AI năm 2026 và ý nghĩa thực tế với người dùng.

Gemini Spark là gì và điểm gì làm nó thực sự khác chatbot?

Gemini Spark là agent AI cá nhân chạy trên máy chủ ảo Google Cloud, tiếp tục hoạt động ngay cả khi thiết bị của bạn đã tắt. Đây là điểm khác biệt kiến trúc cốt lõi so với mọi chatbot AI hiện tại: ChatGPT hay Claude chỉ hoạt động khi bạn chủ động mở ứng dụng và đặt câu hỏi. Spark chạy nền liên tục.

Spark kết nối với Gmail, Docs, Slides và các ứng dụng Workspace khác thông qua giao diện lập trình chính thức của Google, không phải bằng cách đọc những gì hiển thị trên màn hình như một số agent khác. Cách tiếp cận này làm Spark đáng tin cậy hơn nhưng cũng giới hạn hơn: hiện tại nó chỉ làm việc được với các dịch vụ đã được kết nối.

Sundar Pichai mô tả tại I/O 2026: "Bạn không cần giữ laptop mở để đảm bảo nó đang chạy." Đây là thay đổi về mô hình, không phải nâng cấp tính năng.

Gemini Spark có thể làm những gì cụ thể trong công việc hàng ngày?

Spark được thiết kế để xử lý ba nhóm tác vụ riêng biệt, mỗi nhóm có mức độ phức tạp và yêu cầu tin cậy khác nhau.

Tác vụ lặp lại và điều kiện kích hoạt

Spark có thể xử lý tác vụ lặp lại theo lịch cố định hoặc tự động chạy khi một điều kiện được đáp ứng. Ví dụ: bảo Spark mỗi đầu tháng kéo số giờ đã ghi từ Google Sheet, tạo hóa đơn trong Docs, rồi gửi email cho khách hàng, tất cả tự động mà không cần bạn hiện diện. Hoặc phân tích sao kê thẻ tín dụng để tự động gắn cờ các phí đăng ký ẩn.

Đây là loại tác vụ mà con người thường bỏ qua không phải vì khó mà vì lặp đi lặp lại và tẻ nhạt. Spark không bao giờ quên và không bao giờ trễ lịch.

Kỹ năng có thể dạy và lưu lại

Bạn có thể dạy Spark các hành vi có thể tái sử dụng bằng cách mô tả bằng ngôn ngữ thông thường, và Spark lưu lại kỹ năng đó để áp dụng mọi lần sau. Ví dụ điển hình từ Google: nếu bạn viết nhiều email liên hệ, hãy để Spark phân tích 50 email đã gửi gần nhất, chắt lọc phong cách viết của bạn thành một kỹ năng "người viết bóng", rồi áp dụng mỗi khi bạn yêu cầu soạn thảo. Kỹ năng này tồn tại xuyên suốt các phiên làm việc: bạn dạy một lần, Spark nhớ mãi.

Điều thú vị về kiến trúc ở đây là kỹ năng không chỉ là câu lệnh được lưu lại. Spark thực sự phân tích pattern từ dữ liệu thực của bạn, nghĩa là phong cách viết được học từ email bạn đã gửi thực sự, không phải từ mô tả chung chung.

Chuỗi workflow nhiều bước xuyên nhiều ứng dụng

Spark có thể kết nối nhiều bước liên tiếp qua nhiều ứng dụng khác nhau từ một lệnh duy nhất. Ví dụ thực tế: nếu bạn vừa kết thúc cuộc họp lập kế hoạch, yêu cầu Spark kéo danh sách action item từ cuộc trò chuyện Gmail, tạo bảng theo dõi dự án trong Sheets với người phụ trách và thời hạn, soạn email khởi động gửi cho team, và lên lịch nhắc nhở follow-up trong Calendar, tất cả từ một lệnh.

Đây là sức mạnh thực sự của Spark so với chatbot: không phải làm từng việc một khi bạn yêu cầu, mà chuỗi toàn bộ quy trình và thực hiện không cần giám sát.

Gemini Spark kết nối với ứng dụng bên ngoài Google như thế nào?

Spark kết nối với ứng dụng bên ngoài Google thông qua MCP, một giao thức kết nối tiêu chuẩn cho phép agent AI tương tác an toàn với dịch vụ bên thứ ba. Tại thời điểm ra mắt, ba ứng dụng được hỗ trợ là Canva (thiết kế), OpenTable (đặt bàn nhà hàng) và Instacart (mua sắm tạp hóa). Trong các tuần tới, Spark sẽ dùng các kết nối này để thực hiện hành động bên trong ứng dụng bên thứ ba, không chỉ đọc thông tin từ đó.

Trên roadmap gần: khả năng nhắn tin và gửi email trực tiếp cho Spark, tạo agent phụ tùy chỉnh, và kiểm soát trình duyệt local từ ứng dụng desktop. Danh sách ứng dụng được hỗ trợ còn hẹp hơn nhiều so với hệ sinh thái plugin của ChatGPT hoặc tích hợp MCP của Claude ở thời điểm này.

Gemini Spark trên macOS có gì và khi nào có?

Ứng dụng Gemini desktop cho macOS có thể tải ngay hôm nay tại gemini.google/mac, nhưng tính năng Spark và giọng nói sẽ ra mắt vào cuối hè 2026. Phiên bản macOS cho phép Spark hỗ trợ tác vụ liên quan đến file local và tự động hóa workflow trên desktop, mở rộng phạm vi hoạt động ra ngoài hệ sinh thái web của Google.

Tính năng giọng nói mới chuyển lời nói tự do thành bản nháp chính xác, sử dụng ngữ cảnh màn hình để nắm bắt ý định của bạn. Điều này khác với chỉ đọc giọng nói và chép lại: Spark dùng những gì nó thấy trên màn hình để hiểu bạn đang nói về điều gì.

Quyền riêng tư là rủi ro như thế nào khi dùng Gemini Spark?

Gemini Spark yêu cầu quyền truy cập thường trực vào Gmail, Calendar, Docs và các dịch vụ bên thứ ba, và đây là đánh đổi có thực, không phải cảnh báo hình thức. Để đặt bàn ăn tối, Spark sẽ chuyển tên và sở thích của bạn cho OpenTable. Đó không phải là chi phí ẩn mà là cách sản phẩm này vận hành.

Google tương đối minh bạch về điều này. Trang sản phẩm Spark chính thức nói rõ với người dùng hãy "kiểm tra phản hồi" và "giám sát chặt, ngắt khi cần." Google cũng xác nhận Spark "được thiết kế để hỏi bạn trước khi thực hiện các hành động có tác động lớn như chi tiền hoặc gửi email." Quyền truy cập mặc định là tắt; bạn tự chọn ứng dụng nào kết nối và có thể tắt hoàn toàn.

Điểm quan trọng hơn cần hiểu: agent chạy 24/7 với quyền truy cập hộp thư và lịch là mô hình tín nhiệm khác hoàn toàn so với chatbot bạn mở, hỏi và đóng. Bạn đang cấp quyền thường trực, không phải quyền từng lần. Điều đó không có nghĩa là nguy hiểm, nhưng có nghĩa là quyết định thiết lập quan trọng hơn bình thường.

Infinity News khuyến nghị cách tiếp cận thực tế: bắt đầu với danh sách ứng dụng được cấp phép tối thiểu. Kết nối một hoặc hai dịch vụ bạn thực sự muốn Spark hành động, quan sát cách nó xử lý, rồi mở rộng dần. Không có lý do gì để cấp quyền cho mọi thứ ngay ngày đầu, và giao diện của Google cho phép làm điều đó dễ dàng.

Gemini App thay đổi thêm những gì ngoài Spark?

Bản cập nhật I/O 2026 chạm đến nhiều phần khác của ứng dụng Gemini ngoài Spark, với ba thay đổi đáng chú ý độc lập.

Daily Brief là agent riêng chạy qua đêm và cung cấp tóm tắt buổi sáng cá nhân hóa. Nó kéo email và sự kiện lịch, suy luận dựa trên mục tiêu của bạn, rồi tổ chức thành bản tóm lược dễ đọc nhanh với các bước tiếp theo được gợi ý. Daily Brief được xây trên thí nghiệm CC từ Google Labs. Bạn có thể định hướng nó theo thời gian bằng phản hồi thích/không thích. Đang triển khai ngay hôm nay cho người đăng ký Google AI Plus, Pro và Ultra tại Mỹ.

Neural Expressive là ngôn ngữ thiết kế mới cho toàn bộ ứng dụng Gemini, với hoạt ảnh, kiểu chữ và microphone xử lý được lời nói liên tục dài hơn. Thay đổi thực tế quan trọng hơn là Gemini giờ tạo ra phản hồi định dạng hỗn hợp (dòng thời gian, đồ họa tương tác, video có lời tường thuật) thay vì mặc định văn bản thuần túy. Neural Expressive đang triển khai toàn cầu ngay hôm nay trên web, Android và iOS.

Gemini Omni là model mới nhận bất kỳ kết hợp nào của văn bản, hình ảnh và video làm đầu vào rồi xuất ra video. Omni đang triển khai ngay hôm nay cho người đăng ký AI Plus, Pro và Ultra trên toàn thế giới.

Tại sao Gemini Spark quan trọng với toàn ngành AI agent?

Sự dịch chuyển từ "trợ lý trả lời câu hỏi" sang "agent hoàn thành tác vụ" là hướng mà mọi nền tảng AI lớn đang đi. ChatGPT agent của OpenAI chủ yếu hoạt động qua trình duyệt. Claude Cowork của Anthropic làm việc trực tiếp trên desktop người dùng. Microsoft Copilot Cowork được neo vào dữ liệu Office 365. Apple đang chuẩn bị Siri được nâng cấp cho WWDC 2026, một phần được hỗ trợ bởi chính mô hình Gemini của Google thông qua hợp đồng nhiều năm.

Điểm khác biệt của Spark so với các agent cạnh tranh là nó chạy trên máy chủ Google suốt ngày đêm và cắm trực tiếp vào ứng dụng của Google. Vì kết nối qua giao diện lập trình chính thức thay vì đọc màn hình, nó đáng tin cậy hơn, nhưng cũng giới hạn hơn. Hiện tại Spark chỉ làm việc với các dịch vụ đã được kết nối.

Với data scientist và kỹ sư ML, hạ tầng đằng sau Spark đáng theo dõi riêng. Spark chạy trên Antigravity, hệ thống có thể chạy nhiều agent phụ song song và xử lý tác vụ mất nhiều thời gian. Spark là sản phẩm tiêu dùng xây trên đó, nhưng kiến trúc bên dưới tương tự có sẵn qua Gemini API cho developer.

Cách truy cập Gemini Spark và giá bao nhiêu?

Truy cập Gemini Spark yêu cầu gói Google AI Ultra 100 USD/tháng và hiện chỉ có tại Mỹ dạng beta. Google tái cấu trúc các gói đăng ký cùng với thông báo I/O:

AI Ultra 100 USD/tháng: giới hạn usage cao gấp 5 lần gói Pro, 20TB lưu trữ đám mây, YouTube Premium, quyền truy cập ưu tiên Antigravity và Gemini Spark (chỉ Mỹ, beta)
AI Ultra 200 USD/tháng: giới hạn usage cao gấp 20 lần gói Pro, cùng quyền truy cập Spark, cộng thêm Project Genie và bộ tính năng đầy đủ. Gói này giảm từ 250 USD/tháng trước đó
AI Plus và Pro: quyền truy cập Daily Brief và Gemini Omni, nhưng không có Spark

Spark đang triển khai cho người thử nghiệm tin cậy tuần này. Beta rộng hơn cho người đăng ký Google AI Ultra tại Mỹ dự kiến tuần sau. Không có cách tự đăng ký nhóm thử nghiệm tin cậy; bạn cần chờ đợt beta.

Khi có quyền truy cập, thiết lập gồm mở ứng dụng Gemini và điều hướng đến cài đặt Spark, chọn ứng dụng nào Spark được kết nối (Gmail, Docs, Slides và các đối tác MCP gồm Canva, OpenTable, Instacart), đặt tùy chọn về khi nào Spark cần hỏi trước khi hành động so với tự động tiến hành, rồi giao tác vụ bằng cách mô tả bằng ngôn ngữ thông thường.

Gói 100 USD/tháng của Google, Claude và OpenAI: cái nào đáng hơn?

Ba nền tảng AI lớn đều có gói 100 USD/tháng, nhưng những gì bạn nhận được rất khác nhau tùy theo nhu cầu cụ thể.

Tính năng	Google AI Ultra (100 USD/tháng)	Claude Max (100 USD/tháng)	ChatGPT Pro (100 USD/tháng)
Agent chạy liên tục	Gemini Spark (24/7, cloud, hoạt động khi tắt thiết bị)	Không có	Không có
Lập trình với agent	Antigravity (ưu tiên, gấp 5 lần Pro)	Claude Code (terminal, gấp 5 lần Pro)	Codex (cloud sandbox, gấp 5 lần Plus)
Agent trên desktop	Spark trên macOS (hè 2026)	Claude Cowork (nhận diện màn hình, đa bước)	ChatGPT Agent (nghiên cứu sâu qua trình duyệt)
Tích hợp bên thứ ba	MCP (Canva, OpenTable, Instacart khi launch)	MCP + tín dụng Agent SDK	1.000+ custom GPT và plugin
Model	Gemini 3.5 Flash	Claude Opus 4.7, Sonnet 4.6	GPT-5.5 Pro, GPT-5.3-Codex
Giới hạn usage	Gấp 5 lần Pro	Gấp 5 lần Pro	Gấp 5 lần Plus
Lưu trữ đám mây	20TB (Google One)	Không có	Không có
Thêm	YouTube Premium	Không có	Tạo ảnh không giới hạn
Phạm vi	Chỉ Mỹ (beta)	Phát hành rộng rãi	Phát hành rộng rãi

Gói 100 USD của Google là duy nhất có agent cloud bền vững, điều này thực sự tạo ra sự khác biệt. Thêm vào đó 20TB lưu trữ và YouTube Premium làm cho giá trị trên giấy rõ ràng nhất. Nhưng Spark là beta chỉ tại Mỹ với cảnh báo thử nghiệm, trong khi Claude Max và ChatGPT Pro đã phát hành rộng rãi với công cụ agent trưởng thành hơn.

Nếu bạn đã dùng hệ sinh thái Google sâu (Gmail, Docs, Sheets là công cụ hàng ngày): gói 100 USD của Google có lý do mạnh nhất. Tự động hóa always-on của Spark cho Workspace là thứ hai platform kia chưa có, và 20TB lưu trữ cùng YouTube Premium là thêm thắt thực sự.

Nếu bạn là developer quan tâm đến Antigravity và giới hạn API Gemini cao hơn: giá trị nằm ở quyền truy cập hạ tầng, không phải bản thân Spark.

Nếu bạn chủ yếu muốn agent AI có năng lực ngay hôm nay: Claude Max và ChatGPT Pro là lựa chọn an toàn hơn. Họ đã phát hành rộng rãi, không ở beta, và công cụ agent của họ trưởng thành hơn. Thực thi bền vững của Spark là điểm khác biệt thực sự, nhưng khó khuyến nghị trả 100 USD/tháng cho tính năng vẫn chỉ ở Mỹ và đang thử nghiệm.

Kết luận

Infinity News nhận thấy toàn bộ thông tin về Gemini Spark chỉ về một kết luận: đây là câu trả lời trực tiếp nhất của Google cho câu hỏi về điều một trợ lý AI nên thực sự làm, và cũng là sản phẩm đặt ra câu hỏi khó nhất về ranh giới tự chủ của agent AI.

Mô hình thực thi cloud bền vững là khác biệt kiến trúc thực sự so với chatbot, và độ tích hợp sâu với Workspace khó sao chép nhanh với đối thủ. Nhưng câu hỏi lớn hơn không phải về Google cụ thể, mà về ý nghĩa khi cấp cho bất kỳ agent AI nào quyền truy cập thường trực vào hộp thư, lịch và cuối cùng là phương thức thanh toán của bạn. Chúng ta vẫn đang trong giai đoạn đầu xác định các quy tắc về mức độ tự chủ mà các công cụ này nên có mặc định. Cách tiếp cận của Google là giữ quyền tắt mặc định và để bạn tự cho phép từng dịch vụ là điểm khởi đầu hợp lý, nhưng các chuẩn mực xung quanh agent always-on đang được định hình theo thời gian thực trên toàn ngành.

Gemini Spark Google I/O 2026 ai agents