CopilotKit是什麼
CopilotKit 是開源的AI原生應用前端操作系統。工具支持三種 Generative UI 模式,包含受控、聲明式 A2UI、開放式,讓 AI Agent 不再停留在聊天框,能直接在應用內實時生成交互界面。團隊推出了 AG-UI 協議,實現雙向狀態同步、Human-in-the-Loop、持久 Threads 等功能,一次集成可多端全通。

CopilotKit的主要功能
- 三種 Generative UI 模式
-
受控模式(Controlled):開發者預定義 React 組件,Agent 只負責挑選組件和填充數據,確保品牌風格完全一致。
-
聲明式模式(A2UI):Agent 輸出 JSON schema,前端自動映射成組件,適合覆蓋長尾低頻功能而無需手寫代碼。
-
開放式模式(Open-ended):Agent 直接生成 HTML 或驅動 Excalidraw 等工具,適合一次性探索性可視化場景。
-
- 雙向狀態同步:Agent 能直接修改狀態,實現前端與 Agent 的實時雙向綁定。
- Human-in-the-Loop:Agent 可在關鍵執行節點暫停,彈出確認框請求用戶審批後再繼續操作。
- 持久 Threads:所有對話、狀態、生成的 UI 自動持久化,用戶下次打開應用可從斷點無縫續接。
- AG-UI 協議全棧打通:作爲行業標準協議,支持一次編寫 Agent 邏輯,在 Web、Mobile、Slack 等多端同時運行。
CopilotKit的技術原理
- AG-UI 協議層:協議定義了 AI Agent 與用戶界面之間的實時通信標準。工具通過標準化的消息格式和事件流,讓 Agent 能直接生成結構化 UI 指令,實現從對話到操作界面的範式轉換。
- 三種 Generative UI 渲染機制:受控模式通過預註冊的 React 組件映射表,讓 LLM 在工具調用時僅返回組件 ID 與數據載荷,前端按固定渲染管線執行;A2UI 聲明式模式由 Agent 輸出符合 JSON schema 的 UI 描述,前端運行時通過動態組件解析器將 schema 映射爲可交互元素;開放式模式能直接渲染 Agent 生成的 HTML 字符串或沙箱化 iframe。
- 雙向狀態同步架構:前端通過
useAgent等 Hook 與 CopilotKit Runtime 建立 WebSocket 或 SSE 長連接,應用狀態以共享狀態樹(Shared State)形式暴露給 Agent。Agent 側通過協議層讀取狀態快照,執行工具調用後回寫狀態變更,前端訂閱狀態 diff 自動重渲染,形成閉環。 - Human-in-the-Loop 中斷機制:Runtime 在執行鏈中插入中斷節點(Interrupt Node),當 Agent 調用需要人工確認的工具時,執行流暫停並向前端發送中斷事件(Interrupt Event),渲染審批 UI。用戶確認後,前端將審批結果(Approval/ Rejection)回傳 Runtime,執行流恢復,Agent 繼續後續步驟。
- 持久化 Threads 與會話管理:所有對話消息、中間狀態、生成的 UI 節點及用戶審批記錄均按 Thread ID 持久化到存儲層。用戶重新接入時,Runtime 根據 Thread ID 加載完整上下文,Agent 從斷點狀態恢復執行,實現跨會話的連續性。
如何使用CopilotKit
- 新項目快速啓動:執行
npx copilotkit@latest create -f <framework>一鍵創建帶 CopilotKit 的模板項目。 - 現有項目集成:執行
npx copilotkit@latest init自動安裝核心包、配置 Provider、連接 Agent 與 UI。 - 接入 Agent 狀態:用
useAgenthook 讀取和修改 Agent 狀態,例如agent.state.city和agent.setState()。 - 定義 Copilot Actions:將現有 API 調用或業務函數註冊爲 LLM 可調用的 actions,實現工具調用閉環。
- 部署上線:完成配置後可直接部署,支持自託管或 CopilotKit Cloud 企業版。
CopilotKit的核心優勢
-
協議級標準:團隊是 AG-UI 協議締造者,已被 Google、Microsoft、Amazon、LangChain、Mastra 等巨頭採用,生態兼容性強。
-
三種 UI 模式覆蓋全場景:從嚴格受控到完全開放,滿足不同業務對品牌一致性和靈活性的雙重需求。
-
前端狀態深度集成:不同於普通聊天組件,CopilotKit 能與應用內部狀態雙向同步。
-
生產級 Human-in-the-Loop:內置審批流機制,讓 Agent 在關鍵操作前主動請求人工確認,降低風險。
-
跨端一次集成:基於 AG-UI 協議,同一套 Agent 邏輯可同時跑在 Web、移動端和 Slack 等渠道。
CopilotKit的項目地址
- GitHub倉庫:https://github.com/CopilotKit/CopilotKit
CopilotKit的同類競品對比
| 對比維度 | CopilotKit | Assistant-ui |
|---|---|---|
| 核心定位 | 全棧 Agent UI 基礎設施(前端組件 + 運行時 + 協議) | 開源 React 組件庫,專注 AI 聊天界面 |
| UI 生成方式 | Agent 主動生成界面:支持受控組件、A2UI JSON 映射、開放式 HTML 三種模式 | 靜態預置組件:Thread、Message、Composer、Suggestion 等,Agent 不生成新 UI |
| 狀態管理 | 雙向深度同步:Agent 可讀寫應用內部狀態,前端自動響應 | 單向消息流:主要管理對話消息列表,應用狀態需手動橋接 |
| Human-in-the-Loop | 執行流原生中斷:Agent 暫停 → 渲染審批 UI → 用戶確認 → 自動恢復 | 消息級攔截:可插入自定義消息內容,但無執行流控制機制 |
| 後端耦合 | 自帶 Runtime,同時深度集成 LangGraph、Mastra、CrewAI 等 | 純前端,需自行對接 OpenAI、LangChain、Convex 等後端 |
| 持久化 | 內置 Thread 持久化(內存/Redis/數據庫),斷點續接 | 依賴外部後端實現,本身不提供存儲層 |
| 工具調用渲染 | 自動生成對應交互組件(表單、按鈕、圖表等) | 基礎展示工具調用名稱和參數,無動態交互組件 |
| 協議標準 | AG-UI 協議締造者,定義 Agent-UI 交互標準 | 遵循通用消息格式,無專屬協議 |
| 上手成本 | 中等:需理解 Runtime、Actions、三種 UI 模式 | 較低:純 React 組件,按文檔組裝即可 |
| 適用場景 | 在複雜 SaaS 中嵌入能”動手”的智能 Copilot | 快速搭建標準 AI 聊天機器人界面 |
CopilotKit的應用場景
-
SaaS 產品內嵌 Copilot:在 CRM、ERP、數據分析後台等現有產品中嵌入 AI 助手,讓用戶通過對話直接操作複雜功能。
-
AI 原生應用開發:構建以 Agent 爲核心的新一代應用,Agent 可實時生成表單、看板、日曆等交互界面。
-
長尾功能自動化:通過 A2UI 模式讓 Agent 自動生成低頻功能界面(如發票申請、設備預訂),減少開發人力。
-
跨平台 Agent 部署:基於 AG-UI 協議,將同一 Agent 同時部署到 Web 應用、移動端和 Slack 機器人。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...