AgentScope 2.0 – 通義實驗室開源的多智能體開發框架

AI工具1天前發佈新公告 AI管理員
0 0

AgentScope 2.0 是什麼

AgentScope 2.0 是通義實驗室推出的開源多智能體開發框架,聚焦真實場景下的穩定運行、安全控制與生產部署,新增模型容錯、權限系統、上下文管理重構、Middleware 擴展、Workspace 執行解耦和 Agent Service 服務化部署等系統性能力,讓智能體從跑通 Demo走向穩定生產。

AgentScope 2.0 – 通義實驗室開源的多智能體開發框架

AgentScope 2.0 的主要功能

  • 模型容錯:支持 Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等主流模型統一接入。引入自動重試與備用模型切換機制,主模型調用失敗時自動嘗試備用模型,保證長鏈路任務不中斷。
  • 過程透明與事件系統:重構消息模塊,通過統一 Content Block 承載文本、文件/圖片、工具結果、模型思考等多種消息類型。引入事件流系統,支持流式輸出模型調用開始、文本增量、工具調用、用戶確認等事件,實現執行過程實時可見、可交互、可干預。
  • 安全邊界與權限系統:系統化權限控制覆蓋工具調用、文件讀寫、命令執行。基於靜態規則、工具類型和輸入內容進行風險判斷,支持自動允許、拒絕或進入用戶審批流程,可識別危險目錄、敏感文件、高風險命令和危險刪除操作。
  • 上下文管理重構:結構化壓縮保留任務目標、當前狀態、關鍵發現、下一步計劃等關鍵信息。工具結果自動截斷避免超長日誌撐爆上下文。文件讀寫新增緩存機制,強制”先讀後改”,減少重複 IO。
  • Middleware 擴展機制:支持在模型調用、思考規劃、工具執行等關鍵節點插入自定義邏輯,用於日誌追蹤、安全檢查、業務策略注入、動態上下文注入等,無需修改框架源碼。
  • Workspace 執行解耦:抽象執行環境,統一本地、Docker 容器、E2B 雲沙箱等不同後端接口。智能體運行邏輯與環境解耦,支持一次編寫、本地雲端無縫切換。內置預熱池機制,支持並行場景的批量環境初始化。
  • Agent Service 服務化部署:將 Runtime 的 Agent Service 能力合併至主庫,打通開發與部署。提供標準服務接口、流式輸出、會話恢復能力,支持被前端應用、外部系統、工作流穩定調用。

AgentScope 2.0 的技術原理

  • 統一消息結構:用 Content Block 抽象承載文本、文件/圖片、工具結果、模型思考等多模態消息,DataBlock 支持 base64 與 URL 兩類數據源,兼容不同模型 API 的多模態能力。
  • 事件驅動架構:一次 Agent 回覆不再只是返回最終文本,而是流式產生模型調用開始、文本增量、工具調用、工具結果、用戶確認、外部執行等事件,讓前端 UI 實時展示執行進度。
  • 權限檢查流程:智能體發起工具調用、文件讀寫或命令執行時,權限系統依次進行規則檢查、輸入分析、風險判斷,輸出允許、拒絕或用戶確認三種結果。
  • 上下文管理策略:針對長期任務的多輪推理、工具結果和文件內容,採用結構化壓縮保留關鍵狀態,自動截斷超長工具結果,並通過文件緩存機制減少重複讀取。
  • Middleware 插樁:在模型調用、思考規劃、工具執行等關鍵執行環節預留鉤子,開發者可插入自定義邏輯實現日誌、權限、上下文等橫切關注點的統一處理。
  • Workspace 抽象層:通過 WorkspaceBase 抽象出身份標識、生命週期、資源發現、上下文卸載和動態資源管理等通用能力,不同執行後端(本地、容器、雲沙箱)實現同一套接口即可接入。

如何使用AgentScope 2.0

  • 安裝框架:通過 pip 安裝 AgentScope:pip install agentscope
  • 配置模型接入:在配置中指定主模型和備用模型,設置重試次數和切換策略。
  • 定義智能體與工具:用 ReActAgent 創建智能體,註冊所需工具函數到 Toolkit。
  • 設置權限規則:配置工具調用、文件讀寫、命令執行的權限策略,定義允許/拒絕/確認規則。
  • 選擇執行環境:通過 Workspace 選擇本地、Docker 容器或 E2B 雲沙箱作爲執行後端。
  • 啓動服務或本地運行:用 Agent Service 啓動標準接口服務,或通過腳本本地運行智能體工作流。

AgentScope 2.0的核心優勢

  • 穩定性強:模型層自動重試+備用切換、上下文結構化壓縮、文件緩存,保障長鏈路任務持續執行不中斷。
  • 安全性高:系統化權限系統支持規則檢查、風險判斷和用戶審批,爲高危操作建立自動攔截與審批機制。
  • 透明可控:事件流系統讓執行過程實時可見,支持人工確認和人工介入,告別黑盒回覆。
  • 擴展靈活:Middleware 機制允許不改源碼即插即用業務邏輯,Workspace 支持本地/容器/雲沙箱無縫切換。
  • 生產就緒:內置 Agent Service 提供標準接口、流式輸出和會話恢復,可直接從開發腳本上線爲生產服務。
  • 多模態領先:支持圖像生成、TTS、語音輸入、實時語音等豐富多模態能力,以及 MCP、A2A 協議。

AgentScope 2.0的項目地址

  • 項目官網:https://docs.agentscope.io/zh/v2

AgentScope 2.0的同類競品對比

對比維度 AgentScope 2.0 AutoGen (Microsoft) CrewAI
核心定位 企業級多智能體開發框架 多智能體對話編排框架 角色化多智能體編排框架
設計哲學 Agent-Oriented Programming,強調智能體自主性與組織架構 對話即工作流,強調多 Agent 協作對話 角色扮演團隊,自然語言定義 Agent 角色與目標
多模型支持 Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等 OpenAI、Azure OpenAI、Anthropic、本地模型等 OpenAI、Anthropic、Gemini、Ollama、開源模型等
模型容錯 ✅ 自動重試 + 備用模型切換 ⚠️ 依賴模型層自身容錯 ❌ 無內置容錯機制
執行過程透明 ✅ 事件流系統,流式展示執行過程,支持人工介入 ⚠️ 基於對話歷史,過程可見性有限 ❌ 僅展示任務輸出,無過程事件流
權限與安全 ✅ 系統化權限系統,支持規則檢查、風險判斷、用戶審批 ⚠️ 基礎安全控制,無系統化權限 ❌ 無系統化權限控制
上下文管理 ✅ 結構化壓縮 + 結果截斷 + 文件緩存 ⚠️ 對話歷史管理,無結構化壓縮 ⚠️ 基礎任務輸出傳遞,無上下文壓縮
執行環境 ✅ Workspace 抽象,本地/容器/雲沙箱無縫切換 ⚠️ 需自行配置執行環境 ❌ 無執行環境抽象
服務化部署 ✅ Agent Service 內置,標準接口 + 流式輸出 + 會話恢復 ⚠️ 需結合外部服務部署 ⚠️ 需 CrewAI Enterprise 平台
擴展機制 ✅ Middleware 機制,即插即用 ⚠️ 通過 Selector 機制擴展 ⚠️ 通過 Flows 擴展,靈活性有限
多模態支持 ✅ 圖像生成、TTS、語音輸入、實時語音 ⚠️ 文本爲主,多模態需自定義 ❌ 無內置多模態支持
協議支持 ✅ MCP (HTTP+Stdio)、A2A ⚠️ MCP 社區支持 ⚠️ A2A 協議支持中
適用場景 企業級複雜協作、實時語音 Agent、多模態應用 快速原型、多角色對話模擬、代碼生成 快速原型、內容生成、研究分析、角色協作
上手難度 中等(需理解 async/await) 低(10分鐘上手) 極低(20行代碼即可運行)
生產就緒度 高(內置沙箱、服務化、監控) 中(2025年10月生產就緒) 中(企業平台有延遲問題)

AgentScope 2.0的應用場景

  • 企業級複雜協作系統:需要多智能體層級協作、嚴格組織管理的業務流程自動化。
  • 實時語音 Agent:構建支持語音輸入、實時對話的多模態智能體應用。
  • 安全敏感型任務:涉及文件操作、命令執行等需要嚴格權限控制和審計軌跡的場景。
  • 長鏈路持續任務:需要多輪推理、多次工具調用、跨輪次狀態保持的複雜工作流。
  • 多雲/混合部署:需要在本地開發、容器測試、雲沙箱生產之間靈活切換的環境。
© 版權聲明

相關文章

暫無評論

暫無評論...