Dulus – 開源的 CLI AI Agent,可驅動多模型工具調用

AI工具2周前發佈新公告 AI管理員
0 0

Dulus是什麼

Dulus 是約 12K 行 Python 的開源 CLI AI Agent,支持 Claude、GPT、Gemini、DeepSeek、Kimi、Qwen 等 40+ 模型。工具可直接捕獲瀏覽器網頁版 AI 的訪客會話,轉化爲具備文件讀寫、代碼編輯、Bash 執行、Web 搜索等 27 種工具的工具調用代理。Dulus支持 MCP、插件熱加載、子代理、離線語音、持久記憶與自動快照,提供 PyQt6 GUI、WebChat 和 Telegram 多端入口。

Dulus – 開源的 CLI AI Agent,可驅動多模型工具調用

Dulus的主要功能

  • 零密鑰網頁會話捕獲:自動劫持 Gemini、Claude.ai、Kimi.com、DeepSeek 等瀏覽器標籤頁,將網頁對話轉爲可工具調用的本地 Agent。
  • 27 種內置工具:涵蓋 Read、Write、Edit、Bash、Glob、Grep、WebFetch、WebSearch、NotebookEdit、GetDiagnostics、Memory、Tasks、Agents、Skills 等。
  • 多提供商模型切換:支持 Anthropic、OpenAI、Google、DeepSeek、Kimi、Qwen、Zhipu、MiniMax、Ollama、LM Studio 及自定義端點,會話中 /model 實時切換。
  • MCP 與插件生態:放置 .mcp.json 即可註冊任意 MCP 服務器;Auto-Adapter 可零配置熱加載任意 Python 倉庫爲插件。
  • 子代理與任務管理:在獨立 git worktree 中生成 coder、reviewer、researcher 等類型子代理,通過消息傳遞協作,並內置任務看板。
  • 離線語音與喚醒:基於 Whisper-cpp 實現離線語音輸入,Kokoro TTS 實現語音輸出;支持自定義離線喚醒詞如 “hey dulus”。
  • 持久記憶與快照:雙範圍記憶(用戶級+項目級)按置信度與最近度排序;每輪自動創建 Checkpoints,支持對話與文件狀態一鍵回滾。
  • 多模態交互界面:提供 REPL 終端、Flask WebChat(局域網可訪問)、PyQt6 原生桌面 GUI 及 Telegram Bot 四種交互方式。
  • 開發者增強模式:SSJ Mode 提供原始 Token 計數、流延遲計時、工具調用檢查器、Prompt 注入查看器等調試能力。

如何使用Dulus

  • 安裝:執行 pip install duluscurl -fsSL https://raw.githubusercontent.com/KevRojo/Dulus/main/install.sh | bash 一鍵安裝。
  • 配置密鑰:設置任意提供商環境變量如 export ANTHROPIC_API_KEY=sk-ant-...,或直接跳過使用 Ollama 本地模型與瀏覽器劫持模式。
  • 啓動交互:終端輸入 dulus 進入 REPL,用 /model nvidia-web/deepseek-r1/model ollama/qwen2.5-coder 選擇模型。
  • 開啓零密鑰模式: 首次運行時按嚮導提示打開 Gemini 瀏覽器訪客頁面,Dulus 自動捕獲會話,無需 API Key 可開始工具調用。
  • 執行任務:直接輸入自然語言指令如 “refactor the auth module”,Agent 自動讀取文件、編輯代碼、運行測試並提交結果。
  • 擴展能力:通過 /plugin install 倉庫名@URL 熱加載任意 Python 工具庫,或 /mcp 註冊外部 MCP 服務器擴展功能。

Dulus的核心優勢

  • 真正的零成本啓動:無需 API Key、信用卡或登錄,30 秒內通過瀏覽器訪客模式獲得完整工具調用 Agent,降低使用門檻至極致。
  • 模型中立與實時切換:不綁定單一提供商,同一會話中 /model 可在 Claude、DeepSeek、Kimi 等模型間無縫切換,並支持自動降級鏈。
  • 熱插拔生態擴展:Auto-Adapter 讓任意 Python 倉庫秒變插件,MCP 與 Composio 提供 800+ 技能,生態擴展無需等待官方適配。
  • 全鏈路離線能力:支持語音輸入輸出、喚醒詞、OCR、Ollama 本地模型均可在完全斷網環境下運行,適配保密網絡與離線場景。
  • 多界面統一核心:終端、Web、桌面 GUI、Telegram 共享同一 Agent 核心與記憶狀態,用戶可按場景自由切換交互面。

Dulus的項目地址

  • 項目官網:https://dulus.ai/
  • GitHub倉庫:https://github.com/KevRojo/Dulus

Dulus的同類競品對比

對比維度 Dulus Claude Code Aider
提供商鎖定 多提供商中立,實時切換 僅 Anthropic Claude 多模型,但配置較繁瑣
API Key 要求 可選零密鑰(瀏覽器劫持) 必須 API Key 必須 API Key
本地/離線運行 完整支持(Ollama+離線語音) 不支持 支持本地模型,無離線語音
插件生態 Auto-Adapter 任意 Python 倉庫 + MCP 無插件系統 支持自定義工具,生態較小
子代理/多 Agent 內置多類型子代理與消息傳遞 無原生子代理 支持多文件編輯,無獨立子代理
語音交互 離線 Whisper + Kokoro TTS + 喚醒詞 不支持 不支持
Web/Telegram/GUI 四種界面俱全 僅終端 僅終端
記憶與快照 持久記憶 + 自動 Checkpoint 回滾 會話級記憶 無原生快照機制
開源與體積 ~12K 行 Python,pip 直接安裝 閉源 開源,功能聚焦編碼

Dulus的應用場景

  • 個人開發者編碼助手:替代傳統 IDE 插件,直接通過自然語言驅動代碼讀寫、重構、測試與提交,支持多模型協作審查。
  • 零預算 AI 實驗:學生或初學者用 Gemini 訪客模式免費體驗前沿模型的高級工具調用能力,無需訂閱付費 API。
  • 離線/保密環境自動化:政府、軍工或企業內網中,基於 Ollama 本地模型與離線語音實現完全私有化的 Agent 工作流。
  • Telegram 遠程運維:通過手機 Telegram 向家中或服務器上的 Dulus 發送指令,執行文件管理、日誌排查等遠程操作。
  • 多 Agent 協作研發:將代碼編寫、審查、測試分配給不同子代理並行推進,適合大型模塊的分佈式開發。
© 版權聲明

相關文章

暫無評論

暫無評論...