Dulus是什麼
Dulus 是約 12K 行 Python 的開源 CLI AI Agent,支持 Claude、GPT、Gemini、DeepSeek、Kimi、Qwen 等 40+ 模型。工具可直接捕獲瀏覽器網頁版 AI 的訪客會話,轉化爲具備文件讀寫、代碼編輯、Bash 執行、Web 搜索等 27 種工具的工具調用代理。Dulus支持 MCP、插件熱加載、子代理、離線語音、持久記憶與自動快照,提供 PyQt6 GUI、WebChat 和 Telegram 多端入口。

Dulus的主要功能
-
零密鑰網頁會話捕獲:自動劫持 Gemini、Claude.ai、Kimi.com、DeepSeek 等瀏覽器標籤頁,將網頁對話轉爲可工具調用的本地 Agent。
-
27 種內置工具:涵蓋 Read、Write、Edit、Bash、Glob、Grep、WebFetch、WebSearch、NotebookEdit、GetDiagnostics、Memory、Tasks、Agents、Skills 等。
-
多提供商模型切換:支持 Anthropic、OpenAI、Google、DeepSeek、Kimi、Qwen、Zhipu、MiniMax、Ollama、LM Studio 及自定義端點,會話中
/model實時切換。 -
MCP 與插件生態:放置
.mcp.json即可註冊任意 MCP 服務器;Auto-Adapter 可零配置熱加載任意 Python 倉庫爲插件。 -
子代理與任務管理:在獨立 git worktree 中生成 coder、reviewer、researcher 等類型子代理,通過消息傳遞協作,並內置任務看板。
-
離線語音與喚醒:基於 Whisper-cpp 實現離線語音輸入,Kokoro TTS 實現語音輸出;支持自定義離線喚醒詞如 “hey dulus”。
-
持久記憶與快照:雙範圍記憶(用戶級+項目級)按置信度與最近度排序;每輪自動創建 Checkpoints,支持對話與文件狀態一鍵回滾。
-
多模態交互界面:提供 REPL 終端、Flask WebChat(局域網可訪問)、PyQt6 原生桌面 GUI 及 Telegram Bot 四種交互方式。
-
開發者增強模式:SSJ Mode 提供原始 Token 計數、流延遲計時、工具調用檢查器、Prompt 注入查看器等調試能力。
如何使用Dulus
- 安裝:執行
pip install dulus或curl -fsSL https://raw.githubusercontent.com/KevRojo/Dulus/main/install.sh | bash一鍵安裝。 - 配置密鑰:設置任意提供商環境變量如
export ANTHROPIC_API_KEY=sk-ant-...,或直接跳過使用 Ollama 本地模型與瀏覽器劫持模式。 - 啓動交互:終端輸入
dulus進入 REPL,用/model nvidia-web/deepseek-r1或/model ollama/qwen2.5-coder選擇模型。 - 開啓零密鑰模式: 首次運行時按嚮導提示打開 Gemini 瀏覽器訪客頁面,Dulus 自動捕獲會話,無需 API Key 可開始工具調用。
- 執行任務:直接輸入自然語言指令如 “refactor the auth module”,Agent 自動讀取文件、編輯代碼、運行測試並提交結果。
- 擴展能力:通過
/plugin install 倉庫名@URL熱加載任意 Python 工具庫,或/mcp註冊外部 MCP 服務器擴展功能。
Dulus的核心優勢
-
真正的零成本啓動:無需 API Key、信用卡或登錄,30 秒內通過瀏覽器訪客模式獲得完整工具調用 Agent,降低使用門檻至極致。
-
模型中立與實時切換:不綁定單一提供商,同一會話中
/model可在 Claude、DeepSeek、Kimi 等模型間無縫切換,並支持自動降級鏈。 -
熱插拔生態擴展:Auto-Adapter 讓任意 Python 倉庫秒變插件,MCP 與 Composio 提供 800+ 技能,生態擴展無需等待官方適配。
-
全鏈路離線能力:支持語音輸入輸出、喚醒詞、OCR、Ollama 本地模型均可在完全斷網環境下運行,適配保密網絡與離線場景。
-
多界面統一核心:終端、Web、桌面 GUI、Telegram 共享同一 Agent 核心與記憶狀態,用戶可按場景自由切換交互面。
Dulus的項目地址
- 項目官網:https://dulus.ai/
- GitHub倉庫:https://github.com/KevRojo/Dulus
Dulus的同類競品對比
| 對比維度 | Dulus | Claude Code | Aider |
|---|---|---|---|
| 提供商鎖定 | 多提供商中立,實時切換 | 僅 Anthropic Claude | 多模型,但配置較繁瑣 |
| API Key 要求 | 可選零密鑰(瀏覽器劫持) | 必須 API Key | 必須 API Key |
| 本地/離線運行 | 完整支持(Ollama+離線語音) | 不支持 | 支持本地模型,無離線語音 |
| 插件生態 | Auto-Adapter 任意 Python 倉庫 + MCP | 無插件系統 | 支持自定義工具,生態較小 |
| 子代理/多 Agent | 內置多類型子代理與消息傳遞 | 無原生子代理 | 支持多文件編輯,無獨立子代理 |
| 語音交互 | 離線 Whisper + Kokoro TTS + 喚醒詞 | 不支持 | 不支持 |
| Web/Telegram/GUI | 四種界面俱全 | 僅終端 | 僅終端 |
| 記憶與快照 | 持久記憶 + 自動 Checkpoint 回滾 | 會話級記憶 | 無原生快照機制 |
| 開源與體積 | ~12K 行 Python,pip 直接安裝 | 閉源 | 開源,功能聚焦編碼 |
Dulus的應用場景
-
個人開發者編碼助手:替代傳統 IDE 插件,直接通過自然語言驅動代碼讀寫、重構、測試與提交,支持多模型協作審查。
-
零預算 AI 實驗:學生或初學者用 Gemini 訪客模式免費體驗前沿模型的高級工具調用能力,無需訂閱付費 API。
-
離線/保密環境自動化:政府、軍工或企業內網中,基於 Ollama 本地模型與離線語音實現完全私有化的 Agent 工作流。
-
Telegram 遠程運維:通過手機 Telegram 向家中或服務器上的 Dulus 發送指令,執行文件管理、日誌排查等遠程操作。
-
多 Agent 協作研發:將代碼編寫、審查、測試分配給不同子代理並行推進,適合大型模塊的分佈式開發。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...