Optimus-1 – 哈工大聯合鵬城實驗室推出的智能體框架

AI工具1年前 (2024)發佈新公告 AI管理員

0 0 0

Optimus-1是什麼

Optimus-1是哈爾濱工業大學（深圳）和鵬城實驗室推出的智能體框架，能解決在開放世界環境中完成長期任務的挑戰。框架結合結構化知識和多模態經驗，讓智能體更好地執行復雜任務。Optimus-1包含混合多模態記憶模塊，由分層有向知識圖（HDKG）和抽象多模態經驗池（AMEP）組成，知識引導規劃器和經驗驅動反射器，顯著提升在Minecraft等環境中的長期任務性能，接近人類水平。

Optimus-1的主要功能

知識引導規劃（Knowledge-Guided Planner）：基於結構化知識（HDKG）生成可執行的子目標序列，規劃和執行長期任務。
經驗驅動反思（Experience-Driven Reflector）：基於歷史經驗（AMEP）評估當前任務狀態，在必要時調整行動計劃。
行動控制（Action Controller）：執行由規劃器產生的子目標，與環境互動以完成任務。
混合多模態記憶（Hybrid Multimodal Memory）：結合HDKG和AMEP，存儲和利用世界知識和歷史經驗，支持複雜決策和適應性學習。
自我進化（Self-Evolution）：基於“自由探索-教師指導”方法，無需參數更新能逐步提升記憶容量和任務執行能力。

Optimus-1的技術原理

分層有向知識圖（HDKG）：
- 將世界知識（如物品合成規則）轉化爲圖結構，節點代表對象，邊代表對象間的關係（如合成關係）。
- 基於圖檢索和拓撲排序，爲智能體提供完成任務所需的材料和工具的知識。
抽象多模態經驗池（AMEP）：
- 動態總結和存儲任務執行過程中的多模態信息（如環境、狀態、計劃、視覺幀等）。
- 用MineCLIP模型計算視覺和子目標的相似性，存儲相關性強的視覺記憶，爲反思提供參考。
知識引導規劃器：結合視覺觀察和HDKG中的知識，生成合理的子目標序列，指導行動控制器的行動。
經驗驅動反思器：定期激活，從AMEP中檢索與當前子目標相關的多模態經驗，評估當前任務狀態，決定是繼續執行、完成還是需要重新規劃。
行動控制器：根據子目標和當前觀察，生成與環境互動所需的低級行動，如鼠標和鍵盤操作。