AgentGen – 微軟聯合港大推出的提高AI大模型規劃能力的框架

1 0 0

AgentGen是什麼

AgentGen是香港大學與微軟聯合推出的AI項目框架，通過自動生成多樣化環境和任務，顯著提升了大語言模型（LLM）的規劃能力。AgentGen利用BI-EVOL方法，創建難度遞增的任務集，使8B參數的Llama-3模型在某些任務上接近GPT-4水平。AgentGen在領域內和領域外任務評估中表現出色，未來有望應用於機器人控制、智能家居等複雜規劃任務。

AgentGen的主要功能

自適應環境構建：框架能夠自主構思並創造出多樣化的虛擬環境，爲智能體提供豐富的交互場景。
智能任務定製：基於先進的語言模型，AgentGen能智能地定製任務，生成的環境能夠具有適應性。
動態難度調節：通過創新的BI-EVOL策略，框架能夠動態調整任務難度，促進智能體在不同複雜度的任務中學習和成長。
無需大量訓練數據：AgentGen的零樣本生成能力減少了對大規模訓練數據集的需求，加快了模型的訓練過程。
精準技能強化：通過指令微調，框架能夠精準地強化智能體在特定任務上的技能，提升其解決問題的能力。
全面性能監測：AgentGen通過細緻的性能評估體系，智能體能在各種任務中的表現達到最優。

AgentGen的技術原理

環境生成：AgentGen使用大語言模型（LLM）來生成環境規範，包括狀態空間、動作空間和轉移函數的定義。然後，通過代碼生成技術實現這些環境的具體代碼。
啓發式規則和語料庫：在環境生成過程中，AgentGen利用啓發式規則和多樣化的語料庫來指導LLM生成具有多樣性的環境。
任務生成：基於生成的環境，AgentGen進一步使用LLM生成相應的規劃任務，確保任務與環境相匹配。
BI-EVOL方法：AgentGen採用雙向演化（BI-EVOL）方法來調整任務難度，包括easy-evol（簡化任務）和hard-evol（複雜化任務），形成難度遞增的任務集。
零樣本學習：在任務生成的初始階段，AgentGen通過零樣本學習的方式提示LLM生成一組初始規劃任務。
指令微調：AgentGen通過指令微調技術，使用合成的軌跡數據（動作-觀察對序列）對LLM進行微調，提升其規劃能力。
性能評估：AgentGen通過成功率和進度率等指標來評估模型在規劃任務上的表現，確保訓練的有效性。