StableVicuna 是由 Stable Diffusion 背後的 StabilityAI 推出的第一個通過基於人類反饋的強化學習(RLHF)訓練的大規模開源聊天機器人。StableVicuna是Vicuna v0 13b的進一步指令微調和RLHF訓練版本,它是一個指令微調的 LLaMA 130億模型。
數據統計
相關導航
暫無評論...
StableVicuna 是由 Stable Diffusion 背後的 StabilityAI 推出的第一個通過基於人類反饋的強化學習(RLHF)訓練的大規模開源聊天機器人。StableVicuna是Vicuna v0 13b的進一步指令微調和RLHF訓練版本,它是一個指令微調的 LLaMA 130億模型。