Label Studio 是 Human Signal(原Heartex)推出的一個免費開源的數據標註工具,GitHub 上該項目標星近1.4萬,可幫助開發人員微調大語言模型、準備訓練數據或驗證 AI 模型。
Label Studio的功能特色
- 支持標記各種類型的數據,包括圖片、聲音、文本、時間序列、多域、視頻等
- 靈活且可配置,可配置的佈局和模板以結合自己的數據集和工作流
- 機器學習輔助標記,通過 ML 後端集成使用預測來協助標記流程,從而節省時間
- 多個項目和用戶,在一個平台上支持多個項目、用例和數據類型
- 與您的 ML/AI pipeline 集成,可使用 Webhooks、Python SDK 和 API 進行身份驗證、創建項目、導入任務、管理模型預測等。
如何開始使用 Label Studio
- 首先確認在電腦上已安裝好
libq-dev
和python3-dev
依賴項 - 然後使用
pip install label-studio
命令安裝 Label Studio - 在終端/命令行使用
label-studio start
啓動 Label Studio - 通過 http://localhost:8080 打開 Label Studio UI
- 使用自己創建的電子郵件地址和密碼進行註冊
- 單擊 Create 創建項目並開始標記數據
- 爲項目命名,可輸入項目描述並選擇顏色
- 單擊 Data Import 並上傳你要使用的數據文件。如果你想使用本地目錄、雲存儲或數據庫中的數據,可暫時跳過此步驟
- 單擊 Labeling Setup 設置並選擇一個模板並根據你的用例自定義標註名稱
- 單擊 Save 以保存您的項目
更多的設置和相關操作,請查看官方的文檔https://labelstud.io/guide/get_started.html
數據統計
相關導航
沒有相關內容!
暫無評論...