YOLOv9 – 新一代高效的實時目標檢測系統

AI工具1年前 (2024)發佈新公告 AI管理員

19 0 0

YOLOv9是什麼

YOLOv9是一個由台北中研院和台北科技大學等機構的研究團隊推出的新一代先進的目標檢測系統，是YOLO（You Only Look Once）算法系列的最新版本。YOLO是一種流行的實時對象檢測算法，以其速度快和準確性高而聞名。YOLOv9在前代版本的基礎上進行了改進，旨在解決深度學習中信息丟失的問題，並提高模型在各種任務上的性能。YOLOv9的核心創新主要在於引入了可編程梯度信息（PGI）和泛化高效層聚合網絡（GELAN），允許模型在訓練過程中更有效地學習和提取關鍵特徵以及提高輕量級模型的性能。

YOLOv9 - 新一代高效的實時目標檢測系統

YOLOv9的官網入口

官方GitHub代碼庫：https://github.com/WongKinYiu/yolov9
Arxiv研究論文：https://arxiv.org/abs/2402.13616
Hugging Face Demo：https://huggingface.co/spaces/kadirnar/Yolov9
Google Colab 運行地址：https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov9-object-detection-on-custom-dataset.ipynb

YOLOv9的技術原理

可編程梯度信息（PGI）：爲了解決深度網絡中信息丟失的問題，YOLOv9引入了PGI。這是一種輔助監督框架，通過輔助可逆分支生成可靠的梯度信息，以更新網絡參數，從而提高訓練效率和模型性能。
泛化高效層聚合網絡（GELAN）：YOLOv9設計了一種新的輕量級網絡架構GELAN，它基於梯度路徑規劃，通過優化計算塊和網絡深度，提高了模型的參數利用率和推理速度。
信息瓶頸緩解：YOLOv9通過PGI和GELAN的結合，減少了在數據傳輸過程中的信息損失，使得模型能夠更準確地學習到目標任務所需的特徵。
多級輔助信息：PGI還包括多級輔助信息，它通過整合不同預測頭的梯度信息，幫助主分支學習到更全面的語義信息，從而提高模型對各種目標的檢測能力。
訓練策略：YOLOv9採用了一種新的訓練策略，通過調整損失函數和優化器參數，使得模型能夠更快地收斂，並且在訓練過程中保持穩定性。

YOLOv9的性能評估

根據論文中的實驗結果，YOLOv9在MS COCO數據集（一個廣泛用於目標檢測任務的基準數據集）上的表現超越了之前的YOLO系列版本以及其他一些實時目標檢測器。YOLOv9在準確性、參數效率、計算複雜度和推理速度方面都取得了顯著的提升，是一個在多個方面都具有競爭力的目標檢測模型，特別適用於需要實時處理的應用場景。

YOLOv9 - 新一代高效的實時目標檢測系統