Baseline Solido: Tracciamento Multi-UAV tramite YOLOv12 con BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Autori: Yu-Hsi Chen
cs.AI
Abstract
Il rilevamento e il tracciamento di più veicoli aerei senza pilota (UAV) in video a infrarossi termici è intrinsecamente complesso a causa del basso contrasto, del rumore ambientale e delle dimensioni ridotte dei bersagli. Questo articolo propone un approccio diretto per affrontare il tracciamento multi-UAV in video a infrarossi termici, sfruttando i recenti progressi nel rilevamento e nel tracciamento. Invece di affidarsi alla pipeline YOLOv5 con DeepSORT, presentiamo un framework di tracciamento basato su YOLOv12 e BoT-SORT, potenziato con strategie di addestramento e inferenza personalizzate. Valutiamo il nostro approccio seguendo le metriche della 4a Anti-UAV Challenge e dimostriamo prestazioni competitive. In particolare, otteniamo risultati solidi senza utilizzare l'enhancement del contrasto o la fusione di informazioni temporali per arricchire le caratteristiche degli UAV, evidenziando il nostro approccio come una "Strong Baseline" per il compito di tracciamento multi-UAV. Forniamo dettagli implementativi, un'analisi sperimentale approfondita e una discussione sui potenziali miglioramenti. Il codice è disponibile all'indirizzo https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary