ChatPaper.aiChatPaper

Baseline Solido: Tracciamento Multi-UAV tramite YOLOv12 con BoT-SORT-ReID

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

March 21, 2025
Autori: Yu-Hsi Chen
cs.AI

Abstract

Il rilevamento e il tracciamento di più veicoli aerei senza pilota (UAV) in video a infrarossi termici è intrinsecamente complesso a causa del basso contrasto, del rumore ambientale e delle dimensioni ridotte dei bersagli. Questo articolo propone un approccio diretto per affrontare il tracciamento multi-UAV in video a infrarossi termici, sfruttando i recenti progressi nel rilevamento e nel tracciamento. Invece di affidarsi alla pipeline YOLOv5 con DeepSORT, presentiamo un framework di tracciamento basato su YOLOv12 e BoT-SORT, potenziato con strategie di addestramento e inferenza personalizzate. Valutiamo il nostro approccio seguendo le metriche della 4a Anti-UAV Challenge e dimostriamo prestazioni competitive. In particolare, otteniamo risultati solidi senza utilizzare l'enhancement del contrasto o la fusione di informazioni temporali per arricchire le caratteristiche degli UAV, evidenziando il nostro approccio come una "Strong Baseline" per il compito di tracciamento multi-UAV. Forniamo dettagli implementativi, un'analisi sperimentale approfondita e una discussione sui potenziali miglioramenti. Il codice è disponibile all'indirizzo https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal infrared video is inherently challenging due to low contrast, environmental noise, and small target sizes. This paper provides a straightforward approach to address multi-UAV tracking in thermal infrared video, leveraging recent advances in detection and tracking. Instead of relying on the YOLOv5 with the DeepSORT pipeline, we present a tracking framework built on YOLOv12 and BoT-SORT, enhanced with tailored training and inference strategies. We evaluate our approach following the metrics from the 4th Anti-UAV Challenge and demonstrate competitive performance. Notably, we achieve strong results without using contrast enhancement or temporal information fusion to enrich UAV features, highlighting our approach as a "Strong Baseline" for the multi-UAV tracking task. We provide implementation details, in-depth experimental analysis, and a discussion of potential improvements. The code is available at https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .

Summary

AI-Generated Summary

PDF45March 26, 2025