Starke Baseline: Multi-UAV-Tracking mittels YOLOv12 mit BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Autoren: Yu-Hsi Chen
cs.AI
Zusammenfassung
Die Erkennung und Verfolgung mehrerer unbemannter Luftfahrzeuge (UAVs) in thermischen Infrarotvideos ist aufgrund von geringem Kontrast, Umgebungsrauschen und kleinen Zielgrößen von Natur aus eine Herausforderung. Dieser Artikel bietet einen direkten Ansatz zur Bewältigung der Multi-UAV-Verfolgung in thermischen Infrarotvideos, der aktuelle Fortschritte in der Erkennung und Verfolgung nutzt. Anstatt sich auf YOLOv5 mit der DeepSORT-Pipeline zu verlassen, präsentieren wir ein Verfolgungsframework, das auf YOLOv12 und BoT-SORT basiert und durch maßgeschneiderte Trainings- und Inferenzstrategien verbessert wird. Wir bewerten unseren Ansatz anhand der Metriken der 4. Anti-UAV-Challenge und demonstrieren wettbewerbsfähige Leistungen. Insbesondere erzielen wir starke Ergebnisse, ohne Kontrastverstärkung oder zeitliche Informationsfusion zur Anreicherung von UAV-Merkmalen zu verwenden, was unseren Ansatz als „starke Baseline“ für die Multi-UAV-Verfolgungsaufgabe hervorhebt. Wir liefern Implementierungsdetails, eine detaillierte experimentelle Analyse und eine Diskussion potenzieller Verbesserungen. Der Code ist verfügbar unter https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary