ChatPaper.aiChatPaper

Starke Baseline: Multi-UAV-Tracking mittels YOLOv12 mit BoT-SORT-ReID

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

March 21, 2025
Autoren: Yu-Hsi Chen
cs.AI

Zusammenfassung

Die Erkennung und Verfolgung mehrerer unbemannter Luftfahrzeuge (UAVs) in thermischen Infrarotvideos ist aufgrund von geringem Kontrast, Umgebungsrauschen und kleinen Zielgrößen von Natur aus eine Herausforderung. Dieser Artikel bietet einen direkten Ansatz zur Bewältigung der Multi-UAV-Verfolgung in thermischen Infrarotvideos, der aktuelle Fortschritte in der Erkennung und Verfolgung nutzt. Anstatt sich auf YOLOv5 mit der DeepSORT-Pipeline zu verlassen, präsentieren wir ein Verfolgungsframework, das auf YOLOv12 und BoT-SORT basiert und durch maßgeschneiderte Trainings- und Inferenzstrategien verbessert wird. Wir bewerten unseren Ansatz anhand der Metriken der 4. Anti-UAV-Challenge und demonstrieren wettbewerbsfähige Leistungen. Insbesondere erzielen wir starke Ergebnisse, ohne Kontrastverstärkung oder zeitliche Informationsfusion zur Anreicherung von UAV-Merkmalen zu verwenden, was unseren Ansatz als „starke Baseline“ für die Multi-UAV-Verfolgungsaufgabe hervorhebt. Wir liefern Implementierungsdetails, eine detaillierte experimentelle Analyse und eine Diskussion potenzieller Verbesserungen. Der Code ist verfügbar unter https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal infrared video is inherently challenging due to low contrast, environmental noise, and small target sizes. This paper provides a straightforward approach to address multi-UAV tracking in thermal infrared video, leveraging recent advances in detection and tracking. Instead of relying on the YOLOv5 with the DeepSORT pipeline, we present a tracking framework built on YOLOv12 and BoT-SORT, enhanced with tailored training and inference strategies. We evaluate our approach following the metrics from the 4th Anti-UAV Challenge and demonstrate competitive performance. Notably, we achieve strong results without using contrast enhancement or temporal information fusion to enrich UAV features, highlighting our approach as a "Strong Baseline" for the multi-UAV tracking task. We provide implementation details, in-depth experimental analysis, and a discussion of potential improvements. The code is available at https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .

Summary

AI-Generated Summary

PDF45March 26, 2025