ChatPaper.aiChatPaper

MegaLoc: Одно извлечение для размещения их всех

MegaLoc: One Retrieval to Place Them All

February 24, 2025
Авторы: Gabriele Berton, Carlo Masone
cs.AI

Аннотация

Извлечение изображений из того же местоположения, что и заданный запрос, является важным компонентом множества задач компьютерного зрения, таких как Визуальное распознавание мест, Поиск ориентиров, Визуальная локализация, 3D-реконструкция и SLAM. Однако существующие решения созданы специально для работы с одной из этих задач и известно, что они терпят неудачу, когда требования немного меняются или когда они сталкиваются с данными вне распределения. В данной статье мы объединяем разнообразные существующие методы, техники обучения и наборы данных для обучения модели извлечения, названной MegaLoc, которая демонстрирует хорошую производительность на нескольких задачах. Мы обнаружили, что MegaLoc (1) достигает современного уровня на большом количестве наборов данных по визуальному распознаванию мест, (2) показывает впечатляющие результаты на распространенных наборах данных по поиску ориентиров и (3) устанавливает новый современный уровень для визуальной локализации на наборах данных LaMAR, где мы просто заменили метод извлечения в существующем пайплайне локализации. Код для MegaLoc доступен по ссылке https://github.com/gmberton/MegaLoc
English
Retrieving images from the same location as a given query is an important component of multiple computer vision tasks, like Visual Place Recognition, Landmark Retrieval, Visual Localization, 3D reconstruction, and SLAM. However, existing solutions are built to specifically work for one of these tasks, and are known to fail when the requirements slightly change or when they meet out-of-distribution data. In this paper we combine a variety of existing methods, training techniques, and datasets to train a retrieval model, called MegaLoc, that is performant on multiple tasks. We find that MegaLoc (1) achieves state of the art on a large number of Visual Place Recognition datasets, (2) impressive results on common Landmark Retrieval datasets, and (3) sets a new state of the art for Visual Localization on the LaMAR datasets, where we only changed the retrieval method to the existing localization pipeline. The code for MegaLoc is available at https://github.com/gmberton/MegaLoc

Summary

AI-Generated Summary

PDF12February 25, 2025