Rappresentazioni Globali e Dense della Terra: Major TOM Fluttuante nello Spazio Latente

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
Autori: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

Abstract

Con il crescente volume di dati di osservazione della Terra presenti negli archivi dei grandi programmi come Copernicus, c'è una crescente necessità di rappresentazioni vettoriali efficienti dei dati grezzi sottostanti. L'approccio di estrarre rappresentazioni delle caratteristiche da reti neurali profonde preaddestrate è un approccio potente che può fornire astrazioni semantiche dei dati in ingresso. Tuttavia, il modo in cui ciò viene fatto per gli archivi di immagini contenenti dati geospaziali non è ancora definito. In questo lavoro, viene proposta un'estensione a un progetto comunitario esistente, Major TOM, focalizzato sulla fornitura e standardizzazione di set di dati pronti per l'IA aperti e gratuiti per l'osservazione della Terra. Inoltre, vengono rilasciati apertamente e gratuitamente quattro set di dati di embedding globali e densi insieme alla pubblicazione di questo manoscritto, risultando nel set di dati globale aperto più completo di embedding visivi geospaziali in termini di superficie terrestre coperta.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF72December 10, 2024