ChatPaper.aiChatPaper

지구의 전역적이고 밀도 높은 임베딩: 잠재 공간에서 떠다니는 주요 TOM

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
저자: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

초록

지구 관측 데이터의 양이 증가함에 따라 Copernicus와 같은 대규모 프로그램의 아카이브에는 기본 원시 데이터의 효율적인 벡터 표현이 점점 더 필요해지고 있습니다. 사전 훈련된 심층 신경망에서 특징 표현을 추출하는 접근 방식은 입력 데이터의 의미적 추상화를 제공할 수 있는 강력한 방법입니다. 그러나 이러한 작업 방식이 지리 정보 데이터를 포함하는 이미지 아카이브에 대해 아직 정의되지 않았습니다. 본 연구에서는 지구 관측을 위한 오픈 및 무료 AI-ready 데이터셋을 제공하고 표준화하는 데 초점을 맞춘 기존 커뮤니티 프로젝트인 Major TOM에 확장을 제안합니다. 더불어 본 논문의 발표와 함께 네 개의 전역 밀집 임베딩 데이터셋이 공개적으로 무료로 공개되었으며, 지구 표면을 포괄하는 지리 공간 시각적 임베딩의 가장 포괄적인 글로벌 오픈 데이터셋이 되었습니다.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF82December 10, 2024