ChatPaper.aiChatPaper

МОНСТР: Репозиторий оценки масштабируемых временных рядов Монашского университета

MONSTER: Monash Scalable Time Series Evaluation Repository

February 21, 2025
Авторы: Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
cs.AI

Аннотация

Мы представляем MONSTER - MONash Scalable Time Series Evaluation Repository - коллекцию больших наборов данных для классификации временных рядов. Область классификации временных рядов получила пользу от общих стандартов, установленных репозиториями классификации временных рядов UCR и UEA. Однако наборы данных в этих стандартах небольшие, с медианными размерами соответственно 217 и 255 примеров. В результате они предпочитают узкое подпространство моделей, оптимизированных для достижения низкой ошибки классификации на разнообразных небольших наборах данных, то есть моделей, которые минимизируют дисперсию и уделяют мало внимания вопросам масштабируемости. Наша цель - разнообразить область путем введения стандартов с использованием больших наборов данных. Мы считаем, что есть огромный потенциал для нового прогресса в области, занимаясь теоретическими и практическими вызовами эффективного обучения на больших объемах данных.
English
We introduce MONSTER-the MONash Scalable Time Series Evaluation Repository-a collection of large datasets for time series classification. The field of time series classification has benefitted from common benchmarks set by the UCR and UEA time series classification repositories. However, the datasets in these benchmarks are small, with median sizes of 217 and 255 examples, respectively. In consequence they favour a narrow subspace of models that are optimised to achieve low classification error on a wide variety of smaller datasets, that is, models that minimise variance, and give little weight to computational issues such as scalability. Our hope is to diversify the field by introducing benchmarks using larger datasets. We believe that there is enormous potential for new progress in the field by engaging with the theoretical and practical challenges of learning effectively from larger quantities of data.

Summary

AI-Generated Summary

PDF22February 25, 2025