Autoencoder a Diffusione Latente: Verso un Apprendimento di Rappresentazione Non Supervisionato Efficace e Significativo nell'Imaging Medico
Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging
April 11, 2025
Autori: Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
cs.AI
Abstract
Questo studio presenta il Latent Diffusion Autoencoder (LDAE), un innovativo framework encoder-decoder basato sulla diffusione per un apprendimento non supervisionato efficiente e significativo nell'imaging medico, concentrandosi sulla malattia di Alzheimer (AD) utilizzando risonanza magnetica cerebrale (MR) proveniente dal database ADNI come caso di studio. A differenza dei convenzionali autoencoder di diffusione che operano nello spazio delle immagini, LDAE applica il processo di diffusione in una rappresentazione latente compressa, migliorando l'efficienza computazionale e rendendo fattibile l'apprendimento della rappresentazione di imaging medico 3D. Per validare l'approccio proposto, esploriamo due ipotesi chiave: (i) LDAE cattura efficacemente rappresentazioni semantiche significative su risonanze magnetiche cerebrali 3D associate all'AD e all'invecchiamento, e (ii) LDAE raggiunge una generazione e ricostruzione di immagini di alta qualità pur essendo computazionalmente efficiente. I risultati sperimentali supportano entrambe le ipotesi: (i) le valutazioni con linear probe dimostrano prestazioni diagnostiche promettenti per l'AD (ROC-AUC: 90%, ACC: 84%) e la previsione dell'età (MAE: 4.1 anni, RMSE: 5.2 anni); (ii) le rappresentazioni semantiche apprese consentono la manipolazione degli attributi, producendo modifiche anatomicamente plausibili; (iii) esperimenti di interpolazione semantica mostrano una forte ricostruzione delle scansioni mancanti, con un SSIM di 0.969 (MSE: 0.0019) per un intervallo di 6 mesi. Anche per intervalli più lunghi (24 mesi), il modello mantiene prestazioni robuste (SSIM > 0.93, MSE < 0.004), indicando la capacità di catturare le tendenze di progressione temporale; (iv) rispetto ai convenzionali autoencoder di diffusione, LDAE aumenta significativamente la velocità di inferenza (20 volte più veloce) migliorando anche la qualità della ricostruzione. Questi risultati posizionano LDAE come un framework promettente per applicazioni scalabili nell'imaging medico, con il potenziale di servire come modello di base per l'analisi delle immagini mediche. Il codice è disponibile all'indirizzo https://github.com/GabrieleLozupone/LDAE.
English
This study presents Latent Diffusion Autoencoder (LDAE), a novel
encoder-decoder diffusion-based framework for efficient and meaningful
unsupervised learning in medical imaging, focusing on Alzheimer disease (AD)
using brain MR from the ADNI database as a case study. Unlike conventional
diffusion autoencoders operating in image space, LDAE applies the diffusion
process in a compressed latent representation, improving computational
efficiency and making 3D medical imaging representation learning tractable. To
validate the proposed approach, we explore two key hypotheses: (i) LDAE
effectively captures meaningful semantic representations on 3D brain MR
associated with AD and ageing, and (ii) LDAE achieves high-quality image
generation and reconstruction while being computationally efficient.
Experimental results support both hypotheses: (i) linear-probe evaluations
demonstrate promising diagnostic performance for AD (ROC-AUC: 90%, ACC: 84%)
and age prediction (MAE: 4.1 years, RMSE: 5.2 years); (ii) the learned semantic
representations enable attribute manipulation, yielding anatomically plausible
modifications; (iii) semantic interpolation experiments show strong
reconstruction of missing scans, with SSIM of 0.969 (MSE: 0.0019) for a 6-month
gap. Even for longer gaps (24 months), the model maintains robust performance
(SSIM > 0.93, MSE < 0.004), indicating an ability to capture temporal
progression trends; (iv) compared to conventional diffusion autoencoders, LDAE
significantly increases inference throughput (20x faster) while also enhancing
reconstruction quality. These findings position LDAE as a promising framework
for scalable medical imaging applications, with the potential to serve as a
foundation model for medical image analysis. Code available at
https://github.com/GabrieleLozupone/LDAESummary
AI-Generated Summary