후복막 종양 분할에서 U-Net 수정의 성능에 관한 연구
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
저자: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
초록
복막후공간에는 희귀한 양성 및 악성 종을 포함한 다양한 종양이 있으며, 이 종양들은 그 빈도와 주요 구조물에 인접해 있어 진단 및 치료에 어려움을 겪습니다. 종양 부피를 추정하기는 불규칙한 형태 때문에 어렵고, 수동 분할은 시간이 많이 소요됩니다. U-Net 및 그 변형을 사용한 자동 분할은 Vision Transformer (ViT) 요소를 통합하여 유망한 결과를 보여주었지만 높은 계산 요구에 어려움을 겪습니다. 이를 해결하기 위해 Mamba State Space Model (SSM) 및 Extended Long-Short Term Memory (xLSTM)와 같은 아키텍처는 낮은 자원 소비로 장거리 종속성을 처리하여 효율적인 해결책을 제공합니다. 본 연구에서는 CNN, ViT, Mamba 및 xLSTM을 포함한 U-Net 개선 사항을 새로운 내부 CT 데이터셋과 공개 기관 분할 데이터셋에서 평가합니다. 제안된 ViLU-Net 모델은 개선된 분할을 위해 Vi-blocks를 통합합니다. 결과는 U-Net 구조에서 xLSTM의 효율성을 강조합니다. 코드는 GitHub에서 공개적으로 접근할 수 있습니다.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary