최적화된 대형 언어 모델은 당뇨 관리에서 여러 의료 업무를 용이하게 합니다.
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
저자: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
초록
당뇨병은 중대한 세계적 건강 부담을 안겨주는 만성 질환으로, 당뇨병 관리의 최적화에는 다중 이해관계자 간의 협력이 필요합니다. 대형 언어 모델(Large language models, LLMs)은 다양한 의료 상황에서 유망성을 보여주었지만, 당뇨병 작업의 다양한 범위에서의 효과는 아직 입증되지 않았습니다. 본 연구에서는 당뇨병 특화 LLMs를 훈련하고 검증하기 위한 프레임워크를 소개했습니다. 먼저 데이터 수집, 필터링, 증강 및 정제를 포함하는 포괄적인 데이터 처리 파이프라인을 개발했습니다. 이 접근 방식은 고품질의 당뇨병 특화 데이터셋 및 여러 평가 기준을 완전히 새롭게 만드는 데 기여합니다. 수집한 훈련 데이터셋을 활용하여 다른 LLMs와 비교했을 때 다양한 당뇨병 작업을 이해하고 처리하는 데 최신 기술을 보여준 당뇨병 특화 LLMs 패밀리를 세밀하게 조정했습니다. 더 나아가 임상 연구에서는 우리 모델들이 개인 맞춤형 의료, 의학 교육 지원, 임상 작업 간소화 등 당뇨병 관리에 대한 잠재적인 응용 가능성을 보여주었습니다. 결론적으로 본 연구는 당뇨병 특화 LLMs 패밀리를 개발하고 평가하기 위한 프레임워크를 소개하며, 다양한 최종 사용자들에게 직면했을 때 임상 실무를 향상시키고 데이터 기반의 개인 맞춤형 당뇨병 지원을 제공하는 잠재력을 강조했습니다. 코드는 https://github.com/waltonfuture/Diabetica에서 제공됩니다.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary