MedMobile: Een op mobiel formaat taalmodel met klinische mogelijkheden op expertniveau

MedMobile: A mobile-sized language model with expert-level clinical capabilities

October 11, 2024
Auteurs: Krithik Vishwanath, Jaden Stryker, Anton Alaykin, Daniel Alexander Alber, Eric Karl Oermann
cs.AI

Samenvatting

Taalmodellen (LM's) hebben expertniveau redeneer- en herinneringsvermogen aangetoond in de geneeskunde. Echter, toenemende rekenkundige kosten en privacyzorgen vormen obstakels voor grootschalige implementatie. Wij introduceren een zuinige aanpassing van phi-3-mini, MedMobile, een LM met 3,8 miljard parameters die kan draaien op een mobiel apparaat, voor medische toepassingen. We tonen aan dat MedMobile 75,7% scoort op de MedQA (USMLE), hoger dan het slaagcijfer voor artsen (~60%), en de scores benadert van modellen die 100 keer groter zijn. Vervolgens voeren we een zorgvuldige reeks ablaties uit en tonen aan dat ketendenken, ensembleren en fijnafstemming leiden tot de grootste prestatiewinsten, terwijl onverwacht retrieval augmented generation geen significante verbeteringen laat zien.
English
Language models (LMs) have demonstrated expert-level reasoning and recall abilities in medicine. However, computational costs and privacy concerns are mounting barriers to wide-scale implementation. We introduce a parsimonious adaptation of phi-3-mini, MedMobile, a 3.8 billion parameter LM capable of running on a mobile device, for medical applications. We demonstrate that MedMobile scores 75.7% on the MedQA (USMLE), surpassing the passing mark for physicians (~60%), and approaching the scores of models 100 times its size. We subsequently perform a careful set of ablations, and demonstrate that chain of thought, ensembling, and fine-tuning lead to the greatest performance gains, while unexpectedly retrieval augmented generation fails to demonstrate significant improvements

Summary

AI-Generated Summary

PDF82November 16, 2024