Erkundung der Beziehung zwischen Anfrage und Diagnose mit fortschrittlichen Patientensimulatoren.

Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators

January 16, 2025
Autoren: Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian Xie
cs.AI

Zusammenfassung

Die Online-Medikonsultation (OMC) beschränkt Ärzte darauf, Patienteninformationen ausschließlich durch Befragungen zu sammeln, was den ohnehin schon komplexen sequenziellen Entscheidungsfindungsprozess der Diagnose noch herausfordernder macht. In letzter Zeit hat der rasante Fortschritt großer Sprachmodelle ein erhebliches Potenzial zur Transformation der OMC gezeigt. Die meisten Studien haben sich jedoch hauptsächlich darauf konzentriert, die diagnostische Genauigkeit unter Bedingungen relativ ausreichender Informationen zu verbessern, während sie der "Befragung" -Phase des Konsultationsprozesses nur begrenzte Aufmerksamkeit geschenkt haben. Dieser Mangel an Fokus hat die Beziehung zwischen "Befragung" und "Diagnose" unzureichend erforscht. In diesem Artikel extrahieren wir zunächst reale Patienteninteraktionsstrategien aus authentischen Arzt-Patienten-Gesprächen und verwenden diese Strategien, um das Training eines Patientensimulators zu leiten, der das Verhalten der realen Welt genau widerspiegelt. Indem wir medizinische Aufzeichnungen in unseren Patientensimulator eingeben, um Patientenantworten zu simulieren, führen wir umfangreiche Experimente durch, um die Beziehung zwischen "Befragung" und "Diagnose" im Konsultationsprozess zu erforschen. Die experimentellen Ergebnisse zeigen, dass Befragung und Diagnose dem Liebigschen Gesetz folgen: Eine schlechte Befragungsqualität begrenzt die Wirksamkeit der Diagnose, unabhängig von der diagnostischen Fähigkeit, und umgekehrt. Darüber hinaus zeigen die Experimente signifikante Unterschiede in der Befragungsleistung verschiedener Modelle auf. Um dieses Phänomen zu untersuchen, kategorisieren wir den Befragungsprozess in vier Typen: (1) Befragung zur Hauptsymptomatik; (2) Spezifizierung bekannter Symptome; (3) Befragung zu begleitenden Symptomen; und (4) Sammlung von Familien- oder Krankengeschichte. Wir analysieren die Verteilung von Befragungen über die vier Typen für verschiedene Modelle, um die Gründe für ihre signifikanten Leistungsunterschiede zu erforschen. Wir planen, die Gewichte und den zugehörigen Code unseres Patientensimulators unter https://github.com/LIO-H-ZEN/PatientSimulator als Open-Source freizugeben.
English
Online medical consultation (OMC) restricts doctors to gathering patient information solely through inquiries, making the already complex sequential decision-making process of diagnosis even more challenging. Recently, the rapid advancement of large language models has demonstrated a significant potential to transform OMC. However, most studies have primarily focused on improving diagnostic accuracy under conditions of relatively sufficient information, while paying limited attention to the "inquiry" phase of the consultation process. This lack of focus has left the relationship between "inquiry" and "diagnosis" insufficiently explored. In this paper, we first extract real patient interaction strategies from authentic doctor-patient conversations and use these strategies to guide the training of a patient simulator that closely mirrors real-world behavior. By inputting medical records into our patient simulator to simulate patient responses, we conduct extensive experiments to explore the relationship between "inquiry" and "diagnosis" in the consultation process. Experimental results demonstrate that inquiry and diagnosis adhere to the Liebig's law: poor inquiry quality limits the effectiveness of diagnosis, regardless of diagnostic capability, and vice versa. Furthermore, the experiments reveal significant differences in the inquiry performance of various models. To investigate this phenomenon, we categorize the inquiry process into four types: (1) chief complaint inquiry; (2) specification of known symptoms; (3) inquiry about accompanying symptoms; and (4) gathering family or medical history. We analyze the distribution of inquiries across the four types for different models to explore the reasons behind their significant performance differences. We plan to open-source the weights and related code of our patient simulator at https://github.com/LIO-H-ZEN/PatientSimulator.

Summary

AI-Generated Summary

PDF164January 17, 2025