高度な患者シミュレータを用いた問い合わせと診断の関係の探索
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators
January 16, 2025
著者: Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian Xie
cs.AI
要旨
オンライン医療相談(OMC)は、医師が患者情報を問診を通じてのみ収集することに制限され、すでに複雑な診断の連続的意思決定プロセスをさらに困難にしています。最近、大規模言語モデルの急速な進歩がOMCを変革する可能性を示しています。しかし、ほとんどの研究は、比較的十分な情報条件下での診断精度の向上に主に焦点を当てており、相談プロセスの「問診」段階には限られた注意が払われています。この焦点の欠如により、「問診」と「診断」の関係が不十分に探求されています。本論文では、まず、本物の医師と患者の会話から実際の患者とのやり取り戦略を抽出し、これらの戦略を使用して現実世界の行動を密接に模倣する患者シミュレータのトレーニングをガイドします。医療記録を患者シミュレータに入力して患者の反応をシミュレートし、相談プロセスにおける「問診」と「診断」の関係を探るために幅広い実験を行います。実験結果は、問診と診断がリービッヒの法則に従うことを示しています:質の低い問診は、診断能力にかかわらず、診断の効果を制限し、その逆もまた然りです。さらに、実験は、さまざまなモデルの問診パフォーマンスにおける著しい違いを明らかにします。この現象を調査するために、問診プロセスを次の4つのタイプに分類します:(1)主訴の問診;(2)既知の症状の特定;(3)合併症状の問診;および(4)家族や医療歴の収集。異なるモデルにおけるこれら4つのタイプの問診の分布を分析し、その著しいパフォーマンスの違いの背後にある理由を探ります。当社の患者シミュレータの重みと関連コードをオープンソース化する予定であり、https://github.com/LIO-H-ZEN/PatientSimulator で公開する予定です。
English
Online medical consultation (OMC) restricts doctors to gathering patient
information solely through inquiries, making the already complex sequential
decision-making process of diagnosis even more challenging. Recently, the rapid
advancement of large language models has demonstrated a significant potential
to transform OMC. However, most studies have primarily focused on improving
diagnostic accuracy under conditions of relatively sufficient information,
while paying limited attention to the "inquiry" phase of the consultation
process. This lack of focus has left the relationship between "inquiry" and
"diagnosis" insufficiently explored. In this paper, we first extract real
patient interaction strategies from authentic doctor-patient conversations and
use these strategies to guide the training of a patient simulator that closely
mirrors real-world behavior. By inputting medical records into our patient
simulator to simulate patient responses, we conduct extensive experiments to
explore the relationship between "inquiry" and "diagnosis" in the consultation
process. Experimental results demonstrate that inquiry and diagnosis adhere to
the Liebig's law: poor inquiry quality limits the effectiveness of diagnosis,
regardless of diagnostic capability, and vice versa. Furthermore, the
experiments reveal significant differences in the inquiry performance of
various models. To investigate this phenomenon, we categorize the inquiry
process into four types: (1) chief complaint inquiry; (2) specification of
known symptoms; (3) inquiry about accompanying symptoms; and (4) gathering
family or medical history. We analyze the distribution of inquiries across the
four types for different models to explore the reasons behind their significant
performance differences. We plan to open-source the weights and related code of
our patient simulator at https://github.com/LIO-H-ZEN/PatientSimulator.Summary
AI-Generated Summary