医疗行业正快速步入智能化阶段,医疗大语言模型、智能问诊系统、健康AI助手等应用对真实、高质量、多轮医患对话数据的需求日益增长。
本数据集收录了超过十万轮英语医患多轮对话数据,覆盖多个医疗子领域,包括全科、内科、儿科、心理健康、皮肤科等。数据集覆盖以下常见医疗对话场景:
患者描述症状,咨询病情;
医生进行初步问诊、判断并提供诊断建议;
医生告知用药说明或生活指导;
医患多轮交互式随访或慢病管理;
心理咨询与情绪疏导;
所有对话均基于真实临床交流构建,涵盖初诊、复诊、慢病管理、心理干预、用药指导等多样场景。语言风格自然、互动节奏合理,远优于由脚本生成或单轮问答拼接的语料。对话内容紧贴患者表述特征与医生沟通方式,适合训练医疗类多轮问答系统与 LLM 推理能力。数据结构清晰、标注规范,可灵活用于问答抽取、意图识别、实体抽取、对话管理等子任务,也能作为高质量模拟真实问诊的训练源,是构建医疗智能助手、AI问诊产品不可多得的语料资源。