英语医患对话数据集

英语医患对话数据集

V1.0
最新更新:2026-01-02 17:38:55
样本数:157993
文件大小:0
文件格式:
数据领域:文本
持有人:墨比乌斯公司
行业范围:
适用方向:
数据集介绍

医疗行业正快速步入智能化阶段,医疗大语言模型、智能问诊系统、健康AI助手等应用对真实、高质量、多轮医患对话数据的需求日益增长。

本数据集收录了超过十万轮英语医患多轮对话数据,覆盖多个医疗子领域,包括全科、内科、儿科、心理健康、皮肤科等。数据集覆盖以下常见医疗对话场景:

患者描述症状,咨询病情;

医生进行初步问诊、判断并提供诊断建议;

医生告知用药说明或生活指导;

医患多轮交互式随访或慢病管理;

心理咨询与情绪疏导;

所有对话均基于真实临床交流构建,涵盖初诊、复诊、慢病管理、心理干预、用药指导等多样场景。语言风格自然、互动节奏合理,远优于由脚本生成或单轮问答拼接的语料。对话内容紧贴患者表述特征与医生沟通方式,适合训练医疗类多轮问答系统与 LLM 推理能力。数据结构清晰、标注规范,可灵活用于问答抽取、意图识别、实体抽取、对话管理等子任务,也能作为高质量模拟真实问诊的训练源,是构建医疗智能助手、AI问诊产品不可多得的语料资源。

示例样本展示
数据结构总览
字段类型描述
文件名string文件名
question_idint每条对话记录的唯一标识
question_titlestring本组对话的主题
questionstring病人提问的问题
answerstring医生回答的答案
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求