英语医患对话数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

英语医患对话数据集

V1.0

最新更新：2026-07-08 04:48:11

样本数：157993

文件大小：0

文件格式：

数据领域：Text

持有人：墨比乌斯公司

行业范围：

适用方向：

数据集介绍

医疗行业正快速步入智能化阶段，医疗大语言模型、智能问诊系统、健康AI助手等应用对真实、高质量、多轮医患对话数据的需求日益增长。
本数据集收录了超过十万轮英语医患多轮对话数据，覆盖多个医疗子领域，包括全科、内科、儿科、心理健康、皮肤科等。数据集覆盖以下常见医疗对话场景：
患者描述症状，咨询病情；
医生进行初步问诊、判断并提供诊断建议；
医生告知用药说明或生活指导；
医患多轮交互式随访或慢病管理；
心理咨询与情绪疏导；
所有对话均基于真实临床交流构建，涵盖初诊、复诊、慢病管理、心理干预、用药指导等多样场景。语言风格自然、互动节奏合理，远优于由脚本生成或单轮问答拼接的语料。对话内容紧贴患者表述特征与医生沟通方式，适合训练医疗类多轮问答系统与 LLM 推理能力。数据结构清晰、标注规范，可灵活用于问答抽取、意图识别、实体抽取、对话管理等子任务，也能作为高质量模拟真实问诊的训练源，是构建医疗智能助手、AI问诊产品不可多得的语料资源。

示例样本展示

数据结构总览

字段	类型	描述
File Name	string	File name
question_id	int	每条对话记录的唯一标识
question_title	string	本组对话的主题
question	string	病人提问的问题
answer	string	医生回答的答案

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

输液架使用状态分类图像数据集

本数据集提供了输液架使用状态分类的高质量图像，助力医疗智能监测。

血压计品牌与型号识别数据集

本数据集用于血压计品牌与型号的自动识别，提升医疗设备识别的准确性和效率。

指尖采血图像数据集

指尖采血图像数据集旨在提高医疗影像分析的效率与准确性。

助行器与用户交互数据集

本数据集专注于助行器与用户交互的目标检测，为医疗领域提供丰富的图像数据支持。

牙科器械识别数据集

牙科器械识别数据集致力于提升牙科影像分析的自动化水平。

手动轮椅目标检测图像数据集

本数据集致力于手动轮椅的目标检测，为医疗影像分析提供高质量数据支持。

助行器安全使用环境图像数据集

本数据集提供助行器使用环境的图像数据，旨在提升医疗辅助设备的安全性。

缅甸语医疗语音识别数据集

本数据集包含1000小时缅甸语医疗场景语音及高质量转写文本，适用于训练医疗语音识别、语音问答与健康AI系统。

血压与脉搏联合信号数据集

该数据集提供高质量的血压与脉搏联合信号图像，支持医疗监测与研究。

电针操作异常检测数据集

电针操作异常检测数据集，助力医疗影像分析与临床诊断。

没有更多了