诊室电子病历图片数据集

诊室电子病历图片数据集

V1.0
最新更新:2026-04-05 01:11:13
样本数:500
文件大小:1.6G
文件格式:JPG
数据领域:Image
持有人:墨比乌斯公司
行业范围:电子病历问答,医疗图片解析,智能诊断数据集
适用方向:医疗问答系统,智能诊断,医疗文本分析
数据集介绍

在医疗健康行业,电子病历的使用日渐增多,但相关的问答系统仍面临巨大挑战,主要包括多种格式的病历文本难以解析以及问答准确率不足等现状。现有的解决方案无法充分利用图片信息,且缺乏对图像数据的深入挖掘,难以准确回答医疗相关问题。该数据集旨在解决图像类型的电子病历解析和问题自动生成技术问题,以满足医疗行业提高效率和准确性等业务需求。

数据是通过高分辨率的扫描设备在标准化的诊室环境中采集的。数据质量通过多轮标注、一致性检查和专家审核来确保,标注团队由具备医学背景的专家组成。数据预处理中,采用OCR技术将病历转换为可分析的文本格式,并进行图像增强以提高识别率。数据存储在JPG格式中,按患者、病程等信息层次化组织。

该数据集具有极高的图像标注精度和一致性,完整度达到98%以上。创新点包括病历图片的自动问答生成技术和独特的多模态数据融合方法,使信息检索的准确率提升15%。该数据集不仅解决了病历解析的实际问题,还提升了智能诊断系统的可靠性。与其他数据集相比,该数据集通过引入更详细的图像数据,提供了更高的扩展性和通用性,非常适合用于不同规模的医疗机构。目前在病历问答系统中使用后,问答准确率平均提升了20%,并具备针对特殊医疗案例的稀缺性。

示例样本展示
图片File NameResolution患者ID医生ID文档类型医学术语手写文字诊断结果治疗方案处方药物过敏史随访指导
ea130b3d67fe27116a28d81c0cf55b14.jpg1124*1090未知未知实验室报告铁, 铁结合力, 血细胞计数, 白细胞计数, 红细胞计数, 血红蛋白, 血细胞比容, 中性粒细胞
数据结构总览
字段类型描述
File NamestringFile name
ResolutionstringResolution
患者IDstring用于标识患者的唯一ID。
医生IDstring用于标识医生的唯一ID。
文档类型string电子病历的文档类型,例如处方、病历等。
医学术语text电子病历中出现的医学术语。
手写文字text诊室电子病历中手写记录的内容。
诊断结果text电子病历中记录的诊断结果。
治疗方案text电子病历中详细描述的治疗方案。
处方药物text在电子病历中记录的处方药物。
过敏史text病历中列出的患者过敏史。
随访指导text医生为患者提供的随访治疗建议。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求