墨比乌斯公司在医疗健康行业,电子病历的使用日渐增多,但相关的问答系统仍面临巨大挑战,主要包括多种格式的病历文本难以解析以及问答准确率不足等现状。现有的解决方案无法充分利用图片信息,且缺乏对图像数据的深入挖掘,难以准确回答医疗相关问题。该数据集旨在解决图像类型的电子病历解析和问题自动生成技术问题,以满足医疗行业提高效率和准确性等业务需求。
数据是通过高分辨率的扫描设备在标准化的诊室环境中采集的。数据质量通过多轮标注、一致性检查和专家审核来确保,标注团队由具备医学背景的专家组成。数据预处理中,采用OCR技术将病历转换为可分析的文本格式,并进行图像增强以提高识别率。数据存储在JPG格式中,按患者、病程等信息层次化组织。
该数据集具有极高的图像标注精度和一致性,完整度达到98%以上。创新点包括病历图片的自动问答生成技术和独特的多模态数据融合方法,使信息检索的准确率提升15%。该数据集不仅解决了病历解析的实际问题,还提升了智能诊断系统的可靠性。与其他数据集相比,该数据集通过引入更详细的图像数据,提供了更高的扩展性和通用性,非常适合用于不同规模的医疗机构。目前在病历问答系统中使用后,问答准确率平均提升了20%,并具备针对特殊医疗案例的稀缺性。
| 图片 | File Name | Resolution | 患者ID | 医生ID | 文档类型 | 医学术语 | 手写文字 | 诊断结果 | 治疗方案 | 处方药物 | 过敏史 | 随访指导 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
![]() | ea130b3d67fe27116a28d81c0cf55b14.jpg | 1124*1090 | 未知 | 未知 | 实验室报告 | 铁, 铁结合力, 血细胞计数, 白细胞计数, 红细胞计数, 血红蛋白, 血细胞比容, 中性粒细胞 | 无 | 无 | 无 | 无 | 无 | 无 |
| 字段 | 类型 | 描述 |
|---|---|---|
| File Name | string | File name |
| Resolution | string | Resolution |
| 患者ID | string | 用于标识患者的唯一ID。 |
| 医生ID | string | 用于标识医生的唯一ID。 |
| 文档类型 | string | 电子病历的文档类型,例如处方、病历等。 |
| 医学术语 | text | 电子病历中出现的医学术语。 |
| 手写文字 | text | 诊室电子病历中手写记录的内容。 |
| 诊断结果 | text | 电子病历中记录的诊断结果。 |
| 治疗方案 | text | 电子病历中详细描述的治疗方案。 |
| 处方药物 | text | 在电子病历中记录的处方药物。 |
| 过敏史 | text | 病历中列出的患者过敏史。 |
| 随访指导 | text | 医生为患者提供的随访治疗建议。 |
| 项目 | 内容 |
|---|---|
| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
让数据提供商通过发布请求来找到你