药房处方单文字提取数据集

药房处方单文字提取数据集

V1.0
最新更新:2026-05-23 15:21:55
样本数:500
文件大小:1.5G
文件格式:JPG
数据领域:Image
持有人:墨比乌斯公司
行业范围:处方单文字识别,医疗图像数据集,电子处方系统
适用方向:医疗信息化,智能药品管理,电子处方系统
数据集介绍

在医疗健康领域,药房处方单的电子化是提高药品管理效率和减少人为错误的重要方向。然而,目前的解决方案在文本提取精度、对手写文字的识别能力上存在显著不足,影响了电子处方系统的实用性。本数据集的建设旨在解决这些问题,通过提供高质量的处方单影像数据,帮助提升文字识别系统的精度与可靠性。数据集包含了多个环境下采集的处方单图像,涉及不同的处方格式与书写风格。数据的采集过程中使用高清扫描仪与专业拍摄设备,确保图像清晰度。质量控制采用多轮人工标注、交叉验证和专家审核,标注团队由具有医药背景的专业人员组成,共计20人规模。数据预处理包括图像增强、去噪和文本区域检测等步骤,最终以JPG格式存储,并按照处方类型和日期等组织。核心优势在于数据集的标注精度达到98%以上,一致性高度统一,对于手写和印刷文本的覆盖全面。技术创新体现在独特的文本区分与增强方法上,使识别准确率提升15%。该数据集解决了现有系统无法准确解析复杂处方单的难题,显著提升了电子药房的自动化程度及工作效率。与同类数据集相比,我们的数据质量更高,稀缺性体现在于对多种字体与书写习惯的充分涵盖,具备良好的扩展性和通用性,适用于多种药房信息化系统的开发与优化。

示例样本展示
图片File NameResolution患者姓名患者编号医生姓名药物列表剂量说明开具日期药房名称续药信息诊断信息特别指示
0ac49b68e4aa3b07499f58ace3d30f22.jpg1280*1708信息遮挡信息遮挡Dr. Vrishali Tushar RohankarNeobra Soluble Powder, Dompe Xo Tablets, Pantop 40 Delayed Release Tablet, Panadol Advance FilmNeobra Soluble Powder: 1 Sachet every 12 hours for 5 days; Dompe Xo Tablets: 1 tablet every 8 hours for 3 days; Pantop 40 Delayed Release Tablet: 1 tablet OD for 10 days; Panadol Advance Film: 2 tablets every 8 hours for 4 days17-06-2025Life Medical Centre DWTC未提供A09 Infectious gastroenteritis and colitis, unspecified; M62.8 Muscle weakness (generalized); R63.8 Other fatigue; K29.40 Acute gastritis without bleeding; R11.0 Nausea未提供
数据结构总览
字段类型描述
File NamestringFile name
ResolutionstringResolution
患者姓名string处方单中记录的患者姓名。
患者编号string处方单中记录的患者编号,用于唯一标识患者身份。
医生姓名string处方单上提供的医生姓名。
药物列表string处方单中列出的所有药物及其剂量信息。
剂量说明string具体的用药指令以及每种药物的剂量说明。
开具日期string处方单的开具日期。
药房名称string处方单中记录的药房名称。
续药信息string处方单上关于药物续药的信息。
诊断信息string处方单上记录的诊断信息。
特别指示string医生在处方单上给出的任何特别指示。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求