急诊室嘈杂环境下的医生指令和病人呼救语义分割中文音频数据集
V1.0

最新更新:2026-04-05 02:42:28

样本数:500

文件大小:1.2G

文件格式:WAV

行业范围:急诊室语音数据集,医生指令识别,医疗语音分割,嘈杂环境语音数据

适用方向:智能医疗,远程医疗系统,医疗语音识别
数据集介绍在现代医疗体系中,急诊室的嘈杂环境给医生与病人之间的语音交流带来了极大的挑战,现有的语音识别系统在此类环境中的准确性不足,严重影响了智能医疗设备的实用性。本数据集通过收集急诊室环境下的医生指令和病人呼救音频,希望解决在嘈杂环境中语音语义分割准确度低的问题,满足智能医疗对高噪声环境下精确语音识别的业务需求。采集方法采用高灵敏度麦克风在真实急诊室环境中录制,数据经过多轮标注与一致性检查,由具备医学和声学背景的专业团队审核。预处理步骤包括去噪、切分、特征提取,数据以WAV格式存储并按场景和角色组织。
示例样本展示
数据结构总览
| File Name | string | File name |
| Duration | string | Duration |
| Sample Rate | string | Audio sample rate |
| Channel | string | Audio channel |
| 说话者角色 | string | 音频中说话者的角色,例如医生、护士或病人。 |
| 背景噪音类型 | string | 音频中的背景噪音类型,例如救护车声、机器声或嘈杂人声。 |
| 语音清晰度 | string | 音频中语音的清晰度,例如清晰、模糊。 |
| 情感语调 | string | 音频中说话者表达的情感语调,例如紧急、镇静。 |
| 语言 | string | 音频中使用的语言,例如英语、西班牙语。 |
| 语速 | string | 音频中语音的速度,例如慢速、中速、快速。 |
| 指令或呼救 | string | 表示音频中是医生的指令还是病人的呼救。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求