
最新更新:2026-03-07 05:48:54

样本数:500

文件大小:1.6G

文件格式:WAV

行业范围:护士站呼叫识别,医疗语音数据集,语音指令自动化

适用方向:医疗呼叫系统,智能护理,医院自动化
数据集介绍数据集提供高质量的语音样本,尤其是在嘈杂环境中依然能保持90%以上的识别精度,标注一致性达到98%。团队采用创新的多层次标注修正系统,并附有详尽的误识别率分析报告。应用价值显著,通过本数据集训练的模型可提高医务人员响应速度20%,大幅降低误听风险,与其他数据集相比,这一数据集支持的指令范围更广,涵盖常见的医疗指令,具备极高的实用性和扩展潜力,确保其在各类医疗场景下均能快速适应。
示例样本展示
数据结构总览
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 说话人ID | string | 标识说话人的唯一ID。 |
| 说话人年龄 | int | 录音中说话人的年龄。 |
| 说话人性别 | string | 录音中说话人的性别。 |
| 音频语言 | string | 音频中使用的语言。 |
| 呼叫意图 | string | 音频内容中的呼叫意图类型。 |
| 背景噪音水平 | string | 标识音频中背景噪音的水平(例如低、中、高)。 |
| 语音转录 | text | 音频中语音指令的文字转录。 |
| 检测到的情绪 | string | 识别出的音频中说话人的情绪(例如高兴、愤怒、平静)。 |
| 语速 | float | 音频中语音指令的语速(例如每分钟多少字)。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求