候诊提示中文语音识别音频数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

候诊提示中文语音识别音频数据集

V1.0

最新更新：2026-05-24 03:56:49

样本数：500

文件大小：1.6G

文件格式：MP3

数据领域：Audio

持有人：墨比乌斯公司

行业范围：医疗语音识别数据集,候诊音频数据,健康咨询语音

适用方向：医院语音系统,健康咨询,智能语音助手

数据集介绍

在现代医院中，管理候诊信息和提高患者体验依然是一个挑战。现有的语音系统大多局限于简单的对话或固定的回复，难以处理复杂的口语输入。候诊提示语音识别音频数据集的建设旨在提供更精准的语音识别模型，为医院和诊所提供更高效的候诊管理方案。数据通过在真实医院环境中使用多种录音设备采集，包括定向麦克风和便携录音设备，以保证背景噪音的多样性。数据采用多轮标注和专家审核，标注团队由语言学专家和医疗从业者组成，规模超过20人。数据经过噪声过滤、语音增强等预处理步骤，最终存储为MP3格式，并按发音人、情景等标签组织。

该数据集的核心优势在于高质量的标注精度，达到95%以上的一致性和完整性，创新采用语音噪声过滤和增强技术，以准确模拟医院环境中的实际使用情况。从应用价值而言，它可以降低医疗助理的工作负担，提高病人体验；相比同类数据集，它提供了独特的专业医疗术语和方言支持，其稀缺性体现在难以获取的真实医院环境录音。同样适用于其他高噪声环境，如大型客户服务中心，并提供了良好的可扩展性和通用性。

示例样本展示

音频	File Name	Duration	Sample Rate	Channel	语言	说话人性别	说话人年龄组	口音类型	背景噪声水平	语音信噪比	对话类型	情感语调	语速
00:00/00:00	f78c56990ae449a28499823db438136b.wav	11584	44100	2

数据结构总览

字段	类型	描述
File Name	string	File name
Duration	string	Duration
Sample Rate	string	Audio sample rate
Channel	string	Audio channel
语言	string	音频中使用的语言。
说话人性别	string	音频中说话人的性别。
说话人年龄组	string	音频中说话人的年龄组，例如：儿童、成人、老人。
口音类型	string	音频中说话人所表现的口音类型。
背景噪声水平	string	音频中背景噪声的水平，例如：高、中、低。
语音信噪比	string	音频中语音信噪比的程度。
对话类型	string	音频中对话的类型，例如：多人对话、单人独白。
情感语调	string	音频中说话人的情感语调，例如：愤怒、平静、快乐。
语速	string	音频中说话人的语速，例如：慢速、中速、快速。

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

脉搏监测数据集

脉搏监测数据集是一个专注于脉搏率检测的高质量医疗图像数据集。

胎心监护设备品牌检测数据集

胎心监护设备品牌检测数据集用于提升胎心监护设备的品牌识别精度。

多型号麻醉机性能对比数据集

本数据集提供多型号麻醉机的性能对比数据，支持目标检测任务。

手部风湿针灸数据集

手部风湿针灸数据集为医学图像分析提供了高质量的目标检测数据。

手术室多模态数据集

本数据集提供高质量的手术室图像及其目标检测标注，助力医疗影像智能分析。

透析设备图像数据集

本数据集提供高质量的透析设备图像，支持目标检测与医疗影像分析。

药物注射数据集

药物注射数据集是针对医疗影像分析和目标检测任务创建的高质量数据集。

输液瓶与输液袋目标检测图像数据集

本数据集专注于输液瓶与输液袋的目标检测，为医疗图像处理提供高质量的数据支持。

耳针智能识别数据集

耳针智能识别数据集是一个专为针灸图像分析而设计的目标检测数据集。

美国2002-2021年流感疾病的患者与患者数量的比率时序数据集

一个涵盖美国2002-2021年流感病例总体情况的时序数据集。

500条Time Series

没有更多了