粤语医疗语音识别数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

粤语医疗语音识别数据集

V1.0

最新更新：2026-05-24 03:18:49

样本数：1000

文件大小：0

文件格式：

数据领域：Audio

持有人：墨比乌斯公司

行业范围：

适用方向：

数据集介绍

在医疗AI不断向智能语音交互、远程问诊、语音病历生成等方向拓展的背景下，行业专属语音识别模型的性能与数据质量之间的关系变得至关重要。尤其是对于粤语语种，医疗语音资源更显稀缺。
本数据集基于真实医疗场景采集的原始语音，经过精细的切段处理（单条音频 3–20 秒）和高质量人工转写，形成可直接用于训练语音识别系统的“音频 + 对齐文本”结构化语料，为构建精准、稳健的粤语医疗ASR系统提供基础资源。
该数据集具备高质量、任务适配度强、结构标准等显著优势。音频均来源于粤语医疗场景，涵盖真实交流内容，表达自然，语速多样，含丰富医学专业术语。所有音频已按句短段切割，便于模型训练收敛，配套文本由人工转写完成，准确率高，语义完整。结构统一、格式清晰，支持导出为主流ASR训练框架格式。该数据既适用于从零训练粤语医疗语音识别模型，也可用于微调通用大模型在医疗垂类的表现，是当前粤语医疗语音AI发展的关键训练资源。

示例样本展示

音频	File Name	Duration	Sample Rate	Channel	文件名	转写文本	采样率	采样位数	音频声道	音频格式	文本格式	语种

数据结构总览

字段	类型	描述
File Name	string	File name
Duration	string	Duration
Sample Rate	string	Audio sample rate
Channel	string	Audio channel
文件名	string	音频文件的名字，具有唯一性
转写文本	string	音频文件的转写文本
采样率	string	录音文件的采样率，单位是Hz。
采样位数	string	录音文件的采样位数，单位是bit。
音频声道	string	录音文件的音频声道，分为单声道、多声道、立体声。
音频格式	string	录音文件的文件格式
文本格式	string	录音转写的文本文件格式
语种	string	音频内容的语言

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

血氧监控患者数据集

该数据集提供高质量的血氧监控图像，助力医疗行业疾病预警与健康管理。

胎心监护仪屏幕状态分类数据集

本数据集包含胎心监护仪屏幕状态图像，旨在提升监护状态自动识别的准确性。

C形臂设备图像数据集

C形臂设备图像数据集为医疗影像分析提供高质量数据，助力目标检测技术的发展。

脉搏血氧仪数据集

脉搏血氧仪数据集旨在为目标检测提供高质量医疗图像数据。

麻醉机设备图像数据集

本数据集提供丰富的麻醉机设备图像，助力医疗图像分类研究。

透析治疗生理信号数据集

透析治疗生理信号数据集为医疗行业提供高质量的目标检测数据，助力精准医疗。

基础医疗物品图像数据集

基础医疗物品图像数据集，旨在提升医疗物品识别与管理的效率。

输液架挂钩数量检测图像数据集

本数据集用于输液架挂钩数量的检测与识别，支持医疗行业的自动化管理。

头皮电针治疗图像数据集

本数据集专注于头皮电针治疗的图像分析与目标检测。

美国2002-2021年流感疾病的患者与患者数量的比率时序数据集

一个涵盖美国2002-2021年流感病例总体情况的时序数据集。

500条Time Series

没有更多了