
最新更新:2026-02-22 05:58:09

样本数:500

文件大小:1.5G

文件格式:WAV

行业范围:学术演讲语音识别,内容媒体语音数据集,TTS音频数据

适用方向:学术会议,在线学习,内容媒体制作
数据集介绍数据采集是通过高保真度麦克风在不同学术讲座和会议环境下录制完成的,并辅以专业音响设备以减少背景噪音。采用多轮标注和一致性检查,标注由语言学和语音处理领域的专家团队完成,确保标注的高精度和完整性。数据预处理包括音频切片、降噪处理、特征提取等步骤,存储格式为WAV文件,以便于跨平台使用。
示例样本展示
数据结构总览
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 说话者性别 | string | 指说话者的性别,例如男性或女性。 |
| 说话者口音 | string | 描述说话者的口音类型,例如美式英语或英式英语。 |
| 语速 | double | 衡量说话者的语速,即每秒钟的单词数。 |
| 背景噪音水平 | double | 反映音频中背景噪音的强度,通常以分贝表示。 |
| 语音清晰度 | string | 评估语音的清晰度,包括清晰、中等、不清晰等选项。 |
| 主题类别 | string | 表示学术演讲的主题类别,如科学、艺术或历史。 |
| 转录质量 | string | 对音频转录文本质量的评价,例如高、中、低。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求