学术演讲中文语音识别音频数据集

学术演讲中文语音识别音频数据集

V1.0
最新更新:2026-02-22 05:58:09
样本数:500
文件大小:1.5G
文件格式:WAV
数据领域:音频
持有人:墨比乌斯公司
行业范围:学术演讲语音识别,内容媒体语音数据集,TTS音频数据
适用方向:学术会议,在线学习,内容媒体制作
数据集介绍

数据采集是通过高保真度麦克风在不同学术讲座和会议环境下录制完成的,并辅以专业音响设备以减少背景噪音。采用多轮标注和一致性检查,标注由语言学和语音处理领域的专家团队完成,确保标注的高精度和完整性。数据预处理包括音频切片、降噪处理、特征提取等步骤,存储格式为WAV文件,以便于跨平台使用。

示例样本展示
音频文件名时长音频采样率音频通道说话者性别说话者口音语速背景噪音水平语音清晰度主题类别转录质量
00:00/00:00
5cdbba1dd8c92fdba581aec0bcba902d.wav30827441002
数据结构总览
字段类型描述
文件名string文件名
时长string时长
音频采样率string音频采样率
音频通道string音频通道
说话者性别string指说话者的性别,例如男性或女性。
说话者口音string描述说话者的口音类型,例如美式英语或英式英语。
语速double衡量说话者的语速,即每秒钟的单词数。
背景噪音水平double反映音频中背景噪音的强度,通常以分贝表示。
语音清晰度string评估语音的清晰度,包括清晰、中等、不清晰等选项。
主题类别string表示学术演讲的主题类别,如科学、艺术或历史。
转录质量string对音频转录文本质量的评价,例如高、中、低。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求