学术演讲中文语音识别音频数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

学术演讲中文语音识别音频数据集

V1.0

最新更新：2026-07-08 05:47:23

样本数：500

文件大小：1.5G

文件格式：WAV

数据领域：Audio

持有人：墨比乌斯公司

行业范围：学术演讲语音识别,内容媒体语音数据集,TTS音频数据

适用方向：学术会议,在线学习,内容媒体制作

数据集介绍

数据采集是通过高保真度麦克风在不同学术讲座和会议环境下录制完成的，并辅以专业音响设备以减少背景噪音。采用多轮标注和一致性检查，标注由语言学和语音处理领域的专家团队完成，确保标注的高精度和完整性。数据预处理包括音频切片、降噪处理、特征提取等步骤，存储格式为WAV文件，以便于跨平台使用。

示例样本展示

音频	File Name	Duration	Sample Rate	Channel	说话者性别	说话者口音	语速	背景噪音水平	语音清晰度	主题类别	转录质量
00:00/00:00	5cdbba1dd8c92fdba581aec0bcba902d.wav	30827	44100	2

数据结构总览

字段	类型	描述
File Name	string	File name
Duration	string	Duration
Sample Rate	string	Audio sample rate
Channel	string	Audio channel
说话者性别	string	指说话者的性别，例如男性或女性。
说话者口音	string	描述说话者的口音类型，例如美式英语或英式英语。
语速	double	衡量说话者的语速，即每秒钟的单词数。
背景噪音水平	double	反映音频中背景噪音的强度，通常以分贝表示。
语音清晰度	string	评估语音的清晰度，包括清晰、中等、不清晰等选项。
主题类别	string	表示学术演讲的主题类别，如科学、艺术或历史。
转录质量	string	对音频转录文本质量的评价，例如高、中、低。

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

心灵鸡汤文本数据集

心灵鸡汤文本数据集是用于内容媒体行业的优质文本资源库。

街舞舞蹈动作估计视频数据集

街舞舞蹈动作估计视频数据集致力于提升舞蹈动作识别和估计的精准度。

商场中庭广告屏效评估数据集

商场中庭广告屏效评估数据集是用于提升广告投放效果的视觉问答数据集。

没有更多了