
最新更新:2026-04-08 14:36:35

样本数:500

文件大小:1.2G

文件格式:WAV

行业范围:语音对话数据集,语音识别训练,智能客服语音,接待交流音频

适用方向:智能客服,人机交互,语音识别,自然语言处理
数据集介绍数据标注精度达到95%以上,确保了高度的一致性和完整性。实现了新的语音情感标注方法,提高了情感分析的准确性。该数据集被广泛应用于优化拨号系统,提高客服响应能力,提升效率。与同类数据集相比,涵盖更丰富的方言和场景,更适合多领域应用。数据中特定的情感表达和区域性口音使其在语音识别中的应用独树一帜。具备优良的扩展性,可适应新增场景和需求,支持多种语音识别和分析任务。
示例样本展示
数据结构总览
| File Name | string | File name |
| Duration | string | Duration |
| Sample Rate | string | Audio sample rate |
| Channel | string | Audio channel |
| 语言 | string | 音频中使用的语言。 |
| 说话人人数 | int | 音频中参与对话的说话者数量。 |
| 环境噪声级别 | string | 音频录制环境中的噪声级别,例如无、低、中或高。 |
| 对话类型 | string | 音频对话的类型,如问答、讨论或闲聊。 |
| 口音 | string | 音频中说话者的口音特征。 |
| 检测到的情绪 | string | 音频中包含的主要情绪,如愉快、愤怒或中立。 |
| 语音可懂度 | string | 音频中语音的清晰度和可懂度,如清晰、一般或模糊。 |
| 轮流谈话 | boolean | 音频中是否存在说话者轮流交谈的现象。 |
| 语速 | float | 音频中说话者的平均语速,以每分钟单词数衡量。 |
| 是否有转录文本 | boolean | 是否为音频提供了转录文本。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求