
最新更新:2026-04-08 21:31:56

样本数:500

文件大小:1.4G

文件格式:WAV

行业范围:语音识别数据集,意图分类音频,前台服务对话

适用方向:服务行业,语言理解,对话系统
数据集介绍当前,服务行业尤其是前台服务在与客户的语音交互中,面临着迅速准确识别客户意图的挑战。传统的对话系统通常依赖于文字输入,导致在口音、语速等多变语音条件下识别不准确的问题。该数据集旨在提供高质量的前台服务实况对话音频,帮助提升意图分类模型的实用性与精度。数据通过在实际服务台中使用高灵敏度麦克风采集,环境包含不同大小、背景声音复杂度的服务场所。数据经过多轮标注,涵盖一致性检查和专家审核,确保高标注精度。标注团队由语言学和服务行业专家组成,规模达15人。数据预处理包括去噪、音量均衡等步骤,最终以WAV格式存储,按照对话主题分类组织。该数据集的核心优势在于高标注精度(95%)、一致性(98%)、和音频完整性。创新地引入了基于音频特征的增强技术,提升模型在多环境下的适应能力。提供解决意图误判的实际问题,能显著提高对话系统的客户满意度,与现有以文本为主的数据集比,对语音变体的支持更广泛。数据具有稀缺性,涵盖少见意图种类,且具备在多语言、多行业环境下的扩展性,通用性强。
示例样本展示
数据结构总览
| File Name | string | File name |
| Duration | string | Duration |
| Sample Rate | string | Audio sample rate |
| Channel | string | Audio channel |
| 说话者性别 | string | 音频中说话者的性别,例如男或女。 |
| 说话者年龄段 | string | 音频中说话者的年龄段,例如儿童、青年、成年人、老年。 |
| 对话语言 | string | 音频中使用的语言。 |
| 口音 | string | 音频中说话者的口音,例如美式英语、英式英语。 |
| 背景噪音水平 | string | 音频中的背景噪音水平,例如低、中、高。 |
| 意图分类 | string | 音频对话中的意图类别,例如询问、请求、投诉。 |
| 语速 | string | 音频中说话的速度,例如慢速、常速、快速。 |
| 语音情感 | string | 音频中说话者所表达的情感,例如愤怒、高兴、悲伤。 |
| 清晰度 | string | 音频中语音的清晰度,例如清晰、不清晰。 |
| 话语数量 | int | 音频中独立话语的数量。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求