前台服务对话意图分类音频数据集

前台服务对话意图分类音频数据集

V1.0
最新更新:2026-04-08 21:31:56
样本数:500
文件大小:1.4G
文件格式:WAV
数据领域:Audio
持有人:墨比乌斯公司
行业范围:语音识别数据集,意图分类音频,前台服务对话
适用方向:服务行业,语言理解,对话系统
数据集介绍

当前,服务行业尤其是前台服务在与客户的语音交互中,面临着迅速准确识别客户意图的挑战。传统的对话系统通常依赖于文字输入,导致在口音、语速等多变语音条件下识别不准确的问题。该数据集旨在提供高质量的前台服务实况对话音频,帮助提升意图分类模型的实用性与精度。数据通过在实际服务台中使用高灵敏度麦克风采集,环境包含不同大小、背景声音复杂度的服务场所。数据经过多轮标注,涵盖一致性检查和专家审核,确保高标注精度。标注团队由语言学和服务行业专家组成,规模达15人。数据预处理包括去噪、音量均衡等步骤,最终以WAV格式存储,按照对话主题分类组织。该数据集的核心优势在于高标注精度(95%)、一致性(98%)、和音频完整性。创新地引入了基于音频特征的增强技术,提升模型在多环境下的适应能力。提供解决意图误判的实际问题,能显著提高对话系统的客户满意度,与现有以文本为主的数据集比,对语音变体的支持更广泛。数据具有稀缺性,涵盖少见意图种类,且具备在多语言、多行业环境下的扩展性,通用性强。

示例样本展示
音频File NameDurationSample RateChannel说话者性别说话者年龄段对话语言口音背景噪音水平意图分类语速语音情感清晰度话语数量
00:00/00:00
054f537173c1b5cfd7641b8fcc08abee.wav34043441002
00:00/00:00
cb37b7a113a629963b85caf2ca35dc3b.wav59771441002
00:00/00:00
343cac21599ff20a508f388bdff008e6.wav57588441002
00:00/00:00
406ff9d312f5caf11e92e7a5b423f5ac.wav38499441002
数据结构总览
字段类型描述
File NamestringFile name
DurationstringDuration
Sample RatestringAudio sample rate
ChannelstringAudio channel
说话者性别string音频中说话者的性别,例如男或女。
说话者年龄段string音频中说话者的年龄段,例如儿童、青年、成年人、老年。
对话语言string音频中使用的语言。
口音string音频中说话者的口音,例如美式英语、英式英语。
背景噪音水平string音频中的背景噪音水平,例如低、中、高。
意图分类string音频对话中的意图类别,例如询问、请求、投诉。
语速string音频中说话的速度,例如慢速、常速、快速。
语音情感string音频中说话者所表达的情感,例如愤怒、高兴、悲伤。
清晰度string音频中语音的清晰度,例如清晰、不清晰。
话语数量int音频中独立话语的数量。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求