接待交流过程中文语音对话数据集

接待交流过程中文语音对话数据集

V1.0
最新更新:2026-04-08 14:36:35
样本数:500
文件大小:1.2G
文件格式:WAV
数据领域:Audio
持有人:墨比乌斯公司
行业范围:语音对话数据集,语音识别训练,智能客服语音,接待交流音频
适用方向:智能客服,人机交互,语音识别,自然语言处理
数据集介绍

数据标注精度达到95%以上,确保了高度的一致性和完整性。实现了新的语音情感标注方法,提高了情感分析的准确性。该数据集被广泛应用于优化拨号系统,提高客服响应能力,提升效率。与同类数据集相比,涵盖更丰富的方言和场景,更适合多领域应用。数据中特定的情感表达和区域性口音使其在语音识别中的应用独树一帜。具备优良的扩展性,可适应新增场景和需求,支持多种语音识别和分析任务。

示例样本展示
音频File NameDurationSample RateChannel语言说话人人数环境噪声级别对话类型口音检测到的情绪语音可懂度轮流谈话语速是否有转录文本
00:00/00:00
1c58e9cffac6e88fe7aba50166dc80ea.wav6611441002
数据结构总览
字段类型描述
File NamestringFile name
DurationstringDuration
Sample RatestringAudio sample rate
ChannelstringAudio channel
语言string音频中使用的语言。
说话人人数int音频中参与对话的说话者数量。
环境噪声级别string音频录制环境中的噪声级别,例如无、低、中或高。
对话类型string音频对话的类型,如问答、讨论或闲聊。
口音string音频中说话者的口音特征。
检测到的情绪string音频中包含的主要情绪,如愉快、愤怒或中立。
语音可懂度string音频中语音的清晰度和可懂度,如清晰、一般或模糊。
轮流谈话boolean音频中是否存在说话者轮流交谈的现象。
语速float音频中说话者的平均语速,以每分钟单词数衡量。
是否有转录文本boolean是否为音频提供了转录文本。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求