餐厅现场呼叫与提醒中文语音识别音频数据集

餐厅现场呼叫与提醒中文语音识别音频数据集

V1.0
最新更新:2026-02-22 20:11:36
样本数:500
文件大小:1.6G
文件格式:WAV
数据领域:音频
持有人:墨比乌斯公司
行业范围:中文语音识别,零售电商语音数据,餐厅语音识别
适用方向:智能客服,语音助手,自动语音识别
数据集介绍

在零售电商行业中,随着个性化服务和智能化交互的需求增加,通过语音识别技术提升用户体验成为趋势。然而,现有的语音识别系统在嘈杂的餐厅环境中表现不佳,准确率低,无法有效识别多种语言或方言。此数据集旨在解决餐饮现场复杂环境下的语音识别挑战,帮助提升自动化系统的准确性。数据采集采用专业录音设备,选择不同时间和条件的餐厅场景,确保覆盖多噪声背景。质量控制包括多轮专人标注和一致性检查,团队由训练有素的语言专家与数据分析师组成。预处理步骤包含去噪、音频切片、音量均衡等,数据按场景与音素类型分类存储为WAV格式。

示例样本展示
音频文件名时长音频采样率音频通道说话者性别说话者年龄段口音语音情感背景噪声级别语速语音清晰度
00:00/00:00
295f2b875794a935ae6ba3de4c0c782f.wav5632441002
00:00/00:00
886d260f8d094f51b94ee51733c7331a.wav5689441002
数据结构总览
字段类型描述
文件名string文件名
时长string时长
音频采样率string音频采样率
音频通道string音频通道
说话者性别string录音中说话者的性别。
说话者年龄段string录音中说话者所属的年龄段,例如:儿童、青少年、成年人、老年人。
口音string录音中说话者的口音,例如:标准普通话,粤语,北京口音等。
语音情感string录音中说话者表达的情感状态,例如:高兴、悲伤、愤怒等。
背景噪声级别string录音中背景噪声的级别,无噪声、轻微噪声或明显噪声。
语速float说话者的语速,以每分钟说话字数(WPM)表示。
语音清晰度string录音中语音的清晰程度,例如:非常清晰、清晰、不清晰。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求