
最新更新:2026-02-22 20:11:36

样本数:500

文件大小:1.6G

文件格式:WAV

行业范围:中文语音识别,零售电商语音数据,餐厅语音识别

适用方向:智能客服,语音助手,自动语音识别
数据集介绍在零售电商行业中,随着个性化服务和智能化交互的需求增加,通过语音识别技术提升用户体验成为趋势。然而,现有的语音识别系统在嘈杂的餐厅环境中表现不佳,准确率低,无法有效识别多种语言或方言。此数据集旨在解决餐饮现场复杂环境下的语音识别挑战,帮助提升自动化系统的准确性。数据采集采用专业录音设备,选择不同时间和条件的餐厅场景,确保覆盖多噪声背景。质量控制包括多轮专人标注和一致性检查,团队由训练有素的语言专家与数据分析师组成。预处理步骤包含去噪、音频切片、音量均衡等,数据按场景与音素类型分类存储为WAV格式。
示例样本展示
数据结构总览
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 说话者性别 | string | 录音中说话者的性别。 |
| 说话者年龄段 | string | 录音中说话者所属的年龄段,例如:儿童、青少年、成年人、老年人。 |
| 口音 | string | 录音中说话者的口音,例如:标准普通话,粤语,北京口音等。 |
| 语音情感 | string | 录音中说话者表达的情感状态,例如:高兴、悲伤、愤怒等。 |
| 背景噪声级别 | string | 录音中背景噪声的级别,无噪声、轻微噪声或明显噪声。 |
| 语速 | float | 说话者的语速,以每分钟说话字数(WPM)表示。 |
| 语音清晰度 | string | 录音中语音的清晰程度,例如:非常清晰、清晰、不清晰。 |
授权与合规说明| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求