墨比乌斯公司在智能金融语音助手、银行语音客服、金融风控AI系统广泛应用的背景下,训练具有行业术语理解能力、日语语言适配性、语音交互真实度的语音识别模型成为关键技术任务。
本数据集基于日语金融领域真实或准真实的语音内容(如理财咨询、客户服务、业务讲解、风险说明等),完成了音频切割(3–20秒)与人工转写,形成标准的“音频 + 文本对”语料结构,适用于直接训练或微调日语语音识别系统(ASR)、语音合成(TTS)、语音翻译(S2TT)等模型,是智能金融语音AI应用落地的关键基础数据。
| 音频 | 文件名 | 时长 | 音频采样率 | 音频通道 | 文件名 | 转写文本 | 采样率 | 采样位数 | 音频声道 | 音频格式 | 文本格式 | 语种 |
|---|
| 字段 | 类型 | 描述 |
|---|---|---|
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 文件名 | string | 音频文件的名字,具有唯一性 |
| 转写文本 | string | 音频文件的转写文本 |
| 采样率 | string | 录音文件的采样率,单位是Hz。 |
| 采样位数 | string | 录音文件的采样位数,单位是bit。 |
| 音频声道 | string | 录音文件的音频声道,分为单声道、多声道、立体声。 |
| 音频格式 | string | 录音文件的文件格式 |
| 文本格式 | string | 录音转写的文本文件格式 |
| 语种 | string | 音频内容的语言 |
| 项目 | 内容 |
|---|---|
| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
让数据提供商通过发布请求来找到你