日语金融语音识别数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

日语金融语音识别数据集

V1.0

最新更新：2026-07-08 00:51:19

样本数：1000

文件大小：0

文件格式：

数据领域：Audio

持有人：墨比乌斯公司

行业范围：

适用方向：

数据集介绍

在智能金融语音助手、银行语音客服、金融风控AI系统广泛应用的背景下，训练具有行业术语理解能力、日语语言适配性、语音交互真实度的语音识别模型成为关键技术任务。
本数据集基于日语金融领域真实或准真实的语音内容（如理财咨询、客户服务、业务讲解、风险说明等），完成了音频切割（3–20秒）与人工转写，形成标准的“音频 + 文本对”语料结构，适用于直接训练或微调日语语音识别系统（ASR）、语音合成（TTS）、语音翻译（S2TT）等模型，是智能金融语音AI应用落地的关键基础数据。

示例样本展示

音频	File Name	Duration	Sample Rate	Channel	转写文本	语种
00:00/00:00	48954234e00d9039630b89e7d98120d1	24160	16000	1
00:00/00:00	1273ba4a5028ce371738e17d930f7685	9440	16000	1

数据结构总览

字段	类型	描述
File Name	string	File name
Duration	string	Duration
Sample Rate	string	Audio sample rate
Channel	string	Audio channel
转写文本	string	音频文件的转写文本
语种	string	音频内容的语言

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

越南语金融语音识别数据集

本数据集包含1000小时越南语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

英语金融语音识别数据集

本数据集包含2000小时英语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

西班牙语金融语音识别数据集

本数据集包含1000小时西班牙语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

印尼语金融语音识别数据集

本数据集包含1000小时印尼语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

金融报文合规性审查监督微调数据集

本数据集专注于金融话术合规判断任务，训练模型判断金融文案是否合规及风险提示是否充分，助力构建具备监管逻辑解释能力的智能审查系统。

银行理财经理独立办公室合同签署图像数据集

银行理财经理独立办公室合同签署图像数据集用于提升金融服务的自动化文档处理效率。

车辆损伤识别图像数据集

车辆损伤识别图像数据集用于提升车辆保险的自动化理赔效率。

俄语金融语音识别数据集

本数据集包含1000小时俄语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

葡萄牙语金融语音识别数据集

本数据集包含1000小时葡萄牙语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

韩语金融语音识别数据集

本数据集包含1000小时韩语金融行业语音及人工转写文本，适用于训练语音识别、金融语音助手与S2T翻译系统等。

没有更多了