印尼语法律语音识别数据集

本数据集包含1000小时印尼法律场景下的语音及转写文本,适用于训练司法语音识别、法律问答系统与文书自动转录模型。

0
0
立即购买

数据描述

随着法律行业迈入智能化转型,智能语音识别、法律文书自动生成、法庭语音归档系统等AI场景的需求快速增长。特别是在印尼语环境中,具备法律术语、案件语言风格、法庭交互结构的语音识别数据极为稀缺。

本数据集聚焦印尼法律语境下的语音数据,包括法庭发言、律师辩论、证人陈述、法规解读、合同条款播读等多种语音内容,已完成精确切段(3–20秒)与人工转写对齐,可直接用于训练法律语音识别系统,或作为多模态法律AI模型的重要语料资源。

数据参数

文件名

32位MD5字符串

转写文本

无固定长度文本

采样率

16K

采样位数

16bit

音频声道

单声道

音频格式

WAV

文本格式

TXT

语种

印尼语

数据样例

0:00
0:00

相关推荐

没有更多了
找不到您要找的数据?
让数据提供商通过发布请求来找到你
发布您的请求