印尼语法律语音识别数据集

印尼语法律语音识别数据集

V1.0
最新更新:2026-01-02 17:35:00
样本数:1000
文件大小:0
文件格式:
数据领域:音频
持有人:墨比乌斯公司
行业范围:
适用方向:
数据集介绍

随着法律行业迈入智能化转型,智能语音识别、法律文书自动生成、法庭语音归档系统等AI场景的需求快速增长。特别是在印尼语环境中,具备法律术语、案件语言风格、法庭交互结构的语音识别数据极为稀缺。

本数据集聚焦印尼法律语境下的语音数据,包括法庭发言、律师辩论、证人陈述、法规解读、合同条款播读等多种语音内容,已完成精确切段(3–20秒)与人工转写对齐,可直接用于训练法律语音识别系统,或作为多模态法律AI模型的重要语料资源。

示例样本展示
音频文件名时长音频采样率音频通道文件名转写文本采样率采样位数音频声道音频格式文本格式语种
数据结构总览
字段类型描述
文件名string文件名
时长string时长
音频采样率string音频采样率
音频通道string音频通道
文件名string音频文件的名字,具有唯一性
转写文本string音频文件的转写文本
采样率string录音文件的采样率,单位是Hz。
采样位数string录音文件的采样位数,单位是bit。
音频声道string录音文件的音频声道,分为单声道、多声道、立体声。
音频格式string录音文件的文件格式
文本格式string录音转写的文本文件格式
语种string音频内容的语言
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求