土耳其语法律语音识别数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

土耳其语法律语音识别数据集

V1.0

最新更新：2026-07-08 03:21:04

样本数：1000

文件大小：0

文件格式：

数据领域：Audio

持有人：墨比乌斯公司

行业范围：

适用方向：

数据集介绍

随着法律行业迈入智能化转型，智能语音识别、法律文书自动生成、法庭语音归档系统等AI场景的需求快速增长。特别是在土耳其语环境中，具备法律术语、案件语言风格、法庭交互结构的语音识别数据极为稀缺。
本数据集聚焦土耳其法律语境下的语音数据，包括法庭发言、律师辩论、证人陈述、法规解读、合同条款播读等多种语音内容，已完成精确切段（3–20秒）与人工转写对齐，可直接用于训练法律语音识别系统，或作为多模态法律AI模型的重要语料资源。

示例样本展示

音频	File Name	Duration	Sample Rate	Channel	转写文本	语种
00:00/00:00	a7b68e88dfa7afeccd1446dcbdd9df67	29640	16000	1
00:00/00:00	197523c6d1891f571530d990bc29f563	29760	16000	1
00:00/00:00	4c62548f314217c8bb97edf42064428b	25520	16000	1
00:00/00:00	8dc1ef834fcd0153c0e3df8bce614cc1	26760	16000	1

数据结构总览

字段	类型	描述
File Name	string	File name
Duration	string	Duration
Sample Rate	string	Audio sample rate
Channel	string	Audio channel
转写文本	string	音频文件的转写文本
语种	string	音频内容的语言

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据？

让数据提供商通过发布请求来找到你

发布您的请求

相关数据集

泰语法律语音识别数据集

本数据集包含1000小时泰国法律场景下的语音及转写文本，适用于训练司法语音识别、法律问答系统与文书自动转录模型。

普通话法律语音识别数据集

本数据集包含2000小时中国法律场景下的语音及转写文本，适用于训练司法语音识别、法律问答系统与文书自动转录模型。

葡萄牙语法律语音识别数据集

本数据集包含1000小时葡萄牙法律场景下的语音及转写文本，适用于训练司法语音识别、法律问答系统与文书自动转录模型。

印尼语法律语音识别数据集

本数据集包含1000小时印尼法律场景下的语音及转写文本，适用于训练司法语音识别、法律问答系统与文书自动转录模型。

知识产权法商标近似认定推理数据集

本数据集包含5000条商标近似认定推理任务，聚焦组合商标显著部分识别与混淆风险分析，适用于商标审查系统与法律AI模型推理训练。

车辆违停图像数据集

车辆违停图像数据集致力于提升城市管理中的违章停车检测效率。

法律问答AI答案中立性与风险提示RLHF数据集

本数据集聚焦法律问答中AI回答的措辞中立性与风险提示质量，支持构建更可信、更安全的法律AI助手。

合同条款摘要生成监督微调数据集

本数据集专注合同关键条款的要点摘要任务，训练模型以准确、简洁的法律语言生成高度规范化的合规摘要，提升法律大模型的审阅与总结能力。

中国现行法律(2025.1.1)文本数据集

中国现行法律(2025.1.1)文本数据集助力法律智能化应用，提升文本处理准确性与效率。

俄语法律语音识别数据集

本数据集包含1000小时俄罗斯法律场景下的语音及转写文本，适用于训练司法语音识别、法律问答系统与文书自动转录模型。

没有更多了