墨比乌斯公司随着法律行业迈入智能化转型,智能语音识别、法律文书自动生成、法庭语音归档系统等AI场景的需求快速增长。特别是在土耳其语环境中,具备法律术语、案件语言风格、法庭交互结构的语音识别数据极为稀缺。
本数据集聚焦土耳其法律语境下的语音数据,包括法庭发言、律师辩论、证人陈述、法规解读、合同条款播读等多种语音内容,已完成精确切段(3–20秒)与人工转写对齐,可直接用于训练法律语音识别系统,或作为多模态法律AI模型的重要语料资源。
| 音频 | 文件名 | 时长 | 音频采样率 | 音频通道 | 转写文本 | 音频格式 | 文本格式 | 语种 |
|---|
| 字段 | 类型 | 描述 |
|---|---|---|
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 转写文本 | string | 音频文件的转写文本 |
| 音频格式 | string | 录音文件的文件格式 |
| 文本格式 | string | 录音转写的文本文件格式 |
| 语种 | string | 音频内容的语言 |
| 项目 | 内容 |
|---|---|
| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
让数据提供商通过发布请求来找到你