法语医疗行业原始音频数据集

法语医疗行业原始音频数据集

V1.0
最新更新:2026-01-03 07:50:31
样本数:2000
文件大小:0
文件格式:
数据领域:音频
持有人:墨比乌斯公司
行业范围:
适用方向:
数据集介绍

随着多语种医疗AI助手、数字健康问答系统、医学大语言模型(MedLLM)的兴起,构建覆盖真实临床场景、具备语言地域性、富含医学术语的原始语音语料资源成为推动医疗AI发展的关键基础。本数据集聚焦法语语境下的医疗场景语音数据,收录来自医生咨询、患者问诊、远程医疗、心理疏导、诊断讲解等多个子领域的真实或准真实语音内容,具备清晰语音质量与真实行业背景,为构建法语医疗ASR、TTS、语音问诊系统等提供扎实的原始数据支持。

本数据集具备强行业关联性与多场景覆盖力。语音内容涵盖法语医疗问诊中常见的症状陈述、诊断解释、药品交代、心理关怀与健康管理建议,语言自然,情境丰富,充分还原实际诊疗对话氛围。录音质量高,语音发音清晰、背景干扰少,适合直接用于语音预训练或模型微调。数据未标注状态为多种任务留出拓展空间,未来可支持语音转写、说话人分离、语义标注、医学实体识别等处理流程,是打造法语医疗语音AI系统的重要基础数据资产。

示例样本展示
音频文件名时长音频采样率音频通道
数据结构总览
字段类型描述
文件名string文件名
时长string时长
音频采样率string音频采样率
音频通道string音频通道
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求