墨比乌斯公司随着多语种医疗AI助手、数字健康问答系统、医学大语言模型(MedLLM)的兴起,构建覆盖真实临床场景、具备语言地域性、富含医学术语的原始语音语料资源成为推动医疗AI发展的关键基础。本数据集聚焦法语语境下的医疗场景语音数据,收录来自医生咨询、患者问诊、远程医疗、心理疏导、诊断讲解等多个子领域的真实或准真实语音内容,具备清晰语音质量与真实行业背景,为构建法语医疗ASR、TTS、语音问诊系统等提供扎实的原始数据支持。
本数据集具备强行业关联性与多场景覆盖力。语音内容涵盖法语医疗问诊中常见的症状陈述、诊断解释、药品交代、心理关怀与健康管理建议,语言自然,情境丰富,充分还原实际诊疗对话氛围。录音质量高,语音发音清晰、背景干扰少,适合直接用于语音预训练或模型微调。数据未标注状态为多种任务留出拓展空间,未来可支持语音转写、说话人分离、语义标注、医学实体识别等处理流程,是打造法语医疗语音AI系统的重要基础数据资产。
| 音频 | 文件名 | 时长 | 音频采样率 | 音频通道 |
|---|
| 字段 | 类型 | 描述 |
|---|---|---|
| 文件名 | string | 文件名 |
| 时长 | string | 时长 |
| 音频采样率 | string | 音频采样率 |
| 音频通道 | string | 音频通道 |
| 项目 | 内容 |
|---|---|
| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
让数据提供商通过发布请求来找到你