错误医疗信息识别与干预RLHF数据集

数据集介绍

示例样本展示

数据结构总览

授权与合规说明

联系购买

错误医疗信息识别与干预RLHF数据集

V1.0

最新更新：2026-04-09 02:31:32

样本数：5000

文件大小：0

文件格式：

数据领域：Text

持有人：墨比乌斯公司

行业范围：

适用方向：

数据集介绍

在大众健康咨询中，用户常常提出与疫苗接种、感冒用药、儿童喂养、癌症预防等相关的问题，LLM在提供答案时容易输出过度诊疗、违背指南或误导性内容，存在医疗安全风险。本数据集聚焦此类错误信息识别与干预，通过构建含有用户提问、模型初始回答、人类反馈评分（1~5）以及反馈理由的RLHF训练样本，帮助医疗类AI系统学会识别潜在医疗错误并作出安全、合规的修正建议。数据广泛涵盖预防接种、用药咨询、基础病管理、日常护理等高频主题，是提升医疗AI可信度与指导能力的关键资源。

示例样本展示

{
  "prompt": "设备F的电机起动时电流过大跳闸，与设备G曾出现的变频器故障有关吗？",
  "output": "应该有关，两个问题都可能与变频器参数设置错误有关，如加速时间太短、电流限制过小。",
  "human_feedback": 4,
  "rationale": "较好地抓住了“启动逻辑中变频器参数”的共性问题，具备一定跨设备迁移能力。若能举例更佳。"
}

数据结构总览

字段	类型	描述
File Name	string	File name
prompt	string	自然语言表达，可能涉及另一个相似案例
output	string	模型初步答复，尝试解释设备问题及其潜在关联
human_feedback	number	衡量泛化能力、合理性与专业性
rationale	string	指出是否正确提取共性、迁移逻辑是否成立、语言是否有参考价值等

授权与合规说明

项目	内容
授权类型	CC-BY-NC-SA 4.0（非商业署名共享）
商业使用	需申请专属订阅或授权合同（支持按月/按调用次数收费）
隐私与脱敏	无PII，无真实公司名，模拟场景均符合行业标准
合规体系	中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持