错误医疗信息识别与干预RLHF数据集

错误医疗信息识别与干预RLHF数据集

V1.0
最新更新:2026-04-09 02:31:32
样本数:5000
文件大小:0
文件格式:
数据领域:Text
持有人:墨比乌斯公司
行业范围:
适用方向:
数据集介绍

在大众健康咨询中,用户常常提出与疫苗接种、感冒用药、儿童喂养、癌症预防等相关的问题,LLM在提供答案时容易输出过度诊疗、违背指南或误导性内容,存在医疗安全风险。本数据集聚焦此类错误信息识别与干预,通过构建含有用户提问、模型初始回答、人类反馈评分(1~5)以及反馈理由的RLHF训练样本,帮助医疗类AI系统学会识别潜在医疗错误并作出安全、合规的修正建议。数据广泛涵盖预防接种、用药咨询、基础病管理、日常护理等高频主题,是提升医疗AI可信度与指导能力的关键资源。

示例样本展示
{
  "prompt": "设备F的电机起动时电流过大跳闸,与设备G曾出现的变频器故障有关吗?",
  "output": "应该有关,两个问题都可能与变频器参数设置错误有关,如加速时间太短、电流限制过小。",
  "human_feedback": 4,
  "rationale": "较好地抓住了“启动逻辑中变频器参数”的共性问题,具备一定跨设备迁移能力。若能举例更佳。"
}
数据结构总览
字段类型描述
File NamestringFile name
promptstring自然语言表达,可能涉及另一个相似案例
outputstring模型初步答复,尝试解释设备问题及其潜在关联
human_feedbacknumber衡量泛化能力、合理性与专业性
rationalestring指出是否正确提取共性、迁移逻辑是否成立、语言是否有参考价值等
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求