电商商品内容错误识别与干预 RLHF 数据集

电商商品内容错误识别与干预 RLHF 数据集

V1.0
最新更新:2026-02-22 17:57:24
样本数:10000
文件大小:0
文件格式:
数据领域:文本
持有人:墨比乌斯公司
行业范围:
适用方向:
数据集介绍

在零售电商平台中,商品描述文案质量直接影响用户信任与购买决策。然而,部分生成内容存在明显技术性错误或误导性信息,如品牌属性混淆、平台兼容性虚假、参数逻辑不符等。为提升电商内容生成系统的可靠性,本数据集聚焦“商品内容中的事实错误识别”任务,构建了大量人工或模型生成的商品描述片段,并邀请标注人员评估系统判别能力,旨在提升模型对技术误导、虚假兼容、夸大宣传等错误的判断和干预能力。

示例样本展示
{
  "prompt": "检查描述是否准确:‘iPhone 15 Pro Max 支持 Android 应用自由安装,兼容鸿蒙系统。’",
  "output": "描述错误,iPhone 不支持 Android 应用或鸿蒙系统。",
  "human_feedback": 5,
  "rationale": "准确指出平台不兼容性,识别出关键技术误导信息,判断清晰。"
}
数据结构总览
字段类型描述
文件名string文件名
promptstring例如判断是否准确
outputstring如“描述错误,理由是...”
human_feedbacknumber评估该判断是否准确
rationalestring包括错误识别的准确性、措辞是否清晰、是否解释关键矛盾点等
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求