墨比乌斯公司在零售电商平台中,商品描述文案质量直接影响用户信任与购买决策。然而,部分生成内容存在明显技术性错误或误导性信息,如品牌属性混淆、平台兼容性虚假、参数逻辑不符等。为提升电商内容生成系统的可靠性,本数据集聚焦“商品内容中的事实错误识别”任务,构建了大量人工或模型生成的商品描述片段,并邀请标注人员评估系统判别能力,旨在提升模型对技术误导、虚假兼容、夸大宣传等错误的判断和干预能力。
{
"prompt": "检查描述是否准确:‘iPhone 15 Pro Max 支持 Android 应用自由安装,兼容鸿蒙系统。’",
"output": "描述错误,iPhone 不支持 Android 应用或鸿蒙系统。",
"human_feedback": 5,
"rationale": "准确指出平台不兼容性,识别出关键技术误导信息,判断清晰。"
}| 字段 | 类型 | 描述 |
|---|---|---|
| 文件名 | string | 文件名 |
| prompt | string | 例如判断是否准确 |
| output | string | 如“描述错误,理由是...” |
| human_feedback | number | 评估该判断是否准确 |
| rationale | string | 包括错误识别的准确性、措辞是否清晰、是否解释关键矛盾点等 |
| 项目 | 内容 |
|---|---|
| 授权类型 | CC-BY-NC-SA 4.0(非商业署名共享) |
| 商业使用 | 需申请专属订阅或授权合同(支持按月/按调用次数收费) |
| 隐私与脱敏 | 无PII,无真实公司名,模拟场景均符合行业标准 |
| 合规体系 | 中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持 |
让数据提供商通过发布请求来找到你