英特尔宣布推出 Polite Guard,一种用于文本分类任务的开源自然语言处理 (NLP) 语言模型,采用 MIT 许可。
Polite Guard 旨在使开发人员更容易生成自己的合成数据并微调他们的模型、通过提供针对敌对攻击的防御机制来增强系统的弹性、允许开发人员评估和比较他们的模型在礼貌分类方面的性能,以及通过确保在各个平台上进行尊重和礼貌的互动来提高客户满意度和忠诚度。
该模型由 BERT 微调而来,可将文本分为四个不同的类别:polite, somewhat polite、neutral 以及 impolite。目前,英特尔已在 GitHub 和 Hugging Face 上开源了相关的数据集和 Polite Guard 源代码。
Polite Guard 数据集包含三个部分:
公告指出,合成数据被划分为训练集(80%)、验证集(10%)和测试集(10%),每组均根据标签进行平衡。Polite Guard 模型完全在合成数据上进行训练,但在合成数据和真实标注数据的测试集上进行评估,准确率和 F1 分数均达到了 92.4%。
更多详情可查看英特尔社区博客。
评论删除后,数据将无法恢复
英特尔开源全新 NLP 模型:Polite Guard
英特尔宣布推出 Polite Guard,一种用于文本分类任务的开源自然语言处理 (NLP) 语言模型,采用 MIT 许可。
Polite Guard 旨在使开发人员更容易生成自己的合成数据并微调他们的模型、通过提供针对敌对攻击的防御机制来增强系统的弹性、允许开发人员评估和比较他们的模型在礼貌分类方面的性能,以及通过确保在各个平台上进行尊重和礼貌的互动来提高客户满意度和忠诚度。
该模型由 BERT 微调而来,可将文本分为四个不同的类别:polite, somewhat polite、neutral 以及 impolite。目前,英特尔已在 GitHub 和 Hugging Face 上开源了相关的数据集和 Polite Guard 源代码。
Polite Guard 数据集包含三个部分:
公告指出,合成数据被划分为训练集(80%)、验证集(10%)和测试集(10%),每组均根据标签进行平衡。Polite Guard 模型完全在合成数据上进行训练,但在合成数据和真实标注数据的测试集上进行评估,准确率和 F1 分数均达到了 92.4%。
更多详情可查看英特尔社区博客。