黄图鉴别工具 nsfw 首发

正_午
 正_午
发布于 2019年01月23日
收藏 132

写在前面:不要找我要训练数据,我是遵纪守法的好公民,训练数据已经删除。

几天前看到 GitHub 上用于黄图鉴别的数据, 就 down 回来做了个黄图鉴别的模型,现模型已开源:nsfw在线demo

数据

训练数据共五个类别:

porn - pornography images hentai - hentai images, but also includes pornographic drawings sexy - sexually explicit images, but not pornography. Think nude photos, playboy, bikini, beach volleyball, etc. neutral - safe for work neutral images of everyday things and people drawings - safe for work drawings (including anime)

训练数据的数量如下:

drawing: 18251 hentai: 42649 netural: 44677 porn: 108114 sexy: 17253

使用

可以直接下载代码和训练好的模型来用 下载代码和模型

git clone https://github.com/rockyzhengwu/nsfw.git

训练好的模型在 /data/目录下。

cd nsfw
python nsfw_predict.py /tmp/test/test.jpeg

输出结果:

{'class': 'sexy', 'probability': {'drawings': 0.008320281, 'hentai': 0.0011919827, 'neutral': 0.13077603, 'porn': 0.13146976, 'sexy': 0.72824186}}

class: 图片所属列表 probability: 各类别所属的概率得分

也可以使用 Tensorflow Serving 部署,详情可以查看nsfw

模型

模型部分采用 Resnet ,主要参考了 Tensorflow 官方的代码 做了少许修改。详情见 resnet目录下。 尝试了微调和训练一个相对简单的新模型,微调的效果并不好,反而速度会慢很多。我想是因为这些图片和ImageNet 数据集相差太大的缘故。最终发布的模型使用Resnet-32, 准确率 90% 。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:黄图鉴别工具 nsfw 首发
加载中

精彩评论

郭大鹏
郭大鹏
我想建立一个开源项目,专门提供这个的训练数据,请问应该托管到那家?
五毛程序员
五毛程序员
训练数据已删除,你以为我们人民警察会相信你吗😂
echola
echola
https://github.com/alexkimxyz/nsfw_data_scrapper/tree/master/raw_data github已经成了老司机的飙车场地
捍卫机密
捍卫机密
高举社会主义精神文明大旗!向高技术化社会主义精神文明致敬!向伟大的精神乌托邦前进!
开源中国全球总代理
开源中国全球总代理
https://github.com/alexkimxyz/nsfw_data_scrapper/blob/master/raw_data/sexy/urls_sexy.txt害人不浅

最新评论(40

江湖隐士
江湖隐士
贼喊捉贼,已举报110
那句诺言
那句诺言
急需训练集
O
OSC_DwxYrb
niaoshe666你想要的哦
O
OSC_DwxYrb
你懂的味,niaoshe666
OSC程序猿收容所长
OSC程序猿收容所长
老乡开门,查水表
冰镇阳的光
冰镇阳的光

引用来自“郭大鹏”的评论

我想建立一个开源项目,专门提供这个的训练数据,请问应该托管到那家?
秀儿
晒太阳的小猪
晒太阳的小猪

引用来自“开源中国首席一失足成千古风流人物以稀为贵”的评论

谁有图片资源...😃
种子更可贵
mymbrooks
mymbrooks
有没有视频鉴别工具的数据集😆
noonoo
noonoo
This file is too big to show. Sorry!
返回顶部
顶部