授权协议: Apache-2.0
开发语言: Python 查看源码 »
操作系统: 跨平台
开发厂商: 百度
收录时间: 2020-07-07
提 交 者: 编辑部的故事

PaddleClas是飞桨图像分类套件,它是飞桨为工业界和学术界所准备的一个图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

丰富的模型库

基于ImageNet1k分类数据集,PaddleClas提供ResNet、ResNet_vd、Res2Net、HRNet、MobileNetV3等23种系列的分类网络结构的简单介绍、论文指标复现配置,以及在复现过程中的训练技巧。与此同时,也提供了对应的117个图像分类预训练模型,并且基于TensorRT评估了服务器端模型的GPU预测时间,以及在骁龙855(SD855)上评估了移动端模型的CPU预测时间和存储大小。

上图对比了一些最新的面向服务器端应用场景的模型,在使用V100,FP32和TensorRT,batch size为1时的预测时间及其准确率,图中准确率83.0%的ResNet50_vd_ssld_v2和83.7%的ResNet101_vd_ssld,是采用PaddleClas提供的SSLD知识蒸馏方案训练的模型,其中v2表示在训练时添加了AutoAugment数据增广策略。图中相同颜色和符号的点代表同一系列不同规模的模型。不同模型的简介、FLOPS、Parameters以及详细的GPU预测时间(包括不同batchsize的T4卡预测速度)请参考文档教程中的模型库章节

上图对比了一些最新的面向移动端应用场景的模型,在骁龙855(SD855)上预测一张图像的时间和其准确率,包括MobileNetV1系列、MobileNetV2系列、MobileNetV3系列和ShuffleNetV2系列。图中准确率79%的MV3_large_x1_0_ssld(M是MobileNet的简称),71.3%的MV3_small_x1_0_ssld、76.74%的MV2_ssld和77.89%的MV1_ssld,是采用PaddleClas提供的SSLD蒸馏方法训练的模型。MV3_large_x1_0_ssld_int8是进一步进行INT8量化的模型。不同模型的简介、FLOPS、Parameters和模型存储大小请参考文档教程中的模型库章节

  • TODO
  •  EfficientLite、GhostNet、RegNet、ResNeSt的论文指标复现和性能评估

高阶优化支持

除了提供丰富的分类网络结构和预训练模型,PaddleClas也支持了一系列有助于图像分类任务效果和效率提升的算法或工具。

SSLD知识蒸馏

知识蒸馏是指使用教师模型(teacher model)去指导学生模型(student model)学习特定任务,保证小模型在参数量不变的情况下,得到比较大的效果提升,甚至获得与大模型相似的精度指标。PaddleClas提供了一种简单的半监督标签知识蒸馏方案(SSLD,Simple Semi-supervised Label Distillation),使用该方案,模型效果普遍提升3%以上,一些蒸馏模型提升效果如下图所示:

以在ImageNet1K蒸馏模型为例,SSLD知识蒸馏方案框架图如下,该方案的核心关键点包括教师模型的选择、loss计算方式、迭代轮数、无标签数据的使用、以及ImageNet1k蒸馏finetune,每部分的详细介绍以及实验介绍请参考文档教程中的知识蒸馏章节

数据增广

在图像分类任务中,图像数据的增广是一种常用的正则化方法,可以有效提升图像分类的效果,尤其对于数据量不足或者模型网络较大的场景。常用的数据增广可以分为3类,图像变换类、图像裁剪类和图像混叠类,如下图所示。图像变换类是指对全图进行一些变换,例如AutoAugment,RandAugment。图像裁剪类是指对图像以一定的方式遮挡部分区域的变换,例如CutOut,RandErasing,HideAndSeek,GridMask。图像混叠类是指多张图进行混叠一张新图的变换,例如Mixup,Cutmix。

PaddleClas提供了上述8种数据增广算法的复现和在统一实验环境下的效果评估。下图展示了不同数据增广方式在ResNet50上的表现, 与标准变换相比,采用数据增广,识别准确率最高可以提升1%。每种数据增广方法的详细介绍、对比的实验环境请参考文档教程中的数据增广章节

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

PaddleClas 的相关资讯

还没有任何资讯

PaddleClas 的相关博客

用PaddleClas实现酒标识别,让你秒变“鉴酒达人”

“酒”一直在我们中华民族的传统文化中占据着不可或缺的位置,更有“无酒不成席、无酒不成礼”之说。而当今“全球酒坛”百花齐...

23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱

如何训练出优秀的图像分类模型?飞桨图像分类套件 PaddleClas 来助力。 下载安装命令 ## CPU版本安装命令 pip install -f htt...

23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱

如何训练出优秀的图像分类模型?飞桨图像分类套件 PaddleClas 来助力。 下载安装命令 ## CPU版本安装命令 pip install -f htt...

计算机视觉的数据增广技术大盘点!附涨点神器,已开源!

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达 如果要把深度学习开发过程中几个环节按重要程度排个...

计算机视觉的数据增广技术大盘点!附涨点神器,已开源!

如果要把深度学习开发过程中几个环节按重要程度排个序的话,相信准备训练数据肯定能排在前几位。要知道一个模型网络被编写出来...

一、数据增广

一、数据增广 在图像分类任务中,图像数据的增广是一种常用的正则化方法,常用于数据量不足或者模型参数较多的场景。在本章节...

本周AI热点回顾:动森首届「AI 顶会」即将召开、《我的世界》里搭建神经网络、一位中国博士把整个CNN都给可视化了

01重要通知:动物森友会首届「AI 顶会」ACAI 2020即将召开 众所周知,因为疫情的原因,ICML、ICLR、CVPR 等人工智能顶级会议都...

百度联合IFAW推全球首个“濒危物种AI守护官“,已筛查近25万图片信息

4月22日是“世界地球日“,在这个呼吁爱护地球的特殊时刻,百度与国际爱护动物基金会(简称IFAW)联合发布全球首个利用人工智...

百度飞桨开发者超190万,国内首个量子机器学习开发工具"量桨"面世

  机器之心报道   参与:蛋酱、张倩、泽南    百度飞桨深度学习平台又有了大幅度的升级:飞桨企业版正式出炉,还有量子...

零门槛的AI开发课程!2020 WAIC开发者日百度公开课核心干货 - 知乎

一堂为期三小时的手把手 AI 开发教学课程,让开发者学到了什么? 2020 年,人工智能技术进入商业化落地的全新阶段。对于入门不...

PaddleClas 的相关问答

还没有任何问答,马上提问

评论 (8)

加载中
国家倡导的从来是自主可控,是可以不受别人制约,从来没有强调一定要凡是自己造轮子。 开源的话授权没问题也是可以的,但是有些人就是喜欢念歪经。 最近搞得 PostgreSQL 和 .NetCore 也不能投标了,却非要 Java 才行,真是夸张! 有些人就是故意得扩大化搞乱你得初衷,扛着红旗来反红旗。
07/08 15:21
回复
举报
我也觉得,难道java就不是国外的嘛?😂
08/16 10:04
回复
举报
依赖人得到的东西,是幻象.不是真实的.
07/08 09:06
回复
举报
对的,CPU也得自己亲手打磨出来的才踏实
07/08 09:53
回复
举报
指令集、基带什么的也要自己开发才行,决不能用人家的,不仅ARM授权不能用,ASIC-V也不能用
07/08 09:59
回复
举报
ASIC-V是什么?
07/08 10:03
回复
举报
哦,打错了RISC-V
07/08 10:08
回复
举报
同志,我CPU造到了拉沙子阶段,要加入一起嘛
07/08 10:19
回复
举报
更多评论
8 评论
19 收藏
分享
在线直播报名
返回顶部
顶部