三三文章网 - 科技知识大全是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

百度EasyDLAI开发公开课第1期:在对实际AI场景进行实战解析的情况下,极小目标检测和精度提高-量子比特

  • 时间:
  • 浏览:0

目前,各企业行业在AI落地应用中经常遇到极小目标检测问题。在这些AI应用中,需要在大图中准确识别极小目标,其检测至关重要,也面临许多难点。

例如,检测框的宽高比不一定,图像的背景杂乱,数据源不足,检测框与图像相比非常小,这些难点都会导致高的漏检率。

10月21日,在《EasyDLAI开发系列公开课》首期直播中,百度高级工程师以实际产业场景为例,深入分析了如何解决这些难点,有效提高极小目标检测的准确率,并演示了如何用掌上EasyDL建立高精度物体检测模型。

说明分为四个部分。

EasyDL平台整体物体检测任务概述极小目标检测场景难点分析及效果优化EasyDL经典版实技演示

实时播放:

以下为直播文字实录:

EasyDL平台简介

与一家咨询公司的联合调查发现,86%的市场需求需要在商业场景中定制AI模式开发。例如,工业场景需要统计原材料数量,食品安全场景需要监控厨房厨师是否戴头盔,零售场景需要检查商品陈列是否符合标准……等定制化需求是统一的标准化的服务很难覆盖,需要定制开发。

△需要定制AI模型的开发场景

2017年至2020年,百度AI开发平台收到的定制需求增长速度非常快。但我们也知道,构建机器学习系统涉及到非常多的模块,这些模块组合的开发具有很大的挑战性,需要投入大量的人手来进行。因此,百度还总结了AI定制需求开发和应用的核心痛点:

第一个痛点:数据。用户难以获得与场景匹配的数据,存在数据清洗标记、数据多样性等问题。

第二个痛点:开发训练。用户开发模式成本非常高,计算力资源不足,算法调优困难,培训费时。

第三个痛点:配置。配置成本非常高,落地困难,模型适应、过渡困难,还存在重新开发、预测性能差、硬件成本高等问题。

为了解决这些痛点,百度面向AI开发的全过程,提供一站式AI开发平台EasyDL。EasyDL主要分为三个部分。

第一部分是智能数据服务(EasyData),包括数据采集、数据清洗、数据扩展、数据显示四大能力。

EasyData智能数据服务大大降低了AI定制模型的数据成本。如果用户需要对整个过程进行数据收集、数据标记和模型迭代,则需要涉及非常多的过程,并不断迭代。EasyData将整个过程抽象为五个模块:软硬一体数据采集方案、自动数据清洗/扩展、智能显示、模型训练与发布、自动数据闭环。这五个模块的能力允许用户尽可能降低数据收集、模型培训和最后手动部署的成本。

第二部分是开发和培训,提供AutoDL工具,帮助用户自动进行模型调优。此外,还引入了自己的超大规模预训练模型,在训练方面提供了分布式训练的加速能力,其中预置了许多方案算法和网络。

EasyDL培训平台可以帮助用户使用更少的数据,获得更好的效果,培训速度更快。具体来说,百度基于自我研究的大规模预训练模型,大大降低了数据成本,模型调优采用了最先进的AutoDL技术。在训练方面,应用了桨内训练加速机构。

第3部分是端云一体化服务的导入,支持公共云的导入、私有化的配置、设备端的配置(EasyEdge)

EasyDL提供灵活、丰富的服务部署形式,包括公共云部署、本地服务器部署、设备端SDK和软硬一体产品。

以上就是EasyDL在移动终端/设备终端上的应用案例,以深圳旅影为例,用户训练场景识别的模型,只需重复两版就能得到97%以上的准确率,效果非常好。

EasyDL当前支持的图像任务类型包括图像分类、物体检测和图像分割。在企业应用中,由于图像分类和物体检测比较高,百度在这两个方面投入了很多人手进行优化。

物体检测任务物体检测定义的概要

物体检测是指提供一张图像来识别图像中的物体属于哪个类别,并对对应的物体进行位置定位。

物体检测技术已经发展了很长一段时间,从13年至今,主要有两个方面的发展,一是两级检测器,二是一级检测器。总体上技术越来越自动化,越来越向高效方向发展,以满足商业化的需要。

检测器的通用框架

第一部分是特征提取模块,图像可以通过该网络提取相应的特征。

第二个部分是bonding box Matching、Labeling and Sampling模块,输入一组物体标记框,就会有一组anchor(锚框)例如,上图右端的红色和绿色边框就是我们预先定义的anchor,模型以这些anchor为基准,学习物体的定位。有了这些anchor,就和这些GT帧匹配,选择一个与物体比较匹配的帧,称为正样本,绿色帧,不匹配帧为负样本。

从上图可以看出,这里的负样本数量非常多,不能直接学习。因此,接下来添加采样的模块,选择适合模型训练的正负样本,输入下一个模块的检测检测器,进行分类网络和回归网络的学习。

极小目标检测场景难点分析及效果优化

以COCO数据集的物体定义为例,小物体是指小于32的物体×32像素点。在实际场景中,您倾向于使用原始缩放定义。

因此,给出相对的定义,将物体标记框的长宽积除以图像整体的长宽积,打开根编号,如果结果不足3%,则称为小物体。

图中显示了常见的极小目标检测场景。这些检测场景有哪些难点。摘要:

难点1:检查框宽高比变化较多,甚至出现极端宽高比,漏检率较高

难点2:背景杂乱,误检率较高

难点3:缺少数据源,没有丰富的数据训练

难点4:图像非常大,检测框非常小,漏检率高。

优化案例1:以货架挡板检测场景为例

如图中绿框所示,架子挡板的检测难点在于架子挡板的长宽比非常极端,首先选择基础模型进行训练。

例如SSD、YOLO、Faster RCNN等,Faster RCNN达到0.812的最佳效果。如何进一步优化呐。

对于上述难点1,行业中Anchor自适应算法可以解决这样的问题:

△Anchor自适应算法的概要

重点介绍差分进化算法、超参考优化算法两种通用性技术。

1、差分进化算法

它的特点是简单、高效、可扩展。搜索超参数是anchor的纵横比和缩放,优化目标是与所有检测框匹配的anchor的iou的总和最大。

在算法中,第一步是初始化种群。第二步是开始反复的差分进化,留下优秀个体,淘汰劣质个体。包含变异-交叉-选择三个动作。

变异:从种群中随机选取两个个体,按一定规律生成一个变异个体

交叉:变异个体与预先指定的某个目标个体进行参数混合,生成实验个体

选择:将实验个体的优化指标与目标个体进行比较,保留优化指标较好的个体

以上三项操作反复循环,实现优胜劣汰的能力。

该方案的优点在于,它可以广泛应用于EasyDL经典版中集成的各种检测模型,而无需对模型进行训练。

2、元参照优化算法

其特点是优化目标和培训模式一致。优化目标是训练中的模型指标(AP)最优,可以使用贝叶斯优化、进化算法等超参优化算法。

优点是以模型评价指标为优化目标,效果更好,可广泛适用于各种检验模型。

它的缺点是比较消耗计算资源。但相关的算法能力在EasyDL Professional中集成,用户可以在EasyDL Professional中创建项目,实现自动浏览搜索。

货架挡板检测优化-anchor优化

我们在这个案例中应用了anchor适应的方法。对于默认ratios,自适应算法计算出五个比例,即五个比例适合这个模型。

我们采用anchor自适应算法进行优化,效果从0.812提高到0.87。

那么,如何进一步优化呢。我们以前提到了难点2(背景混乱)和难点3(数据不足),现在为了优化数据本身,我们继续采用自动数据强化的方案。

△自动数据扩展算法的概要

概述自动数据扩展的几种主要算法。AutoAugment是一种扩展算法,可以在开始时获得很好的效果,但搜索成本很高。

PBA算法采用优胜劣汰的思路,在多个网络同步训练中不断“利用”网络权重,以期获得最佳的数据增进强调