目标检测之YoloV1论文及tensorflow实现

el/2024/5/23 0:43:48

You Only Look Once: Unified, Real-Time Object Detection

Abstract

作者提出了一种新的物体检测方法YOLO。YOLO之前的物体检测方法主要是通过region proposal产生大量的可能包含待检测物体的 potential bounding box,再用分类器去判断每个 bounding box里是否包含有物体,以及物体所属类别的 probability或者 confidence,如R-CNN,Fast-R-CNN,Faster-R-CNN等。

YOLO不同于这些物体检测方法,它将物体检测任务当做一个regression问题来处理,使用一个神经网络,直接从一整张图像来预测出bounding box 的坐标、box中包含物体的置信度和物体的probabilities。因为YOLO的物体检测流程是在一个神经网络里完成的,所以可以end to end来优化物体检测性能。

YOLO检测物体的速度很快,标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。网络较小的版本Fast YOLO在保持mAP是之前的其他实时物体检测器的两倍的同时,检测速度可以达到155 FPS。

相较于其他的state-of-the-art 物体检测系统,YOLO在物体定位时更容易出错,但是在背景上预测出不存在的物体(false positives)的情况会少一些。而且,YOLO比DPM、R-CNN等物体检测系统能够学到更加抽象的物体的特征,这使得YOLO可以从真实图像领域迁移到其他领域,如艺术。

Introduction

YOLO之前的物体检测系统使用分类器来完成物体检测任务。为了检测一个物体,这些物体检测系统要在一张测试图的不同位置和不同尺寸的bounding box上使用该物体的分类器去评估是否有该物体。如DPM系统,要使用一个滑窗(sliding window)在整张图像上均匀滑动,用分类器评估是否有物体。

在DPM之后提出的其他方法,如R-CNN方法使用region proposal来生成整张图像中可能包含待检测物体的potential bounding boxes,然后用分类器来评估这些boxes,接着通过post-processing来改善bounding boxes,消除重复的检测目标,并基于整个场景中的其他物体重新对boxes进行打分。整个流程执行下来很慢,而且因为这些环节都是分开训练的,检测性能很难进行优化。

作者设计了YOLO(you only look once),将物体检测任务当做回归问题(regression problem)来处理,直接通过整张图片的所有像素得到bounding box的坐标、box中包含物体的置信度和class probabilities。通过YOLO,每张图像只需要看一眼就能得出图像中都有哪些物体和这些物体的位置。

这里写图片描述

如图所示,使用YOLO来检测物体,其流程是非常简单明了的: 
1、将图像resize到448 * 448作为神经网络的输入 
2、运行神经网络,得到一些bounding box坐标、box中包含物体的置信度和class probabilities 
3、进行非极大值抑制,筛选Boxes

下图是各物体检测系统的检测流程对比:

这里写图片描述

YOLO模型相对于之前的物体检测方法有多个优点:

1、YOLO检测物体非常快。 
因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的F


http://www.ngui.cc/el/5179153.html

相关文章

迁移学习总结(One Shot Learning, Zero Shot Learning)

转自: https://blog.csdn.net/XJTU_NOC_Wei/article/details/77850221 目录 目录迁移学习 综述Source Data 与Target Data 都有标签 Fine-tuningMultitask LearningSource Data 有标签Target Data 没有标签 Domain-adversarial trainingZero-shot Learning Source D…

YoloV1源码解析

准备阶段数据集的准备: ① 索引文件trainval.txt: 存放的是训练图片的名称 ② 图片文件: ③ 标签文件xml:

YoloV2之TensorFlow版源码解析

准备阶段数据集的准备: ① 索引文件trainval.txt: 存放的是训练图片的名称 ② 图片文件: ③ 标签文件xml: 网络的设计(分类训练与检测训练)

yolo1以及yolo2转载

物体检测论文-YOLO系列(转自: http://hellodfan.com/2017/10/11/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-YOLO%E7%B3%BB%E5%88%97/) 本次论文主要分为两个部分:YOLO和YOLO9000。 YOLO是Rgb大神在Object Detection上的新尝试…

从零起步构建自己的快速语义搜索模型

雷锋网按:本文为 AI研习社 编译的技术博客,原标题 The unreasonable effectiveness of Deep Learning Representations,作者为 Emmanuel Ameisen 。 翻译 | 付腾 王飞 汪鹏 校对 | 余杭 整理 | MY 训练电脑以人类的方式去看图…

(转)零次学习(Zero-Shot Learning)入门

零次学习(Zero-Shot Learning)入门 小栗子 转自:https://zhuanlan.zhihu.com/p/34656727?spm5176.9876270.0.0.399ce44aXsg7cN 谢谢作者 事物的本质反映世界构成的规律 408 人赞了该文章 很久没有更文章了,主要是没有找到…

1x1卷积核如何降低参数量

本文介绍1*1的卷积核与googlenet里面的Inception。正式介绍之前,首先回顾卷积网络的基本概念。 1. 卷积核:可以看作对某个局部的加权求和;它是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体…

Hadoop-集群网络配置(转)

转自&#xff1a; 虚拟机中Centos设置静态IP地址方法 (一)虚拟机设置 首先要修改一下虚拟机,<选择虚拟网络编辑器> 对照着上面的图一个一个解释吧. 首先要选择NAT模式,这里我选择的是VMnet8,也可以点击添加网络再添加一个; 然后就是下面的两个对勾✔一定要选上(DHCP…

centos中的防火墙问题

centos从7开始默认用的是firewalld&#xff0c;这个是基于iptables的&#xff0c;虽然有iptables的核心&#xff0c;但是iptables的服务是没安装的。所以你只要停止firewalld服务即可&#xff1a; sudo systemctl stop firewalld.service && sudo systemctl disable fi…

hadoop中运行map-reduce程序时,java.net.connectionException

about云开发 标题: mapreduce报错 java.net.ConnectException: Connection refused [打印本页] 作者: Wyy_Ck 时间: 2016-10-31 15:13标题: mapreduce报错 java.net.ConnectException: Connection refused弄了半天&#xff0c;系统是centos 7&#xff0c;本想执行一个测试下…