반응형

[AI 논문 번역 및 리뷰]  (1) -Abstract  YOLO, 욜로, You Only Look Once: Unified, Real-Time Object Detection 

 

내용 - Abstract

We Present YOLO, a new approach to object detection.

우리는 새로운 Object Detection 방식인 YOLO를 제안한다.

(설명 : RCNN 저자가 2저자 이며, YOLO는 RCNN과 다른 새로운 객체 인지 알고리즘임을 설명하고 있다.)

 

Prior Work on object detection repurposes classifiers to perform detection.

이전 객체인지 알고리즘은  분류기를 인지를 수행할 수 있도록 바꿨다. 

(설명 : 이전 객체인지 알고리즘은 RCNN을 의미하며, fully connected layer와 softmax를 사용하여 Bounding Box 안의 객체가 무엇인지 구분하도록 구성을 하였다.)

 

Instead, we frame object detection as a regression problem to spatially separated bounding boxes and associated class probabilities.

대신에, 우리는 객체 인지 문제를  넓게 나뉜 경계 박스와 이와 관련된 클래스 확률의 회귀 문제로 간주했다. 

(설명 : RCNN에서는  객체를 구분하는 Classification 문제와 Bounding Box의 위치를 추론하는 Regression 문제로 나뉘는 2 stage 계열이지만, YOLO는 어떤  객체일 확률과  Bounding Box의 위치를 추론하는 것을 모두 회귀 문제로 간주하기고 동시에 처리가 되기 때문에 1-stage 계열이라고 한다. )

 

A single neural network predicts bounding boxes and class probabilities directly from full images in one evaluation. 

단일 뉴럴 네트워크는 경계 박스와 클래스 확률을 전체 이미지의 한번에 평가로 바로 예측한다.

(설명 : RCNN은 Boiundindg Box와 Classification을 각각 수행하기 때문에 2-stage 계열이라고 하며, 그러기 때문에 속도가 1-stage 계열인 YOLO에 비해 느리다. )

 

Since the whole detection pipeline is a single network, it can be optimized end-to-end directly on detection performance.

전체의 객체 인지 파이프라인이 단일 네트워크이기 떄문에, 감지 성능을 한번에 최적화 할 수 있다. 

(설명 : RCNN은 경계박스 예측과 클래스 예측 뉴럴 네트워크가 각각 존재하므로 각각 최적화를 시켜야 한다. )



Our unified architecture is extremely fast.

우리의 통합된 구조는 굉장히 빠르다.

(설명 : YOLO란 You Only Look Once의 약자이며, 한번에 빠르게 인지한다는 의미를 내포하고 있다.. )

 

Our base YOLO model processes images in real-time at 45 frames per second.

우리의 기본 욜로 모델은 초당 45 프레임의 실시간성을 갖고 이미지 프로세싱을 한다.

(설명 : 자율주행에서 1초에 30번 인지하면 실시간 성이 보장되었다 라고 한다. 그러므로 45 fps는 실시간성이 보장된 것이라고 해석할 수 있다.)

 

A smaller version of the network, Fast YOLO processes an astounding 155 frames per second while still achieving double the mAP of other real-time detectors.

네트워크가 작은 버전인 Fast YOLO는 155FPS가 나오며, 다른 실시간성이 보장되는 감지기에 비하면 map가 두배가 된다. 

(설명 : YOLO는 매번 일반 버전과 모델의 크기가 작은 버전을 동시에 출시하며, 작은 버전인 Fast YOLO는 155 frame per second가 나온다.  YOLO를 사용하는 사람들은 정확도 보다 실시간성을 원하여 사용하는 사람들이 많으므로 Fast 버전의 YOLO도 많이 사용하는 편이다 그리고 mAP란 정확도를 나타내는 성능이며  Fast YOLO는 다른 실시간성이 보장되는 Object Detection 알고리즘의  정확도 보다 2배 더 높다고 한다.)

 

Compared to state-of-the art detection systems, YOLO makes more localization errors but is less likely to predict false positives on background.

다른 최신 객체 인지 시스템과 비교하였을 떄, YOLO는 더 큰 Localization 에러를 갖고 있지만 배경에 대한 False Positives가 낮은 편이다. 

(설명 : state of the art란 최신의 기술을 의미하며, 본 논문에서는 최근에 나온 Object Detection 알고리즘을 가리킨다.Object Detection 성능은 Bounding Box의 위치가 잘 추론되었는지  Localization 성능과 객체를 구분하는 Classification 성능이 모두 만족되어야 한다. YOLO는 안타깝게도 Localization 성능이 많이 떨어지지만, False Positive가 많이 낮은 편이다. False Positive 는  Confusion Matrix 설명 편에서 자세히 설명할 것이다. 분류에 있어서 정확도를 판별할 때 맞는 것을 맞다고 하거나 아닌 것을 아니라고 하는 것 뿐만 아니라 맞는걸 아니라고 하는 것과 아닌 것을 맞다고 할 확률도 고려해야 한다. 만약 고려하지 않고 자율주행 차량에 적용하게 된다면 오인지로 인하여 시도때도 없이 자율주행 차량이 멈추게 될 것이다. )

 

Finally, YOLO learns very general representations of objects.

마지막으로 YOLO는 매우 일반화된 객체의 대표성을 배운다.

(설명 : YOLO 알고리즘 메커니즘 상, 전체 이미지를 보기 때문에 일반화를 잘 한다는 것이다. 예를 들어 그림 속에 사람을 그렸다고 해서 그것이 사람이 아닌 것은 아니다. 대부분의 객체인지 알고리즘들은 그림속 사람을 그림으로 인지하기 때문에 사람이라고 구분을 하지는 못한다. 이는 메커니즘의 차이이다. RCNN의 경우 Bounding Box를 그리고 각 Bounding Box안의 객체를 구분하다보니 전체적인 맥락을 해석하지 못하는 경우가 있다. 하지만 YOLO의 경우 전체 이미지를 입력으로 받아 바로 Object Detection을 하므로, 맥락적으로 사람이라고 인지하는 경우가 많다는 것이다. 이를 일반화를 잘한다고 논문에서는 표현하고 있다. )

 

It outperforms other detection methods, including DPM and R-CNN, when generalizing from neural images to other domains like artwork.

신경망 이미지로에서부터 예술작품과 같은 다른 도메인으로 일반화 할 떄, DPM과 R-CNN과 객체인지 방법을 능가한다. 

(설명 : YOLO 논문 마지막에서는 예술작품을 예로 들며, 다른 객체 인지 알고리즘에 비해서 YOLO가 예술작품에서 객체를 더 잘 인지함을 보여준다. 이는 일반화를 잘한다고 논문에서는 해석을 하고 있다.)




단어

repurpose : 다른 목적에 맞게 만들다. 

frame : 틀에 넣다

spatially : 공간적으로, 우주적으로

separated : 헤어진, 갈라선

associated : 연관된

astounding : 경악스러운, 믿기 어려운 

glance : 흘낏보다.

 

 

참조

[1]. https://arxiv.org/abs/1506.02640

 

#AI논문리뷰 #AI논문번역 #딥러닝논문리뷰 #딥러닝논문번역 #논문번역 #논문리뷰 #머신러닝논문리뷰 #머신런닝논문번역  #인공지능논문리뷰 #인공지능논문번역

반응형

+ Recent posts