반응형

[AI 논문 번역 및 리뷰]  (2) -Abstract  YOLO, 욜로, You Only Look Once: Unified, Real-Time Object Detection 

 

1.Introduction

Humans glance at an image and instantly know what objects are in the image, where they are, and how they interact.

인간은 한번 흙낏 보는 것만으로도 이미지 안에 객체가 무엇인지, 어디에 있는지 어떻게 상호작용하는지 알 수 있다.

(설명 : YOLO는 객체 인지 성능 뿐만 아니라 실시간성에 초점을 둔 논문이다. 이미지 대회의 경우 일반적으로 classification 성능과 localization 성능만을 기준으로 순위를 매기기 때문에 실시간성을 고려하지 않는 경우가 많다. 하지만 YOLO의 경우 실시간성까지 고려하였다.)

 

The human visual system is fast and accurate, allowing us to perform complex tasks like driving with little conscious thought.

운전과 같이 의식을 덜 하면서복잡한 일을 수행할 만큼 인간의 시각 시스템은 정확하고 빠르다.

 

Fast, accurate algorithms for object detection would allow computers to drive cars without specialized sensors, enable assistive devices to convey real-time scene information to human users, and unlock the potential for general purpose, responsive robotic systems.

빠르고 정확한 객체 감지 알고리즘은 특별한 센서 없이 컴퓨터가 차량을 운전할 수 있도록 허락하며, 도움을 주는 장치들이 실시간 장면 정보를 사람에게 전달할 수 있게 한다. 반응로봇시스템과 같은 곳에서 가능성을 열리게 한다. 

 

Current detection systems repurpose classifiers to perform detection.

현재 감지 시스템은 분류기를 객체를 감지하도록 변경하여 사용한다. 

 

To detect an object, these systems take classifier for that object and evaluate it at various locations and scales in a test image. 

객체감지를 위하여, 이러한 감지 시스템들은 분류기를 객체감지에 사용하고 테스트 이미지 안의 다양한 위치와 다양한 크기에서 평가한다. 

(RCNN에서는 Region Proposal 이라고 하여 Localization으로 Bounding Box를 찾고 그 안에 있는 객체를 분류하는 2 단계로 나뉘어 있다. 여기서 다양한 위치와 크기는 Bounding Box를 의미한다.)

 

Systems like deformable parts models(DPM) use a sliding window approach where the classifier is run at evenly spaced locations over the entire image.

DPM 시스템은 전체 이미지에 대하여 고르게 공간을 두며 구분지가 작동하는 스라이딩 윈도우 방식을 사용했다. 



단어

glance : 흘낏보다.

repurpose : 다른 목적에 맞게 만들다. 

deformable : 변형할 수 있는 

space : 공간을 두다 

evenly : 고르게 



참조

[1]. https://arxiv.org/abs/1506.02640

 

#AI논문리뷰 #AI논문번역 #딥러닝논문리뷰 #딥러닝논문번역 #논문번역 #논문리뷰 #머신러닝논문리뷰 #머신런닝논문번역  #인공지능논문리뷰 #인공지능논문번역

반응형

+ Recent posts