VisDrone Challenge 1위 수상,
고종환 교수 연구팀의 이주찬 • 유정엽 원우

  • 455호
  • 기사입력 2020.11.10
  • 취재 이솔희 기자
  • 편집 정세인 기자
  • 조회수 7033

정보통신대학 고종환 교수 연구팀이 한국항공우주연구원과 한 팀을 이루어 참가한 ‘2020 VisDrone Challenge’ 대회(객체탐지 부문)에서 1위를 수상했다. 이 대회는 인공지능 분야 최고 권위 학회에서 진행하는 대회이며, 미국의 노스캐롤라이나 대학, 독일의 프라운호퍼 연구소, 중국과학기술대 등 36개의 팀이 참가하였다. 인공지능을 활용해 드론이 촬영한 영상으로부터 객체를 파악하는 기술을 겨루어 좋은 성적을 거두면서 AI 기술력에 대한 연구팀의 능력을 인정받았다.


이번 성균웹진에서는 고종환 교수 연구실 IRIS(Intelligent & Resource efficient Image processing & System design) lab에서 인공지능 경량화를 연구하고 있는 이주찬, 유정엽 원우를 통해 자세한 이야기를 들어보았다.


본격적인 인터뷰에 앞서, 수상소감을 묻는 질문에 “좋은 기회로 세계적인 학회의 챌린지에 참여하게 되었고 좋은 결과를 얻었다. 많은 분들이 축하해주시고 좋게 봐주셔서 감사하다.”라고 답했다.


Q.  VisDrone Challenge는 어떤 대회인가?

카메라가 장착된 드론 또는 일반 UAV(Unmanned Aerial Vehicle)는 농업, 항공 사진, 빠른 배송 및 감시를 포함한 광범위한 응용 분야에 이용되고 있는데, 이러한 플랫폼에서 수집된 이미지에 대한 객체 탐지가 중요한 기술이 되었다. VisDrone 데이터셋은 다양한 드론 장착 카메라로 촬영한 265,228 프레임과 10,209 이미지로 구성된 400 개의 비디오 클립으로 구성되어 있으며, 다양한 드론 플랫폼(즉, 다른 모델의 드론), 다양한 시나리오, 다양한 날씨 및 조명 조건에서 수집되었다. 우리가 참여한 Visdrone DET challenge는 이러한 데이터로부터 다양한 객체를 더 높은 정확도로 탐지할 수 있는 인공지능 모델을 구성하는 대회이며, 올해 열린 ECCV workshop에서 개최되었다.


Q. 대회에서 선보인 기술을 소개해달라.

사진, 비디오에서 객체를 탐지할 수 있는 기술이다. 기본적으로 학습 데이터에 따라서 사람이 눈으로 보고 물체를 인지하는 기능을 할 수 있기 때문에 거리에서 쓰레기를 찾거나, 사고 현장에서 조난자를 찾는 기술 등에 활용할 수 있을 것이라고 생각한다.

(사진을 클릭하면 영상으로 이동합니다)

기존의 객체 탐지(Object Detection) 분야에서 고성능을 보이는 모델과 여러 기법들을 주어진 데이터셋의 특성에 따라 효과적으로 적용하여 좋은 결과를 얻게 된 것 같다.


Q. 대회 준비 과정에서 기억에 남는 에피소드

대회 마감일이 마감 3-4일 전에 연장되었던 것으로 기억한다. 2주 정도 연장되었는데, 더 성능을 올릴 수 있다는 기대감과 다른 팀들의 성능 개선에 대한 두려움이 공존했던 것 같다.


Q. 대회 준비 과정에서 힘든 점은 무엇이었나?

일반적으로 딥러닝 모델을 학습하기 위해서는 gpu를 사용한다. 이번 대회에 사용할 딥러닝 모델을 만들기 위해서는 1~3일 정도의 학습기간이 필요하였다. 조금이라도 더 많은 모델을 학습하기 위해서 gpu가 학습을 끝내는 새벽까지 잠을 자지 못하고 기다렸다가 다른 모델을 학습시키고 잠을 자곤 했는데, 그 과정에서 수면패턴이 깨지는 것이 힘들었다.


Q. 앞으로의 계획이나 목표는 무엇인가?

앞으로 계속 연구를 진행하여, 더 좋은 성능, 더 빠른 속도로 객체 탐지를 할 수 있도록 하는 것이 목표이다.