제6회 전자공학회 신호처리소사이어티 영상이해연구회 겨울학교
웰리힐리파크(구 현대성우리조트)   /   2017년 01월 18일~2017년 01월 19일
 
행사가 개최되었습니다.

강의 개요

첫째날: 2017년 1월 18일 수요일
세션1: Introduction to action recognition
13:30 – 14:45 비디오 기반 행동인식 연구 Overview 및 최근 CNN/ LSTM기반 행동인식 연구
(계명대 고병철 교수)
본 강의에서는 최근 컴퓨터비전 및 패턴인식 분야에서 이슈로 등장하고 있는 비디오 기반 행동인식 기술에 대한 최신 연구 동향을 발표한다. 행동인식은 전통적으로 전체 영상을 사용하는 방법과 지역적 특성을 추출하여 행동인식에 필요한 시공간적 정보를 추출하는 방법을 사용한다. 몇 년 전까지만 해도 지역적 특징 정보를 시공간적 볼륨으로 추출하고 볼륨 내에서 정적 특징과 동적 특징을 Bag-of-Word (BoW)로 결합하고 최종적으로 SVM이나 Adaboost, Random Forest분류기를 이용하여 분류하는 방법들이 일반적이었다. 하지만 최근 몇 년 사이에는 Deep learning 기술의 하나인 CNN을 이용하거나, 지역적 특징 정보 추출 없이 영상내의 시공간 행동 패턴을 시간적으로 모델링하는 Recurrent NN (RNN) 방법이 많이 사용되고 있다. 특히 RNN의 문제점인 Vanishing gradient문제를 해결하기 위해 LSTM (Long-short term memory)를 이용한 행동인식 방법이 최근 행동인식에서 중요한 이슈로 떠오르고 있다. 따라서 본 강의에서는 전통적인 지역적 특성에 기반한 행동인식 기법에 대해 먼저 소개하고 이어서 최근에 사용되고 있는 LSTM기반의 행동인식에 대해 설명한다.
세션2:  Semantic correspondence and challenges in large scale visual recognition
15:00 - 16:30 의미론적 연관성 모델링을 위한 영상 정합 (연세대 함범섭 교수)
기존 영상 정합 기술은 스테레오 정합 (stereo matching), 움직임 추청 (optical flow)과 같이 동일한 장면 및 물체를 촬영한 영상에 국한되어 있었다. 시멘틱 정합 (semantic matching)은 같은 카테고리에 속해 있지만 서로 다른 형태를 띄고 있는 물체 영상에 대한 정합을 지칭하며, 이를 이용하면 영상 간의 의미론적 연관성을 모델링 할 수 있다. 시멘틱 정합은 물체인식 (object recognition), 시멘틱세그멘테이션 (semantic segmentation), 영상 에디팅 (editing) 및 합성 (synthesis) 등 많은 컴퓨터 비전 분야에 사용되는 핵심 기술이다. 본 세미나에서는 시멘틱 정합 기술의 최근 연구 동향을 소개한다.
 
16:30 - 18:00 Human-Inspired Large Scale Visual Recognition System (UNIST 황성주 교수)
The recent success of deep convolutional neural networks (CNN) has made a breakthrough in visual object categorization, with the state-of-the-art model obtaining 80% classification accuracy on 1,000 object classes. While this is an impressive result, object categorization is yet to bring high impact to our everyday life, due to the small number of categories considered. There exist more than hundreds of thousands of nameable objects, and this set of categories is ever growing with the plethora of products that are newly introduced to our world every day. Thus, a truly practical categorization system should be able to recognize millions of object categories. However, the current state-of-the-art systems obtain only about 30% accuracy at maximum when classifying tens of thousands of classes, which limits their applicability to such large-scale cases. This low performance results from new challenges introduced in the large-scale recognition setting, such as finer granularity of categories, increased number of parameters and training time, class imbalance, and lack of training data. How should we tackle these challenges then? Fortunately, there exists a recognition system that is incredibly robust, scalable, and generalizes well – the human. In this talk, I will discuss about some models and algorithms I have developed to tackle new challenges posed by large-scale categorization, that are inspired by the human recognition and learning process.​
 
둘째날: 2017년 1월 19일 목요일
세션 3: 표정 인식 및 컬러 영상 이해
09:30 - 10:45 Deep Learning 및 Action Unit 기반 표정인식관련 최신 연구 동향 (영남대 이찬수 교수)
표정인식을 기반으로 한 정서분석 및 인식은 HCI나 Affective Computing 분야 뿐 아니라, 사람의 정서 및 상태 인식을 바탕으로 한 다양한 응용 분야에 접목이 시도되고 있다. 이러한 표정인식과 관련하여 최근에 Action Unit 인식을 바탕으로 한 접근 방법 및 DNN을 사용한 다양한 접근이 시도되고 있다. 최근에 개발되고 있는 표정인식관련 연구들을 살펴봄으로써 행동인식의 한 부분으로써의 표정인식에 접근 방법들을 살펴보며, 관련 응용 분야를 검토해 본다.
 
10:45- 12:00 컴퓨터 비전(Vision)을 위한 컬러 시스템의 이해 (연세대 조윤지 박사) 
전자장비에서 다루는 컬러영상의 Red, Green, Blue(R, G, B)는 컬러의 표현 및 재현은 물론 각종 영상처리의 기본적인 요소이다. 컴퓨터 비전에서 전자장비 간의 컬러 불일치의 원인을 제대로 이해하고, R, G, B를 활용한 영상처리를 제대로 이해하는 것은 정확한 컴퓨터 비전에 있어서 아주 중요한 것이다. 이번 강연을 통하여 컴퓨터 비전에서의 Color System들을 올바로 이해하고, 정확하게 처리하는 방법을 명쾌하게 알아보는 시간을 갖고자 한다. 본 강연의 주요 내용은 1) 장비들 간의 컬러 불일치 현상, 2) 장비 간의 컬러 불일치의 원인, 3) 디지털 컬러의 문제점, 4) 컬러 시스템(CIERGB, CIEXYZ, CIELAB)의 소개 등이다.
 
세션 4: 제스처 인식 및 Deep Learning 기반 특징 추출
14:00 - 15:00 영상기반 제스처 인식 및 인터페이스 (한양대 박종일 교수)
영상으로부터 사람의 제스쳐를 실시간에 인식하는 것은 자연스러운 인간-컴퓨터 상호작용을 위해 꼭 필요한 기술이다. 본 강연에서는 컴퓨터비전 기술을 이용하여 사람의 몸 동작, 손 동작을 실시간에 인식하는 기술에 대해 설명한다. 먼저 동작 인식의 주요 연구 동향을 살펴보고, 몸동작을 실시간에 추출하는 가장 대표적인 기술이라고 할 수 있는 Kinect의 제스쳐 인식 기술의 원리를 자세히 설명한다. 이어 손동작 인식 방법에 대해 설명하고, 응용 시나리오에 대해 소개한다.

 
15:00 - 16:15 영상의 의미론적 정합을 위한 Deep Learning 기반 특징 추출(충남대 민동보 교수)
영상의 의미론적 정합은 장면 분석, 의미론적 객체 분할, 영상 편집 등의 다양한 분야에 필요한 핵심 기술로 최근 많은 주목을 받고 있다. 그러나, 동일한 클래스 내에서 존재하는 왜곡, 예를 들어 다른 종류의 자동차 간에 존재하는 기하학적/광도 왜곡 등으로 인해 기존의 의미론적 정합 방식은 정확한 정합 결과를 얻는데 많은 어려움을 겪고 있다. 본 강의에서는 이를 극복하기 위해 최근에 개발된 Deep learning 기반 영상 특징 기술자에 대한 연구를 소개한다. 최근에 발표된 논문들을 위주로 공통적으로 사용되는 이론, 알고리즘 및 한계 등에 대해 자세히 설명한다.
 
16:15 – 16:25 휴식
특별 세션: IEEE Fellow 선정 기념 강연
16:25 - 17:50 영상 압축과 3차원 영상처리 기술  (광주과학기술원 호요성 교수) 
최근 멀티미디어 신호처리와 영상압축 분야의 발전에 기여한 공로를 인정받아 IEEE Fellow로 선정된 소감과 더불어 관련 연구 내용 및 FIEEE 준비 과정을 소개한다.
 

ALL CONTENTS COPYRIGHT 2017 THE INSTITUTE OF ELECTRONICS AND INFORMATION ENGINEERS
사업자등록번호:220-82-01685 (우) 135-703 서울특별시 강남구 테헤란로7길 22 (역삼동, 과학기술회관) 신관 907호
(사)대한전자공학회 대표: 홍대식 / 전화: (02) 553-0255~7 FAX: (02) 552-6093 / E-mail: ieie@theieie.org