MLOps 프로젝트/도서 '케라스 창시자에게 배우는 딥러닝'

2부 5.1 합성곱 신경망 소개

youjin86 2021. 9. 1. 18:00

2부 실전 딥러닝

5장 컴퓨터 비전을 위한 딥러닝


5.1 합성곱 신경망 소개

완전 연결된 모델보다 컨브넷이 더 잘 작동됨.

Dense층은 입력 특성 공간에 있는 전역 패턴을 학습하지만 합성곱 층은 지역 패턴을 학습함.

이미지일 경우 작은 2D 윈도우로 입력에서 패턴을 찾음.

 

컨브넷의 2가지 성질

1. 학습된 패턴은 평행 이동 불변성을 가짐.

2. 컨브넷은 패턴의 공간적 계층 구조를 학습할 수 있음.

 

패딩

입력 특성 맵의 가장자리에 적절한 개수의 행과 열을 추가

입력과 동일한 높이와 너비를 가진 출력 특성 맵을 얻고 싶을 때 사용 (경계 문제를 해결해줌.)

 

스트라이드

두 번의 연속적인 윈도우 사이의 거리로 합성곱의 파라미터

기본값은 1이며 스트라이드가 1보다 큰 스트라이드 합성곱도 가능

스트라이드 2를 사용했다는 것은 특성 맵의 너비와 높이가 2의 배수로 다운샘플링되었다는 뜻

 

최대 풀링 연산

스트라이드 합성곱과 매우 비슷하게 강제적으로 특성 맵을 다운샘플링하는 것

최대 풀링은 입력 특성 맵에서 윈도우에 맞는 패치를 추출하고 각 채널별로 최댓값을 출력함.

합성곱과 개념적으로 비슷하지만 추출한 패치에 학습된 선형 변환(합성곱 커널)을 적용하는 대신 하드코딩된 최댓값 추출 연산을 사용

 

합성곱과의 차이점

최대 풀링 : 보통 2X2 윈도우와 스트라이드 2를 사용하여 특성 맵을 절반 크기로 다운샘플링함.

합성곱 : 전형적으로 3X3 윈도우와 스트라이드 1을 사용

 

다운샘플링을 사용하는 이유

처리할 특성 맵의 가중치 개수를 줄이기 위해

연속적인 합성곱 층이 점점 커진 윈도우를 통해 바라보도록 만들어 필터의 공간적인 계층 구조를 구성

 

최대 풀링이 특성 맵의 각 타일에서 어떤 패턴이나 개념의 존재 여부를 인코딩하는 경향이 있기 때문에 평균 풀링보다 더 잘 작동됨.

 

평균 풀링 : 최댓값을 취하는 최대 풀링 대신 입력 패치의 채널별 평균값을 계산하여 변환

 

가장 좋은 서브샘플링 전략

1. 스트라이드가 없는 합성곱으로 조밀한 특성 맵을 만듦,

2. 작은 패치에 대해서 최대로 활성화된 특성을 고름.