CNN(Convolution Neural Network) 합성곱 신경망

February 23, 2022

1. 합성곱 신경망(CNN)

- Dense 층은 입력 특성 공간에 있는 전역패턴을 학습하지만 합성곱 층은 지역 패턴을 학습힌다.

- 합성곱 신경망의 지역패턴 학습(아래)

위의 특징은 두 가지 흥미로운 성질을 제공한다.
- 학습된 패턴은 평행 이동 불변성을 가진다.(우리가 보는 세상은 평행 이동으로 인해 다르게 인식되지 않는다.)
- 컨브넷은 패턴의 공간적 계층 구조를 학습할 수 있다. 이는 예를 들어 첫 번쨰 합성곱 층이 작은 지역의 패턴을 학습하면 다음 층은 첫 번째 층의 특성으로 구성된 더 큰 패턴을 학습하는 형식이라고 볼 수 있다.
합성곱 연상은 특성 맵이라고 부르는 3D텐서에 적용된다. (2개의 공간축과 1개의 깊이축으로 구성됨)
이런 특성 맵에서 작은 패치(patch)들을 추출하고, 모든 패치에 같은 변환을 적용하여 출력 특성 맵을 만든다.
출력 텐서에서의 깊이는 층의 매개변수로 결정되기 때문에 상황에 따라 다르게 된다.

- 입력으로 뽑아낼 패치의 크기

- 특성 맵의 출력 깊이

케라스의 Conv2D 층에서의 위의 파라미터는 Conv2D(output_depth, (window_height, window_width))처럼 나타난다.

- 출력 높이와 너비는 입력의 높이 너비와 다를 수 있다. 이를 해결하는데 패딩을 사용한다.

- 패딩 : 입력과 동일한 너비를 가지기 위해 입력 특성 맵의 가장자리에 적절한 개수의 행과 열을 추가한다.

- 필터를 적용하는 위치의 간격을 말한다.

- 스트라이드를 키우면 출력 크기는 작아 진다.

- 하지만 실전에서는 스트라이드 합성곱은 드물게 사용된다. 오히려 특성 맵을 다운샘플링을 하기 위해서는 최대 풀링연산을 사용하는 경우가 많다.

- 스트라이드 합성곱과 비슷하게 강제적으로 특성 맵을 다운샘플링 하는 것을 말한다.

- 입력 특성 맵에서 윈도우에 맞는 패치를 추출하고 각 채널별로 최댓값을 출력한다.

- 합성곱과 개념적으로 비슷하지만 추출한 패치에 학습된 선형 변환을 적용하는 대신 하드코딩된 최댓값 추출 연산을 사용합니다.

- 최대 풀링 연산 이외에도 평균 풀링을 사용할 수도 있다. 가장 좋은 방법은 스트라이드가 없는 합성곱으로 조밀한 특성 맵을 만들고 작은 패치에 대해 최대로 활성화된 특성을 고르는 것이다.