티스토리 뷰
728x90
반응형
입력 데이터의 순서가 중요한 경우 CNN을 사용하여 task를 수행할 수 있다. CNN은 convolution layer(+detector stage), pooling layer, fully-connected layer로 구성된다.
입력(input)과 가중치(kernel)의 convolution(엄밀히 말하면 cross correlation이다.)을 통해 핵심적인 정보를 추출한다. 대개 출력의 수는 입력에 비해 작아지나 zero-padding을 통해 유지시킬 수 있다.
convolution 연산은 입력과 그보다 작은 커널의 상호작용만으로 출력을 내기 때문에 결과적으로 특정 입력 노드 주변의 노드들만 기여를 한다.(sparse interaction) 기여하는 입력 노드들의 집합을 receptive field라고 하고 커널의 크기가 클수록 신경망의 깊이가 깊어질수록 커지는 경향을 보인다.
convolution 연산에 사용되는 커널은 모든 입력에 대해 파라미터가 공통적으로 적용되므로 fully-connected에 비해 학습할 파라미터의 수가 적다.
convolution 다음 층인 pooling layer는 데이터를 요약하는 계층이다. 여러 가지 방식이 있으나 max pooling(특정 범위에서 가장 큰 값을 다음 출력으로 전달함.)을 많이 사용한다. 이러한 기법은 입력에 섞인 노이즈에 강건하며 정보 요약을 통해 다음 층의 연산 부담을 줄인다.
728x90
반응형
'머신러닝 > 딥러닝' 카테고리의 다른 글
[머신러닝/딥러닝]오토인코더(Autoencoder) (0) | 2021.08.24 |
---|---|
[머신러닝/딥러닝]RNN(Recurrent neural networks) (0) | 2021.08.24 |
[머신러닝/딥러닝]딥러닝의 과적합과 과소적합 (0) | 2021.08.24 |
[머신러닝/딥러닝]딥러닝 및 다층 퍼셉트론(MLP) (0) | 2021.08.24 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- C++
- 큐
- C언어
- BFS
- 백준
- 애니메이션
- 영어 어휘
- 구현
- Git
- 정렬
- 재귀함수
- 스택
- 베릴로그
- Verilog
- 완전탐색
- 메이플스토리
- gem5
- 건이의 특제 떡국 끓이기
- BOJ
- 알고리즘
- 영화
- 백트래킹
- 이진탐색
- 이분법
- 구조체
- Push
- backtracking
- 너비우선탐색
- 취미
- recursive
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
글 보관함
반응형
250x250