합성곱 신경망
카테고리 : 머신러닝 >> Deeplearning
[참조] 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기
컴퓨터 비전
컴퓨터 비전의 활용 영역은 다음과 같다.
- 이미지 분류(Image Classification)
- 이미지 유사도(Image Similarity)
- 이미지 시각화(Image Visualization)
- 이미지 생성(Generated Images)
- 이미지 질의 응답(Image Q&A)
- 객체 인식(Object Detection)
- 이미지 영역 분할(Image Segmentation)
- 시계열 분류(Time Series Classification)
- 스타일 변환(Style Transfer)
- 컬러 복원(Colorization)
합성곱 신경망(CNN - Convolutional Operation)
이미지는 다음과 같이 3개의 색상으로 나타낼 수가 있다.
- 이미지: 너비 X 높이 X 채널 수
이미지 전처리
그림과 같이 필터를 통해 경계선만 뽑아내는 과정을 전처리 라고 한다.
- MLP의 한계 극복
- 데이터를 그대로 매트릭스 형태로 전달
적용법
- 필터를 이용해 각 요소들을 빠짐없이 순회
- 그림과 같이 이미지 요소와 같은 위치에 있는 필터의 요소의 곱을 합하여 연산
- 4 X 4 이미지에 3 X 3 필터를 적용시키면 2 X 2 형태의 아웃풋이 나오는데 이것을 피쳐맵(Feature map)이라 함
- 필터를 이용해 순회할 때 보폭을 stride이라고 함
- 필터를 적용하게 되면 피쳐맵은 기존의 이미지 크기보다 작게 나올 수 밖에 없음
- 기존 이미지와 동일한 결과를 얻고 싶다면 패딩(Padding)을 주어서 해결 가능
- 그림에서는 0값을 주었기 때문에 제로 패딩(Zero padding)이라고 함
- 0이 아닌 다른 값을 주면 쓰레기 값이 들어올 수 있기 떄문에 특별한 경우가 아니라면 제로 패딩 사용
- 예외로 세포 이미지 같은 경우 대칭되는 값을 넣어주는 미러 패딩을 사용하는 경우도 있음
[참조] 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기
끝!