합성곱 신경망

[참조] 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기

컴퓨터 비전

컴퓨터 비전의 활용 영역은 다음과 같다.

  1. 이미지 분류(Image Classification)
  2. 이미지 유사도(Image Similarity)
  3. 이미지 시각화(Image Visualization)
  4. 이미지 생성(Generated Images)
  5. 이미지 질의 응답(Image Q&A)
  6. 객체 인식(Object Detection)
  7. 이미지 영역 분할(Image Segmentation)
  8. 시계열 분류(Time Series Classification)
  9. 스타일 변환(Style Transfer)
  10. 컬러 복원(Colorization)

합성곱 신경망(CNN - Convolutional Operation)

이미지는 다음과 같이 3개의 색상으로 나타낼 수가 있다.

그림1

  • 이미지: 너비 X 높이 X 채널 수

이미지 전처리

그림2

그림과 같이 필터를 통해 경계선만 뽑아내는 과정을 전처리 라고 한다.

그림3

  • MLP의 한계 극복
  • 데이터를 그대로 매트릭스 형태로 전달

적용법

그림4

  • 필터를 이용해 각 요소들을 빠짐없이 순회
  • 그림과 같이 이미지 요소와 같은 위치에 있는 필터의 요소의 곱을 합하여 연산

그림5

  • 4 X 4 이미지에 3 X 3 필터를 적용시키면 2 X 2 형태의 아웃풋이 나오는데 이것을 피쳐맵(Feature map)이라 함

그림6

  • 필터를 이용해 순회할 때 보폭을 stride이라고 함

그림7

  • 필터를 적용하게 되면 피쳐맵은 기존의 이미지 크기보다 작게 나올 수 밖에 없음
  • 기존 이미지와 동일한 결과를 얻고 싶다면 패딩(Padding)을 주어서 해결 가능
  • 그림에서는 0값을 주었기 때문에 제로 패딩(Zero padding)이라고 함
  • 0이 아닌 다른 값을 주면 쓰레기 값이 들어올 수 있기 떄문에 특별한 경우가 아니라면 제로 패딩 사용
  • 예외로 세포 이미지 같은 경우 대칭되는 값을 넣어주는 미러 패딩을 사용하는 경우도 있음

[참조] 인프런 - 실전 인공지능으로 이어지는 딥러닝 개념 잡기

끝!