논문

하루에도 수만개의 글자를 읽고 있습니다. 하루에도 수백장의 종이를 들춰 읽습니다.
이것은 그 읽기에 대한 일기입니다.

U-Net: Convolutional Networks for Biomedical Image Segmentation

1 Introduction

  • 보통 컨볼루셔널 네트워크는 이미지를 입력 받아 하나의 클래스 레이블을 내놓는 분류 작업에 사용한다.
  • 하지만 많은 영상 작업에서는 특히 의료 영상 처리에서는 출력이 지역적 특성을 가지도록 하는 작업이 많다. 예를 들면 각 픽셀마다 레이블을 할당하는 그런 작업이다.
  • 이 논문에서는 fully convolutional network를 기반으로 한 방법을 제안한다. 이 구조를 변경하고 확장하여 더 적은 학습 이미지를 쓰면서도 더 정교한 세그멘테이션을 하고자 한다.
  • Fully convolutional network의 주요 아이디어는 pooling을 이용한 레이어들로 점점 좁아지는 네트워크를 업샘플링 레이어로 교체하여 출력의 해상도를 뜰어올릴 수 있었다. 또한 지역적 특성을 가지 위해 높은 해상도에서의 특징들을 업샘플링된 출력과 조합하여 사용한 것이다.
  • 이 논문의 중요한 변경점은 업샘플링 부분 또한 많은 채널의 특징을 가지도록 하여 네트워크가 context 정보를 높은 해상도의 층으로 전파하도록 하였다. 그 결과, 다시 이미지 크기로의 확장되는 경로는 줄어드는 모양새와 대칭적으로 되어 U모양의 구조를 갖게 되었다.
  • 네트워크는 fully connected 층을 가지지 않으며, 오직 컨볼루션으로 이루어져 있다.
  • 이미지의 가장자리 부분의 픽셀 또한 값을 추정하기 위해 입력 이미지를 미러링 하여 이미지를 확장하도록 하였다.
  • 적은 학습 데이터만 사용할 수 있었기에, elastic deformation을 적용하여 과도한 augmentation을 하였다.

2 Network Architecture

  • 네트워크 구조는 점점 좁아지는 경로와 다시 확장하는 경로로 이루어져 있다.
  • 좁아지는 경로는 일반적인 컨볼루셔널 네트워크로 3×3 컨볼루션으로 padding없이ReLU를 사용하였다. 다운 샘플링에는 2×2 max pooling을 스트라이드 2로 적용하였다. 각 다운 샘플링 단계에서는 특징을 2배씩 키우도록 하였다.
  • 확장되는 경로는 2×2 컨볼루션으로 업샘플링하였는데, 그 채널은 반으로 줄어들도록 하였다. 이에 좁아지는 경로의 특징 맵에서 크롭한 특징을 붙인 다음, 두 개의 3×3 컨볼루션을 적용하고 ReLU를 적용하였다.
  • 마지막 층은 1×1 컨볼루션을 수행하여 64 길이의 특징 벡터를 원하는 클래스 번호로 매핑하였다

3 Training

  • 에너지 함수는 마지막 특징 맵에서 픽셀 단위로 cross entropy loss 함수를 사용하였다.
  • 데이터 마다 가지는 픽셀의 각기 다른 주파수나, 작은 개체끼리의 가장자리를 잘 학습시키기 위해 미리 계산된 가중치 맵을 사용하였다.

3.1 Data Augmentation

  • 학습 샘플에 elastic deformation을 적용하였다.
  • 3×3 grid에 랜덤 displacement vector를 이용하여 smooth deformation을 적용하였다.

Add a Comment Trackback