1 Introduction

보통 컨볼루셔널 네트워크는 이미지를 입력 받아 하나의 클래스 레이블을 내놓는 분류 작업에 사용한다.
하지만 많은 영상 작업에서는 특히 의료 영상 처리에서는 출력이 지역적 특성을 가지도록 하는 작업이 많다. 예를 들면 각 픽셀마다 레이블을 할당하는 그런 작업이다.
이 논문에서는 fully convolutional network를 기반으로 한 방법을 제안한다. 이 구조를 변경하고 확장하여 더 적은 학습 이미지를 쓰면서도 더 정교한 세그멘테이션을 하고자 한다.
Fully convolutional network의 주요 아이디어는 pooling을 이용한 레이어들로 점점 좁아지는 네트워크를 업샘플링 레이어로 교체하여 출력의 해상도를 뜰어올릴 수 있었다. 또한 지역적 특성을 가지 위해 높은 해상도에서의 특징들을 업샘플링된 출력과 조합하여 사용한 것이다.
이 논문의 중요한 변경점은 업샘플링 부분 또한 많은 채널의 특징을 가지도록 하여 네트워크가 context 정보를 높은 해상도의 층으로 전파하도록 하였다. 그 결과, 다시 이미지 크기로의 확장되는 경로는 줄어드는 모양새와 대칭적으로 되어 U모양의 구조를 갖게 되었다.
네트워크는 fully connected 층을 가지지 않으며, 오직 컨볼루션으로 이루어져 있다.
이미지의 가장자리 부분의 픽셀 또한 값을 추정하기 위해 입력 이미지를 미러링 하여 이미지를 확장하도록 하였다.
적은 학습 데이터만 사용할 수 있었기에, elastic deformation을 적용하여 과도한 augmentation을 하였다.

2 Network Architecture

네트워크 구조는 점점 좁아지는 경로와 다시 확장하는 경로로 이루어져 있다.
좁아지는 경로는 일반적인 컨볼루셔널 네트워크로 3x3 컨볼루션으로 padding없이ReLU를 사용하였다. 다운 샘플링에는 2x2 max pooling을 스트라이드 2로 적용하였다. 각 다운 샘플링 단계에서는 특징을 2배씩 키우도록 하였다.
확장되는 경로는 2x2 컨볼루션으로 업샘플링하였는데, 그 채널은 반으로 줄어들도록 하였다. 이에 좁아지는 경로의 특징 맵에서 크롭한 특징을 붙인 다음, 두 개의 3x3 컨볼루션을 적용하고 ReLU를 적용하였다.
마지막 층은 1x1 컨볼루션을 수행하여 64 길이의 특징 벡터를 원하는 클래스 번호로 매핑하였다

3 Training

에너지 함수는 마지막 특징 맵에서 픽셀 단위로 cross entropy loss 함수를 사용하였다.
데이터 마다 가지는 픽셀의 각기 다른 주파수나, 작은 개체끼리의 가장자리를 잘 학습시키기 위해 미리 계산된 가중치 맵을 사용하였다.

3.1 Data Augmentation

학습 샘플에 elastic deformation을 적용하였다.
3x3 grid에 랜덤 displacement vector를 이용하여 smooth deformation을 적용하였다.

논문

U-Net: Convolutional Networks for Biomedical Image Segmentation

1 Introduction

2 Network Architecture

3 Training

3.1 Data Augmentation

카테고리

최신 글

최신 댓글

보관함

메타

논문

U-Net: Convolutional Networks for Biomedical Image Segmentation

1 Introduction

2 Network Architecture

3 Training

3.1 Data Augmentation

카테고리

태그

최신 글

최신 댓글

보관함

메타