논문

하루에도 수만개의 글자를 읽고 있습니다. 하루에도 수백장의 종이를 들춰 읽습니다.
이것은 그 읽기에 대한 일기입니다.

영상의 특성을 고려한 에지 방향성 기반의 이방성 확산

http://www.riss.kr/link?id=T11649929

1. 서론

노이즈 제거를 위한 방법 중 확산 방정식(diffusion equation)를 적용한 방법이 있습니다. 이것은 물리에서 열이나 농도의 상태가 평형을 이루도록 변화하는 것을 본따서 이미지에 적용시킨 방법으로, Fick의 법칙아라고도 불립니다. 이 때, 이미지에 적용되는 확산이 선형적으로 변화한다면 등방성(isotropic), 비선형으로 변화한다면 이방성(anisotropic) 이라고 불립니다.

2. 관련 연구

등방성 확산 필터링의 가장 쉬운 예는 가우시안 커널인데, 현재 대상 픽셀과 그 주변의 에너지(픽셀 값)을 고려하여 에너지가 확산된 이미지를 계산하게 됩니다. 이 필터링은 단순한 형태로 고주파 성분이 제거되어 에지를 보존할 수 없는 문제점이 있습니다.

등방성 확산 필터링의 단점을 극복하기 위하여 Perona와 Malik이 이방성 필터링을 제안하였습니다.

$$I_t = div(g(|\nabla I|) \nabla I)$$

t는 t단계, 즉 필터링이 t번 반복된 이후의 이미지를 의미합니다. $ \nabla I $는 대상 픽셀과 상하좌우 이웃 픽셀과의 차이를 의미합니다. 함수 g는 에지 정지 함수 (edge stopping function)으로 대상 픽셀과 그 이웃 픽셀 값에 따라 가중치를 0~1 사이의 값으로 변화시켜 확산의 정도를 조절하는 비선형 필터링의 역할을 합니다.

이를 이미지에서 사용할 수 있도록 풀어보면,

$$I_s^{t+1} = I^t + \frac{\lambda}{|\eta_s|} \sum_{p \in \eta_s} g(\nabla I_{s, p}) \nabla I_{s, p}$$

와 같습니다. t+1단계에서의 이미지는 대상 픽셀와 그 이웃 픽셀의 차이값에 함수 g로 결정되는 가중치 평균으로 확산을 계산하여 현재 이미지에 더하는 식입니다. 흥미로운 것은 이 확산 모델을 이미지의 에너지 평형을 찾도록 하는 gradient descent로 생각할 수 있다는 것입니다.

이 Perona와 Malik의 연구를 기반으로 Robust anisotropic diffusion (RAD)나 Gradient histogram anisotropic diffusion (GHAD) 와 같은 방법들이 제안되었습니다.

하지만 이런 방법들 모두 이웃 픽셀들을 정의할 때 4이웃 모델을 사용하기 때문에 다음과 같은 문제점이 있습니다.

  1. 에지가 수평 및 수직 방향으로 고착되어 대각선 방향의 에지 보존률이 저하됨
  2. 직선 패턴의 경계선 에지 보존률이 저하됨

이를 해결하기 위하여 저자는 대각선 방향 정보를 포함하기 위하여 8이웃 모델을 사용한 3 * 3 윈도우 커널을 사용하고, 프리윗 (Prewitt) 마스크를 이용하여 직선 패턴이 발견될 경우 에지 방향에 가중치를 부여하도록 하여 이를 해결하는 방법을 제안하였습니다.

3. 에지 방향성 기반의 이방성 확산

약간 복잡해 보이지만 알고리즘을 정리해보면 아래와 같습니다.

일단 단계 2의 경우 기존 diffusion filtering과 동일한 과정입니다. 상대적으로 약한 에지를 가지고 있는 픽셀인 경우 이웃 픽셀들이 동일 영역으로 생각되므로 별다른 처리 없이 가중치를 결정하는 함수 g에 따라 확산을 적용합니다.

에지 강도가 평균보다 높다면 에지 방향성을 검토해봅니다. 이를 위하여 Prewitt 마스크를 사용합니다. 가로, 세로, 2종류의 대각선 총 4 방향의 마스크를 적용하여 에지의 정도를 계산한 뒤 임계치 이상이면 선 에지 영역으로 간주합니다. 선 에지 영역으로 판단되면 선 방향의 이웃 픽셀, 예를 들어 가로 방향 에지의 경우 좌 우 이웃 픽셀의 가중치를 1로 설정하여 에지 성분의 보존률을 높이도록 합니다.

4. 실험 및 평가

기존의 Perona, Malik 방법, RAD, GHAD 방법과 제안된 방법을 잘 알려진 샘플 이미지와 MRI, 초음파 이미지에서의 결과를 비교하였습니다. PSNR 등의 효과는 좋았지만 추가적인 처리로 인하여 처리 속도는 다른 방법들보다 약간 느려지는 결과를 보입니다.


Add a Comment Trackback