논문

하루에도 수만개의 글자를 읽고 있습니다. 하루에도 수백장의 종이를 들춰 읽습니다.
이것은 그 읽기에 대한 일기입니다.

Toward Flops-constrained Face Recognition

  • 기존의 PolyNet을 수정하여 PolyFace를 제안하였다.
  • NAS를 이용하여 네트워크의 적절한 구조를 찾아내었다.
  • Positive class에 margin을 주는 ArcFace 로스를 수정하여 negative class 부분에도 margin을 추가하는 ArcNegFace를 제안하였다.
  • 이 margin은 백본이 만들어낸 embedding과 샘플이 해당되지 않는 다른 클래스의 Linear layer 가중치 벡터와의 Gaussian 거리에 기반한 margin이다.
  • 때문에 샘플이 해당되지 않는 클래스의 Linear layer 가중치 벡터와 가까지워진다면, 즉 틀린 클래스로 결정 경계와 가까워질 수록 margin이 커지는 구조를 가지고 있다.
  • 그 외, Anchor finetuning, Scale & shift augmentation, Color jitter, Flip, Regular face, Lable smoothing, AdaBN, ArcFace의 margin, Cosine learning rate, stochastic depth 등을 실험한 결과를 보이고 있다.
  • Video에서의 face recognition을 위하여 입력된 샘플의 품질을 측정하는 QAN++를 제안하였다.
  • 학습을 위하여 먼저 품질 수치를 정의하였다.
  • 얼굴 인식기 백본이 생성한 embedding에 대해 해당되는 클래스의 와 해당되지 않는 클래스 중 가장 가 가장 큰 것과의 비를 품질 수치로 사용하였다. 이는 해당되는 클래스와 다른 클래스간의 최소 margin으로 생각할 수 있다.
  • QAN++은 이 품질 수치를 그대로 regression하도록 학습된다.
  • Video에서 한 인물의 얼굴이 여러개 추출되면, QAN++에서 생성된 품질 수치를 이용하여 수식에 의해 가중치 를 부여하여 새로운 embedding을 생성하고 이를 인식에 사용한다.

Add a Comment Trackback