하루에도 수만개의 글자를 읽고 있습니다. 하루에도 수백장의 종이를 들춰 읽습니다.
이것은 그 읽기에 대한 일기입니다.
Toward Flops-constrained Face Recognition
5월 26th, 2020 Posted by 룬룬
기존의 PolyNet을 수정하여 PolyFace를 제안하였다.
NAS를 이용하여 네트워크의 적절한 구조를 찾아내었다.
Positive class에 margin을 주는 ArcFace 로스를 수정하여 negative class 부분에도 margin을 추가하는 ArcNegFace를 제안하였다.
이 margin은 백본이 만들어낸 embedding과 샘플이 해당되지 않는 다른 클래스의 Linear layer 가중치 벡터와의 Gaussian 거리에 기반한 margin이다.
때문에 샘플이 해당되지 않는 클래스의 Linear layer 가중치 벡터와 가까지워진다면, 즉 틀린 클래스로 결정 경계와 가까워질 수록 margin이 커지는 구조를 가지고 있다.
그 외, Anchor finetuning, Scale & shift augmentation, Color jitter, Flip, Regular face, Lable smoothing, AdaBN, ArcFace의 margin, Cosine learning rate, stochastic depth 등을 실험한 결과를 보이고 있다.
Video에서의 face recognition을 위하여 입력된 샘플의 품질을 측정하는 QAN++를 제안하였다.
학습을 위하여 먼저 품질 수치를 정의하였다.
얼굴 인식기 백본이 생성한 embedding에 대해 해당되는 클래스의 와 해당되지 않는 클래스 중 가장 가 가장 큰 것과의 비를 품질 수치로 사용하였다. 이는 해당되는 클래스와 다른 클래스간의 최소 margin으로 생각할 수 있다.
QAN++은 이 품질 수치를 그대로 regression하도록 학습된다.
Video에서 한 인물의 얼굴이 여러개 추출되면, QAN++에서 생성된 품질 수치를 이용하여 수식에 의해 가중치 를 부여하여 새로운 embedding을 생성하고 이를 인식에 사용한다.