🦙 LaMa: Resolution-robust Large Mask Inpainting with Fourier Convolutions
·
CV(컴퓨터비전)
1. Abstract 이미지 페인팅 분야에서는 넓은 손실 영역, 복잡한 기하학적 구조 그리고 고해상도 이미지 처리에서 종종 한계를 드러낸다. 저자들은 이러한 한계의 주요 원인이 network와 loss function의 receptive field 의 부족이라고 지적한다. Lama는 이러한 문제를 해결하기 위해 다음과 같은 3가지 전략을 제시한다. We propose an inpainting network based on recently developed fast Fourier convolutions (FFCs) We propose the use of the perceptual loss [20] based on a semantic segmentation network with a high receptiv..
TTA(Test time Augmentation)
·
CV(컴퓨터비전)
1. TTA란?TTA란 Train 과정이 아닌 Test(Inference) 과정에서 Augmentation을 적용하여 나온 결과들에 대해 대표값 (대체로는 평균값)을 최종 예측값으로 활용한다. 이렇게 하면 보다 모델이 일관되고 강력한 예측을 할 수 있게된다.   해당 방법이 효과적인 이유는 무작위로 변형된 이미지에 대한 예측을평균 내면서 오류도 평균화 하기 때문이다. 단일 벡터에서는 오류가 커질 수 있지만, 이를 평균내면 올바른 예측을 할 수 있도록 유도할 수 있다. 이 때문에 TTA는 모델이 확신하지 못하는 테스트 이미지에 특히 유용하다.  2. 코드실습(Pytorch) https://github.com/qubvel/ttach GitHub - qubvel/ttach: Image Test Time Aug..