본문 바로가기

논문 리뷰

(16)
A Style-Based Generator Architecture for Generative Adversarial Networks Submission : 2019 Conference : CVPR Paper Link : arxiv.org/abs/1812.04948 Keywords Style-based Disentanglement Interpolation Understanding GAN Contribution High level attribute의 scale-specific control이 가능하다. Disentanglement, interpolation을 향상시켰고, 이를 자동적으로 측정하는 방법도 제시했다. Architecture 가우시안 노이즈 z를 바로 이미지 생성에 사용하지 않고, 8층의 MLP를 거쳐서 생성된 intermediate latent space의 w 벡터를 사용한다. w 벡터는 learned affine netwo..
Understanding Deep Learning Requires Rethinking Generalization Submission : 2017 Conference : ICLR Paper Link : arxiv.org/abs/1611.03530 Keywords Generalization Understanding deep learning Contribution 현존하는 딥러닝 모델들의 일반화 성능을 지금의 이론으로 설명할 수 없음을 보임. Introduction 현존하는 딥러닝 모델들은 training data 전체를 memorize 할 수 있을 만큼 parameter가 많다. 그럼에도 불구하고 generalize가 꽤 잘 된다. 즉, training과 test시에 성능 차이가 그렇게 크지는 않다. 물론, generalize를 못하는 모델도 있다. 잘되는 모델과 안되는 모델의 차이를 알면, 잘되는 모델을 만들 때 도..
Training GANs with Limited Data Submission : 2020 Paper Link : arxiv.org/abs/2006.06676 Keywords Data efficient GAN training ADA(Adaptive Discriminator Augmentation) Non-leaking augmentation Discriminator overfitting Contribution ADA라는 augmentation 방법 제시, 10배 적은 데이터로도 styleGAN2와 대등한 성능을 보임. 적은 양의 데이터로 GAN을 학습시키는 다양한 방법들을 비교, 분석하고 최적의 방법 제시함. Introduction Modern GAN에서 좋은 결과를 얻으려면 100K~1000K의 데이터가 필요함. 데이터가 적으면 discriminator ove..
Few-shot Knowledge Transfer for Fine-grained Cartoon Face Generation Submission : 2020 Paper Link : arxiv.org/abs/2007.13332 Keywords Face2Cartooon Conditional GAN Unpaired image to image translation Few shot learning Contribution 데이터가 많은 group에서 얻은 knowledge를 few shot group으로의 image translation에 transfer하는 방법을 소개했다. Proposed methods 기존의 U-GAT-IT같은 cartoon generation 모델을 보면, 이미지의 group을 구분하지 않아서 모든 input이 dominate한 group으로 translate되는 단점이 있었다. 가령 face2anime의 경우 a..
U-GAT-IT 리뷰 Submission : 2019 Paper Link : arxiv.org/abs/1907.10830 Keywords CAM Module AdaLIN Contribution CAM module을 이용해서, geometric change가 많이 필요한 상황에서도 좋은 결과를 얻었다. AdaLIN이라는 새로운 normalization 방법을 제시하고, 이를 이용해 고정된 architecture와 hyperparameter로도 다양한 데이터셋에 대해 안정성을 확보했다. CAM Module yun905.tistory.com/38 CAM(Class Activation Mapping) CNN에서 마지막 FCN을 제거하고 GAP(Global Average Pooling)을 적용하는 것은 대략 2015년 이후부터 자주 ..
VDSR 리뷰 논문 제목은 Accurate Image Super-Resolution Using Very Deep Convolutional Networks이다. Contribution 1. 20층의 깊은 모델을 학습시켜서 기존 모델보다 좋은 성능을 달성했다. 2. 더 깊은데 기존 모델보다 수렴도 빠르다. 3. 하나의 모델에 다양한 scale factor(두 배, 세 배 등등)를 적용할 수 있다. Residual Learning SRCNN은 super resolution에 처음으로 딥러닝을 적용해서 좋은 결과를 얻었고, VDSR의 베이스가 된 논문이다. SRCNN에서 제시한 위 테이블을 보면, 깊이를 키웠을 때 오히려 성능이 더 안좋은 것을 확인할 수 있다. ResNet 이전의 논문이므로 당연한 결과이다. 네트워크가 gr..
Deep Knowledge Tracing 리뷰 Knowledge Tracing Knowledge Tracing(KT)이란 학습자의 과거 performance를 바탕으로 학습자의 지식 수준을 모델링하여 future performance를 예측하는 domain이다. 학습자의 지식 수준을 모델링 할 수 있다는 것은 1:1 맞춤형 교육 서비스를 제공할 수 있다는 것을 의미한다. 이 논문에서 몇가지 사례도 보여준다. 한 학생이 50개의 Khan Academy 문제를 풀 때의 predicted response를 그림으로 나타낸 것이다. Timestep 4~10을 보면 학생이 y-intercept 문제를 계속 틀리니까 색이 파랗다가, 두 번 연달아 맞으면서 초록색으로 바뀌는 것을 볼 수 있다. 모델이 학생의 과거 interaction을 바탕으로 지식 수준을 모델..
StarGAN 리뷰 GAN을 이용한 image translation에 관한 논문이다. Contribution 1. Multi-domain image translation을 하나의 generator와 discriminator로 가능하게 했다. 2. 그 과정에서 서로 다른 데이터셋을 같이 사용할 수 있게 했다. 3. 성능 또한 기존 모델보다 좋다. Multi-Domain Image Translation StarGAN을 CelebA 데이터셋에 적용한 결과물이다. Input image에 여러 attribute를 합성하였는데, 놀랍게도 하나의 generator가 수행한 것이다. 또한, 오른쪽 3개의 열에서 Angry, Happy, Fearful과 같은 label은 심지어 CelebA에는 존재하지 않는 label이다. RaFD라는 f..