
[DL] Attention
·
ML&DL
1. Seq2Seq Model Seq2Seq Model은 쉽게 말해서 일련의 Encoder 가 입력 시퀀스를 처리하여 Latent vector로 정보를 압축하고, 이를 Decoder로 전달하여 출력 시퀀스를 생성하는모델이다. Latent Vector : Encoder 의 마지막 step 에서 생성된 Hidden state로 , 입력 시퀀스의 정보를 요약한 vector 이다.주요 활용 사례 : 번역, 요약, Q&A 2. 문제점 : Bottleneck 현상 발생 latent vector에 입력 시퀀스의 모든 정보를 압축해야하므로, 정보 손실 가능성 존재 ( latent Vector는 입력 시퀀스의 의미를 잘 담아야 한다. )해결방안 : Attention Mechanism : Decoder가 Latent..