CV(2)
-
Image Captioning 논문 리뷰 : Show and tell - A Neural Image Caption Generator
NLP와 CV를 연결하는 Image Captioning의 모델을 소개하겠습니다. Image Captioning은 이미지의 내용을 설명하는 문장을 생성하는 것으로 CV와 NLP를 연결하는 인공지능 분야입니다. show and tell은 2015년 Google은 발표한 논문입니다. 이 논문에서는 CV와 머신번역을 결합한 deep recurrent 구조를 사용합니다. 이 모델은 training image가 주어졌을 때, target description의 likelihood를 최대화하는 방향으로 학습합니다. Introduction 기존의 CV에서 주된 목표였던 이미지 classification이나 object recognition문제보다 어려운 문제를 가지고 있습니다. 이미지에 들어있는 물체는 인식하는 것 뿐..
2022.04.23 -
Image Captioning
CV와 NLP를 연결하는 image captioning에 대해서 공부해보자! image captioning 은 이미지를 언어로 설명하는 작업이다. 공부하면서 참고할 자료들을 모아두었다. https://paperswithcode.com/task/image-captioning Papers with Code - Image Captioning ( Image credit: [Reflective Decoding Network for Image Captioning, ICCV'19](https://openaccess.thecvf.com/content_ICCV_2019/papers/Ke_Reflective_Decoding_Network_for_Image_Captioning_ICCV_2019_paper.pdf) ) pap..
2022.03.08