Recommender System(4)
-
잡케어 추천 알고리즘 프로젝트 기록, 데이콘 공모전 후기
잡케어 추천 알고리즘 경진대회에 참가했다. 고용정보원에서 주체하는 경진대회로 잡케어 서비스에 적용 가능한 추천 알고리즘 개발하는 것이 목적이다. 잡케어는 일자리를 탐색하는 구직자에게 구직자의 이력서를 인공지능 기술로 직무역량을 자동 분석하여 훈련, 자격, 일자리 상담에 활용할 수 있도록 지원하는 시스템이다. 한달동안 개인별 맞춤형 컨텐츠 추천 모델을 만들었다! 간략하게 공모전 과정에서 어떤 생각을 하고 어떤 시도를 해봤는지 남기려고 한다. 2022년 1월 1주차 팀을 구성하고 데이터와 변수에 대해서 파악했다. -34개의 특성변수가 있고 -목적 변수는 컨텐츠 사용여부로 분류문제이다. 특성변수는 (1) 회원 속성 대한 변수, (2) 컨텐츠 속성에 대한 변수, (3) 회원과 컨테츠 속성의 매칭여부로 나눌 수 ..
2022.01.18 -
콘텐츠 기반 필터링(Content-based filtering)
무엇이 좋은 추천인가? 어떻게 하면 추천을 잘할 수 있을까? 추천시스템을 학습하면서 이러한 질문에 대해 계속해서 고민하고자 합니다! 도매인에 따라 같은 방법론을 적용하기 힘들어 추천방법이 다르고 추천방법에 따라 완전히 다른 결과가 나올 수 있습니다. 앞으로 다양한 추천방법에 대해서 포스팅하겠습니다. 오늘은 추천시스템의 개론과 대표적인 추천시스템 방법론을 소개하겠습니다. 추천시스템에는 비개인화 추천과 개인화 추천이 있습니다. 비개인화 추천은 전체 데이터에 대해서 추천하는 방식입니다. 개인화추천은 개인평점, 개인이 시청한 항목 등 개개인의 데이터에 대해서 추천하는 방식입니다. (1) 비개인화 추천 - 랭킹 / 평점 / 등급 - 유사 콘텐츠 - 연관 분석 (2)개인화 추천 - 개인 평점 - 개인이 시청한 항목..
2022.01.14 -
Word2Vec을 활용한 추천시스템
이전 포스트에서 Word2Vec 논문을 리뷰했습니다. 오늘은 Word2Vec을 활용한 추천시스템에 대해서 소개하도록하겠습니다. Word2Vec은 비슷한 의미의 단어를 분류하고 단어끼리 계산하여 적절한 의미를 도출합니다. 자연어를 다루는 문제에서 단어의 분산표현이라는 방법으로 벡터화할 수 있습니다. 이 분산표현은 다양한 자연어처리 작업에 이용할 수 있습니다.(전이학습) 그래서 텍스트 분류, 문서 클러스터링, 기계번역 등 NLP분야에서 다양하게 적용되고 있습니다. 또한 자연어 뿐만 아니라 음성, 이미지, 동영상에도 응용되고 있습니다. Word2Vec을 활용한 추천시스템 1. 단어를 벡터화 the fat cat ___ on the mat Word2Vec(CBOW)는 "the fat cat sat on the ..
2022.01.12 -
잠재요인 협업필터링(latent factor collaborative filtering)
추천시스템에는 콘텐츠 기반 필터링(content based filtering), 협업 필터링(collaborative filtering) 이 있다. 최근에는 협업 필터링이 많이 사용되고 있다. 또 협업 필터링은 최근접 이웃기반 협업 필터링과 잠재요인 협업 필터링을 나뉜다. 사용자가 아이템에 남긴 평점, 구매이력 등의 사용자 행동양식을 기반해주는 것이다. 최근접 이웃기반 협업 필터링은 유사한 아이템, 또는 사용자에 기반해 추천해주는 시스템이다. 잠재요인 협업 필터링은 행렬분해(matricx factorization)에 기반한다. 대규모 다차원 행렬을 SVD와 같은 차원 감소 기법으로 분해하는 과정에서 잠재요인을 찾아내 뽑아내는 과정이다. 사용자-아이템 행렬을 사용자-잠재요인, 잠재요인-아이템 행렬로 분해한..
2021.08.25