분류 전체보기(34)
-
딥러닝_Binary Classification
Binary Classification은 딥러닝에서 분류하고자하는 것이 0,1로 나타날 수있는 2가지일 경우 사용한다. 스팸판정에서 Spam[1], Ham[0], SNS에서 피드의 show[1], hide[0] 등에 사용된다. 1단계) Linear regression H(x) = Wx + b 2단계) Logistic/sigmoid function (sig(t)) 로지스틱 함수는 다음과 같다. 이 함수를 통해서 0,1로 mapping이 가능해진다. 로지스틱 함수를 씌우면 복잡해서 convex 가 보장되지 않는다는 문제점이 생긴다. 그래서 Linear Regression Model에서 사용했던 Gradient Descent Method는 사용될 수 없다. Log 기반의 새로운 cost 함수를 사용해 분모의 ..
2021.08.20 -
딥러닝_Linear Regression Implementation
딥러닝_Linear Regression Implementation 선형회귀모델 Cost Function 은 실제값과 모델값의 차이를 수치화한 함수이다. Linear Regression Implementation의 모델은 다음과 같다. Model : H(x) = Wx+b 이 모델 손실함수를 최소화하는 방법이 Gradient Descent Method(경사하강법)이다. 경사하강법은 경사(기울기)를 측정한 다음 밑으로 하강하는 방식이다. 편미분하면 기울기가 나오고 기울기가 0에 가까울 수록 cost가 가장 작은 값에 수렴한다. 경사하강법은 convex function에만 유용하다. 우리의 목적은 global cost mean을 찾는 것인데 local cost minimum에서 편미분이 0이되어 업데이트가 더 ..
2021.08.19 -
About Me
안녕하세요. 김지후입니다! 통계적 관점에서 인공지능을 학습하고 있습니다. Explainable AI, Natural Language Processing, Recommendation System을 좋아합니다. 고려대학교 통계학과 재학 2020.03 ~ github https://github.com/kimjihooo email jihoo0303@korea.ac.kr
2021.08.19 -
토픽모델링: LDA(Latent Dirichlet Allocation)
토픽모델링은 방대한 양의 텍스트 자료의 주요 주제를 머신러닝을 통해 추출하는 기법이다. 토픽모델링 기법 중에 하나인 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)을 사용할 것이다. 산림빅데이터거래소의 산림교육정보 프로그램교육목적 데이터를 활용할 것이다. #한글 깨짐을 방지 #런타임을 빨리 하기 위해 코랩에서 이 코드를 돌리신 뒤, '런타임-런타임 다시 시작' 누르기 #다시 이 코드를 돌리기. (총 2번 돌리는 것) import matplotlib as mpl import matplotlib.pyplot as plt %config InlineBackend.figure_format = 'retina' !apt -qq -y install fonts-nanum import ma..
2021.08.18