참고한 링크는 여기


Word2Vec이란 무엇인가

말 그대로 단어를 벡터로 바꿔주는 알고리즘. 뉴럴 네트워크를 사용함.

단어를 벡터로 바꾸는 가장 간단한 방법은 ont-hot encoding 인데, 이걸로 하면 단어간 유사성을 계산할 수 없는 단점이 존재.


CBOW, Skip-gram

2가징 방법론이 있는데

CBOW(Continuous Bag of Words)는 주변에 있는 단어들을 가지고, 중간에 있는 단어들을 예측하는 방법.

Skip-gram은 반대로 중간에 있는 단어로 주변 단어들을 예측하는 방법


CBOW

Word2Vec의 입력은 모두 one-hot vector가 되어야 한다. 아래 그림 두 장을 보면 대체로 이해가 된다.

하나의 hidden layer만 사용하기 때문에 deep하지 않음에 주목.

hidden layer의 노드 개수가 결과적으로 인코딩 되는 벡터의 차원수가 된다.




반응형

'AI, ML > ML' 카테고리의 다른 글

Bayesian Online Changepoint Detection 논문리딩  (0) 2019.08.21
부스팅(boosting)  (0) 2019.05.28
weka  (0) 2019.02.28
1D CNN  (0) 2019.02.26
의사결정나무(Decision Tree)  (0) 2019.02.07

+ Recent posts