oryou-sanのブログ

備忘録です

word2vec

Word2Vecの出力をMDSで解釈してみる

はじめに前回紹介したWord2Vecを用いた文章の分散表現をMDSで次元削減し視覚的に解釈可能にしてみます。 oryou-san.hatenablog.com 前処理scikit-learnのdataset"fetch_20newsgroups"を学習用データとして用います。 Word2Vecの入力に適するように文章を単語…

Word2Vecを使ってみる

はじめにPythonの自然言語処理系のライブラリであるgensimでWord2Vecを使ってみます。 データ準備Word2Vecにかけるデータを準備します。分かち書きされている文章をリストにまとめたものならOKです。 前回の記事で紹介したMeCabを使っています。oryou-san.ha…