Edinet APIを使ってみる（書類取得API編　その１）

python 会計 Edinet API

はじめにEdinet APIをPythonで使ってみる。書類一覧APIと書類取得APIの２つがあるが、この記事では書類取得APIについて扱う。まずは叩いてみるpythonからgetメソッドでAPIを叩く。 import requests doc_id = 'S100LF3R' #取得したい書類の書類管理番号 res…

2022-03-22

Edinet APIを使ってみる（書類一覧API編　その２）

python 会計 Edinet API

はじめにEdinet APIをPythonで使ってみる。書類一覧APIと書類取得APIの２つがあるが、この記事では書類一覧APIについて扱う。前回の記事でとりあえず出力をPandas DataFrameに変換するところまで進めたので、本記事ではもう少し実用的な内容を扱う。result…

2022-03-19

Edinet APIを使ってみる（書類一覧API編　その１）

python Edinet API 会計

はじめにEdinet APIをPythonで使ってみる。書類一覧APIと書類取得APIの２つがあるが、この記事では書類一覧APIについて扱う。まずは叩いてみるpythonからgetメソッドでAPIを叩く。出力がJSONフォーマットでそのままだと見づらいのでdict型に変換。 import…

2021-06-27

Word2Vecの出力をMDSで解釈してみる

python 機械学習自然言語処理（NLP） word2vec 教師なし学習 MDS

はじめに前回紹介したWord2Vecを用いた文章の分散表現をMDSで次元削減し視覚的に解釈可能にしてみます。 oryou-san.hatenablog.com 前処理scikit-learnのdataset"fetch_20newsgroups"を学習用データとして用います。 Word2Vecの入力に適するように文章を単語…

2021-06-20

Word2Vecを使ってみる

python 機械学習自然言語処理（NLP） MeCab gensim word2vec

はじめにPythonの自然言語処理系のライブラリであるgensimでWord2Vecを使ってみます。データ準備Word2Vecにかけるデータを準備します。分かち書きされている文章をリストにまとめたものならOKです。前回の記事で紹介したMeCabを使っています。oryou-san.ha…

2021-06-18

MeCabで分かち書き

python 自然言語処理（NLP）機械学習 MeCab

はじめにMeCabというライブラリを使って日本語の分かち書きをしてみます。まずは使ってみる出力はこんな感じになります。 s = 'おいしいパスタつくったお前' import MeCab mecab = MeCab.Tagger("-Ochasen") print(mecab.parse(s)) # おいしいオイシイお…