acokikoy's notes

{"勉強中":"Python","注目":"Shopify","LOVE♡":["ABARTH595","TA-GG9","Ukulele","Movable Type","ガーナ ミルクチョコレート"]} なWebディレクター

形態素解析ツール nagisa で単語分割してWordCloudに出力する(その1)

PyConJP 2019 でnagisaという日本語の形態素解析ツールのことを知ったので触ってみる。ただチュートリアルをこなすだけではつまらないので、CMSからAPI経由でウェブサイトのコンテンツを取得してnagisa とWordCloud でテキストマイニングする。今回は その前段。

  • 今回試したこと: nagisa で単語分割、品詞タグ付け、ユーザ辞書を追加する
  • 今回やってないこと: 固有表現抽出モデルの学習

最終的につくりたいもの

こんな感じにしたい。

f:id:acokikoy:20190922153251j:plain
CMSからコンテンツを取得、テキストマイニングしてWordCloud化

 nagisa とWordCloud でテキストマイニング

gist.github.com

参考文献

  • PyconJPのセッション・スライド
    Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜 池田 大志