2019-09-22 形態素解析ツール nagisa で単語分割してWordCloudに出力する(その1) Python PyConJP 2019 でnagisaという日本語の形態素解析ツールのことを知ったので触ってみる。ただチュートリアルをこなすだけではつまらないので、CMSからAPI経由でウェブサイトのコンテンツを取得してnagisa とWordCloud でテキストマイニングする。今回は その前段。 今回試したこと: nagisa で単語分割、品詞タグ付け、ユーザ辞書を追加する 今回やってないこと: 固有表現抽出モデルの学習 最終的につくりたいもの nagisa とWordCloud でテキストマイニング 参考文献 最終的につくりたいもの こんな感じにしたい。 CMSからコンテンツを取得、テキストマイニングしてWordCloud化 nagisa とWordCloud でテキストマイニング gist.github.com 参考文献 PyconJPのセッション・スライド Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜 池田 大志 WordCloud for Python documentation