PyConJP 2019 でnagisaという日本語の形態素解析ツールのことを知ったので触ってみる。ただチュートリアルをこなすだけではつまらないので、CMSからAPI経由でウェブサイトのコンテンツを取得してnagisa とWordCloud でテキストマイニングする。今回は その前段。
- 今回試したこと: nagisa で単語分割、品詞タグ付け、ユーザ辞書を追加する
- 今回やってないこと: 固有表現抽出モデルの学習
最終的につくりたいもの
こんな感じにしたい。
PyConJP 2019 でnagisaという日本語の形態素解析ツールのことを知ったので触ってみる。ただチュートリアルをこなすだけではつまらないので、CMSからAPI経由でウェブサイトのコンテンツを取得してnagisa とWordCloud でテキストマイニングする。今回は その前段。
こんな感じにしたい。