acokikoy's notes

{"勉強中":"Python","注目":"Shopify","LOVE♡":["ABARTH595","TA-GG9","Ukulele","Movable Type","ガーナ ミルクチョコレート"]} なWebディレクター

セミナー参加ログ》みんなのPython勉強会#65 2021/1/13(水) 19:00〜21:00(オンライン開催)

みんなのPython勉強会#65 の聴講メモ。

startpython.connpass.com

参加目的・獲得目標

シビックテックってなんじゃらほい?と興味を惹かれたため。

セミナー聴講ログ

『ビジネスとテクノロジーの掛け算』大城 信晃@NOB DATA/伊藤 徹郎さん

『データサイエンスのためのリーダブルコードのススメ』@yutakanzawaさん

  • 神沢 雄大ジョンソン・エンド・ジョンソン@yutakanzawa
  • 読みにくい、保守性が低いコード
  • 未来の自分は他人だと思った方がいい
    • 仕様や実行時の注意点、今後の課題とか書いとかないと忘れるし、ずっと自分が担当できるとは限らない
  • データサイエンティストがエンジニアと違う点
    • 最終成果物はデータセットとかモデルとか要は分析結果。コードはアウトプットを出す手段なので一度きりな場合が多い。「動けばOK」になりがち
    • 分析結果を得られるまでの試行錯誤が多い。
    • 目的のために手段を選ばない。Excelで加工してPythonで分析してパワポで見た目を整えて。。。みたいな複数ツールを駆使して云々
  • データサイエンティストがエンジニアを見習うべきポイント
    • ファイルとフォルダの構成 - コードとデータを分ける、処理内容や機能に応じてコードを分割
    • コメントをつける
    • リファクタリング
      • 変数名、関数名の見直し
      • 処理の分割、関数化、for/リスト内包表記化
      • 知識の継続的アップデート ex) f文字列、セイウチ演算子
    • フォーマッターやリンターの使用
  • リファクタリングを身につけるには
    • 趣味のプロジェクトから始める
    • 習慣づけ
      • 命名規則の導入
      • ちびちび実行。コードを書いたらBlack実行
    • ◎レビューまたは鑑賞 - 他人に見てもらう。他人のコードを読む。
  • 忙しい研究者のためのテストコードとドキュメントの書き方 - Qiita
  • atsuoishimoto (Atsuo Ishimoto)

Python+Tesseract OCRで文字認識 渡邊亘@リーディング・エッジ社

  • テッサラク
  • オープンソースOCRエンジン
  • コマンドラインのI/Fを持つ
  • 画像を前処理してからTesseract
  • Tesseract at UB Mannheim から入手
    • Additional script dataで次にチェック
      • Japanese script
      • Japanese vertical script
    • Additional language dataで次にチェック
      • Japanese
      • Japanese(Vertical)
  • Python OCRのインストール(pipでインストールできる)
  • 使うには import pyocr する
  • コード

シビックテックで技術者として成長しよう』関 治之@CODE for JAPAN さん

成果、気づき

  • 関さん、活動のことを始終とても楽しそうに話されていたのが印象に残った。