セミナー参加ログ》みんなのPython勉強会#65 2021/1/13(水) 19:00〜21:00(オンライン開催)
みんなのPython勉強会#65 の聴講メモ。
参加目的・獲得目標
シビックテックってなんじゃらほい?と興味を惹かれたため。
セミナー聴講ログ
- Twitter #stapy
- 『オードリー・タン 自由への手紙』
『ビジネスとテクノロジーの掛け算』大城 信晃@NOB DATA/伊藤 徹郎さん
- 大城 信晃(NOB DATA株式会社 代表取締役社長)
- 伊藤 徹郎(Classi株式会社 データAI部部長)
- 本書いたのでその紹介
- DevOpsからMLOpsエンジニア
- MLOps(エムエルオプス)ってなんじゃ? →機械学習(ML)の開発チームと運用チームが連携・協力してモデルの開発から運用まで一連のライフサイクルを管理する基盤・体制のことらしい。
- 経営陣との期待値調整 → プロジェクトの出口戦略について業界別にヒント集になっているよ
『データサイエンスのためのリーダブルコードのススメ』@yutakanzawaさん
- 神沢 雄大(ジョンソン・エンド・ジョンソン)@yutakanzawa
- 読みにくい、保守性が低いコード
- 未来の自分は他人だと思った方がいい
- 仕様や実行時の注意点、今後の課題とか書いとかないと忘れるし、ずっと自分が担当できるとは限らない
- データサイエンティストがエンジニアと違う点
- データサイエンティストがエンジニアを見習うべきポイント
- リファクタリングを身につけるには
- 趣味のプロジェクトから始める
- 習慣づけ
- 命名規則の導入
- ちびちび実行。コードを書いたらBlack実行
- ◎レビューまたは鑑賞 - 他人に見てもらう。他人のコードを読む。
- 『忙しい研究者のためのテストコードとドキュメントの書き方 - Qiita』
この後の私のトーク『データサイエンスのためのリーダブルコードのススメ』のスライドです。ご査収下さい。 #StaPy https://t.co/x1zRJDQ8Oq
— Yuta Kanzawa (@yutakanzawa) 2021年1月13日
Python+Tesseract OCRで文字認識 渡邊亘@リーディング・エッジ社
- テッサラクト
- オープンソースのOCRエンジン
- コマンドラインのI/Fを持つ
- 画像を前処理してからTesseract
- Tesseract at UB Mannheim から入手
- Additional script dataで次にチェック
- Japanese script
- Japanese vertical script
- Additional language dataで次にチェック
- Japanese
- Japanese(Vertical)
- Additional script dataで次にチェック
- Python OCRのインストール(pipでインストールできる)
- 使うには
import pyocr
する
『シビックテックで技術者として成長しよう』関 治之@CODE for JAPAN さん
- 関 治之(一般社団法人コード・フォー・ジャパン 代表理事)@hal_sk
- CODE for JAPAN(コミュニティ)
- シビックテック: ともに考え、ともに作ろう
- コロナ禍で色々なアクティビティが生まれた
- なぜシビックテック活動は成長に繋がるのか?
- 面白い人たちとプロジェクトができる
- BADオープンデータ供養寺
データクレンジング。苦労の過程がネタになる。Twitterでバズったおかげで、総務省がPDF でなく CSVでデータを出してくれるようになった。
- BADオープンデータ供養寺
- 世の中の仕組みが学べる
- 衆議院選挙候補者インフォ
- 地図情報を印刷できる紙マップ 災害マップを綺麗に印刷するマップを作った
- 色々な技術が学べる
- 社会的意義を感じられる
- COVID-19 Japan - 新型コロナウイルス対策ダッシュボード #StopCOVID19JP
- 遠隔療養者モニタリングシステム
- 技術者とNPOマッチング
- 楽しい!
- 面白い人たちとプロジェクトができる
- 質疑応答
成果、気づき
- 関さん、活動のことを始終とても楽しそうに話されていたのが印象に残った。