mlbookcamp-code - Machine Learning Bookcamp ブックのコードと、そのブックに基づく無料コース

(The code from the Machine Learning Bookcamp book and a free course based on the book)

Created at: 2020-04-17 12:29:23
Language: Jupyter Notebook

機械学習ブックキャンプ

Machine Learning Bookcamp book のコード

便利なリンク:

  • https://mlbookcamp.com : 補足資料
  • https://datatalks.club : データについて話す場所 (および書籍:
    #ml-bookcamp
    チャネルに参加して、書籍に関する質問をしたり、問題を報告したりします)

機械学習 Zoomcamp

Machine Learning Zoomcamp は本に基づいたコースです

  • オンラインで無料です
  • いつでも参加できます
  • course-zoomcampフォルダの詳細

読書計画

第 1 章: 機械学習の概要

  • 機械学習とそれが解決できる問題を理解する
  • CRISP-DM: 成功する機械学習プロジェクトの編成
  • 機械学習モデルのトレーニングと選択
  • モデル検証の実行

コードなし

第 2 章: 回帰のための機械学習

  • 線形回帰モデルを使用した自動車価格予測プロジェクトの作成
  • Jupyter ノートブックを使用して最初の探索的データ分析を行う
  • 検証フレームワークの設定
  • 線形回帰モデルをゼロから実装する
  • モデルの単純な機能エンジニアリングの実行
  • 正則化によるモデルの管理
  • モデルを使用して自動車の価格を予測する

コード: chapter-02-car-price/02-carprice.ipynb

第 3 章: 分類のための機械学習

  • ロジスティック回帰で解約する顧客を予測する
  • 重要な機能を特定するための探索的データ分析の実行
  • 機械学習モデルで使用するためのカテゴリ変数のエンコード
  • 分類にロジスティック回帰を使用する

コード: chapter-03-churn-prediction/03-churn.ipynb

第 4 章: 分類の評価指標

  • バイナリ分類モデルとその限界を評価する方法としての精度
  • 混同表を使用して、モデルがどこで間違いを犯したかを判断する
  • 混同表から適合率や再現率などの他の指標を導き出す
  • ROC と AUC を使用して、バイナリ分類モデルのパフォーマンスをさらに理解する
  • モデルを相互検証して最適に動作することを確認する
  • モデルのパラメーターを調整して、最高の予測パフォーマンスを達成する

コード: chapter-03-churn-prediction/04-metrics.ipynb

第 5 章: 機械学習モデルの展開

  • モデルを Pickle で保存する
  • Flask を使用したモデルの提供
  • Pipenv による依存関係の管理
  • Docker を使用してサービスを自己完結型にする
  • AWS Elastic Beanstalk を使用してクラウドにデプロイする

コード: chapter-05-deployment

第6章: 決定木とアンサンブル学習

  • ツリーベースのモデルでデフォルトのリスクを予測する
  • 決定木と決定木学習アルゴリズム
  • ランダム フォレスト: 複数のツリーを 1 つのモデルにまとめる
  • 決定木を組み合わせる代替方法としての勾配ブースティング

コード: chapter-06-trees/06-trees.ipynb

第 7 章: ニューラル ネットワークとディープ ラーニング

  • 画像分類のための畳み込みニューラル ネットワーク
  • TensorFlow と Keras — ニューラル ネットワークを構築するためのフレームワーク
  • 事前トレーニング済みのニューラル ネットワークの使用
  • 畳み込みニューラル ネットワークの内部
  • 転移学習によるモデルのトレーニング
  • データ拡張 — より多くのトレーニング データを生成するプロセス

コード: chapter-07-neural-nets/07-neural-nets-train.ipynb

第 8 章: サーバーレス深層学習

  • TensorFlow-Lite を使用したモデルの提供 — TensorFlow モデルを適用するための軽量環境
  • AWS Lambda を使用した深層学習モデルのデプロイ
  • API Gateway を介して Lambda 関数を Web サービスとして公開する

コード: chapter-08-serverless

第9章: Kubernetes と Kubeflow

Kubernetes:

  • クラウドでモデルをデプロイおよび提供するさまざまな方法を理解する。
  • TensorFlow-Serving を使用した Keras および TensorFlow モデルの提供
  • TensorFlow-Serving を Kubernetes にデプロイする

コード: chapter-09-kubernetes

キューブフロー:

  • Kubeflow と KFServing を使用して展開プロセスを簡素化する

コード: chapter-09-kubeflow

mlbookcamp.comの記事:

付録

付録 A: 環境の設定

  • 必要な科学ライブラリのほとんどを含む Python ディストリビューションである Anaconda のインストール
  • リモート マシンから Jupyter Notebook サービスを実行する
  • Kaggle からデータセットにアクセスするための Kaggle コマンドライン インターフェイス ツールのインストールと構成
  • Web インターフェイスとコマンドライン インターフェイスを使用して AWS で EC2 マシンを作成する

コード: コードなし

mlbookcamp.comの記事:

付録 B: Python の紹介

  • 基本的な Python 構文: 変数と制御フロー構造
  • コレクション: リスト、タプル、セット、辞書
  • リスト内包表記: コレクションを操作する簡潔な方法
  • 再利用性: 関数、クラス、およびコードのインポート
  • パッケージ管理: ライブラリのインストールに pip を使用する
  • Python スクリプトの実行

コード: appendix-b-python.ipynb

mlbookcamp.comの記事:

付録 C: NumPy と線形代数の紹介

  • 1 次元および 2 次元の NumPy 配列
  • NumPy 配列をランダムに生成する
  • NumPy 配列を使用した操作: 要素単位の操作、集計操作、並べ替えとフィルター処理
  • 線形代数の乗算: ベクトル-ベクトル、行列-ベクトル、および行列-行列の乗算
  • 逆行列を見つけて正規方程式を解く

コード: appendix-c-numpy.ipynb

mlbookcamp.comの記事:

付録 C: パンダの紹介

  • Pandas の主なデータ構造: DataFrame と Series
  • DataFrame の行と列へのアクセス
  • 要素ごとの要約操作
  • 欠損値の操作
  • 並べ替えとグループ化

コード: appendix-d-pandas.ipynb

付録 D: AWS SageMaker

  • GPU クォータ制限の引き上げ
  • AWS SageMaker で GPU を搭載した Jupyter ノートブックをレンタルする