機械学習ブックキャンプ
MachineLearningBookcampブックのコード
便利なリンク:
機械学習Zoomcamp

機械学習Zoomcampは、この本に基づいたコースです
読書計画

チャプター
第1章:機械学習の概要
- 機械学習とそれが解決できる問題を理解する
- CRISP-DM:成功する機械学習プロジェクトの整理
- 機械学習モデルのトレーニングと選択
- モデル検証の実行
コードなし
第2章:回帰のための機械学習
- 線形回帰モデルを使用した自動車価格予測プロジェクトの作成
- Jupyterノートブックを使用して最初の探索的データ分析を行う
- 検証フレームワークの設定
- 線形回帰モデルを最初から実装する
- モデルの単純な特徴エンジニアリングの実行
- 正則化によりモデルを制御下に保つ
- モデルを使用して車の価格を予測する
コード:chapter-02-car-price / 02-carprice.ipynb
第3章:分類のための機械学習
- ロジスティック回帰で解約する顧客を予測する
- 重要な機能を特定するための探索的データ分析の実行
- 機械学習モデルで使用するためのカテゴリ変数のエンコード
- 分類にロジスティック回帰を使用する
コード:chapter-03-churn-prediction / 03-churn.ipynb
第4章:分類のための評価指標
- 二項分類モデルとその限界を評価する方法としての精度
- 混同表を使用して、モデルが間違いを犯す場所を特定する
- 適合率や混同表からの再現率などの他の指標の導出
- ROCとAUCを使用して、二項分類モデルのパフォーマンスをさらに理解する
- モデルが最適に動作することを確認するための相互検証
- 最高の予測パフォーマンスを達成するためのモデルのパラメーターの調整
コード:chapter-03-churn-prediction / 04-metrics.ipynb
第5章:機械学習モデルの導入
- Pickleでモデルを保存する
- Flaskでモデルを提供
- Pipenvによる依存関係の管理
- Dockerを使用してサービスを自己完結型にする
- AWSElasticBeanstalkを使用してクラウドにデプロイする
コード:chapter-05-デプロイメント
第6章:決定木とアンサンブル学習
- ツリーベースのモデルによるデフォルトのリスクの予測
- デシジョンツリーとデシジョンツリー学習アルゴリズム
- ランダムフォレスト:複数の木を1つのモデルにまとめる
- デシジョンツリーを組み合わせる代替方法としての勾配ブースティング
コード:chapter-06-trees / 06-trees.ipynb
第7章:ニューラルネットワークとディープラーニング
- 画像分類のための畳み込みニューラルネットワーク
- TensorFlowとKeras—ニューラルネットワークを構築するためのフレームワーク
- 事前にトレーニングされたニューラルネットワークを使用する
- 畳み込みニューラルネットワークの内部
- 転移学習によるモデルのトレーニング
- データ拡張—より多くのトレーニングデータを生成するプロセス
コード:chapter-07-neural-nets / 07-neural-nets-train.ipynb
第8章:サーバーレスディープラーニング
- TensorFlow-Liteを使用したモデルの提供—TensorFlowモデルを適用するための軽量環境
- AWSLambdaを使用したディープラーニングモデルのデプロイ
- APIGatewayを介してLambda関数をWebサービスとして公開する
コード:chapter-08-サーバーレス
第9章:KubernetesとKubeflow
Kubernetes:
- クラウドでモデルをデプロイして提供するさまざまな方法を理解する。
- TensorFlowを使用したKerasおよびTensorFlowモデルのサービング-サービング
- TensorFlowのデプロイ-Kubernetesへのサービング
コード:chapter-09-kubernetes
Kubeflow:
- デプロイプロセスを簡素化するためのKubeflowとKFServingの使用
コード:chapter-09-kubeflow
mlbookcamp.comからの記事:
付録
付録A:環境のセットアップ
- 必要な科学ライブラリのほとんどを含むPythonディストリビューションであるAnacondaをインストールする
- リモートマシンからJupyterNotebookサービスを実行する
- KaggleからデータセットにアクセスするためのKaggleコマンドラインインターフェイスツールのインストールと構成
- Webインターフェースとコマンドラインインターフェースを使用してAWSでEC2マシンを作成する
コード:コードなし
mlbookcamp.comからの記事:
付録B:Pythonの概要
- 基本的なPython構文:変数と制御フロー構造
- コレクション:リスト、タプル、セット、および辞書
- リスト内包表記:コレクションを操作する簡潔な方法
- 再利用性:関数、クラス、およびコードのインポート
- パッケージ管理:ライブラリのインストールにpipを使用
- Pythonスクリプトの実行
コード:appendix-b-python.ipynb
mlbookcamp.comからの記事:
付録C:NumPyと線形代数の概要
- 1次元および2次元のNumPy配列
- NumPy配列をランダムに生成する
- NumPy配列を使用した操作:要素ごとの操作、要約操作、並べ替え、フィルタリング
- 線形代数の乗算:ベクトル-ベクトル、行列-ベクトル、行列-行列の乗算
- 行列の逆行列を見つけて正規方程式を解く
コード:appendix-c-numpy.ipynb
mlbookcamp.comからの記事:
付録C:パンダの紹介
- パンダの主なデータ構造:DataFrameとSeries
- DataFrameの行と列へのアクセス
- 要素ごとの要約操作
- 不足している値の操作
- 並べ替えとグループ化
コード:appendix-d-pandas.ipynb
付録D:AWS SageMaker
- GPUクォータ制限の増加
- AWSSageMakerでGPUを使用してJupyterノートブックをレンタルする