The-Kaggle-Book - PacktPublishingが発行したKaggleBookのコードリポジトリ

(Code Repository for The Kaggle Book, Published by Packt Publishing)

Created at: 2021-09-15 17:44:20
Language: Jupyter Notebook
License: MIT

Kaggleブック

競争力のあるデータサイエンスのためのデータ分析と機械学習

PacktPublishingが発行したKaggleBookのコードリポジトリ

「LucaとKonradの本は、Kaggleをさらにアクセスしやすくするのに役立ちます。彼らは、Kaggleコミュニティのトップランクのユーザーであり、尊敬されているメンバーです。この本を完成させる人は、Kaggleに自信を持って取り組むことができ、Kaggleに自信を持って取り組むことができると期待する必要があります。多くの報酬があります。」 —Kaggleの創設者兼CEOであるAnthonyGoldbloom

主な機能

  • Kaggleの仕組みと、2人のエキスパートKaggleグランドマスターからの競争を最大限に活用する方法を学びましょう
  • アンサンブル、特徴工学、敵対的検証、AutoML、転移学習、およびパラメーター調整の手法を使用して、モデリングスキルを磨きます。
  • 表形式のデータ、ビジョン、自然言語、シミュレーション、最適化に関する問題に挑戦してください
  • Kaggleで優れた結果を得て、より優れたデータサイエンティストになるためのヒント、コツ、ベストプラクティスをご覧ください
  • 31人のKaggleマスターとグランドマスターのインタビューを読んで、彼らの経験とヒントについて語ってください

スマートデータ処理およびモデリング技術の簡潔なコレクションで、競合他社に一歩先んじてください

本の説明

世界中の何百万人ものデータ愛好家が、その中で最も有名なデータサイエンスの競争プラットフォームであるKaggleで競争しています。Kaggleのコンテストに参加することは、データ分析スキルを向上させ、コミュニティの他のメンバーとネットワークを築き、キャリアの成長に役立つ貴重な経験を積むための確実な方法です。

この種の最初の本であるKaggleを使用したデータ分析と機械学習では、競技会やデータサイエンスプロジェクトなどで成功するために必要な技術とスキルをまとめています。Kaggleの2人のマスターが、他では簡単に見つけられないモデリング戦略と、その過程で蓄積された暗黙知について説明します。Kaggle固有のヒントに加えて、画像データ、表形式データ、テキストデータ、強化学習に基づいてタスクに取り組むためのより一般的な手法を学習します。より優れた検証スキームを設計し、さまざまな評価指標をより快適に使用できるようになります。

Kaggleのランクを上げたい場合でも、データサイエンスのスキルをさらに高めたい場合でも、既存のモデルの精度を向上させたい場合でも、この本はあなたにぴったりです。

あなたが学ぶこと

  • Kaggleやその他の競争プラットフォームに精通する
  • Kaggleノートブック、データセット、ディスカッションフォーラムを最大限に活用する
  • バイナリおよびマルチクラス分類、オブジェクト検出、NLP(自然言語処理)、時系列など、さまざまなモデリングタスクを理解します
  • 優れた検証スキームを設計し、k倍、確率的、および敵対的な検証について学習します
  • MSEとそのバリアント、適合率と再現率、IoU、kでの平均平均精度、およびこれまでにないメトリックを含む評価メトリックを把握します。
  • Kaggleでシミュレーションと最適化の競争を処理する
  • プロジェクトとアイデアのポートフォリオを作成して、キャリアをさらに伸ばしましょう

この本は誰のためのものですか

この本は、Kaggleのユーザーと、データサイエンスのトピックとPythonに少なくとも基本的な知識を持ち、Kaggleのコンテストでより良い成果を上げ、テクノロジーの巨人との仕事を確保しようとしているデータアナリスト/科学者に適しています。この本の完成時点で、96,190人のKaggle初心者(Webサイトに登録したばかりのユーザー)と67,666人のKaggle寄稿者(プロフィールを入力したばかりのユーザー)がKaggleコンテストに参加しています。この本は、それらすべてを念頭に置いて、そして氷を壊してKaggleのコンテストに参加し、それらから学び始めたいと思っている他の人を対象に書かれています。

目次

パート1

  1. Kaggleおよびその他のデータサイエンスコンテストの紹介
  2. データセットを使用したデータの整理
  3. Kaggleノートブックでの作業と学習
  4. ディスカッションフォーラムの活用

パート2

  1. 競争タスクとメトリクス
  2. 優れた検証の設計
  3. 表形式の競争のためのモデリング
  4. ハイパーパラメータの最適化
  5. ブレンディングおよびスタッキングソリューションを使用したアンサンブル
  6. コンピュータビジョンのモデリング
  7. NLPのモデリング
  8. シミュレーションと最適化の競争

パート3

  1. プロジェクトとアイデアのポートフォリオを作成する
  2. 新しい専門的な機会を見つける