Data-Science-For-Beginners - 10週間、20レッスン、すべての人にデータサイエンスを!

(10 Weeks, 20 Lessons, Data Science for All!)

Created at: 2021-03-04 00:30:15
Language: Jupyter Notebook
License: MIT

初心者のためのデータサイエンス - カリキュラム

GitHub コードスペースで開く

GitHub ライセンス GitHub の貢献者 GitHub の問題 GitHub プルリクエスト PR歓迎

GitHub ウォッチャー GitHub フォーク GitHub の星

マイクロソフトの Azure クラウド アドボケイトは、データ サイエンスに関する 10 週間、20 レッスンのカリキュラムを提供できることを嬉しく思います。各レッスンには、レッスン前とレッスン後のクイズ、レッスンを完了するための書面による指示、解決策、および課題が含まれています。私たちのプロジェクトベースの教育法は、新しいスキルを「定着」させるための実証済みの方法を構築しながら学ぶことを可能にします。

著者に心から感謝します:ジャスミン・グリーナウェイドミトリー・ソシュニコフニティア・ナラシムハンジェイレン・マギージェン・ルーパーモード・レヴィティファニー・スーター、クリストファー・ハリソン

🙏 🙏 マイクロソフト学生アンバサダーの著者、レビュー担当者、コンテンツ寄稿者、特にアーリアン・アローラ、アディティア・ガルグ、アロンドラ・サンチェスアンキタ・シン、アヌパム・ミシュラ、アルピタ・ダス、チャイル・ビハリ・デュベイ、ディブリ・ンソフォーディシタ・バシン、マジド・サフィマックス・ブルムミゲル・コレア、モハマ・イフテヘル(イフトゥ)・エブネ・ジャラルに感謝します。 ナウリン・タバスムレイモンド・ワンサ・プトラロヒト・ヤダブ、サムリディ・シャルマ、サーニャ・シンハシーナ・ナルラ、タウキール・アフマド、ヨゲンドラシン・パワル、ヴィドゥシ・グプタジャスリーン・ソンディ

スケッチノート (@sketchthedocs)
初心者のためのデータサイエンス - @nityaによるスケッチノート

あなたは学生ですか?

次のリソースの使用を開始します。

  • 学生ハブページこのページでは、初心者向けリソース、学生パック、さらには無料の証明書バウチャーを取得する方法を見つけることができます。これは、少なくとも毎月コンテンツを切り替えるときにブックマークして時々チェックしたいページの1つです。
  • マイクロソフト ラーニング 学生アンバサダー学生アンバサダーのグローバル コミュニティに参加すれば、マイクロソフトへの道が決まるかもしれません。

はじめ

教師:このカリキュラムの使用方法に関するいくつかの提案が含まれていますディスカッションフォーラムでフィードバックをお待ちしております。

学生:このカリキュラムを自分で使用するには、リポジトリ全体をフォークし、講義前のクイズから始めて、自分で演習を完了します。その後、講義を読み、残りの活動を完了します。ソリューションコードをコピーするのではなく、レッスンを理解してプロジェクトを作成してみてください。ただし、そのコードは、各プロジェクト指向レッスンの /Solutions フォルダーにあります。別のアイデアは、友達と研究グループを形成し、一緒にコンテンツを確認することです。さらに学習するには、マイクロソフトラーンをお勧めします。

チームに会う

プロモーションビデオ

モヒット・ジャイサルによるギフ

🎥上の画像をクリックすると、プロジェクトを作成した人々についてのビデオが表示されます。

教育学

このカリキュラムを構築する際に、プロジェクトベースであることと頻繁なクイズが含まれていることを確認するという2つの教育的信条を選択しました。このシリーズの終わりまでに、学生は倫理的概念、データ準備、データのさまざまな操作方法、データの視覚化、データ分析、データサイエンスの実際のユースケースなど、データサイエンスの基本原則を学びます。

さらに、授業前の低ステークスクイズはトピックの学習に向けた生徒の意図を設定し、授業後の10番目のクイズはさらなる保持を保証します。このカリキュラムは、柔軟で楽しいように設計されており、全体または一部を受講することができます。プロジェクトは小規模に始まり、<>週間のサイクルの終わりまでにますます複雑になります。

行動規範貢献翻訳のガイドラインをご覧ください。建設的なフィードバックをお待ちしております。

各レッスンの内容:

  • オプションのスケッチノート
  • オプションの補足ビデオ
  • レッスン前のウォームアップクイズ
  • 筆記レッスン
  • プロジェクトベースのレッスンについては、プロジェクトの構築方法に関するステップバイステップガイド
  • 知識チェック
  • 課題
  • 補足資料
  • 割り当て
  • レッスン後のクイズ

クイズに関する注意:すべてのクイズがこのアプリに含まれており、それぞれ40つの質問の合計<>のクイズがあります。それらはレッスン内からリンクされていますが、クイズアプリはローカルで実行できます。フォルダ内の指示に従います。それらは徐々にローカライズされています。

quiz-app

レッスン

スケッチノート (@sketchthedocs)
初心者のためのデータサイエンス:ロードマップ-@nityaによるスケッチノート
レッスン番号 話題 レッスンのグループ化 学習の目的 リンクされたレッスン 著者
01 データ・サイエンスの定義 紹介 データ サイエンスの背後にある基本的な概念と、それが人工知能、機械学習、ビッグ データとどのように関連しているかについて説明します。 レッスン動画 ドミトリー
02 データサイエンス倫理 紹介 Data Ethics Concepts, Challenges & Frameworks. レッスン ニティア
03 データの定義 紹介 データの分類方法とその一般的なソース。 レッスン ジャスミン
04 統計と確率入門 紹介 データを理解するための確率と統計の数学的手法。 レッスン動画 ドミトリー
05 リレーショナル データの操作 データの操作 リレーショナル データの概要と、構造化照会言語 ("see-quell" と発音) を使用したリレーショナル データの探索と分析の基本について説明します。 レッスン クリストファー
06 NoSQL データの操作 データの操作 非リレーショナル データの概要、そのさまざまな種類、およびドキュメント データベースの探索と分析の基本。 レッスン ジャスミン
07 パイソンでの作業 データの操作 Panda などのライブラリを使用したデータ探索に Python を使用するための基本事項。Python プログラミングの基礎を理解することをお勧めします。 レッスン動画 ドミトリー
08 データ準備 データの操作 データの欠落、不正確、または不完全な課題を処理するためにデータをクリーニングおよび変換するためのデータ手法に関するトピック。 レッスン ジャスミン
09 数量の視覚化 データビジュアライゼーション Matplotlib を使用して鳥のデータを🦆視覚化する方法を学ぶ レッスン ジェン
10 データの分布の可視化 データビジュアライゼーション 間隔内の観測と傾向を視覚化します。 レッスン ジェン
11 比率の視覚化 データビジュアライゼーション 不連続およびグループ化されたパーセンテージを視覚化します。 レッスン ジェン
12 関係の視覚化 データビジュアライゼーション データセットとその変数間の接続と相関関係を視覚化します。 レッスン ジェン
13 意味のあるビジュアライゼーション データビジュアライゼーション ビジュアライゼーションを効果的な問題解決と洞察のために価値のあるものにするためのテクニックとガイダンス。 レッスン ジェン
14 データサイエンスライフサイクルの概要 ライフサイクル データサイエンスライフサイクルの概要と、データを取得および抽出する最初のステップ。 レッスン ジャスミン
15 分析 ライフサイクル データ サイエンス ライフサイクルのこのフェーズでは、データを分析するための手法に焦点を当てます。 レッスン ジャスミン
16 通信 ライフサイクル データ サイエンス ライフサイクルのこのフェーズでは、意思決定者が理解しやすい方法でデータからの分析情報を提示することに重点を置いています。 レッスン ジェイレン
17 クラウドにおけるデータサイエンス クラウドデータ この一連のレッスンでは、クラウドのデータ サイエンスとその利点を紹介します。 レッスン ティファニーモード
18 クラウドにおけるデータサイエンス クラウドデータ ローコードツールを使用したモデルのトレーニング。 レッスン ティファニーモード
19 クラウドにおけるデータサイエンス クラウドデータ Azure Machine Learning Studio を使用したモデルのデプロイ。 レッスン ティファニーモード
20 野生のデータサイエンス 野生で 現実世界でのデータサイエンス主導のプロジェクト。 レッスン ニティア

GitHub コードスペース

以下のステップに従って、このサンプルをコードスペースで開きます。

  1. [コード] ドロップダウン メニューをクリックし、[コードスペースで開く] オプションを選択します。
  2. ウィンドウの下部にある [+ 新しいコードスペース] を選択します。 詳細については、GitHub のドキュメントを参照してください。

VSCode リモート - コンテナ

次の手順に従って、ローカル コンピューターを使用してコンテナーでこのリポジトリを開き、VS Code リモート - コンテナー拡張機能を使用して VSCode を開きます。

  1. 開発コンテナを初めて使用する場合は、システムが入門ドキュメントの前提条件を満たしていることを確認してください(つまり、Dockerがインストールされている)。

このリポジトリを使用するには、分離された Docker ボリュームでリポジトリを開きます。

:内部では、リモートコンテナ:コンテナボリューム内のリポジトリのクローン...コマンドを使用して、ローカルファイルシステムではなくDockerボリュームにソースコードをクローンします。ボリュームは、オブジェクトデータを永続化するための推奨されるメカニズムです。

または、ローカルでクローンまたはダウンロードしたバージョンのリポジトリを開きます。

  • このリポジトリをローカルファイルシステムにクローンします。
  • F1 キーを押して、[リモート コンテナー: コンテナー内のフォルダーを開く] コマンドを選択します。
  • このフォルダーの複製されたコピーを選択し、コンテナーが起動するのを待ってから、試してみてください。

オフライン アクセス

このドキュメントは、Docsify を使用してオフラインで実行できます。このリポジトリをフォークし、ローカル コンピューターに Docsify をインストールしてから、このリポジトリのルート フォルダーに次のように入力します。ウェブサイトはあなたのローカルホストのポート3000で提供されます:。

docsify serve
localhost:3000

ノートブックは Docsify を介してレンダリングされないため、ノートブックを実行する必要がある場合は、Python カーネルを実行している VS Code で個別に実行します。

ヘルプ募集!

カリキュラムの全部または一部を翻訳したい場合は、翻訳ガイドに従ってください

その他のカリキュラム

私たちのチームは他のカリキュラムを作成します!チェックアウト: