deep-rl-class - このリポジトリには、Hugging Face Deep ReinforcementLearningClassのシラバスが含まれています。

(This repo contain the syllabus of the Hugging Face Deep Reinforcement Learning Class.)

Created at: 2022-04-21 18:19:17
Language: Jupyter Notebook

抱きしめる顔の深層強化学習クラス🤗

この無料コースでは、次のことを行います。

  • 📖理論と実践で深層強化学習を研究します。
  • 🧑‍💻Stable Baselines3、RL Baselines3 Zoo、RLlibなどの有名なDeepRLライブラリの使用方法を学びます。
  • 🤖SnowballFight、HuggytheDoggoなどのユニークな環境でエージェントをトレーニングします🐶、およびスペースインベーダーやPyBulletなどの古典的なもの。
  • 💾 トレーニングを受けたエージェントを1行のコードでHuggingFaceHubに公開します。ただし、コミュニティから強力なエージェントをダウンロードすることもできます。
  • 🏆 他のチームに対してエージェントを評価するチャレンジに参加します。
  • 🖌️🎨 UnityとGodotで作成された独自の環境を共有する方法を学びます

➡️➡️➡️ここでサインアップすることを忘れないでください:https ://forms.gle/4bbgzs3oVZMjgDed7

連絡を取り合うための最良の方法は、私たちの不和サーバーに参加して、コミュニティや私たちと交換することです👉🏻https ://discord.gg/aYka4Yhff9

Discordは初めてですか?ベストプラクティスを取得するには、不和101を確認してください 👉 https://github.com/huggingface/deep-rl-class/blob/main/DISCORD.Md

そして、学びたい友達と共有することを忘れないでください🤗

シラバス🏗️

このコースは自分のペースで進められ、好きなときに始めることができます🥳

📆公開日 📘単位 👩‍💻ハンズオン
公開🥳 深層強化学習入門 月に正しく着陸するように深部強化学習着陸船エージェントを訓練する🌕Stable-Baselines3を使用する
5月11日 ボーナス 🎁驚きです🎁
5月18日 Q学習 この新しいバージョンの環境で凍った湖を渡るようにエージェントを訓練します。
6月1日 深いQ学習と改善 スペースインベーダーをプレイするためのディープQラーニングエージェントをトレーニングする
ポリシーベースの方法 🏗️
アクター-批評家の方法 🏗️
プロキシマルポリシー最適化(PPO) 🏗️
意思決定トランスフォーマーとオフライン強化学習 🏗️
より良い探査方法に向けて 🏗️

このコースで学習するライブラリ

使用する環境

UnityとGodotを使用してHuggingFaceTeamによって作成されたカスタム環境

ジムクラシックコントロール環境🕹️

  • 月着陸船v2🚀🌙

lunarlander.gif

PyBullet🤖

  • もっと来る🚧

ジムアタリ環境👾

  • スペースインベーダーズ👾

spaceinvaders.gif

MLAgents環境🖌️

  • もっと来る🚧

前提条件

  • Pythonの優れたスキル🐍
  • ディープラーニングとPytorchの基礎

まだそうでない場合は、次の無料リソースを確認できます。

よくある質問

このクラスは無料ですか?

はい、完全無料🥳

コースをフォローするには、Hugging Faceアカウントが必要ですか?

はい、ハンズオン中にトレーニングを受けたエージェントをプッシュするには、アカウントが必要です(無料です)🤗

ここで作成できます👉 https://huggingface.co/join

クラスの形式は何ですか?

コースは 8ユニットで構成されています。 各ユニットには、次のものがあります。

  • 理論で説明されている部分:記事とビデオ(深層強化学習コースに基づく)
  • Stable Baselines3、RL Baselines3 Zoo、RLlibなどの有名なDeep RLライブラリを使用して、SnowballFight、HuggytheDoggoなどの独自の環境でエージェントをトレーニングする方法を学ぶ実践的なGoogleColab🐶、およびスペースインベーダーやPyBulletなどの古典的なもの。
  • いくつかのオプションの課題:別の環境でエージェントをトレーニングし、結果を打ち負かそうとします。

ライブコースのビデオではないので、好きなときに各ユニットを見て読むことができます🤗 シラバスはこちらで確認できます👉 https://github.com/huggingface/deep-rl-class

このコースで私は何をしますか?

この無料コースでは、次のことを行います。

  • 📖理論と実践で深層強化学習を研究します。
  • 🧑‍💻Stable Baselines3、RL Baselines3 Zoo、RLlibなどの有名なDeepRLライブラリの使用方法を学びます。
  • 🤖SnowballFight、HuggytheDoggoなどのユニークな環境でエージェントをトレーニングします🐶、およびスペースインベーダーやPyBulletなどの古典的なもの。
  • 💾トレーニングを受けたエージェントを1行のコードでハブに公開します。ただし、コミュニティから強力なエージェントをダウンロードすることもできます。
  • 🏆他のチームに対してエージェントを評価するチャレンジに参加します。
  • 🖌️🎨UnityとGodotで作成された独自の環境を共有する方法を学びます。

どこでサインアップしますか?

ここ👉 https://forms.gle/tfa2nUDKxxg8DJAX8

コースはどこにありますか?

このリポジトリでは、毎週リンク(章、ハンズオン、ビデオ)を公開します。

クラスメートやあなたとどこで交換できますか?

コミュニティや私たちと交換できる不和サーバーがあります👉🏻https ://discord.gg/aYka4Yhff9

サインアップするときに自己紹介することを忘れないでください🤗

フィードバックがあります

私たちはあなたのフィードバックでコースを繰り返し改善し、更新したいと思っています。お持ちの場合は、[email protected]にメールを送ってください。

どのくらいの背景知識が必要ですか?

いくつかの前提条件:

Pythonの優れたスキル 🐍ディープラーニングとPytorch の基礎

まだそうでない場合は、次の無料リソースを確認できます。

証明書はありますか?

はい🎉8つのハンズオンで8つのモデルをアップロードする必要があります。