ColossalAI - Colossal-AI:ビッグモデル時代の統合ディープラーニングシステム

(Colossal-AI: A Unified Deep Learning System for Big Model Era)

Created at: 2021-10-29 00:19:44
Language: Python
License: Apache-2.0

巨大なAI

ロゴ

Colossal-AI:ビッグモデル時代の統合ディープラーニングシステム

論文|ドキュメンテーション|次に例を示します|フォーラム|ブログ

建てる ドキュメンテーション コードファクター ハギングフェイスバッジ スラックバッジ 微信バッジ

|英語|中文|

最新ニュース

目次

なぜ巨大なAIなのか

ジェームズ・デメル教授(カリフォルニア大学バークレー校):巨大なAIは、AIモデルのトレーニングを効率的、簡単、スケーラブルにします。

(一番上に戻る)

顔立ち

Colossal-AIは、並列コンポーネントのコレクションを提供します。私たちはあなたがあなたを書くのをサポートすることを目指しています 分散ディープラーニングモデルは、ラップトップでモデルを作成する方法と同じです。キックスタートするためのユーザーフレンドリーなツールを提供します 数行で分散されたトレーニングと推論。

(一番上に戻る)

パラレルトレーニングのデモ

ViT

  • バッチサイズが 14 倍大きく、テンソル並列処理のトレーニングが 5 倍高速 = 64

GPT-3

  • GPU リソースを 50% 、アクセラレーションを 10.7% 削減

GPT-2

  • GPUメモリ消費量を11倍削減し、テンソル並列処理による超線形スケーリング効率

  • 同じハードウェアで24倍のモデルサイズ
  • 3倍以上の加速

バート

  • トレーニングが 2 倍速く、シーケンスの長さが 50% 長くなる

手のひら

選ぶ

詳細については、ドキュメントをご覧ください。

レコメンデーションシステムモデル

  • キャッシュ埋め込みでは、ソフトウェア キャッシュを利用して、より小さな GPU メモリ バジェットでより大きな埋め込みテーブルをトレーニングします。

(一番上に戻る)

シングルGPUトレーニングのデモ

GPT-2

  • 同じハードウェアで20倍のモデルサイズ

  • 同じハードウェアで120倍大きいモデルサイズ(RTX 3080)

手のひら

  • 同じハードウェアで34倍のモデルサイズ

(一番上に戻る)

推論 (エネルゴン AI) デモ

  • Energon-AI:同じハードウェアで50%の推論アクセラレーション

  • OPTサービング:1,750億パラメータのOPTオンラインサービスを登録なしで無料でお試しください。

(一番上に戻る)

現実世界の巨大なAI

アイティッカー

安定拡散などのAIGC(AI生成コンテンツ)モデルの高速化

  • Colossal-AIによる安定した拡散:6.5倍高速なトレーニングと事前トレーニングのコスト削減、微調整のハードウェアコストはほぼ7倍安くなります(RTX3090 / 4090からRTX3050 / 2070まで)

(一番上に戻る)

生物 医学

アルファフォールドタンパク質構造の加速

  • FastFold:GPUクラスターでのトレーニングと推論の高速化、より高速なデータ処理、10000を超える残基を含む推論シーケンス。

  • xTrimoMultimer:タンパク質モノマーおよび多量体の構造予測を11倍高速化します。

(一番上に戻る)

Installation

Download From Official Releases

You can visit the Download page to download Colossal-AI with pre-built CUDA extensions.

Download From Source

The version of Colossal-AI will be in line with the main branch of the repository. Feel free to raise an issue if you encounter any problem. :)

git clone https://github.com/hpcaitech/ColossalAI.git
cd ColossalAI

# install dependency
pip install -r requirements/requirements.txt

# install colossalai
pip install .

If you don't want to install and enable CUDA kernel fusion (compulsory installation when using fused optimizer):

NO_CUDA_EXT=1 pip install .

(back to top)

Use Docker

Pull from DockerHub

You can directly pull the docker image from our DockerHub page. The image is automatically uploaded upon release.

Build On Your Own

Run the following command to build a docker image from Dockerfile provided.

Building Colossal-AI from scratch requires GPU support, you need to use Nvidia Docker Runtime as the default when doing . More details can be found here. We recommend you install Colossal-AI from our project page directly.

docker build

cd ColossalAI
docker build -t colossalai ./docker

次のコマンドを実行して、Docker コンテナーを対話モードで起動します。

docker run -ti --gpus all --rm --ipc=host colossalai bash

(一番上に戻る)

コミュニティ

フォーラムSlackWeChatを使用して、提案、フィードバック、質問をエンジニアリングチームと共有します。

貢献

このプロジェクトへの貢献を希望する場合は、貢献のガイドラインに従ってください。

私たちの素晴らしい貢献者のすべてに感謝します!

寄稿者のアバターの順序はランダムにシャッフルされます。

(一番上に戻る)

私たちを引用する

@article{bian2021colossal,
  title={Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training},
  author={Bian, Zhengda and Liu, Hongxin and Wang, Boxiang and Huang, Haichen and Li, Yongbin and Wang, Chuanrui and Cui, Fan and You, Yang},
  journal={arXiv preprint arXiv:2110.14883},
  year={2021}
}

(一番上に戻る)