dalle-playground - DALL-E Miniを使用し、OpenAIのDALL-Eに基づいてテキストプロンプトから画像を生成するための遊び場https://openai.com/blog/dall-e/

(A playground to generate images from any text prompt using DALL-E Mini and based on OpenAI's DALL-E https://openai.com/blog/dall-e/)

Created at: 2021-09-13 18:35:50
Language: JavaScript
License: MIT

ダリ

DALL-Eプレイグラウンド

DALL-E MiniをベースにしたOpenAIのDALL-Eのオープンソースバージョンをいじくり回す、DALL-E愛好家のための遊び場。

https://user-images.githubusercontent.com/6180201/136710500-8bb01b4c-5741-4007-a8ea-e18ba5895649.mp4

速い使用法

Githubでホストされているフロントエンドを使用して、DALL-Eプレイグラウンドをいじくり回すことができます。次の手順を実行します:

  1. GoogleColabを使用してDALL-Eバックエンドを実行するColabで開く
  2. 最後に実行されたセルからURLをコピーします。次の行を探します
    your url is: https://XXXX.loca.lt
  3. バックエンドが完全にロードされるのを待ちます。これには約2分かかり、次のように表示されます。
    --> DALL-E Server is up and running!
  4. https://saharmor.github.io/dalle-playground/?backendUrl=https://XXXX.loca.ltを参照します。ここで、
    backendUrl
    クエリパラメーターは前の手順のURLである必要があります

一般的な注意:GoogleColabの無料利用枠でDALL-EMiniバックエンドを実行することは可能ですが、1〜2を超える画像を生成するには、1分以上かかり、フロントエンドのタイムアウトが発生します。Colab Proにアップグレードするか、より強力なMLマシン(AWS EC2など)でバックエンドノートブックを実行することを検討してください。

DALL-EMegaの使用

DALL-E Megaは、DALL-E Miniよりも大幅に機能が優れているため、より忠実な画像を生成します。Google Colab Pro +サブスクリプションを使用するか、強力なローカルマシンを使用することでコンピューティング能力を備えている場合は、colabノートブックでDALL-E Megaモデルを選択するか、

Mega
または
Mega_full
パラメータを使用してバックエンドを実行します。
python dalle-playground/backend/app.py 8000 mega

ローカル開発

DALL-Eプレイグラウンドをローカルで複製して実行する場合は、次の手順に従ってください。

  1. このリポジトリのクローンまたはフォーク
  2. 仮想環境を作成する
    cd backend && python3 -m venv ENV_NAME
  3. インストール要件
    pip install -r requirements.txt
  4. pytorchとその依存関係がインストールされていることを確認してくださいインストールガイド
  5. Webサーバーを実行します
    python app.py 8080
    (8080から独自のポートに変更できます)
  6. 別の端末で、フロントエンドのモジュール
    cd interface && npm install
    をインストールして実行します
    npm start
  7. 手順5のバックエンドのURLをコピーして、ウェブアプリ内のバックエンドのURL入力に貼り付けます

Docker-composeを使用したローカル開発

  1. DockerとNVIDIAContainerToolkitがインストールされていることを確認してください

  2. このリポジトリのクローンまたはフォーク

  3. サーバーを起動し、バックグラウンドで実行する場合は

    docker-compose up
    に追加
    -d
    します
    docker-compose up

  4. 初回は、画像、モデル、その他の依存関係をダウンロードするのに少し時間がかかります。モデルおよびその他の依存関係は一度だけダウンロードされ、その後キャッシュされます。

  5. 手順2からバックエンドのURLをコピーし、Webアプリ内のバックエンドのURL入力に貼り付けます。

    webapp at

    http://localhost:3000/dalle-playground

謝辞

このリポジトリは、 BorisDaymaのDALL-EMiniリポジトリのフルスタックフレーバーです。