stable-diffusion-webui - 安定した拡散ウェブUI

(Stable Diffusion web UI)

Created at: 2022-08-22 22:05:26
Language: Python

安定した拡散ウェブUI

安定した拡散のためのGradioライブラリに基づくブラウザインターフェイス。

顔立ち

画像付きの詳細な機能ショーケース:

  • オリジナルの txt2img および img2img モード
  • ワンクリックでスクリプトをインストールして実行します(ただし、Pythonとgitをインストールする必要があります)
  • アウトペインティング
  • インペインティング
  • カラースケッチ
  • プロンプトマトリックス
  • 安定した拡散アップスケール
  • 注意、モデルがもっと注意を払うべきテキストの部分を指定します
    • (タキシード)の男-タキシードにもっと注意を払うでしょう
    • A Man in A (Tuxedo:1.21) - 代替構文
    • テキストを選択し、Ctrl + 上または Ctrl + 下キーを押して、選択したテキストへの注意を自動的に調整します (匿名ユーザーによって提供されたコード)
  • ループバック、img2img処理を複数回実行する
  • X / Y / Zプロット、異なるパラメータを持つ画像の3次元プロットを描画する方法
  • テキスト反転
    • 必要な数の埋め込みを用意し、好きな名前を使用します
    • トークンごとに異なるベクトル数を持つ複数の埋め込みを使用する
    • 半精度浮動小数点数で動作します
    • 8GBでの列車の埋め込み(6GBの動作の報告も)
  • エクストラタブ:
    • GFPGAN、顔を修正するニューラルネットワーク
    • コードフォーマー、GFPGANの代替としての顔復元ツール
    • RealESRGAN、ニューラルネットワークアップスケーラー
    • ESRGAN、多くのサードパーティモデルを備えたニューラルネットワークアップスケーラー
    • SwinIR および Swin2SR (ここを参照)、ニューラル ネットワーク アップスケーラー
    • LDSR、潜在拡散超解像アップスケーリング
  • 縦横比のサイズ変更オプション
  • サンプリング方法の選択
    • サンプラーのイータ値を調整する(ノイズ乗数)
    • より高度なノイズ設定オプション
  • いつでも割り込み処理が可能
  • 4GBのビデオカードのサポート(2GBの動作のレポートも)
  • バッチの正しいシード
  • ライブプロンプトトークンの長さの検証
  • 生成パラメータ
    • 画像の生成に使用したパラメータは、その画像と共に保存されます
    • PNGの場合はPNGチャンクで、JPEGの場合はEXIFで
    • 画像をPNG情報タブにドラッグして生成パラメータを復元し、自動的にUIにコピーできます
    • 設定で無効にすることができます
    • 画像/テキストパラメータをプロンプトボックスにドラッグアンドドロップします
  • 生成パラメータの読み取りボタン、プロンプトボックスのパラメータをUIにロード
  • 設定ページ
  • UIから任意のPythonコードを実行する(有効にするには--allow-codeで実行する必要があります)
  • ほとんどの UI 要素のマウスオーバーのヒント
  • テキスト設定を介してUI要素のデフォルト/ミックス/最大/ステップ値を変更可能
  • タイリングのサポート、テクスチャのようにタイル化できる画像を作成するためのチェックボックス
  • プログレスバーとライブ画像生成プレビュー
    • 別のニューラルネットワークを使用して、VRAMやコンピューティング要件がほとんどないプレビューを生成できます
  • ネガティブプロンプト、生成された画像に表示したくないものをリストできる追加のテキストフィールド
  • スタイル、プロンプトの一部を保存し、後でドロップダウンから簡単に適用する方法
  • バリエーション、同じ画像を生成する方法ですが、わずかな違いがあります
  • シードサイズ変更、同じ画像を生成するが、解像度がわずかに異なる方法
  • CLIPインタロゲータ、画像からプロンプトを推測しようとするボタン
  • プロンプト編集、プロンプトを途中で変更する方法、スイカを作り始め、途中でアニメの女の子に切り替えると言う
  • バッチ処理、img2imgを使用してファイルのグループを処理する
  • Img2imgの代替、クロスアテンション制御の逆オイラー法
  • 高解像度の修正、通常の歪みなしでワンクリックで高解像度の画像を生成する便利なオプション
  • チェックポイントをオンザフライでリロードする
  • チェックポイントマージ、最大3つのチェックポイントを<>つにマージできるタブ
  • コミュニティからの多くの拡張機能を持つカスタムスクリプト
  • コンポーザブル拡散、一度に複数のプロンプトを使用する方法
    • 大文字を使用したプロンプトの区切り
      AND
    • プロンプトの重みもサポートしています。
      a cat :1.2 AND a dog AND a penguin :2.2
  • プロンプトのトークン制限なし(元の安定した拡散により、最大75個のトークンを使用できます)
  • DeepDanbooru統合、アニメプロンプト用のdanbooruスタイルのタグを作成します
  • xformers、一部のカードの大幅な速度向上: (コマンドライン引数に --xformers を追加)
  • 拡張機能経由:履歴タブ:UI内で画像を便利に表示、指示、削除します
  • 永久に生成オプション
  • トレーニングタブ
    • ハイパーネットワークと埋め込みオプション
    • 画像の前処理:トリミング、ミラーリング、BRIPまたはディープダンブールを使用した自動タグ付け(アニメ用)
  • クリップスキップ
  • ハイパーネットワーク
  • Loras(ハイパーネットワークと同じですが、よりきれいです)
  • プロンプトに追加する埋め込み、ハイパーネットワーク、またはLorasをプレビューで選択できる余裕のあるUI。
  • 設定画面から別のVAEをロードすることを選択できます
  • 進行状況バーの推定完了時間
  • 原薬
  • RunwayMLによる専用インペインティングモデルのサポート。
  • 拡張機能経由:美的グラデーション、クリップ画像埋め込みを使用して特定の美学を持つ画像を生成する方法(https://github.com/vicgalle/stable-diffusion-aesthetic-gradients の実装)
  • 安定した拡散2.0のサポート - 手順についてはwikiを参照してください
  • 代替拡散のサポート - 手順についてはwikiを参照してください
  • 今、悪い文字はありません!
  • セーフテンソル形式のチェックポイントのロード
  • 解像度制限の緩和:生成された画像の優位性は8ではなく64の倍数でなければなりません
  • 今ライセンスで!
  • 設定画面からUIの要素を並べ替える

インストールと実行

必要な依存関係が満たされていることを確認し、NVidia (推奨) と AMD GPU の両方で利用可能な手順に従ってください。

または、オンラインサービス(Google Colabなど)を使用します。

ウィンドウズへの自動インストール

  1. Python 3.10.6をインストールし、「PythonをPATHに追加」にチェックを入れます。
  2. git をインストールします。
  3. 安定版 (stable-diffusion-webui リポジトリ) をダウンロードするには、例えば を実行します。
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
  4. Windows エクスプローラから、通常、管理者以外のユーザーとして実行します。
    webui-user.bat

Linux への自動インストール

  1. 依存関係をインストールします。
# Debian-based:
sudo apt install wget git python3 python3-venv
# Red Hat-based:
sudo dnf install wget git python3
# Arch-based:
sudo pacman -S wget git python3
  1. にインストールするには、次のコマンドを実行します。
    /home/$(whoami)/stable-diffusion-webui/
bash <(wget -qO- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)
  1. 走る。
    webui.sh

アップルシリコンへのインストール

手順については、こちらをご覧ください

貢献

このリポジトリにコードを追加する方法は次のとおりです。 貢献

ドキュメンテーション

ドキュメントは、このREADMEからプロジェクトのwikiに移動されました。

クレジット

借用コードのライセンスは、画面とファイルにあります。

Settings -> Licenses
html/licenses.html