composer - 「Composer: コンポーザブル条件による創造的で制御可能な画像合成」の正式実装

(Official implementation of "Composer: Creative and Controllable Image Synthesis with Composable Conditions")

Created at: 2023-02-22 09:03:54
Language: NULL
License: MIT

作曲家

Composerの公式リポジトリ:コンポーザブル条件での創造的で制御可能な画像合成

その他の例については、プロジェクトページを参照してください。

作曲家の概念

Composerは、数十億の(テキスト、画像)ペアでトレーニングされた、大規模(5億パラメータ)の制御可能な拡散モデルです。それは合成によって制御空間を指数関数的に拡大することができ、画像を生成および操作するための膨大な数の方法、すなわち有限の平均を無限に使用する方法につながります。

藤堂

  • [ ] トレーニングおよび推論コードをリリースします。
  • [ ] 事前トレーニング済みモデルをリリースします。
  • []グラジオUIをリリースします。
  • []安定した拡散2.1に基づいて構築された軽量の潜在作曲家。

構成結果

テキスト深さの構成。

テキスト+深度

マスクされた画像テキストの構成。

マスキング+テキスト

スケッチの構成、深さ、埋め込み(1)。

スケッチ,奥行き+埋め込み

スケッチの構成、深さ、埋め込み(2)。

スケッチ,奥行き+埋め込み

テキストパレットの構成。

テキスト+パレット

埋め込みパレットの構成。

埋め込み+パレット

強度パレットの構成。

強度+パレット

操作結果

スケッチ、深度、パレット、埋め込みを修正するときの画像バリエーション

画像バリエーション

スケッチ、深度、セグメンテーションマップ、パレットを修正するときの画像補間

画像補間

イメージの再構成 (要素を直接変更してイメージを操作する)。

イメージの再構成

色補間。

色補間

地域固有の画像編集。

地域固有の画像編集

古典的課題の再定式化

画像翻訳。

画像翻訳

スタイルの転送。

スタイル転送

ポーズ転送。

ポーズ転送

バーチャル試着。

バーチャル試着

ビブテックス

@article{lhhuang2023composer,
  title={Composer: Creative and Controllable Image Synthesis with Composable Conditions},
  author={Huang, Lianghua and Chen, Di and Liu, Yu and Yujun, Shen and Zhao, Deli and Jingren, Zhou},
  booktitle={arXiv preprint arxiv:2302.09778},
  year={2023}
}