Composerの公式リポジトリ:コンポーザブル条件での創造的で制御可能な画像合成。
その他の例については、プロジェクトページを参照してください。
Composerは、数十億の(テキスト、画像)ペアでトレーニングされた、大規模(5億パラメータ)の制御可能な拡散モデルです。それは合成によって制御空間を指数関数的に拡大することができ、画像を生成および操作するための膨大な数の方法、すなわち有限の平均を無限に使用する方法につながります。
@article{lhhuang2023composer,
title={Composer: Creative and Controllable Image Synthesis with Composable Conditions},
author={Huang, Lianghua and Chen, Di and Liu, Yu and Yujun, Shen and Zhao, Deli and Jingren, Zhou},
booktitle={arXiv preprint arxiv:2302.09778},
year={2023}
}