
Stable Diffusion
クリエイティブ界隈
サバトラ
AIの特徴
Stable Diffusionは、Stability AI社が開発した、テキストから画像を生成するオープンソースの拡散モデル(Diffusion Model)です。2022年の公開以来、その高いカスタマイズ性と無料での利用が可能な点から、AI画像生成の「民主化」を推し進めました。ユーザーは、モデルをローカル環境で動作させたり、多様な拡張機能を組み込むことで、技術的な自由度を極限まで追求した創作活動が可能です。
モデルのコードが公開されているため、利用者は商用・非商用問わず無料で自由に利用・改変できます。これにより、ローカル環境(自身のPC)での実行が可能となり、利用回数の制限なくプライバシーを確保した上で、自由に試行錯誤を重ねることができます。
基本モデル(SDXLなど)に加え、特定のスタイルやキャラクターを再現するLoRA(追加学習モデル)や、複雑な構図やポーズを忠実に制御するControlNet(拡張機能)など、無数の拡張機能やカスタムモデルが存在します。これらを組み合わせて使用することで、ユーザーの求めるあらゆる表現や画風の生成に対応できます。
基本的なText to Image(テキストからの画像生成)のほか、既存の画像を元に変換・加工するImage to Image、画像の一部を指定して修正するInpainting、背景などを拡張するOutpaintingなど、クリエイティブな編集を可能にする多彩な機能が標準で搭載されています。
近年のバージョンアップ(SD3.5など)により、複雑なプロンプトや複数の要素を含む指示(ネガティブプロンプト含む)への理解度と忠実性が大幅に向上しています。これにより、ユーザーの意図をより正確に反映した、高品質で狙い通りの画像を生成できるようになりました。