生成AI全般
2025.06.13
2025.08.08

Stable Diffusionとは？使い方から活用法まで徹底解説

Stable Diffusionとは？

Stable Diffusionは、テキストから画像を生成できるAIモデルの一種で、オープンソースとして公開されている点が大きな特徴です。ユーザーは「プロンプト（呪文）」と呼ばれるテキストを入力することで、リアルな風景やアニメ風のイラスト、抽象的なアートなど、自由度の高い画像を生成できます。

モデルはStability AIを中心に開発されており、ローカル環境で動作させることができるため、ユーザーのプライバシーや自由度も確保されやすいのが利点です。

特徴と他ツールとの違い

オープンソース：MidjourneyやDALL·Eと異なり、コードが公開されており、カスタマイズや拡張が可能。
ローカル動作：Web UIを通じて自分のPCで実行可能。
拡張性：ControlNet、LoRA、カスタムモデルなどを導入することで機能を拡張可能。

比較表：Stable Diffusion vs Midjourney vs DALL·E

ツール名	オープンソース	ローカル動作	カスタマイズ性	日本語対応
Stable Diffusion	〇	〇	◎	△（UIによる）
Midjourney	×	×（Discord上）	△	◎
DALL·E	×	×	△	◎

（画像：比較表や生成画像の例などを差し込み）

Stable Diffusionの導入方法

1. Web UIのインストール

最も一般的なのが「AUTOMATIC1111」のWeb UIを使用する方法です。

PythonとGitをインストール
コマンドラインでGitHubからクローン
起動スクリプトを実行

（画像：インストール手順のスクリーンショット）

2. モデルのダウンロード

Hugging Faceなどから.ckpt形式のモデルをダウンロード
/models/Stable-diffusion/フォルダに格納

（内部リンク：「Stable Diffusion Web UI インストール方法」へ）

プロンプトの基本

プロンプトとは、生成したい画像の内容を指示するテキストです。例えば：

a beautiful sunset over a mountain landscape, trending on artstation, high resolution

ネガティブプロンプト

生成時に避けたい要素を指定することも可能です。

bad anatomy, blurry, watermark

（内部リンク：「ネガティブプロンプトの使い方」へ）

CFG Scaleとは？

生成画像の忠実度を設定するパラメータです。

値が高いと指示に忠実
値が低いと自由な解釈が増える

（内部リンク：「CFG Scaleとは」へ）

活用法と拡張機能

ControlNetの導入

構図の指定やポーズ制御が可能になる拡張機能。

（内部リンク：「ControlNetの使い方」など関連記事へ）

商用利用・著作権の考え方

生成画像の利用に関する法的リスクや各ツールの規約を確認する必要があります。

（内部リンク：「AIイラスト著作権」「AIイラスト商用利用」など）

まとめ

Stable Diffusionは、無料かつ柔軟性の高いAI画像生成ツールとして、多くのクリエイターに支持されています。導入から活用までの流れを理解すれば、誰でも手軽に高品質な画像を作成できます。

無料で始めるAI画像生成｜初心者向けおすすめツール＆使い方ガイド前の記事 AIイラストの作り方｜初心者でもできる具体的な手順とおすすめツール次の記事