🚧 サイトをリニューアル中。運営しながら少しずつ改良中。見づらくてすいません 😭

Stable Diffusionのtext2imgとimg2imgを簡単にすぐに使うインストール方法(2022年8月版)

(約 12,000文字の記事です。)

話題のStable Diffusion、オンラインで試すならば純正のベータ版Webツール「DreamStudio」を使えばいい。だがこれは最初こそお試しで無料で試せるが、無利用体験用のクレジットがなくなるとその後はクレジットカードで課金しないと使えない

無料で何回も、満足できるまでStable Diffusionを試したい!

そのために色々試行錯誤した。以下では具体的なStable Diffusionの導入方法の解説。

対象読者はStable Diffusionを何度も無料で試したい人。(可能ならば)自前のローカルPC上でStable Diffusionを試したい人。

できればローカルPC内でStable Diffusionを試したい。それが無理ならばGoogle Colabでも構わない。どのみちGoogleから怒られるような画像を作り出すつもりはないので。要は便利ならば、何でもいい。

ただし、text2imgとimg2imgの両方を試したい

  1. text2imgは「言葉から画像を生成させるエンジン」
  2. img2imgは、例えば私がラフに描いた「下書き画像から詳細な絵をAIに描かせるエンジン」

これらの両方を実現させたい。

ただ、以下の内容では、私の場合、text2imgは完全にローカル環境で実現できたが、img2imgは残念ながらその手段がなかったのでGoogle Colabで実現させた。以下ではその両方の手順とその解説。

目次

グラボのドライバを最新版にアップデートする

要するに、グラボのドライバを最新版にアップデートすればいい。インストールが終わったら必ずPCを再起動させること!転ばぬ先の杖。お約束的手順です。

アップデートの仕方を知っている人はこの章は飛ばしてOK。

GeForceでリアルタイムのデスクトップキャプチャなどを使ったことがある人はGeForce Experienceというアプリも同時にインストールしているはず。そこから最新のドライバをワンクリックでDLできる。(スタートメニュー=画面左下のwindowsアイコンの、その隣の虫眼鏡アイコンに GeForce と打ち込めば出てくるはず。)

後はエクスプレスインストールでOK。

画像ではStudioドライバーだが、普通の人やゲーマーは恐らくGameドライバーだろう。3DCGクリエーターにはStudioドライバーが推奨されているだけです。どちらのドライバでもいいので、とにかく最新版にアップデートして下さい。

あとは念のためPCを再起動。転ばぬ先の杖。面倒でも再起動です。

【text2img】Windows+nVIDIAグラボ(VRAM 4GB以上)の場合

さて、この条件を満たすPCを持っているならば、何も深く考える必要はない。有志がWindows版Stable DiffusionのGUI版「Stable Diffusion GRisk GUI」を作って公開してくれている。

Stable Diffusion GRisk GUI 0.1 by GRisk

上記サイトをページごとGoogle翻訳して眺めてみればいい。現状ではGTX 1660限定のバグや制限があるっぽい。上手くいかない人は次の章の、汎用的なWindowsユーザーのためのStable Diffusion環境構築=Google Colabを試すしかない。

使い方は簡単で、ファイルをDLして解凍してできた実行ファイルをダブルクリックで実行するだけ

開いたウィンドウGUIに各種パラメータを指定してレンダリングボタンを押すだけ。

そうすれば指定したフォルダに画像とプロンプト(呪文)のテキストファイルが自動生成される。

Output Folderが画像のような場合、exeファイルがあるフォルダ内に「results」というフォルダが自動生成されてその中にファイル群が出力されます。なおこの設定はこのexeファイルを再起動すると自動的に「このデフォルト値」に強制リセットされます。なので常に「任意のフォルダに画像を出力させたい」場合には、このexeファイルを起動させた後に常に毎回、画像の出力先を任意のフォルダをセットし直さなければなりません。面倒くさいが仕方がない。

DLから使い方まで詳しく書いてもいいのだが、先達がすでに分かりやすく解説してくれていたのでそちらをご覧下さい。とても分かりやすく丁寧に書かれていたので、もはやそれ以上何も言うことがない😍

【備忘録】Stable Diffusion GRisk GUIの使い方と用語説明 | 甘味日記

さて、私がハマったポイントとしては、最初に出力画像のサイズを512×512に指定することだ。どうやら512四方以外のサイズでは上手くStable Diffusionが動かない。変な画像が出てきた。なので512四方で固定=一択だと思って間違いない。

DLして、解凍して、実行ファイルをダブルクリック!!!これだけで即Stable DiffusionがローカルPCで動き出す。

DL待ちを除いた作業時間はわずか5分。(初回の起動時のみのロード待ち時間含む)

Windows PCにStable Diffusion環境を整えるべくPythonを入れたりAnacondaを入れたり、何GBものファイルをDL待ちし、奮闘した2日を返して……。返して……😭

Windows+nVIDIAグラボ4GB以上ならこれ一択

GTX 1660で残念ながら上手く動かなかった人は残念ということで、それ以外の人にとっては完全にローカルPC上でtext2imgを試せる。検閲もBANもない(笑)

実際、いくつかセンシティブな画像を生成させることができた。これによってStable Diffusionの学習モデル内にセンシティブな、ぼかしなし画像もまた学習されていることがよく分かった。それをどう扱うかは各自の自由だが。

とにかく、Windows PCと上記nVIDIAグラボが手元にある人は、四の五の言わずにStable Diffusion GRisk GUIをダウンロードすればいい。5分後にはStable Diffusionを無制限に試し始めることができる。つまり、すぐに幸せになれる😊

【重要】Stable Diffusion GRisk GUIユーザーの場合

text2imgはStable Diffusion GRisk GUIでいいや、と思った人(私)も、続く次の章の手順通りにGoogle Colabでtext2imgのセットアップを「体験」してほしい。というのも、次の章のimg2imgではGoogle Colabを使った手順の説明になるのだが、そこで事細かに解説しない(というかできない、それほど知識がない)。そして両者に共通する手順が多いので、一度丁寧なマニュアルサイトにてGoogle Colabの定型作業を知ってほしいのだ。

【text2img】それ以外のWindows PCの場合

残念ながらStable Diffusion GRisk GUIほどサクッと環境をセットできる手段がない。かといってPython環境を整備するのはもはや茨道であり、正解に辿り着ける保証もない。

なので素直にGoogle Colab上でStable Diffusionをセットアップするしかない。

ただし後述するが、text2imgとimg2imgを常時併用する場合には、かなり不利だ。どうやら切替える度に毎回環境のセットアップのし直しになるらしい。よく分からないが、セットアップ後の環境補を保存して次回は続きから、ということができないっぽい?(未検証)

これはもしかしたら私の知識不足のせいであって、実は「何かを保存」すると次回からはセットアップ完了済みの環境で、簡単に続きができる「かも」しれない。ごめんなさい、これについては検証していません。というのも私はtext2imgの場合はStable Diffusion GRisk GUIの実行ファイルを使い、img2imgのみGoogle Colabを使うので、両者を切替えて併用することはしないので、このデメリットに関わらない。強いて言えば定期的にimg2imgの環境をセットアップし直すくらいだが、3~4分の待ち時間くらいならばブラウザのタブを切替えて別のWebサイトを巡回していれば、その間にバックグラウンドで処理が終わっているので気にしない。ゆえにGoogle colabで環境の保存と再読み込みに関する試行錯誤はしない予定。

そもそもの目的として、とにかくStable Diffusionを無制限に試したい、ということが最大の目的なので、その向こう側「如何に快適にStable Diffusionを試すか」という事については現段階では追求する予定がない。

それよりも、とにかく早くStable Diffusionを色々といじり倒したい!まずはそれが先決。

Google ColabにStable Diffusionのtext2imgを導入する方法についてはこちらがとても丁寧で、ハマる罠もないだろう。

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ – GIGAZINE

ほとんどの人にとっては、「Hugging Faceの新規アカウントの作成」になると思うので面倒くさいと思うかも知れないが、記事にしたがって手順通り作業すれば何も難しいことはない。それくらい、シンプルに、丁寧に操作手順を書いてくれている。

そうそう、これこれ、こういうのでいいんだよ、手順書(マニュアル)ってのは。

とにかくこれでStable Diffusionのtext2imgは(ほぼ)自由に何度でも試すことができる。ただしGoogle Colabについては生成画像が検閲されている可能性が高いので、あまりセンシティブな絵を作るとアカウントBANの可能性も有り得る。その辺は公序良俗の範囲内で行なった方がいい。(例外なのは100%ローカルPC環境内でStable Diffusionを実行できる場合のみ、だろう)

【img2img】はGoogle Colab一択

もちろん、UbuntuなどLinux環境を自在に操れる人は、当然ながらローカルPC上にStable Diffusionをインストールできるだろうが、そういう人についての話をしているわけではない(笑)ごく普通のWindowsユーザーならば、img2imgを試そうと思ったら今はGoogle Colab一択だと思った方がいい。それ以外の可能性を探るのは、後でもいいと思う。

十分にimg2imgを堪能した後にそういう可能性を模索しても遅くはないってことね。時が経てばexe環境が登場するかも知れないし、もっと詳細なStable Diffusion インストールマニュアルが公開されるかも知れないから。今はまず、とにかく、img2imgを試すことのほうが大事。

img2imgのGoogle Colabについては何パターンかあった

これについて情報収集していると、インストール方法が複数種類あった。厳密にはUIに改良を加えた他者製作バージョンというものがいくつかあった。色々試した結果、私はGUIっぽい、Windowsに慣れた人が簡単に使えるインターフェースを実装しているこちらを使うことにした。

【注意】
以下を読み進める前に、必ず一度Google Colabでtext2imgをセットアップする練習をし、Google Colabにログインした状態にしておいて下さい。

ブラウザの別タブでGoogle Colabにログインした状態にしておき、別のタブで以下のサイトを開く。

others2/Stable_Diffusion2.ipynb at main · cedro3/others2 · GitHub

以下のボタンをクリックすると、どうやら記述内容がGoogle Colabで開かれるっぽい。(なにぶんGoogle Colab自体をよく分かっていないので、すいません……。)

もしGoogleで複数アカウントを利用していて、別タブで開いたアカウントとは別のメインアカウントでページが開いた場合、アカウントアイコンをクリックし、別タブで開いたアカウントに切替えてあげればいい。

さて、これはどうやら「他人が作ったテンプレート」を開いただけらしく、この状態では自分のGoogle アカウント内にファイルなどが存在しない。読取り専用で開いたような物だ。なのでこれを自分のGoogle ドライブに保存する。

末尾に「 のコピー」が追加された。あとはリネーム可能だ。分かりやすいタイトルに自由に名称変更する。「Stable_Diffusion img2img」などがいいだろう。

そして念のため上書き保存する。この辺の操作はGoogleドライブのドキュメント(Wordっぽいソフト)の取り扱いと一緒だ。Ctrl + Sでもいいし、ファイル > 保存ボタンでもいい。

【確認】
このアイコンボタンをクリックすると、Google ドライブの一階層上?というかGoogle Colabの最上位フォルダに移動する。そこでリネームしたファイルがあることを確認する。

確認できたらブラウザバック、またはそのファイルをダブルクリックして元の作業に戻ろう。

【重要】最終行の1行のコードをFalseに修正

マウスホイールを転がして最終行を見て欲しい。

demo.launch(debug=True)

テンプレートではTrueとなっているところを、手動で False に書き換える必要がある。

False

書き換え後はこうなる。

demo.launch(debug=False)

私の環境ではここがTrueだとなぜかいつまで経ってもインストールが終わらない。40分待っても終わらない。さすがにおかしいぞ?と思って警告メッセージを読んだところ、ここをFalseにしたらいいのかな?と思って体当たり実験したらビンゴ!Falseだと2分後には正常にインストールが完了する。

ここが罠なポイントだった。

修正したらCtrl + Sで上書き保存しておこう。

後は上から順に再生ボタン+トークン入力

あとはtext2imgで行なった手順の通り、再生ボタンクリックでセルの実行を繰り返し、途中のトークン入力でトークンを入力、セルの実行の繰り返し。

もし「ノートブックだと~」警告ダイアログが出たらOKを押して下さい。というか押すしかない。

また「セッションが~」という警告が出たら、以前の実行中のものを終了させるしかない。無料版のColabだと1つのセッションしか実行できないらしい。まぁしょうがない。

(Tips)セルの連続実行

なおセルの実行を「まとめて一気に実行」させたい場合には、こちらを試すといい。

連続実行が可能だ。また以下の設定にすると実行完了後にポップアップウィンドウが開くので便利。

【img2img】テスト

正常にインストールされると、GUIとしてこのようなウィンドウが出てくる。

あとは、例えば手描きのラフな絵をウィンドウにドラッグ&ドロップし、Runボタンの左側の空欄にテキスト(プロンプトと呼ばれる呪文)を打ち込み、最後にRunボタンを押す。30秒程度待つと2枚の絵が出力される。

絵の保存は右クリックのポップアップメニューから画像を保存すればいい。

他にはtext2imgの場合だと自動でGoogle ドライブ上に保存させる方法があるらしいので、もしかしたらimg2imgにも応用できるのかも知れない。分からない。(未検証)

さて、img2imgの使い方そのものについては以下のサイトの解説が分かりやすかったので、ページの中盤から後半にかけて一読するといいだろう。

Stable Diffusionのimg2imgをGoogle Colabでやってみる | cedro-blog

なお私の環境では、インストール完了後の初回1回目だけは「完成するまで何も画面が変化しなかった」のだが、2回目以降はグレーのインジケーターがリアルタイムで描画されるようになった。待ち時間が視覚化されると待つのが多少楽になる😍

これでimg2imgを無限に楽しめる。

【参考】Google Colabでは定期的に環境の再構築が必要?

これについては私の経験不足で、正直よく分からないが、どうやらセッションという「ある一定期間の作業時間」ごとに、定期的にセットアップのやり直しによって環境を再度構築し直さなければならないっぽい。再生ボタンアイコンだったり、画面上の「ランタイム」ツールの「セルの実行」などで再セットアップが必要みたい。例えば今日試して、PCを落として寝て、2, 3日後に再度試そうと思ったら、再セットアップからのやり直し、という具合。

これについては作業環境を継続できる方法があるのかどうかも、よく分からない。が、トークンのコピペし直し程度+2~3回のセルの実行ボタンクリックならば、別にいい。暇つぶしに別タブのWebページを読んでいる間に勝手にロードが終わるので。

まとめ

ここまででStable Diffusionの、

  1. text2imgのローカルPCへのインストール(Windows PC+nVIDIA 4GB以上限定)
  2. Google Colabへのtext2imgのインストール
  3. Google Colabへのimg2imgのインストール

各種のインストール手順と罠についてご紹介した。とにかくこれで無料で回数制限なしに何度でもStable Diffusionを試せる。

たったこの2種類を自由に無限に試せるという手段を得るためだけに、たくさんの無駄な試行錯誤をしてしまった。だがようやく今、どちらも自分で自由に試せる環境が手に入った。

願わくば将来的に、どちらもローカルPCのみで、Windows PCで簡単にStable Diffusionの環境構築ができる「手順書、マニュアル」を完成させたWebページが公開されることを願う。今回、私の環境ではtext2imgはWindows版GUI実行ファイルを使えば問題ないが、img2imgについてはローカル化できていない。特にGoogleに怒られることをするつもりはないが、できれば全部ローカルPCで完結させたいというのが本音。

また将来的にStable Diffusionがアプデしたときに、Windows版実行ファイルの更新が追従するかという不安もある。

だが、コンソールインストールによるPython環境の構築は、ハッキリ言って面倒臭いし、環境構築自体が目的ではない。それはあくまでも手段であって、目的はStable Diffusionを使うことなのだ。そういう意味では、今の時代にCUIベースでの環境構築を素人に強いるという状況は、Stable Diffusionの普及にとっては大きな足かせ、高いハードル、マイナスポイントだと言っていい。

なので将来的に、特にWindows PCの初心者ユーザーにとってStable Diffusionの環境構築のハードルが下がってくれればいいなぁ、と願っている。今の時代、色んな影響があってnVIDIA製の高性能グラボを持っている人も多いはず。3DCGクリエーターならば余裕で持っている人も多いだろう。そういう人にとってはローカル環境+Stable Diffusionの試行錯誤の可能性は、色んなクリエイトへの挑戦につながるポテンシャルを秘めている。是非ともそういう手順書サイトやマニュアルサイトが増えてくれればいいな、と願う。

とりあえず私はようやくStable Diffusionを色々試せるようになった。

そして今夜はこれにて終了です😍

「さて、どこへ行こうかしら、Stable Diffusionは広大だわ」

Looking down on the night view from the roof of a building at night, building at night in the background

2022/09/01 追記 cmd.exeが起動しない?

Anacondaをアンインストール後にWindowsのスタートボタンを右クリック >ファイル名を指定して実行 >cmd(またはcmd.exe)を入力してEnterすると、一瞬黒いウィンドウが表示されるもののすぐに消える。

困った。このせいでBlenderのバッチファイルが動作せず、なぜ起動しないの?ということで調べて色々試行錯誤した結果、こちらの記事がビンゴでしたので追記しておきます。

Anacondaをアンインストールした後コマンドプロンプトが起動しなくなった時の解決方法: 駄文と書評

内容としてはレジストリエディタで

コンピューター\HKEY_CURRENT_USER\SOFTWARE\Microsoft\Command Processor

そこにあるAutoRun(内容がif exists)というキーを削除すればOKだった。こちらの記事にはもっと簡単にやり方が書いてあった。

Anacondaアンインストール後にcmdが起動しない – Qiita

PowerShellに謎の赤文字エラーが出たまま?

こちらの対処方法もここにありました。助かりました!

PowerShellを起動するとconda.exeのエラーが表示されるのを改善する方法: 駄文と書評

ただ、私の場合はマイドキュメントをデフォルトではなくてDドライブ直下のMyDataフォルダに指定を移していたので、profile.ps1ファイルは上記の記事のフォルダパスとは違って、例えば、

D:\MyData\Documents\WindowsPowerShell

この中にprofile.ps1がありました。削除して完了。

なんだか色々とAnacondaにはイライラさせられるなぁ。

今回の創作活動は約4時間30分(累積 約2,896時間)
(841回目のブログ更新)

筆者はAmazonアソシエイト・プログラムに参加しています。(AmazonアソシエイトとはAmazon.co.jpの商品を宣伝し所定の条件を満たすことで紹介料をAmazon様から頂けるという大変ありがたい仕組みのこと。)
以下のリンクを経由してAmazonでお買物をするとその購入額の1~3%ほどのお小遣いが私に寄付されます(笑)以下のリンクを経由して頂ければ紹介商品以外のご購入でもOKですよ~。

お役立ち情報を伝えよう!
  • URLをコピーしました!
目次