Stable DiffusionのLoraモデルとは？　わかりやすく解説 - ガジェットと雑談@信濃まつもと

AIお絵描きのStable Diffusionにおいて、Loraモデルというものがある。

これはある絵を学習させた場合、その絵の特徴のみを保存したモデルだ。

例えばLoraで仮面ライダーv3を学習させた場合、仮面ライダーv3の特徴のみを保存する。

だから1モデルあたりの大きさが200MB程度で済む。

しかし、仮面ライダーv3の特徴しか入っていないモデルなので、出力する時は普通のモデル(Stable Diffusion1.5など)と併用する必要がある。

これは面倒くさく見えるが、絵を描く際に普通のモデルさえあればあらゆる特徴のモデルを臨機応変に追加できるのでとても便利なわけだ。

注意点としては、そもそも崩れた絵ではLoraを適用してもその特徴が出にくいのでpromptをしっかり考える必要がある。もしくは崩れにくいモデル(anythingなど)と併用する必要がある。

Loraは決して崩れた絵を美しくする物ではない。描いた絵を学習させた特徴に方向付ける物なのだ。

例えばこの絵はLoraモデルを適用していない。

f:id:shinanomatsumoto:20230221154510p:image

そして上記の絵と同じseed、prompt、その他同じ設定で韓国アイドルの特徴を学習させたLoraを適用するとこうなる。

f:id:shinanomatsumoto:20230221154611p:image

「美しい女性」の出力結果に、Loraを適用する事で「韓国アイドル」という方向性が特徴付けられたわけだ。

という事で、Loraモデルの特徴でした。