AIお絵かき創作入門(完全に理解した)

2022-11-23
AIお絵かき創作入門(完全に理解した)

AIお絵かきは単なる悪ふざけではない

すいません僕が間違っていました、AI画像生成は単なる悪ふざけの延長ではありません。AI画像生成なんてプロンプト入力してパラメータ調整してランダム生成される画像見て遊んでるだけでしょ?ってのは理解が浅すぎます。そういった面はありますが、それだけではないのです。当たり前ですが道具の使い方によっては創作にもなるのです。

しばらくAI画像生成と真剣に向き合った結果、AI画像生成を無機質な言い方ではなく「AIお絵かき」のように創作の方法のように呼ぶ意味がやっとわかってきました。

創作としてのAI画像生成の根底にあるものは、プロンプトを通じた表現です。ロマンチックなプロンプト「dazzling light beam penetrated through the window」のような詩的な情景を思い浮かべ、出力される画像の僅かなタッチの差を調整し、ミックスして望み通りの画像を出力し、それによって(自分も含め)「誰かに何かを伝えたい」という目的を持って道具としてAI画像を使うわけです。

このような行為はまさに創作の一種で、「思いを画像表現に変換する道具」としてAI画像生成を使っている人達がいます。

プロンプト中心のAIお絵かきによる表現

AI画像にはみんなプロンプトを通じて少なからず思いを乗せているわけです。美少女を描いて!(beautiful 1girl)と指定しても全然思ったようなのは出ないはずです。AIに美少女を定義しろよ!って言われている感じですね。

全部言わなければAIにはわからないわけですが、ソシャゲみたいな、とか有名な絵描きのような、とか言えばだいたいそれっぽく描いてくれます。まずここで大きな方向性が決まってくるため、より好ましいものを探したり、ミックスして、ベースとなる顔つきや雰囲気を決定します。

そこからです、雰囲気が決まったら髪型、体型、衣服、ポーズ、表情をプロンプトに指定して素体を作り、さらに絵のタッチ、質感、精細さなどを詰めていくことになります、ここまで来ると当人の趣味がだいたい反映されて、そして絵がランダムに出力されていきます。何かをやろうとすると100~300枚くらいは出力されるでしょうか。

大量の絵が出たら誰かに見せるための一枚を選び、必要であれば出力パラータを調整し、img2imgで微修正を行い、さらにトリミングや高解像度化、必要なら色調補正も行います。そして発表することになります。

発表された画像を見ればAI画像だろうなというところは推測がつくのが今のクオリティですが、見る人が見ればパラメータを工夫していることがわかります。あぁこういうのが好きなんだな…いいね!というのがAIお絵かきを通じたコミュニケーションの一例になってくるわけです。

picture 2

プロンプトだけで伝える/手描きとの差

思いはプロンプトに込められています。様々なパラメータがありますが、気持ちの部分はプロンプトで伝えることがメインになってきます。(embeddingやhypernetworkの方が大きく影響しますが、気持ちの部分ではプロンプトになってくると思っています)

現在のAI画像生成の肝はこのプロンプトで、ほぼこのプロンプトによってのみAIに絵の指定をします。ここにどれだけ気持ちを込められるか、そういう遊びのような部分があります。若干ですが、俳句に似ているように思います。文字数制限が微妙にあったり、仕える語句が事実上限られていたり。でも表現は無限であったりと。

手書きのイラストとの大きな違いもここにあって、プロンプトで指定できることの範囲を超えて出力しようとすると相当苦労します。特に微妙な感情を表現することはかなり難しく、それっぽいけど無機質で感情がよくわからない絵が出がちです。

手書きには技術を必要としますがこの辺りの制限は無いので、ラフのような表現であっても微妙な感情を伝えることで共感を得ることができます。この差をAIが現在のようなプロンプトのみで埋めるのはかなり難しく、イラストレーターや漫画家が時代に合わせてキャラクターの感情を描いている限りは、棲み分けが可能なのではないかと思います。

一方で表現の方法として微細な、緻密な、あるいは奇想天外なといった無機質なものを選んでいた場合、そこはAIが最も得意とする領域なので直接的に競合する可能性がありそうです。もともと写真や3Dと競合している分野な気もしますが、そこにさらにAI画像がやってきたような状態です。これは頭を抱える可能性がありそうです。


余談

AI画像の腕は

イラストレーターや美術を学んでいる人の出力は桁違いに上手いです。ほぼ同じプロンプトでも、微調整と出力内容のチョイスやトリミングのセンスに差が出ています。小道具やシチュエーションの引き出し、色味の調整なども圧倒的な差があります。

構図の指定や表現したい内容にあわせた作風(画材)のチョイスも、引き出しの数が桁違いでしょう。

300枚の画像から最も伝わる好ましい1枚選べと言われた時に、常に最適な1枚を選べるのはプロでしょう。この手のデザイナの領域の知識や技術がプロンプトの後に効いてくるようです。

やってみるほど、普通の美術や芸術表現の延長上にあることがわかってきます。AI画像生成というものは、美少女を召喚して笑っているだけの悪ふざけではないのです…そんなことをしているのはオレだけだったんかい。すまん。

© 水マン(みずマン) - waterman_jp