waifu/NAI/Anything-V3.0 あれから何があったの? (10月と11月のこと)

2022-11-19
waifu/NAI/Anything-V3.0 あれから何があったの? (10月と11月のこと)

更新の再開

ぱたりと更新しなくなって2ヶ月ほど経ってしまった。その間もずっとAI画像は出力していたんですが、公開を控えていました。その理由と、再開した理由についても少し説明したいと思います。

NovelAIの衝撃とリーク

waifu1.3で遊んでいたわけですが、NAI出現後の出力内容は完敗していました。この時点でwaifu1.4までは別のことをやろうと思っていたのですが、NovelAIのモデルの流出というとてつもないことが起きます。

詳細は不明ですが、当時の情報ではNovelAIのリポジトリのパスワードはかなり脆弱で、状況としては盗まれたというよりは置いてあったくらいに脆弱な状態だったようです。

リーク当時hypernetworkやembeddingは一般的ではなかったのですが、リポジトリ流出を境にNovelAIの用いていた二次元イラストを最適化する技術が勝手に公になり、技術的なブレイクスルーがあったように思えます。どうもNAIはhypernetworkを先駆けて実装していたらしく、その手法が知られると、事実として学習データの追加学習や最適化が一気に進みました。

複数のモデルのマージによって大規模なリソースを使わずに出力を好ましくするという手法も行われるようになり、さらにembeddingという出力を指定した画像に似せたように出力する技術も追加されたことで、同じような学習データを使っても、waifu1.3とNAI(とそのリーク)では出力結果に雲泥の差が出るようになったように思います。

そしてリークにせよNAIにせよAIイラスト界隈はNAI系一色、そしてhypernetworkやembeddingを使ってこれまで見たことも無いような既存アーティストに似せた画像を出力することもできるようになり、4ch界隈など無法地帯はカオスになっていきます。(ただそこまで悪用するような輩はおらず、迷惑をかけたという話はあまり聞きません)

NAI出現後なぜか盛り下がる

NAIはメチャクチャ凄いのですが、世間一般のAI画像への関心はWaifuの時よりもかなり下がったように感じていました。特に驚いたのがAnything-V3.0というNAIを凌駕する部分のあるモデルが出現した際に、あまり話題にならなかったことでしょうか。

NAIは細かい指定をしない場合にデフォルトで出やすいロングヘアーの女性がいるらしく、初学者の出力は軒並み顔つきが似ています。みんなが安直に初音ミクを利用したりする傾向や、児童っぽいイラストの無修正画像を連投したりと倫理観の低い行為も見られ、NAI後の界隈の雰囲気はかなり変わったように思います。

hypernetworkとembedding

hypernetworkとembeddingは特定の画像郡だけ(大抵は一人のアーティスト)を使って、その傾向を強化学習したり、出力を誘導したりするような挙動をします。詳細は詳しい人の記事を読んで下さい。NAIがアスカや初音ミクに強いのはこれらを使っている可能性がありそうです。

こういった特化した行為はdanbooruが騒ぎになった時よりもさらに議論のある行為のはずですが、公開されている画像を使った学習が適法な上、画風の模倣自体も裁くことはできないので、誰にも止められないでしょう。ソシャゲなどで世界的に有名で人気のある特徴的な作風、asanagiさんとかですが、その画風を模倣して驚くほど似た画像を出力することができます。

この手の話は尽きない状況なのでAIイラスト界隈はどんどん語るほど苦しいようなよくわからん状態になっているように思います。無断学習にはじまり、リーク、模倣の強化、出所不明のモデルの合成…

もうグレーというかこの界隈は黒いのでは、と言われたら学習と模倣は適法ですというのがまずあって、倫理感としては個人の裁量に任される部分がありますとしかいいようがないです。AI画像出力は道具の一つであって、プログラムやコピー機や刃物をどう使うかという話になると思っています、生み出すも傷つけるも何にでも使えるわけです。

Anything-v3.0の衝撃(再々々)

NAIリーク後の学習モデル界隈は、完全にわからなくなってしまいました。AnythingV3は中国初の出所不明のモデルで、いくつか情報はありますが確定的な正確なことはよくわかりません。名前の通り「あらゆるもの」を、合成した何かだということは推測できるわけですが、何を学習したり合成したのかは詳細は誰にもわかりません。当初謎の存在でしたが、現在はHagging Faceで公開されています。似たようなものとしてEimisAnimeDiffusionというものも公開されてますが、これも何を合成したものなのかは全くわかりません。

Linaqruf/anything-v3.0 · Hugging Face

eimiss/EimisAnimeDiffusion_1.0v · Hugging Face

Anythingの出力は、それはもう椅子から転げ落ちるような衝撃がありました。Waifuを初めて触った時の、これはいけるか?というような感触ではなく、一発目からぶっ飛ばされます。

picture 10

確か最初の出力郡からいきなりこれが出てきて椅子から転げ落ちそうになった。

プロンプトの変化

モデルが多様化し、さらにhypernetworkとembeddingもあり、そしてネガティブプロンプトの重要性が増したことなどから、クリーンではないプロンプトが増えたはずです。当時からみんながartgermさんを連呼していてどうかと思っていた部分がありますが、最近ではクリーンとは言えないような様々な思惑がプロンプトに投下されているはずです。ちょっと公開しにくくなってきました。

一例として、自分のネガティブプロンプトには常に特定のゲームタイトルが指定されていたり、特定の国や地域が指定されていたりしています。ベクトルの方向性をそうではない画像に向けたいだけですが、それだけ見ると語弊があるのでもう公開はしません。

それから

またやってみようということです。AI画像生成は面白い。この面白さは、2ヶ月前よりもかなりわかってきました。次回はAI画像生成を通じた創作の良い部分について、説明したいと思います。

あわせて、AI画像生成が起こした摩擦や葛藤についても、少し意見を述べたいと思います。

なにやってたん

Twitterにあげてましたが、お殿様ごっこやったりw、昔の風呂シリーズを投げ込みなおしたり、4chの市場で露出するエルフに執着するニキの真似をしたり、微細なのをやりなおしたり、Waifuの続きですね。

picture 3 picture 6 picture 7
picture 8

ぼやきというか界隈へのお願い

AI画像を使った問題行動、要は他人に迷惑をかけたり不快な思いをさせる行為、特に児童ポルノ関連はコミュニティ全体に対して極めて問題のある状況を引き起こす可能性があるため、やってはいけないですし、絶対にやらないで欲しいことです。同人誌でも同じですねこれは。幼児向けアニメのキャラでエロパロやってもいいけど(よくない)、それで問題起こしたら業界全体どうなるかわかってんだろなっていう。

© 水マン(みずマン) - waterman_jp