Stable Diffusion その1 どうすんだよこれ

2022-09-16
Stable Diffusion その1 どうすんだよこれ

StableDiffusion

Stable Diffusionを使って画像を30,000枚くらい出力したのでいろいろ紹介したりしていきます。とりあえずダイジェストから。

picture 2 picture 3

初日に作成したのがこれで、MTGのカードのイラストが無限に描けるんだな、凄いなという印象だった。成果物が版権フリーで、自分のものになるというのが信じられなかった。

picture 1

female monster hunter,resident evil,Emma Watson,William Waterhouse,Alfons Maria Mucha

翌日になると悪いことを覚えて、女優や製品名や画家を入れると上手くいくということがわかった。William Waterhouse(J.W.ウォーターハウス)やWilliam Adolphe Bouguereau(ブーグロー)のファンであることが役に立つ日がくるとは思わなかった。(でも最も重要なのはミュシャだった)。

そして…

picture 5 picture 4

それからいろいろあってこうなる。上記もStableDiffusionをいろいろと応用したもので、完全自動生成の無加工である。

StableDiffusionはヤバイ

どうすんだよこれ

StableDiffusionの素直な感想は「どうすんだよこれ」である。AI画像生成のOSS化、完全なフリー化というのはいろいろな意味で破壊的な技術である。法律やモラルに関して周辺環境が整っていなかったり、利用者の倫理観が共通認識になっていない。

インターネットの黎明期にはアイコラが流行り逮捕者がでたりしていたが、アレも一般家庭に普及しているPCでPhotoshopが動くようになったということが少なからず影響してただろう。画像生成AIは悪用すればPhotoshopよりも遥かに危険なものである。

とんでもないものがいきなり野に放たれてしまったという印象を受ける。そもそも、StableDiffusionは本来であれば2022年の8月の時点で一般人が無料で手に入れられるはずが無いものであったろうと思う。理由はその作成コストにある。

よくわからんけど2億円くれたようなもの

stable-diffusion/Stable_Diffusion_v1_Model_Card.md at main · CompVis/stable-diffusion · GitHub

  • Hardware Type: A100 PCIe 40GB
  • Hours used: 150000
  • Cloud Provider: AWS
  • Compute Region: US-east

超高性能なGPUを並べて述べ150,000時間(15万時間=256台のマシンで24日以上)を費やした学習モデルの生成コストは、概算でも2億円以上と言われている。それが何故かタダで配布されてしまった。

ソースコードがOSSとして公開されることはよくあることだが、純粋なコストの塊のような学習モデルが全公開されるというのは理解しがたい。

本当の目的はなんのか、動機は、作者は一体どんな奴なんだろうか、謎の資金援助をしているパトロンは何者なのか、動機は…よくわからんが使ってみようということで使ったが、これにはかなり不安があった。

  • Stable Diffusionを公開した会社は Stability.Ai である。 Stable Diffusion launch announcement — Stability.Ai
  • 配布データは継続的に強化されて継続的にアップデートされると宣言されている。億円単位の学習コストの積み重ねが、無償で公開され続けるということである。

聖人達が作ってた

公開されてからしばらくして、作者の一人がredditに君臨した。そこで全員の疑問に答えている。このプロジェクトの動機は何なのか?

このプロジェクトの最初の衝動は何だったのでしょうか?ある朝、「そうだ、txtからimgへのIAを作ろう」と思い立ったのでしょうか。?

My pleasure. It was because I saw a future where closed AI by organisations that feed on our dreams and hopes controlled our minds and I got pissed off. This was particularly true when I was lead architect of the CAIAC project https://hai.stanford.edu/watch-caiac to organise the worlds COVID-19 knowledge and make it understandable, https://oecd.ai/en/wonk/collective-and-augmented-intelligence-against-covid-19-a-decision-support-tool-for-policymakers backed by the WHO, World Bank, UNECO etc and a bunch of the private sector backers refused to give me their tools and AI causing me stress and anxiety. Can’t have that as the future, need to change it. Took me a bit of time with the team to figure out how to do this properly though, was the start of this year while last year I was supporting AI art as it is super cool.

それは、私たちの夢や希望を糧とする組織による閉じたAIが、私たちの心を支配する未来を見て、腹が立ったからです。

それは、私たちの夢や希望を糧とする組織による閉じたAIが、私たちの心を支配する未来を見て、腹が立ったからです。特に、私がCAIACプロジェクト(https://hai.stanford.edu/watch-caiac) のリード・アーキテクトとして、世界のCOVID-19の知識を整理し、理解できるようにしたときはそうでした。 https://oecd.ai/en/wonk/collective-and-augmented-intelligence-against-covid-19-a-decision-support-tool-for-policymakers WHO、世界銀行、UNECOなどの支援を受けながら、民間企業の支援者の多くが彼らのツールやAIを私に与えることを拒否し、私にストレスと不安をもたらしました。 このままではいけない、変えなければならない。 昨年は、AIアートを超クールなものとしてサポートしていましたが、今年はそのスタートでした。 www.DeepL.com/Translator (無料版)で翻訳しました。

言ってることがもう聖人である。特定の営利団体によってAIが独占され、閉じたAIによって支配される未来というものもあり得なくはない。想像がつかない世界ではあるが、中の人は業界の中でこれを具体的な脅威として認識して、義憤に駆り立てられているように見える。民間に画像生成AIを配布することは彼らにとっての聖戦のようなものらしい。

AI画像生成の後の世界に突入した

2022年の夏に、民間レベルで突然AI画像生成の後の世界に突入してしまった。この後どうなるのかは全然わからない。行動指針的なものはライセンスに書いてあります。stable-diffusion/LICENSE at main · CompVis/stable-diffusion

StableDiffusionを使って以下のようなことをしてはいけません
  • 適用される国、連邦、州、地方、または国際的な法律または規制に違反する方法での使用。
  • いかなる方法であれ、未成年者を搾取し、害し、または搾取もしくは害しようとする目的。
  • 他者に危害を加える目的で、検証可能なほど虚偽の情報および/またはコンテンツを生成または流布すること。
  • 個人を特定できる情報であって、他人に危害を加えることができるものを作成し、又は流布すること。
  • 他者を誹謗、中傷、その他嫌がらせをすること。
  • 個人の法的権利に悪影響を与える、または拘束力のある強制力のある義務を作成または修正する完全自動化された意思決定のため。
  • オンラインまたはオフラインの社会的行動、あるいは既知または予測される個人的または人格的特徴に基づいて、個人またはグループを差別したり、害したりすることを意図した、またはそのような効果を持つあらゆる使用。
  • 年齢、社会的、身体的または精神的特徴に基づく特定のグループの脆弱性を利用し、そのグループに属する人の行動を、その人または他の人に身体的または精神的損害を与えるか、与える可能性がある方法で著しく歪曲すること。
  • 法的に保護された特性又はカテゴリーに基づく個人又はグループに対する差別を目的とする又はその効果を有するあらゆる用途のため。
  • 医学的なアドバイスや医学的な結果の解釈を提供するため。
  • 個人が詐欺や犯罪を犯すことを予測するなど、司法、法執行、移民または亡命プロセスの管理に使用する目的で情報を生成または広めるため(例:テキストプロファイリング、文書内の主張の因果関係を描く、無差別かつ任意に対象を絞った使用による)。
  • www.DeepL.com/Translator(無料版)で翻訳しました。

割とあたりまえの倫理観が書いてある。アイコラを作ってひん剥いて公開してはダメ(危害を加えたり、嫌がらせをしてはダメ)ということです。

なにをしようか

パッと思いつくものだけでも、いくつもある。2億円相当のデータを貰ったのだから、楽しんでいきたい。何か貢献しなければいけないだろう。

  • 自作のボードゲーム・カードゲームのグラフィックとして
    • それらのアセットとして高品質な結果を集めるなど
  • ニッチな美少女の趣味を追い求める
  • 自画像生成機として

日記002に続く

© 水マン(みずマン) - waterman_jp