ERNIE-ViLGで遊ぶ #ernievilg #AIお料理部 #AI絵師 #AIart

 

ハンバーガー;Infinity


ERNIE-ViLG(中国大陸のBaiduが開発したやべー画像生成AI)でいろいろな画像(謎に料理中心)を生成してみたまとめ。


前提条件として

・Stable Diffusionとかはそうでもないんだけど、ERNIE-ViLGに関してだけはHugging Faceがやってられんくらい重たいので、基本はGoogle Colaboratory無料プランでコマンドラインで動かしまくっている。やり方はここの通り。

・プロンプトは基本簡体中文、たまに面倒くさくて繁體中文を使用。掲載可能なものは記事中には日本語または繁體中文にして「プロンプト;Style」形式で掲載。

・料理名などはプロンプトに入れる前にBaiduで検索をしてみて、それっぽい画像検索結果が出たり、百度百科に記事があったりしたワードを主に選定してやってみた。

・個人的に納得した結果だけを入れているので失敗したりディストピアっぽいものができた場合は除外している。

だいたいこんな感じ。ではまず料理系から。

蘭州牛肉面;Infinity

麺類を色々やってみた中では蘭州牛肉麺の画像生成が安定しており、本格的な仕上がりとなった。何も知らない @madshirase に見せたところ、「どこの店のものか」と聞かれた。

エッグタルト;Infinity




お菓子類では何をどう転がしてもエッグタルト(パステル・デ・ナタ)は安定してこのヴィジュアルを生成した。うまそう。


月餅;Infinity

季節柄、月餅を出力したらどうなるかと思ってやってみたところかなり完成度が高くて驚いた。ちなみに私は月餅苦手です(笑)。

ボンゴレ・ビアンコ;Infinity

スパゲティ;Infinity

唐突な西洋料理、の割にスパゲティ類は結構しっかりと出力している。


チャパティ;Infinity




そして今度は唐突なインド料理。簡体字でやらないとうまく出力されず、繁體字でやるとカレーセットが生成されてしまった。

XO醤海鮮卵チャーハン;Infinity

初心に戻ってチャーハン。エビの主張が謎に激しめ。

ワンタン;Infinity

言わずもがなワンタン。スープに浮いてる野菜はパクチーだったりネギだったりした。

武漢熱乾麺;Infinity

もう一つ麺類で完成度が高かったのが武漢熱乾麺。食べたこと無いけどうまそう。

小籠湯包;Infinity

言わずもがな。料理本体はうまそうなのだが、周りの道具類の生成に失敗するパターンが多い。

杏仁豆腐;Infinity

杏仁豆腐は謎に豆腐感全面に押し出した画像を生成したりしていたが、その中から日本人でも容易に認識できそうなものを一つ掲載。

タピオカミルクティー;Infitiny

タピオカ多すぎ&でかすぎやろ。ストロー入らんやろ。


上記には一部を掲載したが、一通り料理画像をやってみた所感としては

・お菓子類、特に謎にエッグタルトは安定して出る?

・麺類やスープに入れる野菜がだいたいパクチーかネギ。謎にでかい青梗菜が入ってることも。

・ツヤ感というか、シズル感・熱々の湯気などの風合いにかける画像が多い。

・日本料理(ラーメン・寿司など)はまだまだ認識不足なのか、安定しない。

・簡体字と繁體字で安定感が割と変わる。

・箸や食器、付け合せなどの生成は高確率でうまくいかない。食器がだまし絵状態になっていることも。

といったところ。

とどめにもういっちょエッグタルト


以下料理画像以外とその他気になった点など。





Twitterのアイコンに採用している画像2つ。アークナイツっぽいやつ、とかめちゃくちゃ長いプロンプトを入れてCartoonで生成したが、今までより安定しているとはいえ9割は失敗作を生む。どのような絵にしてほしいと詳細にプロンプトに盛り込むことは大事だが、やりすぎると混乱する。

・バズった当初言われていた「pixiv排名第一」はしっかりプロンプトを作ればなくても安定する。もちろんのことだが、英語や日本語、韓国語、繁體中文よりも簡体中文が一番安定する。

・上記2画像については、生成したそのままでは微妙な感じだったので、レイヤーのアスペクト比を水平5.8%ほど引き伸ばすことで顔の輪郭のを広くしたり、肌の色が白すぎてキモかった暗い感じだったので、色温度7700、彩度1.3~1.5くらいに調整している。また、あえてAIが描いたことが分かるように、人間なら描かないような不自然な部分も残しており、消去などは一切はしていない。






・人物描写では虹彩・手指を描画することについてもう一歩といったところ。AIの人物描写は虹彩などの眼球周りの描画がDeepFakeの時代からダメダメだと言われていたため、AIに共通して言えるウィークポイントなのかもしれない。

・あとキャラクターの顔面を中央に持って来るのが下手くそ。

・中国大陸製造のAIだからか、禁止ワードが多い。他のAIでもエロワードなどは禁止だったが、政治的に敏感になりがちなワード、特に中華民国、台湾、朝鮮民主主義人民共和国、ロシア、習近平、毛沢東などは禁止ワードとして弾かれた。

・ただし同じロシアでも「俄國」はだめで、「俄羅斯」はOKだった。オリヴィエ・サラダを生成するときにこれで一回コケた。

・このほか朝鮮民主主義人民共和国はだめでも、「北朝鮮」「平壌」は禁止ワードではなかった。また、「台湾」がだめでも「台北」はOK。

・総じて中国大陸が開発したソシャゲっぽい画風に強い印象。

・皆さんも楽しいAIお絵かきライフを!

美しい夜景;Infinity

Q.なんでStable DiffusionとかMidjourneyじゃなくてERNIE-ViLG?

A.Colabで動かすのが一番楽だった。