旧PancakeSwap

【画像生成AI】Midjourney、月刊マガジンと新モデルバージョンV5をリリース!

うぇ~い!ニナ(@_ninahaus_)🦆です。

2023年3月15日、私が沼って抜け出せない画像生成AI・Midjourneyから2つのアナウンスがありました。

  1. 月刊Midjourneyマガジンのローンチ
  2. 新モデルバージョンであるバージョン5(V5)のリリース

本記事ではこれらについて紹介します。

ニナ
ニナ
新モデルバージョンV5、とても良い!比較画像も載せます。

Midjourneyの紹介記事はこちら:

Midjourneyとは?話題の画像生成AIにすっかりハマって課金までした話もいんもいん!ニナ(@_ninahaus_)🦆です。 規制当局の強硬姿勢やら銀行の清算やらでクリプト界隈には暗雲が...

① 月刊Midjourneyマガジン、リリース

Midjourney
Midjourney
毎号、インタビューや息を飲むような素晴らしい画像、そしてもちろんプロンプト(Midjourneyに画像を生成させるためにユーザーが入力するテキスト)を載せますよ!Midjourneyコミュニティのクリエイティビティ、想像力、そして人類の心の表現を祝福するためにも、ぜひどうぞ!

気になる価格は4ドル (2023年17日現在)です。

課金の価値はあるのか?

月刊マガジンの購読をおすすめしない人

Midjourneyが生成した画像やプロンプトを大量かつランダムに眺めたいだけの場合は、公式Discordサーバーおよび公式ウェブサイト上にあるCommunity Showcaseで十分でしょう。

ニナ
ニナ
大量の生成画像とプロンプトはDiscordと公式サイトで参照できます
公式Discordサーバー内の共有チャンネルたち
newbies-XXXチャンネル
ニナ
ニナ
おもろい画像作ってんな
image-jamsチャンネル
公式ウェブサイト内、Community Showcase

 

月刊マガジンの購読をおすすめする人

テキストから画像を生成するAIにおいては、「ユーザーの頭の中にあるイメージを、いかにAIが理解できる優秀なプロンプトに落とし込むか」が最重要です。Discordサーバーに毎秒大量に流れるプロンプトおよび生成画像は一般ユーザーの試行錯誤過程の産物であり、参考にならないものも多いです。

『一般ユーザーの作品ではなく、AIの挙動を知り尽くしたMidjourney運営が選んだ生成画像、プロンプトが知りたい』『インタビューに興味がある』という方は購読されると良いでしょう。

② 新モデルバージョンV5リリース!

※現役モデルバージョンはV4ですが、プロンプトオプション「–v 5」を指定することで新モデルバージョンV5を利用できます。

V5では「一貫性」を重視した改善が為されました。ユーザーの入力プロンプトに対するAIの生成画像が、より「言葉通りのもの」になるようになりました。

  • さらに優秀な自然言語解釈
  • 高解像度
  • 繰り返しパターン(tile)などの高機能をサポート

公式による新旧の比較を見てみましょう。左がV4、右が新V5による生成です。

プロンプト「鮮やかなカリフォルニアポピー」

V4ポピーは確かに鮮やかですが、植物にしてはやややりすぎで不自然です。対してV5ポピーは鮮やかでありつつ、よりリアルな花となっています。

プロンプト「ハイコントラストのシュールなコラージュ」

どちらもシュールなコラージュを作成していますが、V4コラージュは「ハイコントラスト」とは言いづらいです(AIにとってはハイコントラストなのかもしれませんが)。対してV5コラージュは誰がどう見てもハイコントラストですね。

ここがすごいぞ新モデルV5

ここからは、新旧モデルによる生成画像を比較してV5の良さを推したいと思います。

なお、Midjourneyはプロンプトに応じ毎回画像を生成するため、まったく同じプロンプトを入力したとしても試行毎に異なる画像が出来上がります。たまたま出来たV4のヘンテコ画像とV5のベスト画像の比較になると不公平なので、各モデルで同じ入力プロンプト利用の画像生成を何度か実行して、平均的な結果を比較に使いました。

より人の期待するイメージに近く

「猫と犬」と言われたら、どんな画像を想像しますか?多くの人は、猫と犬が座っている/立っている状態の画像を思い浮かべるのではないでしょうか。

V4では猫と犬の顔のアップが生成されることが多いのですが、V5ではより人の想像に近いであろう画像を生成します。

V4で作成した「猫と犬」

V5で生成した「猫と犬」

 

広角レンズ・遠景に対応!

V4を利用して過去記事のカバー画像を作っているとき困ったことがありました。「遠くから撮影した、広い範囲が映った(いわゆる広角レンズ利用)画像」を生成したいのに、Midjourneyがプロンプトの指定をうまく拾わなかったのです。これがV5では大幅に改善されました。めちゃくちゃ嬉しい!

V4で作成した「ファンタジーな風景」(広角レンズ、遠景指定)

V5で作成した「ファンタジーな風景」(広角レンズ、遠景指定)

ちなみに生成したのはファイナルファンタジーXIVのLv80ダンジョン「魔法宮殿グラン・コスモス」です。入力プロンプトにはダンジョンの紹介文を使用。

戦士ニナ
戦士ニナ
このダンジョンの合言葉は「まとめます」です

便利なタイル機能

V1~V3ではサポートされていたタイル機は、V4ではサポート外でした。V4はそれまでのコードを一新した完全に新しいモデルと説明されており、タイル機能の実装には何か技術的な難しさがあったのかもしれません。このV5にて、タイル機能が復帰しました🙌

ここではスペイン・ポルトガルの伝統特産品として名高い「アズレージョタイルがあしらわれた壁」作ってみます。青が美しいタイルで、繰り返しパターンありのこのような生成画像を期待しています。

V3で作成した「アズレージョタイル壁」(タイル機能使用)

タイル機能による繰り返しは効いているような効いていないような。かろうじてところどころ青いものの、とてもアズレージョには見えません。

V4で作成した「アズレージョタイル壁」(タイル機能なし)

アズレージョであろうと認識できるものの、繰り返し部分はありません。壁のデザインと認識できないのか、壁に貼り付けるのも苦労しているように見受けられます。

V5で作成した「アズレージョタイル壁」(タイル機能使用)

繰り返しのあるパターン、デザインも文句なしのアズレージョです!

ニナ
ニナ
やったー!!

大事なこと:旧モデルバージョン=ダメ、ではない

Midjourneyは新モデルごとに改善を重ねていますが、古いモデルバージョンがダメなのかと言うとそうではありません。公式サイトには、各モデルごとに得意とする画像が異なることが明記されています。

HDモデル

早期のオルタナティブモデル。細部にこだわった抽象的な生成をするが、プロンプトと生成画像の一貫性は低い。

 

 

V1モデル

2022年4月22日~7月22日のデフォルトモデルでした。とても抽象的で絵画的。プロンプトと生成画像の一貫性は低い。

 

 

V2モデル

2022年4月22日~7月22日のデフォルトモデルでした。創造的でカラフルで絵画的なのが特徴。プロンプトと生成画像の一貫性は低め。

 

 

V3モデル

2022年7月22日~11月22日のデフォルトモデルでした。非常に創造的な構成に特化。プロンプトと生成画像の一貫性はそこそこ。

 

 

V4モデル

2022年11月22~2023年3月17日現在のデフォルトモデル。旧モデルとは完全に異なる学習プロセスを経た、完全に新しいコードベースとAIアーキテクチャのモデル。複数のキャラクターやオブジェクトを含む複雑なプロンプトの処理が可能。プロンプトと生成画像の一貫性は高め。

 

V5モデル(今回のリリース)

  • 2023年3月15日に公開されたモデル。
  • 自然言語解釈に秀で、高解像度・繰り返しパターン(タイル)などの高機能をサポートする。プロンプトと生成画像の一貫性が非常に高い。

 

 

ニナ
ニナ
私は基本V5利用で、プロンプトに対する意外な出力結果が欲しいときはV4を使うことにします

V5の欠点:画像生成に時間がかかる

プロンプトに対しより正確な画像を生成してくれるという特徴とトレードオフかもしれませんが、V5を使用しての画像生成はV4以前と比べると時間がかかります。

Fast GPU Timeが0.4時間/LifetimeしかないFree Trial(無課金)ユーザーにとっては使いづらいかもしれません。

おまけ:まだ学習が必要だぞMidjourney

最後に、Midjourney V5でもまだ生成が難しいものを紹介します。

「猫と犬」インプットに対するV5生成画像が非常に良いものであったことは紹介した通りですが、「ちょっと特殊な2種類の生き物の組み合わせ」を指定するとMidjourneyは混同してしまいます。

前準備:V5で生成した「ユニコーン」🦄

王道ユニコーンですね。

前準備:V5で生成した「カバ」🦛

完璧なカバ。良いテカリ具合。

V5で生成した「ユニコーンとカバ」🦄🦛

う~ん。

カバみが強いキメラになってしまう。

ユニコーンは伝説上の生き物なので、上手く処理できないのかもしれません。実在の動物を利用して「ちょっと特殊な2種類の生き物の組み合わせ」を作ってみます。

V5で生成した「猫とカバ」🐈🦛

左下は見てはいけない

 

ニナ
ニナ
混ぜるな危険!!

この「2種類の生物が共存しない問題」についてはMidjourney Redditで頻繁に話されています。プロンプト内で各生物に重みづけパラメータを追加する、「川の中にある石の上に座る猫と川の中で水浴びをするカバ」のように、プロンプトにてできるだけ細かく説明する、ひたすら色んな表現・言い回しを試し何とかするYOLOスタイルなどが回避策として挙げられていますが、それでも改善しないことも多々。「AIを利用して簡単にハイクオリティな画像を生成できる」がMidjourneyの良さなので、今後の進化を願うばかりです。

おまけ2:課金厨と化したアヒル

Basic Plan付属のFast GPU Timeでは足りず、ちょくちょくTimeを追加購入していたのですが…その合計が大きくなってきたのでこの度思いきってStandard Planに変更しました。Midjourneyの応援にもなるといいな。

ニナ
ニナ
もう1回遊べるドン!!

 

アヒルの活動支援

寄付をいただけると大変励みになります🦆
0xb0c12f825c53E665e119fef5C3108d58c1e38db8