※本記事のアイキャッチは、ImageFX(Imagen 3)にて生成された画像です。
Googleが画像生成AIの最新Verである「Imagen 3」の技術を用いたAI画像生成ツール「ImageFX」を、Google AI Test Kitchen で発表しましたね。
ImageFXは、テキストからリアルな人物画像を生成するGoogleのAI画像生成ツールで、日本人の特徴を捉えた自然な表情や姿勢を高精度で再現できる点が、高く評価されています。
ImageFXは、Googleアカウントがあれば、誰でも無料で利用できますが、現時点(2024年8月31日時点)では実験的なツールということもあり、1日の生成数には上限があるようです。
ImageFXで生成した作品の商用利用について、公式なアナウンスはまだされていないようですが、「SynthID(デジタルウォーターマーク)」が付与され、AIが作成したものであることが確認できることから、商用利用できる可能性は高そうですね。
ImageFXは将来的に、Googleの生成AIサービス「Gemini」に統合される可能性が高いと思われますが、無料利用が継続されるかについては不明です。
今後、有料サービスになる可能性は十分にあるので、無料で使えるうちに試しておきましょう。
以前、日本マクドナルドが生成AIを使用したプロモーション動画で炎上しましたが、下記Xの投稿のようなクオリティであったら、反応はまた違うものになっていたかもしれませんね。
ImageFXの生成画像は、それくらいに自然で違和感がないので。
ImageFXでできること
ImageFXは多機能なツールですが、主な機能(強み)としては以下の5つです。
① 高画質な画像生成: Imagen 3は、4K解像度の画像を生成する能力があり、細部までクリアでシャープな画像を生成できます。印刷用途やデジタル広告など、質の高いビジュアルが要求される制作物にも対応可能。
② リアルな人物画像生成: Imagen 3の高度なディープラーニング技術により、人物の表情や肌の質感がより自然で、かつ微細なニュアンスを捉えることができます。なかでも、日本人女性の自然な表情や姿勢の再現に強いのが、ImageFXの特徴です。
③ さまざまなスタイルの画像生成:「表現力チップ(expressive chip)」機能を使うことで、複数の画像バリエーションから最適なものを簡単に選択できます。リアルな画像からアニメ風、イラスト風とさまざまなスタイルに対応できます。
④ 既存画像の編集: 生成された画像に表示される編集ボタンを押すと、髪色や背景など選択した画像の一部分を、より細かく編集することができます。たとえば、画像内の変更したい部分を選択し、左側のフォームに変更内容をテキストで指示するだけで、選択部分のみにフォーカスした編集を行い、画像を再生成してくれます。
⑤ 架空のキャラクターや世界観の構築: 実在しない人物や風景を生成し、生成した画像を起点にオリジナルな世界観を構築したり、広告やプロモーションなどに横展開するといった可能性を秘めています。
たとえば、日本のアイドル(以下、1970年代風と2010年代風)に見立てた架空のアイドルを生成したり、架空のロックバンドのアー写を生成するといったユニークな使い方もできます。
「Midjourney」や「DALL-E 3」「FLUX.1」などのAI画像生成ツールでも、高品質な人物画像は生成できますが、日本人の特徴を捉えきれていないところがあり、プロンプトで「日本人」と指示しても、韓国や中国のテイストが入り混じり、どこか違和感のあるものが出力される場面が少なくありませんでした。
また、日本ならではの文化や風景、モチーフを扱うものをAIで表現しようとすると、どうしても「コレジャナイ」感が強いものが生成されがちですが、ImageFXの日本の文化、風土への理解度は非常に深く、日本人の特徴を的確に捉え、人物の顔や表情、髪型、服装などを、写真さながらに再現します。
また、ImageFXには、「表現力チップ(expressive chip)」という便利な機能が備わっています。簡単にいうと、生成した画像に対し、異なるスタイルや色調や構図などのバリエーションを簡単に試せるように設計された機能です。
たとえば、同じプロンプトでも、リアルな画像からアニメ調やイラスト調に変更させたり、髪の長さや色などを変えて、複数のスタイルやバリエーションを簡単に試せるよう、複数の選択肢を提示してくれます。
具体的には、ImageFXで画像を生成した際に、プロンプトの一部が下線付きで、以下のように表示されます。
たとえば、[Pretty]の下線部分をクリックすると、[beautiful] [handsome] [ugly]といった複数の選択肢が表示されます。
別の単語やフレーズを選ぶことで、画像の要素を部分的に変更できます。ちなみに以下の画像は、[pretty]から[beautiful]へ変更したものです。
表現力チップ機能を使うことで、プロンプトをあれこれと調整し直さなくても、さまざまなバリエーションにて簡単に生成することができます。
さらに、生成された画像の一部分を塗りつぶして編集するといった機能もあり、選択部分のみを指示どおりに編集して画像を再生成するといったことも可能です。
複雑なプロンプトを考えるのは面倒ですし、直感的な操作で、簡単にリアルで高品質なAI画像を生成したいユーザーにとって、非常に便利な機能であるのは間違いありません。
雑誌や広告クリエティブと遜色のないクオリティ
美女からイケメン、おじさん、おばあさんまで、「こういう人いるよな」ってくらい自然で、違和感がありません。
髪の毛一本一本や肌の質感、服のシワ、背景のディテールまで精密に描写。AI特有の同じ顔にならず、もはや実写と判別ができないレベルです。日本人のAI画像生成において、ImageFXは、頭一つ抜けているといっても過言ではないでしょう。
ドラマや映画の宣伝画像かと思うほどに実写顔負けのクオリティなので、商品・サービスの広告塔モデルなどに、AI美女を採用する企業が今後は増えていくでしょうね。
とはいえ現時点では、ImageFXが生成する画像の著作権について、明確なルールは確立されていませんので、商用利用する際は、著作権まわりの最新情報を十分に確認し、慎重に扱う必要はあるでしょう。
おわりに
ImageFXは、現時点では実験的なサービスということもあり、その生成結果は必ずしも完璧ではありません。
たとえば、日本刀を持つ侍の画像生成において、刃が逆刃になっているなど、歴史的な事実と食い違ったり、不自然な描写がされてしまうことがあります。
また、日本語を含む多言語に対応しているものの、日本語での生成精度は英語に比べて劣ります。Googleのモデルは、英語でのプロンプト入力を前提に学習されているため、英語で指示を出したほうが、意図した画像を生成しやすい傾向にあります。
さらに、不適切なコンテンツの生成を防ぐためにコンテンツフィルターが搭載されていますが、精度は完璧ではありません。Googleが不適切と判断した画像については表示されないものの、ユーザーが意図しない結果を返してくる可能性は残ります。
これらの課題はImageFXに限らず、他の画像生成AIにおいても共通です。そのため、サービスごとの強みや特性、弱点を理解し、プロンプトの工夫やパラメータ調整など試行錯誤することで、より実践的な活用法が見えてくるでしょう。
広告、マーケティング、エンターテイメント、アート・デザインなどさまざまなビジネス分野での利活用が期待されているImageFXは、今後の私たちの生活に大きな変化をもたらす可能性を秘めています。
そう遠くないうちのバージョンアップで、動画生成機能の追加や日本語対応の精度向上により、複雑なプロンプトにも対応できるようになっていくでしょうね。
また、Googleの他サービス(検索エンジンやGoogle Gemini(対話型AI)など)との連携が可能になり、よりシームレスで利便性の高いサービスに成長していくと思われます。今後の展開に、乞うご期待です。
▼ こちらの記事も何気に読まれています!
本記事では、ImageFXを実際に使っている筆者の所感も踏まえ、現状わかっている点についてサクッとまとめています。
情報収集を時短するアシストになれば幸いです。