もはや判別不能! 日本人のAI画像生成でImageFXが抜けている件

※本記事のアイキャッチは、ImageFX(Imagen 3)にて生成された画像です。

 

本記事では、ImageFXを実際に使っている筆者の所感も踏まえ、現状わかっている点についてサクッとまとめています。

ImageFXに関する情報のキャッチアップにどうぞ。

 

Googleが、画像生成AI技術「Imagen 3」を用いたAI画像生成ツール「ImageFX」を、Googleが提供するプラットフォーム「AI Test Kitchen」 にて発表しましたね。

 

「ImageFX」利用時のスクリーンショット

 

ImageFXは簡単にいうと、テキストからリアルな人物画像を生成するGoogleのAI画像生成ツールです。

とりわけ、日本人の特徴を捉えた自然な表情、姿勢などを高精度で再現できる点が高く評価されています。

 

 

現状(2024年8月31日時点)、ImageFXの生成物の商用利用について、公式なアナウンスはされていないようです。

ただし、SynthID(デジタルウォーターマーク)」が付与されることから、その画像がAIで作成されたものであると確認することができます。

ImageFXは、Googleアカウントがあれば、誰でも無料利用可能ですが、現状は1日の生成数に上限が設けられている模様です。

ImageFXは、将来的に、Googleの生成AIサービス「Gemini」に統合される可能性が高いようですが、統合後も無料で利用できるかわかりませんので、無料のうちに試しておいたほうがいいでしょう。

  

以前、日本マクドナルド社が生成AIを使用したプロモーション動画を作成し炎上してましたが、下記Xの投稿のようなクオリティであれば、世間の反応はまた違うものになっていたかもしれませんね。

 

 

ImageFXの生成物は、それくらい自然で違和感がないので。

 

 

ImageFXでできること

 

ImageFXは多機能なツールですが、主な機能(強み)としては以下の5つです。

① 高画質な画像生成: Imagen 3は、4K解像度の画像を生成する能力があり、細部までクリアでシャープな画像を生成できます。印刷用途やデジタル広告など、質の高いビジュアルが要求される制作物にも対応可能。

② リアルな人物画像生成: Imagen 3の高度なディープラーニング技術により、人物の表情や肌の質感がより自然で、かつ微細なニュアンスを捉えることができます。なかでも、日本人女性の自然な表情や姿勢の再現に強いのが、ImageFXの特徴です。

③ さまざまなスタイルの画像生成:「表現力チップ(expressive chip)」機能を使うことで、複数の画像バリエーションから最適なものを簡単に選択できます。リアルな画像からアニメ風、イラスト風とさまざまなスタイルに対応できます。

④ 既存画像の編集: 生成された画像に表示される編集ボタンを押すと、髪色や背景など選択した画像の一部分を、より細かく編集することができます。たとえば、画像内の変更したい部分を選択し、左側のフォームに変更内容をテキストで指示するだけで、選択部分のみにフォーカスした編集を行い、画像を再生成してくれます。

⑤ 架空のキャラクターや世界観の構築: 実在しない人物や風景を生成し、生成した画像を起点にオリジナルな世界観を構築したり、広告やプロモーションなどに横展開するといった可能性を秘めています。

 

たとえば、日本のアイドル(以下、1970年代風と2010年代風)に見立てた架空のアイドルを生成したり、架空のロックバンドのアー写を生成するといったユニークな使い方もできます。

 

 

「Midjourney」や「DALL-E 3」「FLUX.1」などのAI画像生成ツールでも、日本人の高品質な人物画像は生成できますが、日本人の特徴や、日本ならではの文化や風景、モチーフを扱うものへの理解が乏しいところがあり、プロンプトで細かく指示しても、韓国や中国のテイストも入り混じったりして、違和感のある画像が出力されてしまうことが多々ありました。

一方、ImageFXの日本の文化、風土への理解度は非常に高いものがあり、日本人の特徴を的確に捉えた人物の顔や表情、髪型、服装などを再現してくれます。

  

 

また、ImageFXには、「表現力チップ(expressive chip)」という機能が備わっています。簡単に説明すると、生成した一つの画像に対し、複数の選択肢を提示して、異なるスタイルや色調、構図を変えたアレンジを簡単に行える機能です。

たとえば、リアルな実写画像からCG調やアニメーション調に変更させたり、髪の長さや色などを部分的に変えたりといったことができます。

具体的には以下の画像のように、生成した際にプロンプトの一部が下線付きで表示されて、[Pretty]の下線部分をクリックすると、[beautiful] [handsome] [ugly]といった複数の選択肢が提示される感じですね。

 

 

 

 

別の単語やフレーズを選ぶことで、画像の要素を部分的に変更できます。ちなみに以下の画像は、[pretty]から[beautiful]へ変更したものです。

 

 

表現力チップ機能を使うことで、プロンプトをあれこれと調整し直さなくても、さまざまなバリエーションにて簡単に生成することができます。

さらに、生成された画像の一部分を塗りつぶして編集するといった機能もあり、選択部分のみを指示どおりに編集して画像を再生成するといったことも可能です。

複雑なプロンプトを考えるのは面倒ですし、直感的な操作で、簡単にリアルで高品質なAI画像を生成したいユーザーにとって、非常に便利な機能であるのは間違いありません。

 

雑誌や広告クリエティブと遜色のないクオリティ

 

 

美女からイケメン、おじさん、おばあさんまで、「こういう人いるよな」ってくらい自然で、違和感がありません。

髪の毛一本一本や肌の質感、服のシワ、背景のディテールまで精密に描写。AI特有の同じ顔にならず、もはや実写と判別ができないレベルです。日本人のAI画像生成において、ImageFXは、頭一つ抜けているといっても過言ではないでしょう。

ドラマや映画の宣伝画像かと思うほどに実写顔負けのクオリティなので、商品・サービスの広告塔モデルなどに、AI美女を採用する企業が今後は増えていくでしょうね。

とはいえ現時点では、ImageFXが生成する画像の著作権について、明確なルールは確立されていませんので、商用利用する際は、著作権まわりの最新情報を十分に確認し、慎重に扱う必要はあるでしょう。

 

おわりに

 

ImageFXは、現時点では実験的なサービスということもあり、その生成結果は必ずしも完璧ではありません。

たとえば、日本刀を持つ侍の画像生成において、刃が逆刃になっているなど、歴史的な事実と食い違ったり、不自然な描写がされてしまうことがあります。

また、日本語を含む多言語に対応しているものの、日本語での生成精度は英語に比べて劣ります。Googleのモデルは、英語でのプロンプト入力を前提に学習されているため、英語で指示を出したほうが、意図した画像を生成しやすい傾向にあります。

さらに、不適切なコンテンツの生成を防ぐためにコンテンツフィルターが搭載されていますが、精度は完璧ではありません。Googleが不適切と判断した画像については表示されないものの、ユーザーが意図しない結果を返してくる可能性は残ります。

これらの課題はImageFXに限らず、他の画像生成AIにおいても共通です。そのため、サービスごとの強みや特性、弱点を理解し、プロンプトの工夫やパラメータ調整など試行錯誤することで、より実践的な活用法が見えてくるでしょう。

 

広告、マーケティング、エンターテイメント、アート・デザインなどさまざまなビジネス分野での利活用が期待できるImageFXは、今後の私たちの生活に大きな変化をもたらす可能性を秘めています。

そう遠くないうちのバージョンアップで、動画生成機能の追加や日本語対応の精度も向上し、複雑なプロンプトに対応できるようになっていくでしょうし、Google検索エンジンやGoogle Geminiなどとの連携も可能になり、よりシームレスで利便性の高いサービスに成長していくと思われます。

今後の展開に、乞うご期待ですね。

  

▼ こちらの記事も何気に読まれています!

ABOUT US
HiraQ編集者/WEBライター/WEBデザイナー
都内の某広告代理店勤務。Web広告のライティング、編集、デザイン業務に従事。当サイト(Writehack.-ライトハックドット-)では主に、Webライターやブロガー、Webデザイナー向けに役立つ記事をゆるく発信します。山梨県出身。いて座のO型。犬より猫派。ラーメンは塩派。サッカーはプレミアリーグ派。