ここ1~2年で急速に成長してきているAI業界、chatGPTなども画期的でしたが画像生成もAIによって大きく変わってきています。
この記事では、AIによる画像生成の最先端を探りつつ、現在の課題にも触れます。どんな画像が生み出されるのか、そしてAIの画像生成を利用するための撮影法も解説します。
AI画像生成とは
AI画像生成とは、人工知能(AI)を使用して画像を生成することです。従来は、画像を作成するには、画家や写真家などの専門家が手作業で行う必要がありました。しかし、AI画像生成ツールの登場により、誰でも簡単に画像を作成できるようになりました。
AI画像生成のメリットとデメリット
AI画像生成には、いくつかのメリットとデメリットがあります。
ただしデメリットは今ではかなりの早さで改善されてきています。
精度に関しては、プロンプトと呼ばれるテキストの進化で高精度の画像も作成が可能になってきています。著作権に関しては、AIの進化に法の整備が追いついていないというのが現状です。グレーゾーンがかなり多い状態になっていることは確かですが、Adobeなどは、独自のやり方でほぼ完全に著作権の問題はクリアできそうです。Adobeが生成AIの学習に使っているのがAdobe Stock(アドビストック)の画像や著作権が切れた画像なので100%の商用利用が可能になるようです。画像も商用利用が可能になれば、もっと幅広く使用されるでしょう。
AI画像生成ツールの進化
AIを使った画像生成は、以前からありましたが、ある時期を境に飛躍的に進歩をとげます。そのきっかけとは?
機械学習とディープラーニング
画像生成AIは、機械学習とディープラーニングの技術を使用して開発されたAIです。このAIは、画像の特徴を学習し、その学習結果を元に新しい画像を生成できます。機械学習は、コンピューターにデータを与えて学習させ、新しいデータを処理できるようにする技術であり、ディープラーニングはその一種です。
ディープラーニングでは、人工ニューラルネットワークと呼ばれるコンピューターシステムを使用し、大量のデータから学習することで高度な画像生成が可能になります。人工ニューラルネットワークは、人間の脳の神経系に似た構造を持ち、画像生成において人間のような結果を生み出すことができます。
ディープラーニングを用いた画像生成AIは、従来の手法に比べてより高い精度で画像を生成できます。さらに、ユーザーの入力に基づいて、求められる画像を柔軟に生成することも可能です。将来的には、画像生成、分類、認識、補正などのさまざまな分野で広く活用されることが期待されています。
画像生成が進化した要素
ディープラーニング以外にも、AI画像生成の進歩に貢献している要素としては、以下のようなものがあげられます。
- 計算能力の向上
- データの増加
- アルゴリズムの改善
計算能力の向上により、ディープラーニングで必要な計算をより効率的に行うことができるようになりました。データの増加により、ディープラーニングが学習できるデータ量が増えました。アルゴリズムの改善により、ディープラーニングの精度が向上しました。これらの要因が相まって、近年のAI画像生成の進歩が加速しています。
AI画像生成ツールの種類
現在かなり数多くのツールがありますが、一般的なものをピックアップしてみました。
ツール | 画質 | 価格 | 特徴 |
Stable Diffusion | 高 | 無料 | オープンソースの画像生成AI。高品質な画像を生成できる。無料のGPUクラウドのGooglecolabの終了で有料GPUクラウドを使用必須(2023年6月) |
DALL・E 2 | 高 | 有料 | OpenAIが開発した画像生成AI。Stable Diffusion同様高品質な画像を生成できる。 |
Midjourney | 高 | 有料 | OpenAIが開発した画像生成AI。今の画像生成の進化はこのツールから始まりました。 |
Canva | 中 | 無料(制限あり) | グラフィックデザインツール。画像生成機能(text to imge)も搭載されている。 |
Adobe Firefly (ベータ版) | 中 | 無料 | Adobeが開発した画像生成AI。著作権問題を完全クリアできそうなツール。 |
Bing Image Creator | 中 | 無料 | Microsoftが開発した画像生成AI。 |
Stable Diffusion、 DALL・E 2、 Midjourneyは、プロンプトの複雑さやセットアップの難しさなどから素人向きではないです。
プロンプトとは、画像生成の呪文とも言えるもので、望む画像の特徴や品質などを具体的に伝える役割を果たします。さらに、ネガティブプロンプトと呼ばれるものもあります。これは、「こんな画像は作ってほしくない」という意図を詳細に伝えることで、生成の精度も向上します。
手軽に無料でできるものはCanva、Adobe Firefly、Bing Image Creatorですが、無料だと枚数制限があったりダウンロード画像にウオーターマークが入るものがあります。
特に写真関係ならばAdobe Firefly(ベータ版)とそれを実装したPhotoshop(ベータ版)が使いやすいです。
作品の使用について
https://firefly.adobe.com/
Adobe Firefly、Bing Image Creatorはダウンロードした画像にウオーターマークがついています。、それぞれについて、Google bardとBingでいろいろ調べてみました。
以下の記事は、独自に調べたものなので画像使用に際しては自己責任でお願いします。
Bing Image Creatorについては、
「作成物の使用。お客様は、本契約、Microsoft サービス規約、および弊社のコンテンツ ポリシーを遵守することを条件に、オンライン サービス以外の場所で、個人の合法的な非商業的目的のために作成物を使用できます。」
Bing Image Creator 利用規約より
https://www.bing.com/new/termsofuse?FORM=GENTOS
Adobe Firefly(ベータ版)のウオーターマーク(上記)が入った画像は、商用以外でレビューや解説などのブログで使用可能のようです。Adobe Fireflyは2023年下半期にエンタープライズ版ができる予定なのでそこで商用の利用も可能になる見込みです。
どちらも商用利用以外なら使えるという事らしいです。
2023年10月現在、有料版(月額680円)にて商用利用が解禁されています。無料版は今まで通りにウォーターマークが入っています。なお、無料版ではクレジットが月25回に制限されています。
現在のウォーターマーク、割とすっきりしました。↓
今のところAdobe以外の画像生成ツールは、著作権に関してはグレーゾーンです。
Adobe FireflyとPhotoshopで生成
ここでは、Adobe FireflyとPhotoshopを使った作例をあげてみます。ただし、詳細な使い方の説明ではなくこの機能を使うと、どんな画像ができるのかという事をみていきますので使い方などは動画や以下のリンクを参照してください。
Photoshopのベータ版もAdobe Fireflyを使っていますのでできることはほぼ同じことなのですが、写真の編集に関してはPhotoshopの方が細かい作業ができます。
ただし、パソコンのスペック次第ではかなり重くなります。私のパソコンはノートでかなり低スペックなので互換性に警告?っぽいものが出ますがゆっくりと生成はできました。あまり負荷のかかる処理だとフリーズするかもしれません。7日間の無料お試し期間でも使用できますので一度試してみるのもよいでしょう。Firefly(ベータ版)の場合はパソコンのスペックはあまり関係なくスムーズに生成できます。
まずPhotoshop(ベータ版)とFirefly(ベータ版)で現在使用可能な機能は、
Fireflyのほうは上記以外にテキストをいろんなイメージ画像に変換(Text Effects)したり、画像データの色味を自在に変えてくれる(Recolor Vectors)機能があります。
現在(2023年6月)Adobe Fireflyで使えない機能(写真の赤線で囲んだ部分)が3D画像の生成(3D to image)と、画像拡張(Extend image)ですが下半期にAdobe Fireflyのエンタープライズ版ができると使えるようになりそうです。
生成の実例
順に試していきたいと思います。
オブジェクトの生成(Adobe Firefly)
オブジェクトの生成は、何もない状態でテキストから画像生成をします。
プロンプトと呼ばれる言葉を入力してそれに合ったイメージを作成してもらいます。
https://firefly.adobe.com/
Stable DiffusionやDALL・E 2なども無料で使用できますが、プロンプトになれていないとなかなか思い通りの画像ができません。その点、Adobe Fireflyはもともと写真などに特化したところなので他で使う「高画質」「高精度」などの余計なプロンプトは必要なくわりと単純な言葉で、生成してくれます。
「text to image」を選ぶと、Describe the image you want to generate(English only)とプロンプトを入力するところがあります。
テキストボックスに「Deep sea,lots of jellyfish, fish ( 深海 たくさんのクラゲ 魚)」と入れてみました。2023年7月20日現在、日本語にも対応しています。
気に入らない場合は、さらに生成できます。アスペクト比やスタイルなどもいろいろ選べます。
Photoshopでは、この機能は「ジェネレ‐ティブ塗りつぶし」と言って選択範囲を使って画像を生成していきます。何もない状態で生成する機能はありません。(画像を選んで大部分を生成するという事は出来そうです)
背景(選択範囲)を生成(Photo shop、 Firefly)
FireflyではGenerative Fill(Photoshopのジェネレ‐ティブ塗りつぶし)と言う機能を使います。これは、Photoshopもほぼ変わらない使い方で背景を選択後に選択範囲にテキストでプロンプトを入力します。
背景だけじゃなく、選択した部分を置き換えたり、新たに生成もできます。
元画像です。
頭の上を選択後帽子を生成。
背景を森に入れ替えてみました、テーブルが不自然になるので人物の頭から手の部分まで選択して範囲を反転後、テキストボックスに「in the forest(森の中)」と入力して生成します。
そのままの服では森に似合わないので、服を選択して着せ替えてみました。
東京駅の元画像、下3分の1が道路で広くあいています。
プロンプト(Water surface reflection 水面 反射 )で生成、水の揺れた感じもよく出ています。
プロンプト(mirror reflection 鏡 反射)で生成、水と違ってクッキリ揺れがありません。プロンプト次第でイメージもかなり変わってきます。
画像拡張(Photoshop)
Fireflyで今はできない機能なのでPhotoshopのジェネレイティブ塗りつぶしを使います。
元画像を切り抜きツールを使って拡張します。
下に拡張したらテーブルを含めて選択します。腕の下ギリギリまで選択すること。
プロンプトに「cross legs in skirt(スカートで足を組む)」と入力したら、かなり大人の雰囲気で完成。
プロンプトに何も入れなくても、こんな感じで脚は生成してくれます。
元画像を切り抜きツールで左右に拡張します。
自然な感じに左右に拡張されました。元画像に少しかぶせて選択すると自然に仕上がります。ちなみに私の環境で上下左右全て拡張して生成しようとしたら、PCがフリーズしてしまったので、左右だけにしました。
削除(Photoshop、Firefly)
Photo shopでは、もともと削除のためのツールがありますが、ジェネレイティブ塗りつぶしを使うとより自然に消すことができます。
元画像、観光地の橋ってなかなか人がいなくならないですね。
人の居た場所もきれいに成型されています。
Fireflyを使った場合もみていきましょう。
Generative Fillを使って元画像をアップロード。
選択範囲を決めます。
消去後、スッキリと消えています。
AI画像生成の今と昔
AIによる画像生成はここ1~2年で、今までの数十年を上回るくらい急速に進歩してきています。
コンピューターハードウエアの性能向上により、画像生成AIはより多くのデータ処理を実行できるようになり、より高品質な画像を生成できるようになりました。また、大規模なデータセットの利用により、画像生成AIはより多くの画像を学習できるようになり、より自然な画像を生成できるようになりました。さらに、機械学習アルゴリズムの改良により、画像生成AIはより効率的に画像を生成する方法を学ぶことができ、画像生成の速度が向上しました。
これらの要因により、画像生成AIはここ1~2年で急速に進歩し、実用のレベルに達しました。画像生成AIは、画像編集、画像生成、画像検索などの分野で幅広く利用されています。また、画像生成AIは、新しい芸術作品の創作や、新しい商品やサービスの開発にも利用されています。
今後も画像生成AIはさらに進歩し、私たちの生活にさまざまな影響を与えると考えられます。
以前のAIとの比較
2019年にリリースしたルミナー4を使った背景の置き換えと削除を最新のPhoto shop(ベータ版)と比較してみます。
背景の置き換え
青空に向けて咲く花の写真。
ルミナー4で置き換え後に画像編集しています。
Photo shop(ベータ版)で置き換え編集はしていません。編集するとほぼ似たような画像ができそうです。
削除
元画像ですが、後ろの方まで複数の人がみえます。
ルミナー4で削除。何か不自然になっています。
Photo shop(ジェネレ‐ティブ塗りつぶし)で削除。
拡大して比較、左がルミナー4、右がPhotoshop(ベータ版)かなり違いが出てますね。
ルミナーも今はneoに変わって進化していますので、これよりはうまく削除できると思いますが、ルミナー4の場合は完全に削除できておらず不自然なものが生成されています。それに比べるとPhoto shop(ベータ版)のほうは、全く違和感もなく再現、生成してくれています。わずか4年ほどでこんなに進化しているのですね、先を考えるとちょっと怖くなりそうです。
AIの苦手な分野
まだ進化の途中ということもあって、完璧に生成できない画像もあります。
よく言われるのが、人物の手や指の形が不自然ということですが、やはり苦手な分野もあるようです。
バックの暗い画像を選んで背景を選択して bright blue sky(明るい青空)とプロンプトを入力。
何度生成し直しても全くイメージに合わない画像になりました。もしかすると花の端部が暗くなっているので明るすぎる背景が合わないとAIが判断したのかは定かではありませんが、なかなか思い通りにいかないということも今はあります。
プロンプトを入力した人の主観ではなく、学習した要素で生成される画像が変わってくるという事です。例えば、ネコの画像を子ネコで学習したとするとプロンプトにネコと入力して生成される画像は
すべて子ネコになり、何度再生成しても親ネコの画像はでてこないということです。
実際はこんな単純ではないのですが、学習していない要素は画像には反映されないという事ですね。AIは人間のように想像で物を作ることが今は出来ません。でも、きっとこれも近い将来改善されていく事でしょう。今の学習スピードは尋常じゃない早さなので。
変わっていく写真撮影
https://firefly.adobe.com/
AIを使った画像生成を行うという前提で撮影法を考えるということも今後は出てくるでしょう。
- 何かを生成するために、左右にスペースを空けて撮影。
この場合、何を生成するのか具体的にイメージできるとよりそれにあわせた撮影ができます。 - 背景を切り抜きやすいように単純にする。
いまだに複雑な背景は、完璧には生成できないことが多いです。かなり進化しているとはいえ、少しでも本物らしくみせるためには、単純な背景の方が成功しやすいです。 - 置き換えるオブジェクトに複雑なものを選ばない。
指先や髪の毛など複雑なものを選ぶと失敗も多くなるのでオブジェクトも単純なものを選びましょう。ただしPhoto shopを使っている場合は、そのまま編集をすることができるので編集が得意な方はそれほど気を使う必要がないです。
一般の撮影の基本、構図などからは、ちょっと外れた撮り方となります。今までの写真の常識もくつがえすような撮影方法というのもがAI画像生成には必要になって来るかもしれません。
例をあげると、
左が元画像、花の上にカエルが乗っているので花をそのまま手に置き換えてみました。ちょっと手の生成があやしい感じもしますが、元画像のカエルの姿勢を生かしてみました。
AI画像生成の未来
AI画像生成の未来は、より高精度で、より創造的なものになるでしょう。また、AI画像生成は、さまざまな分野で活用されるようになるでしょう。
精度が向上することで、現実と見分けがつかないほどリアルな画像を生成できるようになります。これは、映画やゲームなどのエンターテインメント業界で、よりリアルな映像を実現するために活用され、教育や医療などの分野でも、より効果的な学習や診断を行うために活用されるでしょう。
創造性が向上することでは、これまでにない新しい画像を生成できるようになります。これは、広告やファッションなどの分野で、より斬新なデザインを実現するために活用されるでしょう。また、建築やインテリアなどの分野でも、より魅力的な空間をデザインするために活用されるでしょう。
AI画像生成は、さまざまな分野で活用されるようになり、その可能性は無限大で、私たちの生活をより豊かにしてくれるでしょう。
未来の使用法
AI画像生成の新しい使い方は、考えるときりがないくらいあります。例えば、
- 商品やサービスの宣伝に、AI画像生成で作成した画像を使用することで、より魅力的に訴求できます。
- 教育の分野では、AI画像生成で作成した画像を使って、よりわかりやすく、効果的な学習コンテンツを作成。
- 医療の分野では、AI画像生成で作成した画像を使って、より正確な診断や治療を行うことができます。
- 建築やインテリアの分野では、AI画像生成で作成した画像を使って、より魅力的な空間をデザイン。
- ファッションの分野では、AI画像生成で作成した画像を使って、より斬新なデザインの衣服やアクセサリーを作成。
これらは、AI画像生成の新しい使い方のほんの一例です。AI画像生成の可能性は無限大であり、私たちの生活をより豊かにしてくれるでしょう。
まとめ
https://firefly.adobe.com/
AIの進化は驚異的なスピードで進んでおり、その流れに追いつくことは容易ではありません。しかし、確実に言えることは、将来に向けてそのスピードはさらに加速するということです。
写真に関しては、これまでの撮影方法を否定するつもりはありません。ただし、画像生成技術に合わせた新たな撮影のアプローチを考える必要があります。これによって、より楽しく多様な写真の世界が開かれることは間違いありません。
AI画像生成を楽しんでみませんか。
スマホで撮るトリック写真はこちら↓