誰でも、手軽に、高品質な画像が作れる、画像生成AI。2023年は多くの画像生成AIがリリースされた1年でした。
その中でも一際注目された画像生成AIが、「DALL•E3(ダリスリー)」です。
DALL•E3って何?特徴は?
DALL•E3の使い方が知りたい!
商用利用はどうなってる?!
この記事を読むことで、上記のような悩みや疑問が解決します。
数ある画像生成AIの中でも、「DALL•E3」は最も使いやすく、また高品質な画像生成ができるAIと言って、過言ではありません。
こんにちは、シントビ管理人のアキラです。
2023年にChatGPT上で利用できるようになった「DALL•E3」は、画像生成AIの中でも、特に注目されているツールの一つです!
今回も文系目線でわかりやすく解説していきます。
この記事を読んでいただくことで、「DALL•E3」の特徴だけでなく、使い方まで習得することが可能です。
この記事を参考に、ぜひ画像生成を楽しんでみてください。
DALL•E3(ダリスリー)とは?画像生成AIの新時代
「DALL•E3(ダリスリー)」は、「ChatGPT」で有名なアメリカの「OpenAI」社が開発、提供している画像生成AIです。
DALL•E3はChatGPTの有料プランである「Plus」や「Team」を契約していれば、誰でも利用可能です。
このDALL•E3で生成される画像はとてもクオリティーが高く、リアルな画像から水彩画やアニメの画像など、様々なジャンルにも対応しています。
近年、様々な画像生成AIが登場しましたが、DALL•E3はそれらとは異なる特徴を持っていますので、次項で詳しく解説します。
画像生成AIについて知りたい方は以下の記事を参考にしてください。
Youtubeやブログをはじめとした様々な場面で、画像生成AIで生成された画像を見かけるようになりましたね。
ChatGPT上で動作する
DALL•E3は、ChatGPT上で動作する画像生成AIです。
「ChatGPT上で動作する」の意味するところは、私たちが日常で使用する自然言語で画像生成AIに指示を出せるということです。(ChatGPTの特徴が、「自然言語でやり取りできる」という点ですね。)
通常、画像生成においてAIに対する指示(プロンプト)は、「watercolor,cat,garden」のように、単語を列挙するように行います。もちろん文章も可能ですが、普段会話で使う表現とは若干異なります。
しかし、ChatGPTでは、「庭に猫がいる水彩画を書いて」のように、普段の会話のように指示することが可能です。
画像生成AIのプロンプト作成に難しさを感じる方も多かったと思いますが、DALL•E3では、それらの難易度が格段に下がったということです。
「プロンプトエンジニアリング」という言葉ができたように、どのように指示を出すかがとても重要です。DALL•E3では、普段の会話のように指示が出せます。
生成された画像に追加で指示ができる
AIで画像生成をした際、「少し変えてほしい」「ちょっと違うな」というように、歯痒さを感じたことは誰しも一度はあるでしょう。
他の画像生成AIでは、再度作成してみたり、プロンプトを変更してみたりして、試行錯誤し続ける必要があります。この際、元の画像から大きく変わってしまうことも頻繁にありますね。(少しだけ変えたいのに、全体が変わってしまいます)
しかしChatGPT上で利用できるDALL•E3では、「服の色を赤に変更して」「表情を笑顔に変えて」と指示するだけで、その通りに変更を加えてくれます。
一度生成した画像を元に、追加で変更を加えられるという点は、DALL•E3の大きな特徴の一つと言えるでしょう。
この変更の手軽さは、驚嘆に値します!
DALL•E3での画像生成3ステップ
DALL•E3を活用して画像を生成することは、とても簡単です。
ChatGPTの有料プランを申し込む
DALL•E3はChatGPTの有料プランで利用できます。そのため、まだ有料プランでない方は、先にChatGPTの有料プランを申し込みましょう。
個人で利用する場合、「Plus」のプランが月額20ドルです。
まだChatGPTの利用を初めていない方、アップグレード方法を知りたい方は、以下の記事を参考にしてください。
DALL•E3のGPTsを利用する
ChatGPTにログインをしたら、「GPTs」と呼ばれるカスタマイズされたChatGPTを利用します。追加料金は不要です。
左メニューバーの「GPTを探索する(Explore GPTs)」をクリックします。
GPTストアが表示されますので、「DALL•E3」を探しましょう。「By ChatGPT」のカテゴリーの中にあります。
「DALL•E3」のChatGPTをクリックすると、チャット画面が表示されます。
テキスト入力バーにプロンプトを入力する
あとはテキスト入力バーにプロンプト(AIへの指示)を入力するだけです。
試しに「水彩画で猫を描いて。猫は三毛猫で日本家屋の縁側で気持ち良さそうに寝ている。」というプロンプトを入力してみます。
指示通りに画像が2枚生成されました。
画像をクリックすると、拡大表示されます。赤枠をのダウンロードボタンをクリックすることで、画像を保存することが可能です。
また次の画像の赤枠の箇所をクリックすると、使用されたプロンプトが表示されます。
私たちが入力した日本語のプロンプトは、表現豊かな英語に変換されて、AIに指示が出されているのがわかりますね。使用されたプロンプトが表示されるので、次回のプロンプト作成の参考することもできます。
次に作成した画像に変更を加えてみましょう。「庭に木を追加して」とプロンプトを入力すると、庭に木が追加された画像を生成してくれました。
このように出来上がった画像を元に、追加変更を加えられるのがDALL•E3の特徴です。
DALL•E3でよりよい画像を生成するコツ
DALL•E3で出来上がった画像は十分高品質ですが、さらによくするためのテクニックを紹介します。
英語でプロンプトを入力する
ChatGPTはアメリカの企業が開発しているため、AIの裏側は英語で動作しており、DALL•E3への指示も英語で行われています。
日本語で入力されたプロンプトが英語に変換されてから、AIに伝えられているのでしょう。日本語→英語に変換される際に、正しく変換されているか、細かいニュアンスまで伝わっているか、は結果でしかわかりません。
そこで、もし可能ならば、初めから英語を使用してプロンプトを入力すると、細かいニュアンスまで正確に伝わると考えられます。
例えば「かわいい」という単語を英語にすると、「cute」「charming」「lovely」「pretty」など様々な表現がありますね。
自分のイメージを正しく言語化してAIに伝えることが重要です。
AIの学習には、英語が一番多く使われていますので、AIは英語が最も得意です。
やり取りしながら微調整をする
画像生成AI全般に言えることですが、一度でイメージ通りの完璧な画像を生成することは困難です。
常に、出来上がった画像を見比べ調整していき、イメージに近づけるというステップを意識しましょう。
プロンプトには、主に以下の3点を加えることを意識して、生成を始めてみてください。
- 作風:リアルな写真、水彩画、ポップアートなど
- 主題:猫,双子の子供,建物など
- 補足:緑溢れる公園、人通りの多い商店街、草原など
そして出来上がった画像に対して、「○○を追加して」「○○を変更して」「○○は削除して」のように微調整をして、イメージに近づけていくといいでしょう。
イメージする画像のファイルを読み込ませてプロンプトに変換する
ChatGPTでは画像ファイルをアップロードすることができます。そして、その画像をAIに解釈させて、プロンプト(文章)で表現させることが可能です。
試しにMidjourneyで作成した「女性とロボットが打ち合わせをしている画像」を読み込ませてみましょう。テキスト入力欄の横にクリップのアイコンをクリックすると、ファイルをアップロードすることが可能です。
プロンプトには「画像生成をするためのプロンプトに起こして。」と入れます。上の画像のように、DALL•E3より返答がありました。
このプロンプトを元に画像を生成してみましょう。
どうでしょうか、かなりクオリティー高く生成してくれました。
便宜的に”プロンプトに起こす”というステップを踏みましたが、画像を読み込ませてそのまま画像生成の指示を出すことも可能です。
このように、画像ファイルを読み込ませることで、イメージに近い画像の生成を行うことができます。
DALL•E3の商用利用は?
DALL•E3による画像生成の商用利用については、OpenAI社が設定したガイドラインに従う必要があります。
DALL•E3で作成した画像は基本的に、広告や製品デザイン、Webコンテンツなどの商業目的での利用が可能です。
ただしその場合、他人の著作権や知的財産権を侵害するような画像の生成は認められていません。
また他人を貶めたり、社会を混乱させるようなフェイク画像などを生成することは、倫理的に問題があります。
DALL•E3では著作権で保護されているキャラクターなどを描こうとすると、以下のような答えが返され、画像生成自体が行われません。
それでもやり方によっては、著作権を侵害するような画像を生成することは可能でしょう。これは違法になりますので、法律の範囲内で利用してください。
画像生成AIで作成した画像を販売してみよう!
画像生成AIで作成した画像は様々な形で利用できますが、それ自体でマネタイズできている人は少ないでしょう。
そこであなたが作り出したプロンプトを販売してみてはいかがでしょうか。
プロンプト売買のマーケットプレイス「PromptWorks」では、MidjourneyやDALL・E、ChatGPTなど様々なAIツールのプロンプトを販売、購入ができます。
現在リリースされているベータ版では、プラットフォーム利用料はなんと0円!決済手数料は、わずか5%+50円です。(2024年6月時点)
PromptWorksの詳細や登録方法、販売方法については以下の記事を参考にしてください。
AIで稼げる可能性がありますね!
ChatGPTでスキルアップをしたい方は
ChatGPTが世界に公開されて1年以上が経ちましたが、増々ChatGPTの存在感は増すばかりですね。
すでに多くの企業で生成AIが取り入れされていますが、まだ「生成AIの活用の仕方がわからない」「周りにおいていかれている」と焦っている方も多いでしょう。
そのような方向けには「DMM 生成AI CAMP」がオススメです。生成AIのスクールとしては日本国内唯一のリスキリング補助金適用を受けられるオンラインスクールです。
以下の記事で詳しく紹介していますので、興味がある方はぜひご覧ください。
DALL•E3で手軽に高品質な画像を生成しよう
今回の記事では、ChatGPTで画像生成を行うツール「DALL•E3」について解説をしました。
ChatGPT上で画像生成AIが利用できるとあって、世界中で利用され始めています。特にロゴやアイコン作成、イラスト、サムネイルなどでの利用が目立ちます。
今後は、企業で広告やWebページの画像などにも広く使われることでしょう。
ぜひ今のうちから親しんで、仕事や趣味に活用してみてください。
最後までお読みいただき、ありがとうございました!!