ChatGPTで画像生成！Dall･E3やSoraとの違いは？Midjourneyとの比較も

2025年3月25日。OpenAI社より、ChatGPT4oの画像生成機能「4o Image Generation」がリリースされ、注目を集めました。（以降、「4o画像生成」と表記することもあります）ChatGPTでは以前より「Dall･E3」という画像生成モデルを使用でき、またSoraでも画像生成機能があるなど、混乱している方もいるでしょう。

4o画像生成とDall･E3、Soraは同じ？何が違うの？
画像生成AI「Midjourney」とどちらが優秀？

この記事を読むことで、上記のような疑問が解決します。

こんにちは、シントビ管理人のなかむーです。

結論から言うと、4o画像生成とDall･E3は別物、Soraの画像生成とはほぼ同じです。Midjourneyユーザーの私が、どちらが優秀かも紹介します。

今回も文系目線でわかりやすく解説していきます。

この記事を読むことで以下のことがわかります。

この記事でわかること

4o画像生成とDall･E3、Soraの画像生成の違い
Midjourneyとどちらが優秀か
4o画像生成の使い方

今回の内容を参考にChatGPTで画像生成を始めてみましょう。

この記事の目次

ChatGPTユーザーが使える3つの画像生成方法とは
- 4o画像生成、DALL-E3（ダリスリー）、Soraの画像生成の特徴
- 4o画像生成、Dall･E3（ダリスリー）、Soraの画像生成の違いを検証
4o Image GenerationとMidjourney｜どちらを選ぶべき？
- Midjourneyとは？クオリティーレベルが最高クラスの画像生成AI
- 4o Image GenerationとMidjourneyの生成画像を比較
ChatGPT4oの画像生成機能の使い方
ChatGPTの生成画像は商用利用できる？規約を守ればOK
生成AIスキルを高めたい方はスクールもおすすめ！
ChatGPTで画像生成を始めよう！

ChatGPTユーザーが使える3つの画像生成方法とは

ChatGPTユーザーは2025年4月現在、3つの画像生成方法を利用できます。

4o Image Generation（ChatGPT4oの画像生成機能）
Dall･E3（ダリスリー）
Sora（ソラ）の画像生成

それぞれの特徴を解説していきます。

4o画像生成、DALL-E3（ダリスリー）、Soraの画像生成の特徴

「4o Image Generation（4o画像生成）」は2025年3月にリリースされたGPT4o（GPT4オムニ）の画像生成機能です。通常のチャットインターフェースから、簡単に画像生成を指示できます。画像のクオリティーや文字精度の高さが特徴的です。

以下の画像のように、漢字やひらがな、カタカナも画像内で表現できます。

「Dall･E3（ダリスリー）」は2023年にChatGPT上で利用可能になったOpenAIの画像生成モデルです。現在でもGPTsで利用できますが、4o画像生成と比べるとクオリティーが低いため、今後利用されることはなくなるでしょう。

「Sora」は動画生成AIという位置づけが一般的ですが、画像生成も可能です。Soraの画像生成機能もクオリティーが高いのが特徴です。4o画像生成との違いは、画像生成を行なうインターフェースです。

4o画像生成がチャットインターフェースで画像生成を行なうのに対し、Soraは専用のインターフェースで画像生成を行います。そのため、細かい調整などがしやすいのが特徴です。

上の画像の赤枠の箇所でプロンプトを入力したり、サイズの設定や生成枚数、プリセットの選択をします。

Soraは厳密にはChatGPTとは別物になりますが、同じOpenAIが提供する生成AIで、ChatGPTの有料ユーザーが追加料金なしで使えるため、今回紹介しました。

4o画像生成、Dall･E3（ダリスリー）、Soraの画像生成の違いを検証

実際に画像を生成させて違いを見てみましょう。今回使用したプロンプトは以下です。

Tokyo, Cyberpunk, AI robots walking through the city, buildings and Tokyo Tower

（東京、サイバーパンク、AIロボットが歩く街なか、ビル群と東京タワー）

まずは4o Image Generationです。

暗い街を歩くAIロボットがなんとも不気味でかっこいいですね。うまくできていない箇所もありますが、一部日本語も記述できています。東京タワーは一目でわかりますね。

続いてDall･E3です。

Dall･E3は日本語の精度はダメですね。東京タワーというよりは、スカイツリーです。今となっては画像のクオリティーが低いと言わざるを得ませんね。

最後にSoraです。

かなり4o画像生成と似ていますね。クオリティーは高いです。

4o Image GenerationとSoraの画像生成を行なう中のモデルは、同一かもしれません。

簡単に表でまとめます。

	4o画像生成	Dall･E3	Dall･E3
クオリティー	高い	低い	高い
生成速度	遅い	早い	遅い
自然言語処理	可能	可能	不可
プリセット	なし	なし	あり
拡張子	.png	.webp	.webp

自然言語処理とはチャットで会話するようにプロンプトを指示できるかどうかです。プリセットは「漫画調で」や「ピクセルアート風に」というテイストなどを入れるものです。

プリセットを使いたい場合にはSoraを、そうでなければ4o画像生成を使用するのがおすすめです。

4o Image GenerationとMidjourney｜どちらを選ぶべき？

仕事で画像生成をしたい方で、4o画像生成とMidjourneyのどちらを選ぶべきか悩んでいる方もいるでしょう。そのような方向けに、両者で画像を生成し、比較してみましょう。

Midjourneyとは？クオリティーレベルが最高クラスの画像生成AI

画像生成AIブームの火付け役といえば「Midjourney」でしょう。2022年のデジタルアートのコンテストでMidjourneyで生成された画像が1位を獲り、一躍有名になりました。

長らく、画像生成といえば「Midjourney」か「Stable Diffusion」と言われ、使いやすさの観点からMidjourneyを利用していた方も多いと思います。（私もその一人！）

4o Image GenerationとMidjourneyの生成画像を比較

実際に生成した画像を比較してみましょう。リアルな静物画、リアルな人物画、アニメ調の人物画の3つの観点で比較します。プロンプトには同一のものを与えています。

リアルな静物画

まずは4o画像生成で生成したワイングラスです。非常にクオリティーが高く、実物写真と見分けが付きません。

続いて、Midjourneyで作成したワイングラスです。こちらもとても美しいグラスで本物と見紛うクオリティーですね。

どちらもクオリティーが高く、HPなどで使用しても全く問題ないレベルです。この勝負は引き分けとなりました。

リアルな人物画

続いてリアルな人物画です。

まずは4o画像生成です。実際にいそうな人物画像が出力されました。会社のHPやLPなどでも使えるレベルでしょう。今回はあまり細部までこだわっていませんが、もっとクオリティーを高めることも可能です。

続いて、Midjourneyです。とても爽やかなイケメンで、こちらも本物の人間と区別がつきません。

色々試しましたが、4o画像生成はリアルな描写が得意です。この勝負も引き分けとなりました。

（完璧すぎるのが逆にAIっぽい笑）

アニメ調の人物画

最後にアニメ調の画像です。

まずは4o画像生成。好みもあると思いますが、クオリティーは高くありません。ただ、サムネなどには、これでも十分使用できるでしょう。

ちなみに、アニメ画像を作成すると背景が簡素になりやすい傾向にあります。

続いてMidjourneyです。圧倒的にクオリティーが高いですね。

画像のクオリティーを下げることはいくらでもできるので、アニメ画像に関しては、Midjourneyの方が優秀といえます。

その他の比較内容も合わせて簡単な表にしました。

	4o画像生成	Midjourney
静物画像	◯	◯
リアルな人物画像	◯	◯
アニメ画像	△	◯
画像内の日本語表現	◯	×
簡易さ	◯	△
細かい調整	△	◯
料金	月額20ドル〜（画像生成以外もできる）	月額10ドル〜
オススメな人	ちょっと画像生成をしたい	仕事でバリバリ使いたい

Midjourneyは画像の縦横サイズを柔軟に指定できたり、ズームアウトしたり、一部分だけ的確に変更したりもでき、柔軟性が高いです。また、一度に4枚生成でき、4o画像生成と比較して画像生成スピードも早いです。一方で、操作を覚えるのには少し時間がかかるでしょう。

あまりいないでしょうが、画像生成をするためだけにChatGPTを契約する場合、月20ドルはコスパが悪いです。ただし、元々ChatGPTを使っていたからすると、追加コストはないため、大変コスパが良いです。

本格的に画像生成を仕事を使う方にはMidjourneyがオススメですが、たまに使う程度であれば4o Image Generationで十分でしょう。

ChatGPT4oの画像生成機能の使い方

4o Image Generationの使い方を解説します。使い方はとても簡単です。

ChatGPTのチャット画面を開きモデルを選択します。チャット欄にある「⋯」をクリックし、「画像を作成する」を選択します。

あとはプロンプトを入力して、ChatGPTに指示するだけです。

生成された画像をクリックすると拡大表示されます。画像を保存したり、追加でプロンプトを入れて修正を加えたりできます。

なお画像生成に対応している言語モデルは以下の通りです。（2025年4月時点）

GPT4o
GPT4o-mini
GPT4.5
GPT4（2025年4月30日まで）

ChatGPTの生成画像は商用利用できる？規約を守ればOK

ChatGPTで生成した画像は、以下の禁止次項に抵触しない限り、商用利用可能です。

禁止事項　お客様は、違法行為、有害行為、又は悪用する行為のために当社の本サービスを使用してはなりません。例えば、以下の事項は禁止されます。

他者の権利を侵害、悪用、又は侵害する方法で本サービスを使用すること。
当社の本サービスを変更、コピー、リース、販売、又は配布すること。
当社モデル、アルゴリズム、又はシステムを含む、本サービスのソースコード又は基礎となるコンポーネントの発見、リバースエンジニアリング、逆コンパイルについて試みたり、他者を支援したりすること（当該制限が適用法令で禁止されている場合を除く）。
データ又はアウトプット（以下に定義します）を自動又はプログラムにより引き出すこと。
人が作り出したものではない場合に、アウトプットを人が作り出したものと表示すること。
レート制限や規制を回避したり、当社が本サービスに実装させている保護措置や安全管理上の緩和対策を迂回したりするなど、本サービスを妨害又は中断させること。
アウトプットを使用して、OpenAIと競合するモデルを開発すること。

引用：OpenAI公式サイト利用規約

他人の著作権を侵害するようなプロンプトを入れると、そもそも生成されません。悪質な場合には、利用が制限されたり、アカウントが停止したりすることもあるそうですから、注意しましょう。

他にも、暴力的な表現や性的な表現、人を貶めたり、世の中を混乱させたりするディープフェイクなどもNGです。絶対に止めましょう。