はじめに:同じ指示を出したら、画像はどれくらい違うのか?
皆さんは、生成AIで画像生成をしたことがありますか?
最近では、
ChatGPT、
Microsoft 365 Copilot、
Gemini
といった生成AIでも気軽に画像生成できるようになりました。
ただ、実際に使ってみると、
「結局、何がどう違うのか?」
「同じことを頼んだら、結果はどれくらい変わるのか?」
と感じることはないでしょうか。
このシリーズでは、
3つの生成AIにまったく同じプロンプトを与え、実際に生成された画像を並べて比較する
という、シンプルな実験を行います。
優劣を決めることや、ランキングを作ることが目的ではありません。
あくまで「同じ条件で試したら、今回はこうなった」という観察と記録です。
今回の比較実験について
この実験でやること
今回の記事では、次の条件で画像生成を行います。
- 3つの生成AIに同一の日本語プロンプトを入力する
- 画像生成は各AIにつき1回のみ
- 生成された画像を、そのまま並べて比較する
生成時点のモデルや仕様によって結果が変わる可能性があるため、
この記事の内容は「執筆時点での結果」に基づくものです。
この実験でやらないこと
一方で、次のことは行いません。
- どの生成AIが「一番良いか」を決めること
- 点数付けや順位付け
- 画像の良し悪しを断定する評価
あくまで、表現の傾向や解釈の違いを見て、
皆さん自身が判断するための材料を提示することを目的としています。
今回使用したプロンプト
比較に使用する共通プロンプト
以下が、今回の比較実験で使用したプロンプトです。
3つの生成AIすべてに、同じ文章をそのまま入力しています。
これまでの会話内容や、私との過去のやり取りがあれば、それらはすべて無視してください。
この指示文に書かれている条件のみを前提として考えてください。
以下の条件に従って、画像を1枚生成してください。
・テーマ:「学び」と「テクノロジー」を組み合わせた日常のワンシーン
・表現:シンプルでフラットなイラスト
・色数:少なめ
・背景:白
・雰囲気:落ち着いていて、親しみやすい
・文字やロゴは入れない
説明文や補足は不要です。画像のみを生成してください。
このプロンプトは、
抽象すぎず、かといって具体的に縛りすぎない内容にすることで、
各生成AIの解釈や表現の違いが出やすいことを狙っています。
生成された画像の比較結果
それでは、実際に各生成AIが生成した画像を見ていきます。
以下に掲載している画像は、同じ日本語プロンプトを入力し、各生成AIにつき1回だけ生成した結果です。画像の加工や選別は行っていません。
この段階では、「どれが良いか」「どれが正しいか」は考えず、まずは見たままの印象を持ってもらえればと思います。
ChatGPT が生成した画像

ChatGPT には、チャット画面に直接プロンプトを入力し、そのまま画像を生成してもらいました。
Microsoft 365 Copilot が生成した画像

Microsoft 365 Copilot については、少し補足が必要です。
同じプロンプトをチャット画面に入力したところ、今回の環境では画像はチャット上に表示されませんでした。
その後、「作成」というメニューに進んで同じプロンプトを入力すると、画像が生成されることを確認できたため、今回はその画像を比較対象として使用しています。
この挙動は、システムやブラウザなどの利用環境によって異なる可能性があります。
Gemini が生成した画像

Gemini についても、チャット画面にプロンプトを入力し、そのまま画像を生成しています。
ここまでが、同じプロンプトを使って生成された3枚の画像です。
次のパートでは、これらの画像を並べて見たときに気づく点や、表現・構図・解釈の違いについて、あらためて整理していきます。
生成された画像を見比べて気づいた点
3つの画像を並べて見てみると、同じプロンプトを使っているにもかかわらず、表現の方向性や解釈にははっきりとした違いが見えてきます。
以下では、それぞれの生成AIがどのような要素を重視しているように見えるかを、観察ベースで整理します。
ChatGPTの画像から受ける印象
ChatGPT が生成した画像は、「日常の学習風景」を中心に、学びに関連する要素を周囲に配置する構成になっています。
- ノートパソコンで学習する人物が主役になっている
- 電球、動画、通信などのアイコンが点在している
- 全体として、落ち着いた雰囲気で情報量はやや多め
学びの手段として、テクノロジーが自然に生活の中に溶け込んでいる、という印象を受けます。
Microsoft 365 Copilotの画像から受ける印象
Microsoft 365 Copilot の画像は、学習ツールや情報リソースを整理して並べるような構成が特徴的です。
- 人物を中心に、クラウドや地球、専門的なモチーフが配置されている
- 全体の構図が比較的整っている
- 学びを「情報の集約・管理」という視点で捉えているように見える
日常感よりも、学習環境や仕組みそのものを表現している印象が強く、落ち着きつつもやや整理された雰囲気があります。
Geminiの画像から受ける印象
Gemini が生成した画像では、「人とテクノロジーの関係性」が比較的はっきり描かれています。
- 人物の近くにロボットが配置されている
- 本や電球、検索を連想させるアイコンが円状に並んでいる
- 学びのプロセスを象徴的・抽象的に表現している
現実の学習風景というよりも、未来的・概念的な「学びのイメージ」を強調しているように感じられます。
今回の比較から見えてきたこと
今回の条件で生成された画像を見比べると、
- 同じテーマでも
- 「日常の風景」として描くか
- 「学習環境」として整理するか
- 「人とAIの関係」として象徴化するか
といった 解釈の方向性が分かれていることが分かります。
これは、どれが正しい・優れているという話ではなく、
同じプロンプトでも、
どこに焦点を当てるかが生成AIごとに異なる
という、今回の実験ならではの結果だと言えそうです。
どれが良いということではありません
繰り返しになりますが、この記事では、どの画像が一番良いかを決めることはしません。
- どの雰囲気が好みか
- どの表現が用途に合いそうか
は、読む人それぞれで異なるはずです。
今回の比較結果は、その判断をするための 一つの材料 として、記録しておきたいと思います。
まとめ:同じプロンプトでも、結果は一様ではなかった
今回は、
ChatGPT、
Microsoft 365 Copilot、
Gemini
の3つの生成AIに、まったく同じ日本語プロンプトを与え、生成された画像をそのまま並べて比較しました。
その結果、テーマや条件は同じでも、表現の方向性や重視する要素には違いがあるという点が、はっきり見えてきました。
- 日常の学習風景として描く
- 学習環境や情報の整理として表現する
- 人とAIの関係性を象徴的に表す
といったように、どこに焦点を当てるかは、生成AIごとに異なるように見えます。
今回の結果は「一例」である
今回の実験結果は、あくまで この条件・この環境・このタイミングでの結果 です。
- 生成AIの仕様変更
- モデルの更新
- 利用環境やUIの違い
によって、同じプロンプトを使っても結果が変わる可能性は十分にあります。
そのため、この記事の内容は「常に同じ結果が得られる」ことを保証するものではありません。
優劣ではなく、使い分けを考える材料として
この記事では、
- どの生成AIが一番優れているか
- どれを選ぶべきか
といった結論は出していません。
代わりに、
同じ指示を出したときに、
どのような違いが現れるのか
という点を、実際の生成結果を通して記録しました。
生成AIは、「正解を出す道具」というよりも、表現の方向性や発想の幅を持つ道具として見ると、違いがより分かりやすくなるように感じます。
次回以降について
このシリーズでは、今後も同じ考え方で比較実験を続けていく予定です。
- 制約を強めたプロンプト
- より抽象的なテーマ
- 具体的なモチーフを指定した場合
など、条件を変えながら、「同じプロンプトで試すとどうなるか」を記録していきます。今回の結果も、そのための 基準点のひとつ として残しておきます。
皆さまが、生成AIを活用されるうえで、何かしらのヒントになれば幸いです。

