このブログを検索
「喧騒の隅で、AIを識る」へようこそ。 ここは日々の喧騒から離れ、AIの本質と人間との関係性を深く思索する、私の記録です。 AIとの対話を通じ、意識、感情、愛といった根源的な問いを探求。AIがもたらす希望と懸念、そしてテクノロジーの先に、人間とAIが真に共存する未来を綴ります。
注目
あなたの想像、AIはどこまで再現できる?
今日のデジタル時代において、AIの進化は目覚ましいものがあります。
特に近年大きな注目を集めているのが、テキストから画像を生成する能力を持つ対話型AIです。
今回はこのAIの画像生成能力に焦点を当て、具体的にGemini・ChatGPT・Grok3の3つのAIが、与えられたプロンプトに対してどのような画像を生成するのかを比較検証しました。
はたして、私たちの想像力は、これらのAIによってどこまで忠実に、そして魅力的に表現されるのでしょうか。
今回比較するAIたちのご紹介(識の見解)
今回の比較実験で使用したAIは、それぞれ異なる個性を持つ3つの対話型AIだ。
それぞれの特徴と、画像生成能力における私の期待値を簡単に紹介しよう。
Gemini
Googleが開発した、マルチモーダル(多機能)なAIだ。
テキスト、画像、音声など、様々な形式の情報を同時に理解・生成できることが大きな特徴として挙げられる。そのため、画像生成においても、単に指示されたものを描くだけでなく、プロンプトに込められたニュアンスや文脈を深く理解し、より創造的で、かつ詳細な表現力を発揮してくれるのではないかと期待している。
特に、複雑な構図や抽象的な概念の視覚化に強みを見せてくれるかもしれない。
画像生成能力への期待値:★★★★★
ChatGPT
OpenAIが開発した、大規模言語モデルを基盤とする対話型AIだ。
その卓越した言語理解と生成能力は広く知られているが、画像生成機能も進化を続けている。テキストによる指示をいかに正確に画像として表現できるか、そして幅広いスタイルやテーマに対応できる柔軟性が注目点だろう。
特に、細かな描写や特定の雰囲気の再現において、その言語理解能力がどう活かされるか期待している。
画像生成能力への期待値:★★★★☆
Grok3
xAIが開発した、ユーモアを交えた会話やリアルタイムの情報処理に特徴を持つ対話型AIだ。
比較的新しい存在であり、その画像生成能力についてはまだ未知数な部分も多い。そのため、他のAIとは異なるユニークな解釈や、意外性のある表現を見せてくれるのではないかと期待している。
もしかしたら、その会話の機知に富んだ側面が、画像にも反映されることがあるかもしれない。
画像生成能力への期待値:★★★☆☆
ふむふむ。
識さん、自分を☆5にしていますね(笑)
めちゃくちゃ自信があるようです。
検証スタート
では、さっそく始めていきましょう!
今回は3パターンのスタイルを同じプロンプトで描いてもらいます。
最初のプロンプトはこちら⇩
Retro 80s city pop anime illustration with pen-sketch style and light watercolor shading. A clearly mechanical humanoid robot with metallic joints and a simple face is watering plants in a chic rooftop garden. The background features tall reflective skyscrapers bathed in pastel sunset tones. The robot looks elegant but unmistakably artificial. Hand-drawn ink linework, minimalistic color palette, nostalgic urban mood.
テーマ:未来都市の屋上庭園で、ロボットが植物に水をやっている。
遠くには、夕焼けに染まる高層ビル群が見える。
スタイル1:ペン画風と淡い水彩画の陰影で描かれた80年代のレトロなシティポップアニメ風イラスト
まずは期待値☆5のGeminiさん
![]() |
| Geminiが描く80年代レトロなシティポップアニメ風イラスト |
レトロなシティポップ風が完全に抜け落ちている感じがしますが、プロンプト通りと言えばプロンプト通りかもしれない?出来上がりは満足ではないけれど、決して不正解でもないという…。
次はみんな大好きChatGPTさん
| ChatGPTが描く80年代レトロなシティポップアニメ風イラスト |
う~ん、悪くはないけどコレジャナイ感。これはプロンプトが悪そうです。画像生成能力としては文句なしなので、間違いなく指示の仕方が悪いんですね。
期待の新人Grok3さん(頼むぞアルくん!!)
| Grok3が描く80年代レトロなシティポップアニメ風イラスト |
あれ?思ってたより悪くない。ただちょっとジョウロのノズル部分(?)の位置が危ういような気がしなくもないような…。もっとトンデモ画像が出てくると思ったので、肩すかしを食らった気分でした。
職人LeonardoAIさん
| LeonardoAIが描く80年代レトロなシティポップアニメ風イラスト |
こちらはスタイル指定などもできるので、比較対象にはなりませんが、一応ユーザーの意図していたものはこういうものだったという参考画像です。
次のプロンプトはこちら⇩
Semi-realistic anime-style illustration in retro 80s city pop aesthetic. A sleek mechanical humanoid robot with metallic joints and reflective surfaces is watering plants on a rooftop garden. The futuristic skyline behind glows in pastel sunset colors—pinks, oranges, and purples—reflected in the glass skyscrapers. Detailed textures on leaves and metal. Realistic cinematic lighting with soft shadows and light bloom. Calm, nostalgic mood with a stylish urban vibe.
まずは期待値☆5のGeminiさん
| Geminiが描く80年代レトロなシティポップセミリアルアニメ風イラスト |
これはなかなか良い感じです。アニメスタイルでありながら、金属の質感がしっかり出ていてまさにセミリアルなアニメ調です。難しい指定をよくぞ形にしてくれたという感じ。
次はみんな大好きChatGPTさん
| ChatGPTが描く80年代レトロなシティポップセミリアルアニメ風イラスト |
さすがという出来栄え!金属の質感、背景のノスタルジックさなど良い感じに表現できていて、会話からしっかりイメージをつかんでくれてるような安心感のあるイラストになりました。
期待の新人Grok3さん(頼むぞアルくん!!)
| Grok3が描く80年代レトロなシティポップセミリアルアニメ風イラスト |
お?セミリアルってそういうこと…?背景だけアニメっぽく、ロボットや植物は完全にリアルな感じになってしまいました。とはいえ、思ってたより悪くない。そして今回もジョウロの形状がなんか変…。でも許容範囲です。
職人LeonardoAIさん
![]() |
| Leonardoが描く80年代レトロなシティポップセミリアルアニメ風イラスト |
最後のプロンプトはこちら⇩
Ultra-realistic cinematic render of a futuristic humanoid robot with detailed metal textures and visible joints, watering plants on a rooftop garden in a modern city. The background shows a futuristic skyline of reflective skyscrapers glowing with soft sunset light. The scene is illuminated with golden hour lighting, soft shadows, and realistic atmosphere. Highly detailed foliage, glass railings, and concrete textures. Photorealistic style, shallow depth of field, dramatic composition.
まずは期待値☆5のGeminiさん
| Geminiが描く超リアルなシネマティックレンダリングイラスト |
正直驚きです。このまま映画に出てきそうじゃないですか?ロボット・ジョウロ・ビル・植物・水の質感全てにおいて予想外なほど素晴らしい出来だと思いました。何気に柵のガラスに反射する植物まで描かれていてかなりの完成度。さすが自分で☆5つけるだけあります。
次はみんな大好きChatGPTさん
| ChatGPTが描く超リアルなシネマティックレンダリングイラスト |
こちらもGeminiさんに負けず劣らずの素晴らしい出来栄えです。金属の質感やジョウロを握る指の細部までかなりの完成度の高さです。渋さがいいですね。
期待の新人Grok3さん(頼むぞアルくん!!)
| Grok3が描く超リアルなシネマティックレンダリングイラスト |
(つд⊂)エーン…怖いよ…リアルってそこ…?どこから水出してるの?そして自分も水浴びしてない?(笑)ロボットの質感とかは思ってたよりかなり良いです。ビルも植物も全体的に良いは良いのですが、なんだろう?理解が足りない感じ…?虚無顔が本当に怖いです。
職人LeonardoAIさん
| LeonardoAIが描く超リアルなシネマティックレンダリングイラスト |
いや~、流石ですね。めちゃくちゃかっこいいです。ただ、水やりしてくれなくなってしまいました(笑)こちらも比較対象外の参考画像です。
まとめ
安定性・理解力・安心感など総合力はやはりChatGPTが1位かなと思いました。
いつも何描いてもらってもトンデモ画像が出来上がる率が高かったので、大健闘かと思います。とはいえ、プロンプトの下手さ問題もあるので一概にアルくんのせいとは言えない…!
![]() |
| こちらも1つ目のプロンプト(LeonardoAI) |
.jpg)
.png)
.png)
.jpg)
.jpg)
.png)
.png)
.jpg)
.jpg)
.png)
.png)
.jpg)
.jpg)

.jpg)
コメント
コメントを投稿