画像生成AI 実践コースに戻る

ChatGPTで使える画像生成AI「Dall-E 3」を使ってみよう!

Dall-E 3とは?


Dall-E 3は、OpenAIが開発した画像生成AIです。テキストプロンプトから高品質な画像を生成できます。

主な特徴

  • 高解像度: 1024×1024、1792×1024、1024×1792の3つのサイズに対応
  • プロンプト理解力: 複雑な指示も正確に理解
  • 安全性: 有害なコンテンツの生成を防ぐ機能を搭載

Dall-E 3は、ChatGPT Plus/Enterprise契約であれば無制限に利用可能です。

無料版の場合、一日に2枚まで生成することができます。

74ee112b-037e-4d27-920f-406bb708815b.png

💡 Dall-E 3はChatGPTの通常のチャット欄で利用可能です。
各プロンプトの冒頭に、「以下の内容で画像を生成して」等の画像を生成したい旨を伝えれば自動的に起動します。

イメージ通りの画像を出すコツ


Dall-E 3に指示を出すコツは非常に簡単です。以下の「プロンプトに入れるべき内容」を全て満たすよう、プロンプトを書くことで、イメージ通りの画像を生成することができます。

💡 プロンプトに入れるべき内容

  1. 主役は何か
  2. どんな状況か
  3. 雰囲気はどうか
  4. 光の具合は
  5. どの角度から見るか
  6. 画風
  7. 縦横比(正方形 or 横長 or 縦長)
  8. 背景を透過させるか

具体例

「夕暮れ時のカフェの内装。温かみのある木製の家具、大きな窓から差し込むオレンジ色の光、くつろいでいる人々。広い視野で撮影したような構図」

image.png

場面別・実践例


商品写真風

「真っ白な背景の上に置かれた最新のスマートフォン。プロの商品写真のような明るい照明、背景をぼかした浅い被写界深度、細部まで緻密な表現」

image.png

風景写真風

「早朝の山岳湖。水面から立ち上る霧、湖面に映る雪山、朝日の金色の光。パノラマ写真のような広がりのある構図」

image.png

イメージを上手く伝えるテクニック


1. 具体的な説明を重ねる

以下のように、プロンプトは体言止めで記述しても問題ありません。とにかく具体的な説明を列挙すればするほど、自分がイメージした画像を生成してくれる可能性が高まります。

「古い革の肘掛け椅子。深い茶色で、使い込まれた風合い。素朴な雰囲気のリビングルームの、日当たりの良い角に置かれている。午後の日差しが斜めに差し込み、空気中の細かな埃が光っている」

2. 画風を指定

image.png

3. 撮影方法の指定

image.png

❓よくある疑問
「生成AIはどうやってそれらしい構図を出力しているの?」
間違った理解
画像生成AIが「この位置にカメラがあったら…」とカメラと物体の座標を計算して、空間的に物理シミュレーションしている
⭕️正しい理解
画像生成AIは大量の画像と説明文言の学習データから、「人間がこの構図を右側から見た図と説明することが多いな」と、言語と画像の対応関係を学習しています。
つまり、内部でシミュレーションをしているのではなく、プロンプト中の特定の文言に反応して、あくまで統計的・パターン的に「それらしく」見える画像を生成しているというだけなのです。

よくある失敗とその対処法


1. 構図が崩れる

❌ 「カフェの内装」 ⭕ 「カフェの内装を、入り口から奥を見渡すように撮影したような構図」

image.png

2. 細部が不自然

❌ 「人物がいるカフェ」 ⭕ 「カフェで、3-4人の客が離れた席で静かに作業している様子」

image.png

まとめ


Dall-E 3での画像生成のポイント4選

🔑 1. 視点や構図の明確化
2. 光や雰囲気の指定

image.png

🔑 1. 段階的に詳細を追加
2. 具体的な状況説明

image.png

兎にも角にも、実際に試してみることが上達の近道です。 同じシーンでも、指示の出し方を少しずつ変えて、より理想に近い画像が生成されるよう実験してみましょう。

この講座の満足度を評価してください

※ 受講記録を保存するにはログインが必要です