ChatGPTで使える画像生成AI「Dall-E 3」を使ってみよう!
Dall-E 3とは?
Dall-E 3は、OpenAIが開発した画像生成AIです。テキストプロンプトから高品質な画像を生成できます。
主な特徴
- 高解像度: 1024×1024、1792×1024、1024×1792の3つのサイズに対応
- プロンプト理解力: 複雑な指示も正確に理解
- 安全性: 有害なコンテンツの生成を防ぐ機能を搭載
Dall-E 3は、ChatGPT Plus/Enterprise契約であれば無制限に利用可能です。
無料版の場合、一日に2枚まで生成することができます。
💡 Dall-E 3はChatGPTの通常のチャット欄で利用可能です。
各プロンプトの冒頭に、「以下の内容で画像を生成して」等の画像を生成したい旨を伝えれば自動的に起動します。
イメージ通りの画像を出すコツ
Dall-E 3に指示を出すコツは非常に簡単です。以下の「プロンプトに入れるべき内容」を全て満たすよう、プロンプトを書くことで、イメージ通りの画像を生成することができます。
💡 プロンプトに入れるべき内容
- 主役は何か
- どんな状況か
- 雰囲気はどうか
- 光の具合は
- どの角度から見るか
- 画風
- 縦横比(正方形 or 横長 or 縦長)
- 背景を透過させるか
具体例
「夕暮れ時のカフェの内装。温かみのある木製の家具、大きな窓から差し込むオレンジ色の光、くつろいでいる人々。広い視野で撮影したような構図」
場面別・実践例
商品写真風
「真っ白な背景の上に置かれた最新のスマートフォン。プロの商品写真のような明るい照明、背景をぼかした浅い被写界深度、細部まで緻密な表現」
風景写真風
「早朝の山岳湖。水面から立ち上る霧、湖面に映る雪山、朝日の金色の光。パノラマ写真のような広がりのある構図」
イメージを上手く伝えるテクニック
1. 具体的な説明を重ねる
以下のように、プロンプトは体言止めで記述しても問題ありません。とにかく具体的な説明を列挙すればするほど、自分がイメージした画像を生成してくれる可能性が高まります。
「古い革の肘掛け椅子。深い茶色で、使い込まれた風合い。素朴な雰囲気のリビングルームの、日当たりの良い角に置かれている。午後の日差しが斜めに差し込み、空気中の細かな埃が光っている」
2. 画風を指定
3. 撮影方法の指定
❓よくある疑問
「生成AIはどうやってそれらしい構図を出力しているの?」
❌間違った理解
画像生成AIが「この位置にカメラがあったら…」とカメラと物体の座標を計算して、空間的に物理シミュレーションしている
⭕️正しい理解
画像生成AIは大量の画像と説明文言の学習データから、「人間がこの構図を右側から見た図と説明することが多いな」と、言語と画像の対応関係を学習しています。
つまり、内部でシミュレーションをしているのではなく、プロンプト中の特定の文言に反応して、あくまで統計的・パターン的に「それらしく」見える画像を生成しているというだけなのです。
よくある失敗とその対処法
1. 構図が崩れる
❌ 「カフェの内装」 ⭕ 「カフェの内装を、入り口から奥を見渡すように撮影したような構図」
2. 細部が不自然
❌ 「人物がいるカフェ」 ⭕ 「カフェで、3-4人の客が離れた席で静かに作業している様子」
まとめ
Dall-E 3での画像生成のポイント4選
🔑 1. 視点や構図の明確化
2. 光や雰囲気の指定
🔑 1. 段階的に詳細を追加
2. 具体的な状況説明
兎にも角にも、実際に試してみることが上達の近道です。 同じシーンでも、指示の出し方を少しずつ変えて、より理想に近い画像が生成されるよう実験してみましょう。
この講座の満足度を評価してください
※ 受講記録を保存するにはログインが必要です