跳到主內容

什麼是DALL-E 3

起源

DALL-E 是由 OpenAI 開發的文本到圖像模型,利用深度學習技術從自然語言描述(被稱為「提示」)生成數字圖像。該模型於 2021 年 1 月首次推出,隨後 DALL-E 2 和 DALL-E 3 的版本也相繼問世。在 2023 年 10 月,DALL-E 3 被原生地整合到了 ChatGPT 的 ChatGPT Plus 和 ChatGPT Enterprise 版本中,並在 11 月初通過 OpenAI 的 API 和「Labs」平台提供。DALL-E 是基於一個 120 億參數的 GPT-3 版本,旨在從文本描述生成圖像,使用了一個文本-圖像對的數據集。這使得 DALL-E 能夠根據輸入的文本生成各種物體和場景的圖像,並可以控制場景的觀點和 3D 渲染的風格。該模型還具有推斷出上下文細節的能力,例如物體的方向和陰影。同時,它可以獨立控制少量物體的屬性和它們的排列方式,也能生成已知物體的圖像,並且還能結合不同的想法來合成物體。

作品範例

DALL-E 3的 優點