DALL-E 3
什麼是DALL-E 3
起源
DALL-E 是由 OpenAI 開發的文本到圖像模型,利用深度學習技術從自然語言描述(被稱為「提示」)生成數字圖像。該模型於 2021 年 1 月首次推出,隨後 DALL-E 2 和 DALL-E 3 的版本也相繼問世。在 2023 年 10 月,DALL-E 3 被原生地整合到了 ChatGPT 的 ChatGPT Plus 和 ChatGPT Enterprise 版本中,並在 11 月初通過 OpenAI 的 API 和「Labs」平台提供。DALL-E 是基於一個 120 億參數的 GPT-3 版本,旨在從文本描述生成圖像,使用了一個文本-圖像對的數據集。這使得 DALL-E 能夠根據輸入的文本生成各種物體和場景的圖像,並可以控制場景的觀點和 3D 渲染的風格。該模型還具有推斷出上下文細節的能力,例如物體的方向和陰影。同時,它可以獨立控制少量物體的屬性和它們的排列方式,也能生成已知物體的圖像,並且還能結合不同的想法來合成物體。
作品範例
請參考 https://www.facebook.com/groups/synthbang/ 社團
DALL-E 3的 優點
- 更精準的文字理解與生成: DALL-E 3在理解文字描述方面有顯著的提升,能更準確地將你的文字描述轉換為具體的視覺效果。這意味著你輸入的提示詞越詳細,生成的圖片就越符合你的期望。
- 更高的圖像品質: 相較於前一代,DALL-E 3生成的圖片細節更豐富、更逼真。無論是人像、風景、還是抽象藝術,都能呈現出令人驚豔的視覺效果。
- 更廣泛的風格選擇: DALL-E 3能生成各種風格的圖片,從寫實到抽象、從古典到現代,應有盡有。你可以指定想要的風格,或是讓模型自由發揮。
- 更強大的創造力: DALL-E 3能將不同的概念結合在一起,創造出獨一無二的圖像。例如,你可以要求它生成一隻穿著太空衣的貓,或是一座漂浮在雲端的城堡。
- 更易於使用: DALL-E 3的介面更加直觀,使用者可以輕鬆地輸入提示詞並生成圖片。
DALL E-3 之應用領域
- 創意設計: 設計師可以使用DALL-E 3來快速生成各種視覺概念,例如產品設計、服裝設計、室內設計等。
- 內容創作: 作家、部落客、行銷人員可以使用DALL-E 3來生成圖片,豐富他們的文章或社交媒體內容。
- 教育: DALL-E 3可以幫助學生和教師更直觀地理解抽象概念,例如科學原理、歷史事件等。
- 娛樂: DALL-E 3可以生成各種有趣的圖片,用於製作梗圖、表情包、或是個人化的藝術作品。
如何使用DALL-E 3 (Bing Image Creator)
如果你不想付費,可以使用 Bing 的 Image Creator,他也是能使用 DALL·E 3 的喔:https://www.bing.com/images/create?

微軟在第一季宣布向台灣用戶開放名為「Image Creator」的免費 AI 繪圖工具,10 月初再度宣布將 OpenAI 旗下 GPT-4 技術與最新的 DALL-E 3 繪圖模型整合至 Image Creator 和 Bing Chat (Microsoft Copilot)聊天機器人中,有助於對話理解和文字轉圖片變得更精準。微軟近期將 OpenAI 最新的 DALL-E 3 AI 藝術生成器整合到 Bing Image Creator和 Bing Chat(Microsoft Copilot) 中,透過輸入對影像的文字描述,就能讓 AI 自動生成不同風格的圖像內容。
DALL-E 3 基本語法教學
雖然這三大介面配置和操作功能不盡相同,不過對於 DALL-E 3 下命令的基本語法並無二致,當要在 AI 生成圖片中下指令時, 可輸入「生成圖片」作為開頭,並以逗號區隔,接著鍵入「主題」+「風格」這兩個主要的關鍵字,其中,主題是所要表達的主體,像是涵蓋「形容詞+名詞+動詞」的短語句,最後再加入想要的「圖片風格」或「照片樣式」作結,例如繪畫、寫實、照片、漫畫...等等不同的風格來呈現,基本上,你給的描述和關鍵字愈多,愈有機會得到想要的結果。
如何在Image Creator 使用 DALL-E 3 圖片生成功能
由於微軟 Bing AI 的 DALL-E 3 圖像生成工具,目前一共導入至旗下三大服務之中,包含 Bing Image Creator 影像創立工具、網頁版和行動版Microsoft Copilot,三者在介面設計、後續設定和操作功能方面略有不同,例如,在 Bing Image Creator 可以查看剩餘點數、儲存的照片庫,甚至能請系統幫忙出主意,提供構想提示詞等
步驟 1:首先在瀏覽器中輸入並前往「https://www.bing.com/create」,即可於對話框中輸入 Prompt 提示詞,接著按下「加入並創作」。
步驟 2:若未事前先登入微軟帳號,這裡則會請你先登入。(可用個人的微軟帳號或您的tDrive帳號 XXX@tdrive.thu.edu.tw)
步驟 3:登入完成後,便會根據方才輸入的 Prompt 提示詞進行製圖,目前大約五秒鐘左右,就會生成四張圖片。
Prompt範例:a wolf, minimalistic colorful organic forms, energy, assembled, layered, depth, alive vibrant, 3D, abstract, on a light blue background
步驟 4:每輸入一組 Prompt 提示詞 Bing Image Creator 皆會產生 4 張圖片,且每張圖片都可以點擊放大檢視。
步驟 5:每張圖片的解析度皆為 1024x1024px,可以直接下載圖片檔案、儲存至集錦,或透過 Bing Image Creator 的連結分享。
步驟 6:Prompt 提示詞「枯藤老樹昏鴉,小橋流水人家,古道西風瘦馬,夕陽西下」
步驟 7:這時 Bing Image Creator 就會生成相關圖片。
步驟 8:同一帳號於不同 Bing 平台上生成且儲存下來的圖片,皆能在 Bing Image Creator 介面右上角的「選單-集錦」中找到。
資料來源:
- https://medium.com/dean-lin/dall-e-3-%E5%BF%85%E5%AD%B8%E7%9A%84-8-%E5%80%8B%E6%8A%80%E5%B7%A7-%E8%BC%95%E9%AC%86%E4%B8%8A%E6%89%8B-ai-%E7%B9%AA%E5%9C%96-21f359c83004
- https://www.techbang.com/posts/110864-bing-chat-image-generator-is-hands-on