打字即可生成攝影大片,NVIDIA黑科技全新升級2.0
2024-07-26 10:02:48 1
不知道是否有人希望在未來可以如神筆馬良一般,只需隨手一畫,一幅色彩豔麗且生動形象的圖畫即可呈現在眼前。而現在NVIDIA推出的最新黑科技系統,利用深度學習AI只需輸入單詞即可輕鬆生成攝影大片。這項最新的技術可以將用戶輸入的文字描述以及色塊塗鴉轉換成擬真的圖片,真正意義上做到了只需要語義即可完成一副精美逼真的照片。
在2019年舉辦的GTC大會上,NVIDIA就展示了如何利用生成對抗網絡將分割圖轉換為栩栩如生的精美圖片,並將這款新的交互應用命名為GauGAN。如今其繼任者GauGAN2正式推出,它允許用戶可以輕鬆創建一個現實中不存在的逼真風景圖像。GauGAN2作為一款將分割映射、修復和文本生成圖像等技術結合在一起的工具,只需要通過輸入文字和簡單的繪圖就能創建出逼真的圖像。
GauGAN2作為生成對抗網絡的一種變體,由生成器和鑑別器組成。生成器用於獲取樣本,例如獲取與輸入的文本配對的圖片,並預測可能與圖片中元素相對應的數據。生成器生成的圖像將不斷受到鑑別器的檢測,鑑別器將判斷其生成的圖像是否真實。最初的GauGAN生成的圖像質量較差,但隨著鑑別器的反饋不斷進行改進,更新到GauGAN2時其生成的圖像質量也越來越逼真,呈現出的效果也越來越接近現實中的場景。
NVIDIA表示這是一個迭代的過程,用戶在文本框中輸入的每一個單詞都會使AI創建的圖像添加更多的內容。GauGAN2背後的AI模型通過使用NVIDIA Selene超級計算機對1000萬張高質量風景圖像進行訓練,這是一個NVIDIA DGX SuperPOD系統,是世界上最強大的 10 臺超級計算機之一。GauGAN2藉助神經網絡來學習詞彙與其對應的視覺效果之間的聯繫,而這種輸入文本生成匹配圖像的方式也是GauGAN2的最大創新之處,其生成的圖像會逐漸根據輸入的內容進行修改,直到最終生成和文本匹配的圖像。
GauGAN2在未來將會廣泛應用在電影、軟體、視頻遊戲等概念圖的設計上,並在視覺領域中具有潛在的應用前景,在未來NVIDIA也宣布會提供開原始碼並投入進實際應用中。GauGAN2的技術演示展現了圖像生成工具在未來的強大可能性,而這樣一款圖像生成工具在未來是否需要強大的性能支持並不清楚,但現在市面上的其他圖形應用軟體就有著不小的配置要求,那麼影馳RTX 3070 Ti金屬大師OC絕對可以滿足你在圖形製作上的一切需求。
影馳RTX 3070 Ti金屬大師OC,鋁合金鐵甲散熱器,幾何鏤空設計,大幅提升散熱面積。全新NVIDIA Ampere架構加持,搭載全新的GDDR6X高速顯存,帶來強勁的性能提升。RTX光追與DLSS技術加持,帶來高幀率低延遲的優質遊戲體驗。
優秀的硬體支持與強大的GauGAN2技術,或許在不遠的將來,人人都能輕鬆成為藝術家。