導讀:動態(tài),意味著自運行?聽上去倒是有點像修仙小說里的“小千世界”了!
【釘科技編譯】在今年的GPU技術大會上,F(xiàn)acebook 的人工智能團隊展示了可以讓用戶生成基于文本描述的獨特影像(釘:這句簡直是玄之又玄)的神經(jīng)網(wǎng)絡。團隊成員首先鍵入了“海灘”一詞,之后就出現(xiàn)了一片油畫般的沙灘。因為影像中有一大片云,他們鍵入了“海灘—云”,一片新的萬里無云藍天下的沙灘就出現(xiàn)了。(釘:沒搞懂,這里的意思是說技術有問題嗎)最后,他們鍵入“夕陽下的海灘-云”,橙色日落下的海灘就出現(xiàn)了。
作為一種嘗試模仿人腦運行方式的算法,神經(jīng)網(wǎng)絡已經(jīng)成了人工智能領域的寵兒。
Facebook 所做的就是用圖片訓練他們的神經(jīng)網(wǎng)絡,把某些特定的單詞和特定的圖像類型聯(lián)系起來,圖片的數(shù)量達到數(shù)百萬。(釘:好像也不是很多)
技術的關鍵在于提高系統(tǒng)結合圖文的能力,要通過各種要素進行識別,這樣才能做到面熟之后,立即成像。
首先進行的是2D圖像的訓練,比如油畫,同時,如果應用到3D領域,這項技術應該會大有可為。構建一個虛擬現(xiàn)實空間需要大量的3D素材,如果能夠憑借描述生成,將會大大縮短制作周期,現(xiàn)在看來,這個目標應該并不遙遠。
谷歌的DeepMind神經(jīng)網(wǎng)絡,從2D到3D的發(fā)展過程不到一年。
當然,說是一回事,實際操作中總會遇到很多困難的。首先要調整識別算法,從2D升級到3D,當然視覺計算和三維運算都會推動這一進程;其次,因特網(wǎng)上并沒有足夠的3D素材來供給訓練,開發(fā)者需要找到結合2D與3D圖像識別的方式,一個令人比較振奮的消息是虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)技術的普及會帶來更多的素材。(釘:高興地太早了,先普及了再說吧,把希望寄托在外力智商總是很不靠譜的做法。)
筆者認為,十年內能夠生成3D影像的神經(jīng)網(wǎng)絡將問世。這項技術會讓虛擬世界的建構變得簡單,像標題中說的一樣。(釘:一樣你大爺,全文也沒發(fā)現(xiàn)“動態(tài)”這個概念,這作者一定是猴子請來的……)
(編譯:釘科技小灰 From:uploadvr by:SKY NITE)
- QQ:61149512