OpenAI發(fā)布新人工智能系統(tǒng)：根據(jù)文字生成圖像

2021-01-07 09:48:44 來源：新浪評(píng)論：0 [收藏] [評(píng)論]

導(dǎo)讀：　　舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng)，能根據(jù)短文本來生成圖像。　　OpenAI在官方博客中表示，這個(gè)新系統(tǒng)名為DALL-E，名稱來源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦

　　舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng)，能根據(jù)短文本來生成圖像。

　　OpenAI在官方博客中表示，這個(gè)新系統(tǒng)名為DALL-E，名稱來源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦力(WALL-E)的結(jié)合。新系統(tǒng)展示了“為一系列廣泛的概念”創(chuàng)造圖像的能力，創(chuàng)作的作品包括牛油果形狀的扶手椅等。

　　通過神經(jīng)網(wǎng)絡(luò)去生成圖像，這種技術(shù)并不新穎。此前，生成對(duì)抗網(wǎng)絡(luò)(GAN)已被廣泛用于創(chuàng)建真實(shí)的人、寵物、租賃房產(chǎn)和食物的照片。

　　不過，DALL-E的獨(dú)特之處在于可以根據(jù)輸入的文本來創(chuàng)作圖像。該系統(tǒng)基于文字生成系統(tǒng)GPT-3的一個(gè)版本，該系統(tǒng)此前被用于撰寫詩歌和新聞文章等。利用配對(duì)好的文本和圖像數(shù)據(jù)集進(jìn)行訓(xùn)練，DALL-E可以根據(jù)新的文字提示生成圖像，此外還展示了創(chuàng)造多種風(fēng)格圖片的能力。

　　OpenAI還發(fā)布了圖像識(shí)別系統(tǒng)Clip。Clip通用性比當(dāng)前針對(duì)單個(gè)任務(wù)的系統(tǒng)更好，可以用網(wǎng)上公開的文字圖像配對(duì)數(shù)據(jù)集來訓(xùn)練。

　　DALL-E還需要繼續(xù)優(yōu)化。OpenAI指出，DALL-E目前的可靠性還存在問題，對(duì)類似“glass”等有多個(gè)含義的名詞常常會(huì)混淆，文字中不同的語法也可能會(huì)造成不同的結(jié)果。

　　此外還有更深層次的問題需要解決。OpenAI表示：“我們注意到，涉及生成模型的工作可能會(huì)產(chǎn)生重大而廣泛的社會(huì)影響。”未來可能的舉措包括研究對(duì)就業(yè)崗位的影響，生成結(jié)果的偏見，以及技術(shù)的長期道德挑戰(zhàn)。

　　長期以來，公眾一直擔(dān)心人工智能生成的媒體內(nèi)容被濫用，例如神經(jīng)網(wǎng)絡(luò)被用來制造虛假的音視頻和圖像，用于不道德的目的，例如政治上的假信息和欺詐活動(dòng)等。

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：

新聞
圖片
下載
專題

返回產(chǎn)品頻道

快速導(dǎo)航：新聞立場(chǎng) 角度消費(fèi) 服務(wù) 產(chǎn)品

OpenAI發(fā)布新人工智能系統(tǒng)：根據(jù)文字生成圖像

網(wǎng)友評(píng)論

智能應(yīng)用排行

延伸閱讀

最新智能應(yīng)用