OpenAI發(fā)布新人工智能系統(tǒng):根據(jù)文字生成圖像

2021-01-07 09:48:44   來源:新浪   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng),能根據(jù)短文本來生成圖像。  OpenAI在官方博客中表示,這個(gè)新系統(tǒng)名為DALL-E,名稱來源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦
  舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng),能根據(jù)短文本來生成圖像。

  OpenAI在官方博客中表示,這個(gè)新系統(tǒng)名為DALL-E,名稱來源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦力(WALL-E)的結(jié)合。新系統(tǒng)展示了“為一系列廣泛的概念”創(chuàng)造圖像的能力,創(chuàng)作的作品包括牛油果形狀的扶手椅等。

  通過神經(jīng)網(wǎng)絡(luò)去生成圖像,這種技術(shù)并不新穎。此前,生成對(duì)抗網(wǎng)絡(luò)(GAN)已被廣泛用于創(chuàng)建真實(shí)的人、寵物、租賃房產(chǎn)和食物的照片。

  不過,DALL-E的獨(dú)特之處在于可以根據(jù)輸入的文本來創(chuàng)作圖像。該系統(tǒng)基于文字生成系統(tǒng)GPT-3的一個(gè)版本,該系統(tǒng)此前被用于撰寫詩歌和新聞文章等。利用配對(duì)好的文本和圖像數(shù)據(jù)集進(jìn)行訓(xùn)練,DALL-E可以根據(jù)新的文字提示生成圖像,此外還展示了創(chuàng)造多種風(fēng)格圖片的能力。

  OpenAI還發(fā)布了圖像識(shí)別系統(tǒng)Clip。Clip通用性比當(dāng)前針對(duì)單個(gè)任務(wù)的系統(tǒng)更好,可以用網(wǎng)上公開的文字圖像配對(duì)數(shù)據(jù)集來訓(xùn)練。

  DALL-E還需要繼續(xù)優(yōu)化。OpenAI指出,DALL-E目前的可靠性還存在問題,對(duì)類似“glass”等有多個(gè)含義的名詞常常會(huì)混淆,文字中不同的語法也可能會(huì)造成不同的結(jié)果。

  此外還有更深層次的問題需要解決。OpenAI表示:“我們注意到,涉及生成模型的工作可能會(huì)產(chǎn)生重大而廣泛的社會(huì)影響。”未來可能的舉措包括研究對(duì)就業(yè)崗位的影響,生成結(jié)果的偏見,以及技術(shù)的長期道德挑戰(zhàn)。

  長期以來,公眾一直擔(dān)心人工智能生成的媒體內(nèi)容被濫用,例如神經(jīng)網(wǎng)絡(luò)被用來制造虛假的音視頻和圖像,用于不道德的目的,例如政治上的假信息和欺詐活動(dòng)等。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論