OpenAI展示新音頻工具 可朗讀文本并模仿聲音
該公司分享了名為“語(yǔ)音引擎”(Voice Engine)的文本轉(zhuǎn)語(yǔ)音模型小規(guī)模試用的早期演示和用例,據(jù)發(fā)言人介紹,目前約有10家開(kāi)發(fā)商可使用該模型。OpenAI在3月早些時(shí)候向記者介紹了這一功能,但決定暫不大規(guī)模發(fā)布。
OpenAI的發(fā)言人說(shuō)該公司在收到政策制定者、行業(yè)專家、教育工作者和創(chuàng)意人士等利益相關(guān)方的反饋后決定縮減發(fā)布規(guī)模。據(jù)早前的新聞發(fā)布會(huì)介紹,該公司原本計(jì)劃通過(guò)申請(qǐng)流程向多達(dá)100家開(kāi)發(fā)商發(fā)布該工具。
其他AI技術(shù)已經(jīng)在某些情境下被用來(lái)偽造聲音。今年1月,一通自稱喬·拜登(Joe Biden)總統(tǒng)打來(lái)的以假亂真的電話呼吁新罕布什爾州居民不要在初選中投票,這一事件在全球關(guān)鍵選舉前加劇了對(duì)AI的恐懼。
與OpenAI過(guò)去生成音頻的功能不同,語(yǔ)音引擎可以創(chuàng)建聽(tīng)起來(lái)像具體個(gè)人的聲音,并完整呈現(xiàn)特有的語(yǔ)調(diào)和語(yǔ)氣。該軟件只需要一段15秒的錄音,即可重現(xiàn)一個(gè)人的聲音。
“只要音頻設(shè)置得當(dāng),基本就能得出人類水準(zhǔn)的聲音。”OpenAI產(chǎn)品負(fù)責(zé)人杰夫·哈里斯(Jeff Harris)說(shuō),“這種技術(shù)質(zhì)量非常了不起。”但哈里斯也表示,“準(zhǔn)確模仿人類語(yǔ)音的能力顯然存在很多安全上的不確定性。”
非營(yíng)利性醫(yī)療系統(tǒng)Lifespan旗下的Norman Prince Neurosciences Institute是OpenAI目前的開(kāi)發(fā)合作伙伴之一,該機(jī)構(gòu)正在利用此項(xiàng)技術(shù)幫助患者恢復(fù)聲音。例如,據(jù)OpenAI的博客文章,該工具被用于恢復(fù)一位因腦瘤失去清晰說(shuō)話能力的年輕患者的聲音,方法是復(fù)制她此前為一個(gè)學(xué)校項(xiàng)目錄制的發(fā)言。
OpenAI的自定義語(yǔ)音模型還可將生成的音頻翻譯成不同語(yǔ)言。這對(duì)于音頻行業(yè)公司非常有用,比如Spotify Technology SA。Spotify已經(jīng)在自己的試點(diǎn)計(jì)劃中利用該技術(shù)來(lái)翻譯萊克斯·弗里德曼(Lex Fridman)等熱門主持人的播客節(jié)目。OpenAI還宣傳了該技術(shù)的其他有益應(yīng)用,例如為兒童教育內(nèi)容創(chuàng)建更多樣化的聲音。
在測(cè)試計(jì)劃中,OpenAI要求合作伙伴同意其使用政策,即在使用原始聲音前征得聲音主人的同意,并告知聽(tīng)眾他們聽(tīng)到的是AI生成的聲音。該公司還加入了聽(tīng)不見(jiàn)的音頻水印,以判斷哪些音頻由其工具創(chuàng)建。
OpenAI表示在決定是否大范圍發(fā)布該功能前,正在征求外部專家的反饋。該公司在博文中表示:“讓全球人民了解這項(xiàng)技術(shù)的發(fā)展方向至關(guān)重要,不論我們最終是否親自廣泛部署它。”
OpenAI還寫道,希望其軟件的試用能“激發(fā)增強(qiáng)社會(huì)韌性的需求”,以應(yīng)對(duì)更先進(jìn)的AI技術(shù)帶來(lái)的挑戰(zhàn)。例如,該公司呼吁銀行逐步停止將語(yǔ)音身份驗(yàn)證作為訪問(wèn)銀行賬戶和敏感信息的安全措施。它還尋求開(kāi)展公眾教育,幫助大家了解欺騙性的AI內(nèi)容,并開(kāi)發(fā)更多技術(shù)來(lái)檢測(cè)音頻內(nèi)容是否由AI生成。
網(wǎng)友評(píng)論
智能應(yīng)用排行
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開(kāi)發(fā),上線 HarmonyOS
- 蘋果官方認(rèn)可“越獄”術(shù)語(yǔ):特殊版iPhone罕見(jiàn)現(xiàn)身 用于查找
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量?jī)A斜,成電商
- 釘釘公布數(shù)據(jù):用戶數(shù)7億 軟件付費(fèi)企業(yè)數(shù)12萬(wàn)
- AI大模型讓智慧交通“更聰明” 海信亮相2024世界人工智能大
- 沃爾瑪?shù)娜斯ぶ悄芰闶鄣暌严蚬婇_(kāi)放
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)合實(shí)驗(yàn)室
- 都是科技的狠活?2024中國(guó)國(guó)際消費(fèi)電子博覽會(huì)即將全新亮相
- 百度:智能云業(yè)務(wù)Q1營(yíng)收47億元,生成式AI貢獻(xiàn)比例達(dá)6.9%
延伸閱讀
- OpenAI推出ChatGPT“克星”:可識(shí)別文章是否人工智能代筆
- 游戲聊天社區(qū)Discord整合OpenAI技術(shù) 推出多項(xiàng)新功能
- Zoom引入OpenAI生產(chǎn)力功能 推出數(shù)字助手
- “微軟+OpenAI”聯(lián)手的新一站:網(wǎng)絡(luò)安全
- 日本政府或引入人工智能技術(shù) OpenAI考慮開(kāi)設(shè)日本辦公室
- 歐盟官員將于6月會(huì)見(jiàn)OpenAI CEO:討論人工智能法規(guī)
- OpenAI:超智能AI或在這個(gè)十年出現(xiàn),將加大資源應(yīng)對(duì)
- Meta正在開(kāi)發(fā)更強(qiáng)大的AI系統(tǒng) 對(duì)標(biāo)OpenAI
- 微軟據(jù)悉正自主研發(fā)AI模型 降低對(duì)OpenAI的依賴
- OpenAI發(fā)布首個(gè)視頻生成模型Sora:將AI戰(zhàn)場(chǎng)引向好萊塢
最新智能應(yīng)用
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量?jī)A
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開(kāi)發(fā),上線 H
- 都是科技的狠活?2024中國(guó)國(guó)際消費(fèi)電子博覽會(huì)即將
- 百度沈抖:百舸4.0升級(jí)發(fā)布,模型訓(xùn)練有效時(shí)長(zhǎng)達(dá)
- 華為云發(fā)布AI原生云基礎(chǔ)設(shè)施架構(gòu)CloudMatrix,新
- 阿里CEO吳泳銘:AI算力需求滲透率已超50%,正主導(dǎo)
- 羅技發(fā)布 G PRO 2 LIGHTSPEED(GPW4 朱雀)
- 華為:將啟動(dòng)“鴻蒙生態(tài)伙伴及開(kāi)發(fā)者見(jiàn)非凡體驗(yàn)計(jì)
- 華為運(yùn)動(dòng)健康發(fā)布玄璣感知系統(tǒng) 華為手表或?qū)⒅С?/a>