如何保障AI安全？OpenAI詳細(xì)解答，將積極與各國政府接觸

2023-04-06 17:18:22 來源：網(wǎng)易科技評(píng)論：0 [收藏] [評(píng)論]

導(dǎo)讀：　　4月6日消息，美國當(dāng)?shù)貢r(shí)間周三，OpenAI發(fā)帖，詳細(xì)介紹了其確保AI安全的方法，包括進(jìn)行安全評(píng)估、改進(jìn)發(fā)布后的保障措施、保護(hù)兒童以及尊重隱私等。該公司表示，確保AI系統(tǒng)的構(gòu)建、部署和安全使用對(duì)實(shí)現(xiàn)其使命

　　4月6日消息，美國當(dāng)?shù)貢r(shí)間周三，OpenAI發(fā)帖，詳細(xì)介紹了其確保AI安全的方法，包括進(jìn)行安全評(píng)估、改進(jìn)發(fā)布后的保障措施、保護(hù)兒童以及尊重隱私等。該公司表示，確保AI系統(tǒng)的構(gòu)建、部署和安全使用對(duì)實(shí)現(xiàn)其使命至關(guān)重要。

　　以下是OpenAI帖子的全文：

　　OpenAI致力于確保強(qiáng)大的AI安全，讓盡可能多的人受益。我們知道，我們的AI工具為當(dāng)今人們提供了許多幫助。世界各地的用戶向我們反饋，ChatGPT有助于提高他們的工作效率、增強(qiáng)他們的創(chuàng)造力，并提供量身定制的學(xué)習(xí)體驗(yàn)。但我們也認(rèn)識(shí)到，與任何技術(shù)一樣，這些工具也存在真正的風(fēng)險(xiǎn)。因此，我們正在努力確保在各個(gè)系統(tǒng)層面上的安全性。

　　打造更加安全的人工智能系統(tǒng)

　　在推出任何新的人工智能系統(tǒng)之前，我們都會(huì)進(jìn)行嚴(yán)格的測(cè)試，征求外部專家的意見，并通過人工反饋的強(qiáng)化學(xué)習(xí)等技術(shù)來改善模型的表現(xiàn)。同時(shí)，我們還建立了廣泛的安全和監(jiān)控系統(tǒng)。

　　以我們最新的模型GPT-4為例，完成訓(xùn)練后，我們?cè)谡麄€(gè)公司范圍內(nèi)進(jìn)行了長達(dá)6個(gè)月的測(cè)試，以確保其在公開發(fā)布之前更加安全可靠。

　　我們認(rèn)為，強(qiáng)大的人工智能系統(tǒng)應(yīng)該接受嚴(yán)格的安全評(píng)估。監(jiān)管是必要的，以確保這種做法被廣泛采納。因此，我們積極與各國政府接觸，探討最佳的監(jiān)管形式。

　　從實(shí)際使用中學(xué)習(xí)，提高保障措施

　　我們盡力在系統(tǒng)部署之前預(yù)防可預(yù)見的風(fēng)險(xiǎn)，但實(shí)驗(yàn)室中的學(xué)習(xí)永遠(yuǎn)有限。我們廣泛研究和測(cè)試，但無法預(yù)測(cè)人們會(huì)如何使用我們的技術(shù)，或?yàn)E用它。因此，我們認(rèn)為從實(shí)際使用中學(xué)習(xí)，是創(chuàng)建和發(fā)布越來越安全的人工智能系統(tǒng)的關(guān)鍵組成部分。

　　我們謹(jǐn)慎地將新的人工智能系統(tǒng)逐步發(fā)布給人群，并采取實(shí)質(zhì)性的保障措施，并根據(jù)我們吸取的教訓(xùn)不斷改進(jìn)。

　　我們提供自己服務(wù)和API中最強(qiáng)大的模型，以便開發(fā)人員可以直接將技術(shù)集成到他們的應(yīng)用程序中。這使我們能夠監(jiān)控濫用行為并采取行動(dòng)，同時(shí)制定應(yīng)對(duì)措施。這樣，我們可以采取實(shí)際行動(dòng)，而不僅僅在理論上想象如何應(yīng)對(duì)。

　　實(shí)際使用中的經(jīng)驗(yàn)也促使我們制定了越來越細(xì)化的政策，以應(yīng)對(duì)對(duì)人們構(gòu)成真正風(fēng)險(xiǎn)的行為，同時(shí)仍然允許我們的技術(shù)以更有益的方式使用。

　　我們認(rèn)為，社會(huì)需要更多時(shí)間適應(yīng)日益強(qiáng)大的人工智能，每個(gè)受其影響的人都應(yīng)該在人工智能的進(jìn)一步發(fā)展方面擁有發(fā)言權(quán)。迭代部署有助于不同利益相關(guān)者更有效地參與人工智能技術(shù)的對(duì)話中，而擁有使用這些工具的第一手經(jīng)驗(yàn)至關(guān)重要。

　　保護(hù)兒童

　　我們的安全工作關(guān)注重點(diǎn)之一是保護(hù)兒童。我們要求使用我們的人工智能工具的人必須年滿18歲或以上，或者在父母同意的情況下年滿13歲或以上。目前，我們正在研究驗(yàn)證功能。

　　我們不允許我們的技術(shù)用于生成仇恨、騷擾、暴力或成人等內(nèi)容。與GPT-3.5相比，最新的GPT-4對(duì)受限制內(nèi)容請(qǐng)求做出響應(yīng)的可能性降低了82%。我們已經(jīng)建立了強(qiáng)大的系統(tǒng)來監(jiān)控濫用行為。GPT-4現(xiàn)在可供ChatGPT Plus的訂戶使用，我們希望隨著時(shí)間的推移能讓更多人體驗(yàn)它。

　　我們已經(jīng)采取重大措施，最大限度地減少我們的模型產(chǎn)生傷害兒童內(nèi)容的可能性。例如，當(dāng)用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時(shí)，我們會(huì)阻止它并向國家失蹤和受剝削兒童中心報(bào)告此事。

　　除了默認(rèn)的安全防護(hù)，我們與非營利組織可汗學(xué)院(Khan Academy)等開發(fā)機(jī)構(gòu)合作，為他們量身定制了安全措施。可汗學(xué)院已經(jīng)開發(fā)了一款人工智能助手，它可以作為學(xué)生的虛擬導(dǎo)師，也可以作為教師的課堂助手。我們還致力于開發(fā)允許開發(fā)者為模型輸出設(shè)置更嚴(yán)格標(biāo)準(zhǔn)的功能，以更好地支持需要此類功能的開發(fā)者和用戶。

　　尊重隱私

　　我們的大型語言模型是在廣泛的文本語料庫上進(jìn)行訓(xùn)練的，其中包括公開可用的內(nèi)容、獲得授權(quán)的內(nèi)容以及由人類審核人員生成的內(nèi)容。我們不利用這些數(shù)據(jù)來銷售我們的服務(wù)或廣告，也不用它們來建立個(gè)人檔案。我們只是利用這些數(shù)據(jù)來讓我們的模型更好地為人們提供幫助，例如通過與人們進(jìn)行更多對(duì)話來提高ChatGPT的智能水平。

　　盡管我們的許多訓(xùn)練數(shù)據(jù)中包括可以在公共網(wǎng)絡(luò)上獲得的個(gè)人信息，但我們希望我們的模型了解的是整個(gè)世界，而不是個(gè)人。因此，我們致力于在可行的情況下從訓(xùn)練數(shù)據(jù)集中刪除個(gè)人信息，微調(diào)模型以拒絕個(gè)人信息的查詢請(qǐng)求，并響應(yīng)個(gè)人從我們的系統(tǒng)中刪除其個(gè)人信息的請(qǐng)求。這些措施將我們的模型生成包含個(gè)人信息的響應(yīng)的可能性降至最低。

　　提高事實(shí)準(zhǔn)確性

　　現(xiàn)今的大型語言模型，基于之前的模式和用戶輸入的文本，可以預(yù)測(cè)下一個(gè)可能要使用的詞匯。但在某些情況下，下一個(gè)最有可能出現(xiàn)的詞匯實(shí)際上可能存在事實(shí)性錯(cuò)誤。

　　提高事實(shí)準(zhǔn)確性是OpenAI和許多其他AI研究機(jī)構(gòu)關(guān)注的重點(diǎn)之一，我們正在取得進(jìn)展。通過利用被標(biāo)記為不正確的ChatGPT輸出的用戶反饋?zhàn)鳛橹饕獢?shù)據(jù)來源，我們提高了GPT-4的事實(shí)準(zhǔn)確性。相比于GPT-3.5，GPT-4更可能產(chǎn)生符合事實(shí)的內(nèi)容，提高幅度達(dá)到40%。

　　當(dāng)用戶注冊(cè)使用該工具時(shí)，我們努力做到盡可能透明，以避免ChatGPT可能給出錯(cuò)誤回復(fù)。然而，我們已經(jīng)認(rèn)識(shí)到，要進(jìn)一步降低誤解的可能性，并教育公眾了解這些AI工具目前的局限性，還有很多工作要做。

　　持續(xù)的研究和參與

　　我們認(rèn)為，解決AI安全問題的一個(gè)切實(shí)可行方法是，投入更多的時(shí)間和資源來研究有效的緩解和校準(zhǔn)技術(shù)，并針對(duì)現(xiàn)實(shí)世界可能被濫用的情況進(jìn)行測(cè)試。

　　重要的是，我們認(rèn)為提高AI的安全性和能力應(yīng)該同時(shí)進(jìn)行。我們迄今為止最好的安全工作來自于與我們最有能力的模型合作，因?yàn)樗鼈兏瞄L遵循用戶的指示，更容易駕馭或“引導(dǎo)”它們。

　　我們將越來越謹(jǐn)慎地創(chuàng)建和部署能力更強(qiáng)的模型，并將隨著AI系統(tǒng)的發(fā)展而繼續(xù)加強(qiáng)安全預(yù)防措施。

　　雖然我們等了6個(gè)多月才部署GPT-4，以更好地了解其功能、好處和風(fēng)險(xiǎn)，但有時(shí)可能需要更長的時(shí)間來提高AI系統(tǒng)的安全性。因此，政策制定者和AI開發(fā)商需要確保AI的開發(fā)和部署在全球范圍內(nèi)得到有效監(jiān)管，這樣就沒有人會(huì)為了保持領(lǐng)先而采取捷徑。這是一項(xiàng)艱巨的挑戰(zhàn)，需要技術(shù)和制度創(chuàng)新，但我們渴望為此做出貢獻(xiàn)。

　　解決AI安全問題還需要廣泛的辯論、實(shí)驗(yàn)和參與，包括為AI系統(tǒng)的行為設(shè)置界限。我們已經(jīng)并將繼續(xù)促進(jìn)利益相關(guān)者之間的合作和開放對(duì)話，以創(chuàng)建更安全的AI生態(tài)系統(tǒng)。

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：