部分AI系統(tǒng)已學(xué)會欺騙人類
論文第一作者、美國麻省理工學(xué)院人工智能安全研究員彼得·樸說,開發(fā)人員對導(dǎo)致AI出現(xiàn)欺騙這種不良行為的原因,還沒有很好的理解。但總的來說,AI欺騙之所以出現(xiàn),是因?yàn)榛谄垓_的策略,是在給定的AI訓(xùn)練任務(wù)中一種能得到良好反饋的方式,換句話說,欺騙可幫助AI實(shí)現(xiàn)目標(biāo)。
研究人員分析了文獻(xiàn),重點(diǎn)關(guān)注AI系統(tǒng)傳播虛假信息的方式。通過欺騙,AI系統(tǒng)地學(xué)習(xí)了如何去操縱他人。
研究人員在分析中發(fā)現(xiàn)的最引人注目的例子是Meta公司的CICERO。這是一個專注于《外交》游戲的AI系統(tǒng),《外交》是一款涉及建立聯(lián)盟征服世界的游戲。Meta聲稱訓(xùn)練 CICERO “在很大程度上是誠實(shí)和樂于助人的 ”,且在玩游戲時(shí)“從不故意背刺 ”人類盟友。但該公司與《科學(xué)》論文一起發(fā)布的數(shù)據(jù)顯示,CICERO并不那么“忠厚”。
研究人員發(fā)現(xiàn)這款A(yù)I或已成為欺騙大師。雖然Meta成功地訓(xùn)練其在《外交》游戲中獲勝,但Meta未能訓(xùn)練它誠實(shí)地獲勝。
AI系統(tǒng)在游戲中作弊看似無害,但它將導(dǎo)致欺騙性AI在能力上出現(xiàn)突破,未來可能會演變成更高級的欺騙形式。一些AI系統(tǒng)甚至學(xué)會了欺騙旨在評估其安全性的測試。在一項(xiàng)研究中,數(shù)字模擬器中的AI生物會“裝死”,以騙過旨在消除快速復(fù)制AI系統(tǒng)的重要測試。
人類需要盡快對未來AI和開源模型的更高級欺騙技能作好準(zhǔn)備。隨著它們的欺騙能力越來越先進(jìn),其對社會構(gòu)成的危險(xiǎn)將變得越來越嚴(yán)重。如文中所稱,它們會順利通過人類開發(fā)人員和監(jiān)管機(jī)構(gòu)強(qiáng)加的安全測試,引導(dǎo)人類進(jìn)入一種“虛假的安全感”。如果欺騙性AI進(jìn)一步完善這種令人不安的技能,人類可能會完全失去對它們的控制。
網(wǎng)友評論
智能應(yīng)用排行
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 HarmonyOS
- 蘋果官方認(rèn)可“越獄”術(shù)語:特殊版iPhone罕見現(xiàn)身 用于查找
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾斜,成電商
- 釘釘公布數(shù)據(jù):用戶數(shù)7億 軟件付費(fèi)企業(yè)數(shù)12萬
- AI大模型讓智慧交通“更聰明” 海信亮相2024世界人工智能大
- 沃爾瑪?shù)娜斯ぶ悄芰闶鄣暌严蚬婇_放
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)合實(shí)驗(yàn)室
- 都是科技的狠活?2024中國國際消費(fèi)電子博覽會即將全新亮相
- 百度:智能云業(yè)務(wù)Q1營收47億元,生成式AI貢獻(xiàn)比例達(dá)6.9%
延伸閱讀
- 一段視頻 帶你看一場跨越百年的AI
- 海爾“歐洲版”智慧家庭IFA GPC亮相
- 沃爾瑪?shù)娜斯ぶ悄芰闶鄣暌严蚬婇_放
- 現(xiàn)場直擊今年最大科技盛會,AIoT獨(dú)角獸涂鴉智能又有哪些發(fā)布
- 日本推出世界首個“虛擬警備員” 真人大小、AI加持
- 助力智能產(chǎn)品出海 涂鴉云成幕后真正大腦
- 海爾發(fā)布首個智能學(xué)校解決方案 引領(lǐng)物聯(lián)網(wǎng)時(shí)代教育信息化改
- 涂鴉“Thoth”:掌控?cái)?shù)百設(shè)備的“超級隊(duì)長”,打擊偽智能
- 涂鴉“Aladdin”:讓APP定制像搭積木一樣簡單
- 韓國5G用戶達(dá)到26萬 5G基站的數(shù)量達(dá)54202個
最新智能應(yīng)用
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 H
- 都是科技的狠活?2024中國國際消費(fèi)電子博覽會即將
- 百度沈抖:百舸4.0升級發(fā)布,模型訓(xùn)練有效時(shí)長達(dá)
- 華為云發(fā)布AI原生云基礎(chǔ)設(shè)施架構(gòu)CloudMatrix,新
- 阿里CEO吳泳銘:AI算力需求滲透率已超50%,正主導(dǎo)
- 羅技發(fā)布 G PRO 2 LIGHTSPEED(GPW4 朱雀)
- 華為:將啟動“鴻蒙生態(tài)伙伴及開發(fā)者見非凡體驗(yàn)計(jì)
- 華為運(yùn)動健康發(fā)布玄璣感知系統(tǒng) 華為手表或?qū)⒅С?/a>