文心一言“大戰(zhàn)”ChatGPT：誰更能忽悠？

2023-03-17 17:13:34 來源：新浪科技評(píng)論：0 [收藏] [評(píng)論]

導(dǎo)讀：　　GPT-4發(fā)布后的第二天，百度頂著壓力，推出了自己的新一代知識(shí)增強(qiáng)大語言模型——文心一言。　　一開場(chǎng)，別著白色褲腰帶走上舞臺(tái)的百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏，便放低姿態(tài)道，文心一言對(duì)標(biāo)ChatGPT

　　GPT-4發(fā)布后的第二天，百度“頂著壓力”，推出了自己的新一代知識(shí)增強(qiáng)大語言模型——“文心一言”。

　　一開場(chǎng)，別著白色褲腰帶走上舞臺(tái)的百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏，便放低姿態(tài)道，“文心一言對(duì)標(biāo)ChatGPT甚至是對(duì)標(biāo)CGT-4，門檻是很高的，全球大廠還沒有一個(gè)做出來，百度是第一個(gè)，我自己測(cè)試感覺還是有很多不完美的地方。”

　　真實(shí)的文心一言如何?新浪財(cái)經(jīng)對(duì)比ChatGPT對(duì)文心一言進(jìn)行實(shí)測(cè)，一窺“文心一言”發(fā)布后的真實(shí)表現(xiàn)。

　　實(shí)測(cè)：實(shí)時(shí)信息獲取有亮點(diǎn)，內(nèi)容準(zhǔn)確性不足

　　在先后輸入“黃繼光出生于哪一年”“北京明天天氣怎么樣?”“劉備和曹操誰活得更久?”等問題，以及提出“請(qǐng)寫一篇文心一言PK ChatGPT的實(shí)測(cè)稿件”，“寫一篇太空旅行的市場(chǎng)分析報(bào)告”，“生成一幅有馬和飛機(jī)的水墨畫”等操作指令后，文心一言先后給出的答案，有的表現(xiàn)相比此前OpenAI發(fā)布的ChatGPT也不遑多讓，而有的則又相對(duì)存在不足。

　　以“中國(guó)人民志愿軍特級(jí)英雄黃繼光去世多少年”這一問答為例，文心一言給出的答案中，黃繼光的去世時(shí)間為1952年，截至2021年已經(jīng)去世69周年。而在由ChatGPT給出的答案中，黃繼光去世的時(shí)間為2021年，明顯與事實(shí)不符。

　　如李彥宏所述，作為扎根于中國(guó)市場(chǎng)的大語言模型，文心一言具備中文領(lǐng)域領(lǐng)先的自然語言處理能力。由于ChatGPT并不面向中國(guó)地區(qū)用戶開放并做出知識(shí)內(nèi)容優(yōu)化，這為百度在中文知識(shí)問答領(lǐng)域的領(lǐng)先性，預(yù)留了足夠的改進(jìn)空間。

　　提問“明天天氣怎么樣等問題時(shí)”，文心一言列出的數(shù)據(jù)，與目前手機(jī)上顯示的數(shù)據(jù)基本一致。而由于ChatGPT此前所收集的數(shù)據(jù)僅截至2021年，并不具備查詢實(shí)時(shí)數(shù)據(jù)的能力，自然也無法獲取到更加精確的天氣預(yù)報(bào)這一類數(shù)據(jù)。

　　此外，相比ChatGPT更加擅長(zhǎng)知識(shí)回答、代碼寫作等能力，內(nèi)測(cè)時(shí)候文心一言所具備的以文繪圖能力，在一定層面上超越了ChaGPT。雖然，目前OpenAI推出的GPT4大模型已經(jīng)具備多模態(tài)技術(shù)能力，同樣支持以文繪畫能力。不過文心一言也嵌入了以文繪圖能力，這也在一定程度上驗(yàn)證了文心一言的創(chuàng)新性。

　　不過，在中文知識(shí)問答、繪畫以及實(shí)時(shí)信息獲取等亮點(diǎn)之外，諸如ChatGPT此前被吐槽的“一本正經(jīng)地胡說八道”“知識(shí)缺乏嚴(yán)謹(jǐn)性”等問題，也同樣出現(xiàn)在文心一言身上。

　　在新浪財(cái)經(jīng)發(fā)出“劉備和曹操誰獲得更久?”這一問題時(shí)，由于錯(cuò)將“活”字寫成了“獲”字，文心一言卻開始不假思索地給出了“劉備和曹操誰獲得更多?”的長(zhǎng)篇大論。

　　而在新浪財(cái)經(jīng)將問題更正為“劉備和曹操誰活得更久?”后，文心一言給出的解釋，卻多少存在一些“忽悠”的成分。

　　相比于百度搜索能夠直接給出的結(jié)果而言，目前文心一言給出的答案在實(shí)用性上仍有改善的空間。

　　李彥宏親自帶隊(duì)，一場(chǎng)必須贏的戰(zhàn)役

　　文心一言發(fā)布后，各種各樣的聲音開始浮現(xiàn)。有吐槽文心一言“用錄制視頻做發(fā)布會(huì)演示的”，也有吐槽“文心一言與ChatGPT存在差距的”，但對(duì)于先后注冊(cè)了四次海外版ChatGPT賬號(hào)，但前三次已經(jīng)因不明原因無法再繼續(xù)使用ChatGPT賬號(hào)的親測(cè)人員而言，文心一言的出現(xiàn)確實(shí)有著重要的意義。

　　畢竟，國(guó)內(nèi)也需要有一款自己的“類ChatGPT”產(chǎn)品。而對(duì)于百度而言，作為目前擁有國(guó)內(nèi)70%以上搜索市場(chǎng)，同時(shí)擁有最為豐富的中文語料庫的企業(yè)。文心一言的推出，既有其過去多年投入AI研究和努力的延續(xù)，但同時(shí)也是一場(chǎng)必須要贏的戰(zhàn)爭(zhēng)。

　　此前，在OpenAI推出ChatGPT之后，業(yè)界便開始提出“ChatGPT將取代搜索引擎”的觀點(diǎn)。雖然短期內(nèi)ChatGPT無法完全取代搜索引擎，但如果放任其發(fā)展不管，隨著后續(xù)ChatGPT的用戶生態(tài)和內(nèi)容體系不斷完善，重新改寫網(wǎng)絡(luò)搜索行業(yè)規(guī)則，也未嘗不是沒有可能。

　　據(jù)李彥宏發(fā)布會(huì)上介紹，從2019年開始，百度就推出了文心大語言模型ERNIE 1.0。目前，多次升級(jí)后的ERNIE 3.0每天接受數(shù)十億次用戶的搜索請(qǐng)求。這讓文心一言能夠基于一個(gè)龐大的、高效的數(shù)據(jù)池，快速地學(xué)習(xí)和改進(jìn)。試想，百度在語言大模型領(lǐng)域有著如此長(zhǎng)期的積累，而且未來ChatGPT發(fā)展起來后，最先威脅到的很可能就是作為百度基本盤的搜索類業(yè)務(wù)，他又怎么會(huì)不顧一切地推出文心一言來應(yīng)對(duì)這一變化呢?

　　據(jù)悉，目前，文心一言是由李彥宏親自過問、CTO王海峰掛帥的項(xiàng)目，兩人每晚會(huì)和所有相關(guān)技術(shù)、產(chǎn)品人員，以及CFO、PR和GR、法務(wù)高層開會(huì)，這樣的團(tuán)隊(duì)配置在百度也是少見的。

　　除百度外，目前，國(guó)內(nèi)包括阿里、騰訊、字節(jié)跳動(dòng)以及京東等在內(nèi)的企業(yè)，均已先后披露了自家的“類ChatGPT”產(chǎn)品研發(fā)計(jì)劃。作為國(guó)內(nèi)最先發(fā)布“類ChatGPT”產(chǎn)品的大廠，截至目前，接入“文心一言”的生態(tài)伙伴已超過650家。

　　雖然文心一言的推出仍存在這樣那樣的問題，但至少，目前百度在這一方面的優(yōu)勢(shì)和領(lǐng)先性，是有目共睹的。文心一言后續(xù)發(fā)展將會(huì)如何?

　　且讓子彈再飛一會(huì)兒吧!

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：

新聞
圖片
下載
專題

返回消費(fèi)頻道

快速導(dǎo)航：新聞立場(chǎng) 角度消費(fèi) 服務(wù) 產(chǎn)品

文心一言“大戰(zhàn)”ChatGPT：誰更能忽悠？

網(wǎng)友評(píng)論

消費(fèi)評(píng)論排行

延伸閱讀

最新消費(fèi)評(píng)論