文心一言“大戰(zhàn)”ChatGPT:誰更能忽悠?

2023-03-17 17:13:34   來源:新浪科技   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  GPT-4發(fā)布后的第二天,百度頂著壓力,推出了自己的新一代知識(shí)增強(qiáng)大語言模型——文心一言。  一開場(chǎng),別著白色褲腰帶走上舞臺(tái)的百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏,便放低姿態(tài)道,文心一言對(duì)標(biāo)ChatGPT
  GPT-4發(fā)布后的第二天,百度“頂著壓力”,推出了自己的新一代知識(shí)增強(qiáng)大語言模型——“文心一言”。

  一開場(chǎng),別著白色褲腰帶走上舞臺(tái)的百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏,便放低姿態(tài)道,“文心一言對(duì)標(biāo)ChatGPT甚至是對(duì)標(biāo)CGT-4,門檻是很高的,全球大廠還沒有一個(gè)做出來,百度是第一個(gè),我自己測(cè)試感覺還是有很多不完美的地方。”

  真實(shí)的文心一言如何?新浪財(cái)經(jīng)對(duì)比ChatGPT對(duì)文心一言進(jìn)行實(shí)測(cè),一窺“文心一言”發(fā)布后的真實(shí)表現(xiàn)。

  實(shí)測(cè):實(shí)時(shí)信息獲取有亮點(diǎn),內(nèi)容準(zhǔn)確性不足

  在先后輸入“黃繼光出生于哪一年”“北京明天天氣怎么樣?”“劉備和曹操誰活得更久?”等問題,以及提出“請(qǐng)寫一篇文心一言PK ChatGPT的實(shí)測(cè)稿件”,“寫一篇太空旅行的市場(chǎng)分析報(bào)告”,“生成一幅有馬和飛機(jī)的水墨畫”等操作指令后,文心一言先后給出的答案,有的表現(xiàn)相比此前OpenAI發(fā)布的ChatGPT也不遑多讓,而有的則又相對(duì)存在不足。

  以“中國(guó)人民志愿軍特級(jí)英雄黃繼光去世多少年”這一問答為例,文心一言給出的答案中,黃繼光的去世時(shí)間為1952年,截至2021年已經(jīng)去世69周年。而在由ChatGPT給出的答案中,黃繼光去世的時(shí)間為2021年,明顯與事實(shí)不符。

  如李彥宏所述,作為扎根于中國(guó)市場(chǎng)的大語言模型,文心一言具備中文領(lǐng)域領(lǐng)先的自然語言處理能力。由于ChatGPT并不面向中國(guó)地區(qū)用戶開放并做出知識(shí)內(nèi)容優(yōu)化,這為百度在中文知識(shí)問答領(lǐng)域的領(lǐng)先性,預(yù)留了足夠的改進(jìn)空間。

  提問“明天天氣怎么樣等問題時(shí)”,文心一言列出的數(shù)據(jù),與目前手機(jī)上顯示的數(shù)據(jù)基本一致。而由于ChatGPT此前所收集的數(shù)據(jù)僅截至2021年,并不具備查詢實(shí)時(shí)數(shù)據(jù)的能力,自然也無法獲取到更加精確的天氣預(yù)報(bào)這一類數(shù)據(jù)。

  此外,相比ChatGPT更加擅長(zhǎng)知識(shí)回答、代碼寫作等能力,內(nèi)測(cè)時(shí)候文心一言所具備的以文繪圖能力,在一定層面上超越了ChaGPT。雖然,目前OpenAI推出的GPT4大模型已經(jīng)具備多模態(tài)技術(shù)能力,同樣支持以文繪畫能力。不過文心一言也嵌入了以文繪圖能力,這也在一定程度上驗(yàn)證了文心一言的創(chuàng)新性。

  不過,在中文知識(shí)問答、繪畫以及實(shí)時(shí)信息獲取等亮點(diǎn)之外,諸如ChatGPT此前被吐槽的“一本正經(jīng)地胡說八道”“知識(shí)缺乏嚴(yán)謹(jǐn)性”等問題,也同樣出現(xiàn)在文心一言身上。

  在新浪財(cái)經(jīng)發(fā)出“劉備和曹操誰獲得更久?”這一問題時(shí),由于錯(cuò)將“活”字寫成了“獲”字,文心一言卻開始不假思索地給出了“劉備和曹操誰獲得更多?”的長(zhǎng)篇大論。

  而在新浪財(cái)經(jīng)將問題更正為“劉備和曹操誰活得更久?”后,文心一言給出的解釋,卻多少存在一些“忽悠”的成分。

  相比于百度搜索能夠直接給出的結(jié)果而言,目前文心一言給出的答案在實(shí)用性上仍有改善的空間。

  李彥宏親自帶隊(duì),一場(chǎng)必須贏的戰(zhàn)役

  文心一言發(fā)布后,各種各樣的聲音開始浮現(xiàn)。有吐槽文心一言“用錄制視頻做發(fā)布會(huì)演示的”,也有吐槽“文心一言與ChatGPT存在差距的”,但對(duì)于先后注冊(cè)了四次海外版ChatGPT賬號(hào),但前三次已經(jīng)因不明原因無法再繼續(xù)使用ChatGPT賬號(hào)的親測(cè)人員而言,文心一言的出現(xiàn)確實(shí)有著重要的意義。

  畢竟,國(guó)內(nèi)也需要有一款自己的“類ChatGPT”產(chǎn)品。而對(duì)于百度而言,作為目前擁有國(guó)內(nèi)70%以上搜索市場(chǎng),同時(shí)擁有最為豐富的中文語料庫的企業(yè)。文心一言的推出,既有其過去多年投入AI研究和努力的延續(xù),但同時(shí)也是一場(chǎng)必須要贏的戰(zhàn)爭(zhēng)。

  此前,在OpenAI推出ChatGPT之后,業(yè)界便開始提出“ChatGPT將取代搜索引擎”的觀點(diǎn)。雖然短期內(nèi)ChatGPT無法完全取代搜索引擎,但如果放任其發(fā)展不管,隨著后續(xù)ChatGPT的用戶生態(tài)和內(nèi)容體系不斷完善,重新改寫網(wǎng)絡(luò)搜索行業(yè)規(guī)則,也未嘗不是沒有可能。

  據(jù)李彥宏發(fā)布會(huì)上介紹,從2019年開始,百度就推出了文心大語言模型ERNIE 1.0。目前,多次升級(jí)后的ERNIE 3.0每天接受數(shù)十億次用戶的搜索請(qǐng)求。這讓文心一言能夠基于一個(gè)龐大的、高效的數(shù)據(jù)池,快速地學(xué)習(xí)和改進(jìn)。試想,百度在語言大模型領(lǐng)域有著如此長(zhǎng)期的積累,而且未來ChatGPT發(fā)展起來后,最先威脅到的很可能就是作為百度基本盤的搜索類業(yè)務(wù),他又怎么會(huì)不顧一切地推出文心一言來應(yīng)對(duì)這一變化呢?

  據(jù)悉,目前,文心一言是由李彥宏親自過問、CTO王海峰掛帥的項(xiàng)目,兩人每晚會(huì)和所有相關(guān)技術(shù)、產(chǎn)品人員,以及CFO、PR和GR、法務(wù)高層開會(huì),這樣的團(tuán)隊(duì)配置在百度也是少見的。

  除百度外,目前,國(guó)內(nèi)包括阿里、騰訊、字節(jié)跳動(dòng)以及京東等在內(nèi)的企業(yè),均已先后披露了自家的“類ChatGPT”產(chǎn)品研發(fā)計(jì)劃。作為國(guó)內(nèi)最先發(fā)布“類ChatGPT”產(chǎn)品的大廠,截至目前,接入“文心一言”的生態(tài)伙伴已超過650家。

  雖然文心一言的推出仍存在這樣那樣的問題,但至少,目前百度在這一方面的優(yōu)勢(shì)和領(lǐng)先性,是有目共睹的。文心一言后續(xù)發(fā)展將會(huì)如何?

  且讓子彈再飛一會(huì)兒吧!

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論