比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > BNB > Info

GPT-4收獲滿堂彩 百度“文心一言”還只是PPT?_GPT

Author:

Time:1900/1/1 0:00:00

原文:《產品“擺拍”展示文心一言露怯》

作者:文刀

3月16日,“文心一言”沒有在問答環節“翻車”,因為,百度創始人李彥宏在開發會現場展示的這個自然語言大模型產品,測試的過程和結果是提前錄制好的。

“擺拍”的測試Demo里,文心一言能用中文回答問題,能續寫《三體》,能理解“洛陽紙貴”,能計算“雞兔同籠”的數學問題并給出推算過程,還能生成圖片、語音甚至視頻。看上去挺強大,但也僅限于看上去,遠沒有更早一天OpenAI直接演示GPT-4模型時帶來的全網驚艷。

展示看似穩妥,但沒保住股價。李彥宏登臺后,港股百度集團股價從130港元開跌,22分鐘后跌幅超9%至120港元,發布會結束后,百度股價也沒能回到130港元。

整場發布會,文心一言沒有真實互動、沒有技術數據細節、沒有與其他大模型的對比,李彥宏與百度CEO王海峰一人一套PPT,公眾一個多月的期待落空。當下,王海峰宣布,“邀測開啟”,需要邀請碼。

這意味著,普羅大眾還無法體驗文心一言。而那邊廂,GPT-4已經被嵌入到ChatGPT和搜索引擎Bing,讓AI技術直抵普通人。

ImmuneFi:64%的受訪者認為ChatGPT在識別安全漏洞方面“準確度有限”:金色財經報道,ImmuneFi最近發布的一份報告顯示,許多安全研究人員正在將ChatGPT作為其日常工作流程的一部分。根據其調查,大約76%的白帽研究人員(即那些探測系統和需要修復的弱點的代碼)經常使用ChatGPT,相比之下,不使用ChatGPT的比例略高于 23%。

然而,報告稱,許多研究人員發現ChatGPT在其重要的領域存在不足,ImmuneFi發現,約64%的受訪者表示ChatGPT在識別安全漏洞方面“準確度有限”,約61%的受訪者表示該工具缺乏識別黑客可能濫用漏洞的專業知識。[2023/7/21 11:08:22]

相較而言,百度對文心一言更有信心的領域似乎在產業,李彥宏和王海峰都強調了自然語言大模型對“千行萬業”的影響,這也是它與ChatGPT的區別之一,后者的“現象級”、“殺手級”評價純來源于用戶“自來水”。

1、問答演示系提前錄制股價應聲大跌

李彥宏一上臺就給“文心一言”定了一個調——這個基于文心大模型底層的產品在公眾的期待中,對標的是ChatGPT甚至GPT-4,“門檻很高。”

OpenAI:推出iOS平臺的ChatGPT應用程序:金色財經報道,OpenAI稱,推出IOS版ChatGpt應用程序,首先在美國推出,未來幾周再推廣至其他國家。App可以免費使用,并且支持跨設備同步歷史記錄。該App集成了Whisper開源語音識別系統,支持語音輸入。ChatGPT Plus用戶可在iOS上訪問GPT-4的功能、及早獲得功能和更快的響應時間。[2023/5/19 15:12:12]

他話鋒一轉,巧妙地避開了百度與OpenAI的比較,而是把對比放在了全球大廠的范疇里,“百度是第一個發布的,大家知道微軟是直接調用OpenAI,谷歌、Meta、英偉達都沒有真正發布同類型的、同級別的產品。”這句話沒說完,李彥宏清了下嗓子,一如他在過往發布會上一樣,略顯緊張。

后來的15分鐘里,李彥宏用Demo展示了文心一言的五大能力:文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成。對應每個能力,他以文字的形式輸入了不同的、有上下文聯系的需求。

比如,展現文學創作能力時,他讓文心一言總結《三體》核心內容后,提出從哲學的角度續寫《三體》的要求;展現商業文案創作時,他讓文心一言按企業業務給公司起名、生成Slogan、寫公司成立的新聞稿;在展示梳理邏輯推算時,李彥宏用小學生們躲不開的“雞兔同籠”數學題為例,甚至故意輸錯了題干,文心一言指出有錯后,在修改的題干后給出了正確答案和解題過程。

觀點:ChatGPT每天運行開銷達70萬美元:4月21日消息,據《科創板日報》消息,芯片行業研究公司SemiAnalysis首席分析師迪倫?帕特爾表示,由于ChatGPT運行在價格昂貴的計算基礎設施之上OpenAI每天為運行ChatGPT投入的成本可能高達70萬美元。帕特爾指出,ChatGPT需要龐大的算力,才能基于用戶的輸入信息做出反饋,包括撰寫求職信、生成教學計劃,以及幫助用戶優化個人資料等。他表示,大部分成本都來自于昂貴的服務器。[2023/4/21 14:17:53]

此時,發布會直播剛好進入到第21分鐘,面向全網,李彥宏突然解釋了一句:演示不是現場進行的,而是提前錄下來的,“因為需要輸入很多詞,為了節省時間。”

此話一出,全網嘩然,“原來是擺拍的。”2分鐘后,港股百度集團股價直接下挫至120港元,較發布會14點開始時的130港元跌超9%。

百度港股股價在發布會期間大跌

“擺拍”的測試Demo繼續演示了文心一言的“強大”:解答“洛陽紙貴”在當時到底有多貴,能拿這個成語作一首藏頭詩,根植于中國的百度能拿出比其他自然語言大模型競品更好的中文理解能力;它也能在輸入文字需求后生成海報、語音甚至視頻,即多模態生成能力。

中國支付清算協會:支付行業從業人員謹慎使用ChatGPT等工具:金色財經報道,中國支付清算協會今日根據《中華人民共和國網絡安全法》《中華人民共和國數據安全法》等法律規定發布《關于支付行業從業人員謹慎使用ChatGPT等工具的倡議》,一是提高思想認識,依法依規使用。支付行業從業人員要遵守所在地區的網絡使用規定,正確認識ChatGPT等工具的機遇和風險,全面評估使用ChatGPT等工具處理工作內容的風險,依法合規使用ChatGPT等工具。二是不上傳關鍵敏感信息。三是會員單位加強內部管理和引導。[2023/4/11 13:55:41]

然而,“提前錄制”這個轉折讓文心一言后續的展示效果變弱了。

一天前,OpenAI的聯合創始人GregBrockman直播演示GPT-4的多模態能力時,沒有PPT,沒有酷炫的開場廣告,將一張手繪的“玩笑網站”模版草圖拍照上傳至新模型后,10秒生成了網站。這場展示不到半小時,但Brockman全程與社群平臺Discord上的用戶保持互動,還隨機選擇了用戶的需求測試GPT-4。

誰對自己的產品更自信,一目了然。

2、中文能力顯本土優勢跨語言“還在學習”

Citadel創始人:旗下眾多公司正在尋求使用ChatGPT工具的企業許可證:3月8日消息,Citadel Securities 創始人兼首席執行官 Ken Griffin 在接受彭博社的采訪時表示,其旗下眾多公司正在就使用 OpenAI 的 ChatGPT 工具的企業范圍許可進行談判。Ken Griffin表示,這一技術分支對我們的業務產生了真正的影響,ChatGPT從幫助開發人員編寫更好的代碼到在不同語言之間翻譯軟件,再到分析我們在日常業務過程中分析的各種類型的信息,應有盡有。ChatGPT可能會幫助創建股票投資組合,或加速分析師演示文稿的制作。[2023/3/8 12:48:39]

如果拋卻信心不談,那么,文心一言對標ChatGPT或GPT-4到底能否勝出?

在數據或技術細節上,無論是李彥宏還是后來上臺解釋文心一言技術背景的CTO王海峰,都沒有在發布會現場給出具體的對比,僅提到了“5500億”這個事實量指標,而GPT-4并沒有對外披露知識數。

普通人或許無法在數據對比中得出結論。但作為中文用戶,我們將李彥宏給文心一言輸入的中文需求甩給了植入GPT-4模型的ChatGPT,這個“外國AI”也可以理解,但很容易給出錯誤答案。

比如,做雞兔同籠數學題了錯不說,題干錯誤也未能指出;將成語“洛陽紙貴”解釋成“高分考卷在洛陽被大量復制、傳閱”,“表示名貴、珍重、有價值”,屬于沒讀過《晉書·左思傳》里的《三都賦》典故,不知這個成語原意是比喻“著作風行”之意了。

ChatGPT似乎在從字面上理解中國成語?????

有趣的是,ChatGPT又回答出“洛陽紙貴”在現代經濟學原理中代表“供求關系”的引申義。當它用這個成語作藏頭詩時,前面三個字都藏頭入詩了,但“貴”寫成了“綺”,沒能對這個中文字正確識別。

正如李彥宏所說,文心一言根植于中國,一定比其他國家的自然語言大模型更理解中文和中國文化。而對于跨語言,文心一言還在學習,“英文也能用,但肯定沒有中文好。”

GPT-4適應的“母語”顯然是英語,但為了初步測試該模型在其他語言上的能力,OpenAI的研究團隊曾使用AzureTranslate將MMLU基準翻譯成多種語言時,GPT-4的英語精度(85.5%)較GPT-3.5的精度(70.1%)更高,而跨語言精度放在普通話上,GPT-4能達到80.1%,高于日語和韓語等亞洲國家的語言。

作為中國本土化的ChatGPT,中文能力好當然是應盡之責。對用戶和客戶來說,這也是最明顯的利好,語言門檻低了,申請、使用相應地都會帶來便捷。但放在全球競爭中,這個優勢最多能體現在使用中文的國家和地區中,而OpenAI將輻射英文使用區。

在多模態生成上,文心一言的Demo展示了輸出圖片、語音、視頻的能力;GPT-4也披露將具備圖片、視頻的輸出能力,但目前無法在ChatGPT上向更廣泛的公眾展現,而它對網絡“梗圖”的理解力曾讓網友驚嘆,當然,最驚訝的還是它用草圖框架生成代碼的能力。

寫代碼這一涉及多模態的能力,文心一言并沒有在發布會中展示。但已經拿到測試資格的媒體《量子位》成員在晚間的直播中測試了文心一言寫代碼能力,給出的評價是“一般般”,“Python語言還可以,其他語言就不太行了。”他還測試了文心一言是否具有GPT-4的角色扮演能力,結論是“沒辦法”。

3、聚焦企業客戶以用戶反饋促迭代

“從我自己的內測體驗看,文心一言確實也不能叫作完美。”李彥宏謙虛了一下又說,“但是,為什么今天要發布?”屏幕前一定有人以為他要說競爭、要說文心一言的出品難度,沒想到的是,他自問完自答:因為有市場需求。

他說,百度的各個產品線,從搜索、智能云到自動駕駛、到小度都等著要用這樣的的技術,“更重要的是,我們的客戶、我們的合作伙伴在等著用這樣的技術,大家都在催,我們需要盡早的將它發布出來。”

一句話,李彥宏道出了文心一言的企業級場景,客戶、合作伙伴成為重中之重,背后的一頁PPT里寫著,“文心一言讓每一家公司都離客戶更近”。

李彥宏解釋大模型的產業機會

在解釋文心一言以及底層的文心大模型會帶來哪些創業機會和投資機會時,李彥宏說,大模型將帶來三大產業機會,包括新型云計算、行業模型精調和應用開發,而有關文字、圖像、音視頻生成、數字人、3D生成等的應用開發是“最大的機會”。

萬眾期待的文心一言發布會在這一刻如同一場“商業路演”,坐等客戶上門。而在這場發布會之前的一個月里,幾百家企業紛紛官宣加入了文心一言生態,百度給出的數據是650多家。

ToB或許是文心一言的重要優勢,畢竟,這個產品是集合了百度多個大模型的產物,包括ERNIE和PLATO,而這兩個模型都產出過多個企業級模型,場景涵蓋金融、醫療、航天、媒體、汽車等等。文心一言給企業用,簡直是水到渠成。

此前,有兩家“官宣”的公司告訴《元宇宙日爆》,“先占坑,測試后再看怎么用。”企業需求到底有多強烈,還有待觀察。觀察的窗口期也開始了,在發布會上,百度CTO王海峰當場宣布,“邀請測試”當天啟動,獲得邀請碼即可參與測試,包括合作伙伴和個人。

很快,文心一言的測試入口開通,當然,需要邀請碼才能開測。當晚10點,百度發布了文心一言的“邀測”喜報,申請調用的企業為6.5萬家。

測試Demo是提前錄制的,真實的測試將在有限的用戶中展開,文心一言到底強不強,測試用戶心里會有數。那么個人用戶如何獲得邀測權限?百度公布方案:在測試入口網站點擊“立即體驗”,參與排隊。更廣泛的個人用戶想要用到這個產品,大概率要等它正式上線了。

百度倒不是不重視C端,發布會上,李彥宏說了,大語言模型這種產品,一旦發布出來,就會獲得真實用戶的反饋,“有了這些反饋,它迭代的速度、能力的提升就會非常快。”

可見,“真實用戶中”的C端也有他的價值,為文心一言的大模型貢獻“反饋”,提升它的迭代速度與能力。希望這個貢獻對C端是免費的,這樣又能與ChatGPT產生差異化。畢竟,那個“外國AI”要向體驗GPT-4模型的用戶收Plus版的訂閱費。

Tags:GPTATGCHAHATNOISEGPTBeatGen NFTChampionchat幣要歸零嗎

BNB
長推:L2的局限性和另一種擴容方法_以太坊

原文作者:Luyao 原文來源:twitter注:本文來自@levi0214推特,MarsBit整理如下:Gnosis的創始人@koeppelmann昨天在EthDenver做了個分享.

1900/1/1 0:00:00
2023空投指南:有望空投的4個潛力項目及參與方式_ARB

原文作者:veDAO?研究院空投作為Web3的一種激勵用戶參與和貢獻的方式,在過去的幾年里,我們已經見證了一些成功的Web3項目空投,如?Uniswap、1inch、Aptos等.

1900/1/1 0:00:00
解構 Silvergate 危機:擁有千名頂級客戶的加密銀行為何破產?_SIL

原文作者|DaniloLantas 原文編譯|白澤研究院 是不是覺得加密市場最近表現得有點奇怪?上周,加密行業最重要的銀行Silvergate關閉了其交易網絡SEN.

1900/1/1 0:00:00
美國SEC主席:讓加密貨幣公司在法律范圍內開展工作_PPL

金色財經報道,美國證券交易委員會主席GaryGensler表示,自古以來,金融世界就建立在信任和法治之上。此外,從銀行到證券交易所,金融已經趨向于集中化和相互關聯。加密市場也不例外.

1900/1/1 0:00:00
關于Blur的深度討論及潛在投資機會_SEA

原文作者:JessicaShen,MintVentures?投資經理本文先對?Blur?當前的機遇和挑戰展開討論,再談論了從Web3.0??創業和投資角度對我們看到的?Blur?值得學習的點.

1900/1/1 0:00:00
Cosmos生態的項目Babylon現已在測試網上線_BAB

金色財經報道,旨在將比特幣安全性帶至Cosmos生態的項目Babylon現已在測試網上線,將在年底推出主網之前于今年夏天推出第二個測試網.

1900/1/1 0:00:00
ads