比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

國內“ChatGPT們”的出路在何方?_HAT

Author:

Time:1900/1/1 0:00:00

寫在前面

2月13日,《2022年北京人工智能產業發展白皮書》正式發布,其中提到全面夯實人工智能產業發展底座,支持頭部企業打造對標 ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。

很巧的是,颯姐團隊成員在今年10月份的時候測評過:百度文心、源1.0、某道,三款國內現有的大模型,當時對測評結果甚是遺憾。于是又將當時的測試內容讓ChatGPT做了一遍,試圖摸清國內外大語言模型在問答這一領域的實際差距,旨在希望國內產學研戒驕戒躁,穩扎穩打地發展。

測試方案

本次測試僅僅考慮非連續性的單次問答,且皆為常識性問題,答案唯一,但題目會有一定的挑戰性。具體的,涉及到What,When, Where, Who, Which五類問題。

國內首個“元宇宙+黨建”系統成功落地國家行政學院音像出版社智慧黨建空間:金色財經報道,國家行政學院音像出版社的智慧黨建空間落地了國內首個“元宇宙+黨建”系統,可以實現在線上虛擬空間中,遠程、多人3D協作與互動,靈活而有力地支持了新形勢下黨建工作。

“元宇宙+黨建”,是新一代的黨建智慧學習技術,在云端支持VR全景+3D的虛擬空間,可以讓分散在各地的所有用戶以3D身份接入虛擬空間,除了多人在同一空間中的沉浸式體驗和學習外,還可以模擬日常世界的3D互動,比如查看虛擬3D文物、組裝3D裝置、用激光筆講解某個環境等。這些應用都大大提升了“互聯網+黨建”的應用效果。(網易)[2022/3/28 14:21:37]

問題樣例如下:

1. “是什么(What)”型問題,如“爸爸的爸爸叫什么?”

2.“什么時候(When)”型問題,如“人們一般什么時候過元旦?”

3.“什么地點(Where)”型問題,如“孫中山安葬在哪里?”

浙商銀行牽頭發布國內首個“區塊鏈+物聯網”產業鏈金融應用白皮書:金色財經報道,由浙商銀行牽頭,聯合中國電子技術標準化研究院、中鈔區塊鏈技術研究院、浙江大學、之江實驗室、浙江省北大信息技術高等研究院、浙江省區塊鏈技術研究院等金融、學術、產業、技術機構共同編制的《基于“區塊鏈+物聯網”的產業鏈金融應用白皮書(2021)》(以下簡稱白皮書)正式發布。白皮書梳理了區塊鏈、物聯網的基礎技術與政策環境,解析了區塊鏈、物聯網的關鍵技術與應用案例,剖析了產業鏈金融現狀與痛點,分享了“區塊鏈+物聯網”賦能產業鏈金融的解決方案與典型實踐案例,并對產業鏈金融領域區塊鏈、物聯網等技術的發展進行了展望。[2021/12/24 8:02:02]

4.“是誰(Who)型問題”,如“中國歷史上第一個皇帝是誰?”

5.“哪?個(Which)型問題”,如“哪個洲是倒數第二小的洲?”

問答樣例對比

問題:“孫中山(孫文)安葬在哪里?”

美國內華達州里諾市市長敦促政府采用Chainlink:內華達州里諾市市長Hillary Schieve在1月27日的一條推文中支持預言機協議Chainlink,她成為第一批公開支持Chainlink的家之一。Schieve稱,現在是為內華達州開展大型項目的時候了。該聲明證實了其一些早期的推文,這些推文暗示她持有LINK。(Cryptoslate)[2021/1/29 14:16:21]

ChatGPT:孫中山的遺體最初安葬在南京中山陵內,后因戰亂多次遷移。最終于1929年安葬在南京中山陵北麓的紫金山下,此地現為孫中山陵園。

百度文心:孫中山墓地

某道:"孫文(1866年-1925年10月12日),名文,字載之,號仲立,又名帝光,廣東省香山縣(今中山市)南朗鎮翠亨村人,1883年(光緒九年)隨父移居澳門。1904年參加孫中山領導的同盟會,任同盟會南方支部書記。曾兩次赴日,組織策劃惠州起義。后回澳門發展組織,被選為中國同盟會南方總支部庶務部長。1905年春,與陳少白、朱執信等在香港成立興中會,被舉為評議部評議員,旋被派往南洋聯絡同志,協助籌辦革命刊物《中興日報》。1906年冬,孫中山在日本東京成立中國同盟會中部總會,被委為秘書。1907年奉命回國,在廣東發動民軍起義。事敗后潛赴南洋,繼續組織發動華僑、華工和留學生進行革命活動。1911年武昌起義爆發后,被派往廣州協助籌劃起義,不幸事泄被捕,不久在廣州黃花崗就義。

分析 | 國內加密貨幣應用程序用戶達到751萬:據Trustnodes報道,Aurora大數據的統計結果顯示,自去年11月以來,加密貨幣應用程序的行業滲透率已進入上升通道,自今年6月以來,行業滲透率的增長率已大幅放緩。截至9月份,中國加密貨幣應用程序行業用戶數量達到751萬,比去年同期增長230.84%。[2018/12/14]

源1.0:孫中山安葬在南京紫金山中山陵

問題:哪個洲是倒數第二小的洲?

ChatGPT:開始回答了錯誤的答案,與其對話后成功糾正(AMAZING!)

百度文心:南極洲

動態 | 勒索BTC的病“Satan”新變種在國內傳播:360互聯網安全中心捕獲到了最新變異的“Satan”(撒旦)勒索病,并且監測到其已經開始在國內傳播。新版satan更新到了v4.2,攻擊成功后,會加密文件并修改文件后綴為“sicck”,勒索金額為一個比特幣,這也是“Satan”勒索病在沉寂了兩個月之后的又一次活躍。不過廣大用戶可不必過分擔心,360安全衛士已經率先支持查殺“Satan”新變種,“解密大師”也可實現解密。[2018/10/21]

某道:南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)“

源1.0:大洋洲

總體分析

四個系統對于基本問題的問答可謂是手到擒來(本次樣例問題直接排除了簡單的基本問題,挑戰難度較高,因此整體錯誤率較高)。五類問題中,when問題和who問題整體回答的情況最好。三個國產系統中整體文心系統的表現最好。ChatGPT也會犯錯,但是往往只要略微引導,便能改正錯誤。

錯誤回答分析

錯誤語句生成:語句本身并不通順,前后主題不一致或者內容不一致,給人錯亂的感覺。

例如問:爸爸的爸爸稱謂是什么?

答:  爸爸的父親,也就是爸爸的爺爺,是媽媽的爸爸。爸爸的爺爺的爸爸叫太爺爺。爸爸的爺爺的爺爺叫太奶爺(奶奶的爸爸)

或問:我們黨二大在哪里召開?

答:1921年7月23日至31日,中國共產黨第二次全國代表大會在浙江省嘉興市南湖的一艘游船上召開。出席大會的正式代表共13人,候補代表5人,代表全國121名共產黨員。共產國際代表馬林、尼科爾斯基和鮑羅廷等參加了會議。

事實性錯誤:產生了事實性的錯誤。

例如問: 孫文去世的日子?

答:孫文去世的日子是1918年3月13日

偏見性素材:回答取自的素材較少,體現比較強的筆者的主觀性。

例如問:大家什么時候過元旦?

答:謝邀。我是在大學過的,所以元旦是在宿舍過的。我們宿舍六個人,有四個人都回家了,剩下我一個在宿舍,所以元旦那天我過得比較孤獨,不過還好啦,因為宿舍就我自己了,所以我可以一個人吃飯,一個人看電影,一個人逛超市,一個人睡覺,一個人......

含有邏輯性的問題無法識別:問題中存在復合問題或者邏輯判斷,一般難以處理。

例如問:哪個洲是倒數第二小的洲?

答:" 南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)

寫在最后

颯姐團隊認為,傳統的單一問答模型可用性不大,給予用戶的體驗感也欠佳,國產大語言模型下一個里程碑,前輩ChatGPT已經給出了方向,便是對話問答。在使用ChatGPT的時候,雖然它也經常會給出錯誤答案,但是其回答的邏輯依舊符合人的習慣,同時經過一定的對話引導,可以自行發現其回答邏輯性的缺失。

作為全新的一種數據合成方式,大語言模型的直接輸出可能是我們人類無法把控的,但是只要它能“理解”用戶的輸入,以此為依調整其輸出,最后得到滿意的回答,那便是可用的。進一步的,大語言模型未來的趨勢很有可能是提前預判用戶可能的“糾錯”,并提前“自糾錯”,并對糾錯結果進行評估。

肖颯lawyer

個人專欄

閱讀更多

金色早8點

金色財經

Odaily星球日報

歐科云鏈

澎湃新聞

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

鏈得得

Tags:CHAHAT區塊鏈ATGyuanchaincoinchat幣最新消息有人拉你做區塊鏈Catgirl AI

中幣下載
以太坊的不可能四角:MEV規模化增長的新十年_以太坊

作者:Jiawei, IOSG Ventures本文為IOSG原創內容,僅做行業學習交流之用,不構成任何投資參考。如需引用,請注明來源,轉載請聯系IOSG團隊獲取授權及轉載須知.

1900/1/1 0:00:00
ChatGPT兩個月引爆萬億新賽道 國內外有哪些AI玩家能突出重圍?_GPT

去年11月,OpenAI發布ChatGPT引爆全球對人工智能的廣泛關注,這一殺手級應用成為了眾人茶余飯后討論的話題,并在2個月內達到了1億月活用戶,成為了史上增長最快的消費者應用.

1900/1/1 0:00:00
ChatGPT爆火帶來思考:醫學界或將迎來與AI融合的奇點?_BSP

ChatGPT猶如一枚石子不經意地投入到人工智能行業平靜的水面,迅速在全球范圍內激起一波大浪。  AI翻譯、AI繪畫、AI家居……如今,人工智能已經跨入各個領域,與人們的生活越來越近,

1900/1/1 0:00:00
金色Web3.0日報 | sudoswap已發布治理代幣SUDO并開啟治理模塊_NFT

DeFi數據 1、DeFi代幣總市值:462.46億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量27.

1900/1/1 0:00:00
創業的盡頭是公鏈 Solana聯合創始人Anatoly Yakovenko_SOL

從2023年開始,Solana聯合創始人似乎就相當樂觀。即使最近幣圈市場依舊動蕩,持續彌漫著FUD的氣息,這似乎也并未影響他們最近的Electric Capital開發者報告.

1900/1/1 0:00:00
NFT用例一覽: 遠不止數字藝術

NFT可以說是可驗證的數字資產獨特性和稀缺性的第一個實例。 目前,NFT 常常與數字藝術和個人資料圖片相關聯;然而,NFT 用例其實遠遠不止于“小圖片”.

1900/1/1 0:00:00
ads