比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > BTC > Info

OpenAI用GPT-4解讀GPT-2,看來能打敗魔法的,只有魔法_NAI

Author:

Time:1900/1/1 0:00:00

來源丨元宇宙簡史

作者丨元宇宙簡史編輯Eco

OpenAI最新研究利用GPT-4自動進行大語言模型中神經元行為的解釋和評分,并將其應用于另一種語言模型GPT-2,公開了這些GPT-2神經元解釋和分數的數據集。這項技術讓人們能夠利用GPT-4來定義和自動測量AI模型的可解釋性,從而更好地理解智能是如何工作的。

大語言模型是基于大量文本數據訓練,包含數千億或更多參數的語言模型。

在大數據時代,這類AI機器學習模型可以在提升產品銷售、輔助人類決策過程中起到很大的作用。

但是計算機通常不會解釋它們的預測結果,而語言模型想要變得更強大、部署更廣泛,就需要研究可解釋性,因為人類對模型內部工作原理的理解仍然非常有限,例如可能很難從中檢測到有偏見、欺騙性內容輸出。

OpenSea推出批量購買“Sweep”功能,單筆交易可支持30個NFT:金色財經報道,據 OpenSea 官方,該 NFT 市場已推出了批量 NFT 購買功能“Sweep”,允許用戶在單筆交易中掃描最多 30 個 NFT,這樣用戶就不再需要依賴第三方聚合器來進行批量購買并且能夠有效節省 gas 費用。根據 OpenSea 發布的演示視頻,該功能支持掃描匯總多個 NFT 項目,用戶將 NFT 添加到“購物車”后滑動滑塊即可匯總并顯示價格,之后即可執行批量購買操作。[2023/1/10 11:04:00]

可解釋性就是將模型能用通俗易懂的語言進行表達,把模型的預測過程轉化成具備邏輯關系的規則的能力,從而通過查看模型內部來發現更多信息。

例如,如果有一個針對“漫威超級英雄”的神經元,當用戶向模型提問“哪個超級英雄的能力最強”時,這個神經元就會提高模型在回答中說出漫威英雄的概率。

OpenSea 7月交易量約5.28億美元,較1月歷史高點下降近90%:8月1日消息,Dune Analytics數據顯示,OpenSea的7月交易量為約5.28億美元,相比 2022年1月的歷史最高值(48.57億美元)下跌89.12%,創一年以來新低。[2022/8/1 2:50:57]

站在OpenAI的角度看,大模型未來將和人腦一樣擁有“神經元”,這些神經元會觀察文本中的特定規律,進而影響到模型本身生產的文本。

所以可解釋性就是將模型能用通俗易懂的語言進行表達,把模型的預測過程轉化成具備邏輯關系的規則的能力,從而通過查看模型內部來發現更多信息。

為了實現這個目標,OpenAI最近發布了一個關于GPT-4語言模型解析神經元的對齊性研究成果,利用自研基于GPT-4技術的開源工具,來嘗試計算其他架構、更簡單語言模型上神經元的行為并對其進行評分。

2月OpenSea以太坊鏈上NFT銷售交易量創下歷史第二高記錄:金色財經報道,據 Dun Analytics 3 月 1 日數據顯示,2 月 OpenSea 以太坊鏈上 NFT 銷售交易量達到 2,143,988 ETH,創下月交易量歷史第二高記錄。2022 年 1 月 OpenSea 以太坊鏈上 NFT 銷售交易量為 2,465,115 ETH,為歷史最高記錄。此外,在 Polygon 區塊鏈上,2 月 OpenSea NFT 銷售交易量為 1,833,724 ETH,創下 Polygon 鏈上月交易量歷史第三高記錄,低于 2022 年 1 月(2,685,757 ETH)和 2021 年 12 月(1,998,459 ETH)。[2022/3/1 13:29:44]

OpenDAO多重簽名錢包已有超過10個候選人:金色財經報道,OpenDAO核心貢獻者9x9x9發推稱,OpenDAO多重簽名錢包已有超過10個候選人。20%的SOS將被轉移到多重簽名錢包。一旦選舉完成,staking智能合約的所有者將被轉移到多重簽名。[2021/12/29 8:11:17]

而且,還可以將其應用于另一種語言模型中的神經元——本次選擇4年前發布、包含307200個神經元的大模型GPT-2為實驗樣本,公開了這些GPT-2神經元解釋和分數的數據集。

“我們邁出了使用AI進行自動化對齊研究的重要一步。”OpenAI聯合創始人GregBrockman表示。

具體來說,OpenAI開發了一套包含自動化工具和測試方法的評估流程:

OpenSea8月28日單日交易額超2.35億美元,創歷史新高:8月29日消息,據Dune Analytics數據顯示,Opensea昨日(8月28日)單日交易額超2.35億美元,創歷史新高。[2021/8/29 22:44:15]

首先,研究人員讓GPT-2運行文本序列,等待某個特定神經元被頻繁“激活”;

然后,讓GPT-4針對一段文本生成解釋,例如通過GPT-4接收到文本和激活情況判斷漫威是否與電影、角色和娛樂有關;

隨后用GPT-4模擬GPT-2的神經元接下來會做什么,預測行為;

最后評估打分,對比GPT-4模擬神經元和GPT-2真實神經元的結果的準確度,在下圖這個例子中,GPT-4的得分為0.34。

使用上述評分方法,OpenAI開始衡量他們的技術對網絡不同部分的效果,并嘗試針對目前解釋不清楚的部分改進技術。例如,他們發現以下方式有助于提高分數:

-迭代解釋。他們可以通過讓GPT-4想出可能的反例,在根據其激活情況修改解釋來提高分數;

-使用更大的模型來進行解釋。隨著解釋模型能力的提升,平均得分也會上升。然而,即使是GPT-4給出的解釋也比人類差,這表明還有改進的余地;

-改變被解釋模型的架構。用不同的激活函數訓練模型提高了解釋分數。

OpenAI表示,他們正在將GPT-4編寫的對GPT-2中的所有307,200個神經元的解釋的數據集和可視化工具開源,同時還提供了OpenAIAPI公開可用的模型進行解釋和評分的代碼,從而希望學術界能開發出新的技術來提升GPT模型解釋分數。

OpenAI還發現,有超過1000個神經元的解釋得分至少為0.8分,這意味著GPT-4模型可以解釋大部分人類神經元,同時目前GPT理解的概念似乎和人類不太一樣。例如,他們發現了一些有趣但GPT-4并不理解的神經元。

這些神經元似乎對文本中的某些特征或模式有敏感度,但是GPT-4無法用簡單的語言描述它們。OpenAI希望隨著技術和研究方法的改進,進一步提高AI模型可解釋性能力,從而更好地理解這些神經元的行為和意義。

對于本研究局限性,OpenAI表示,目前GPT-4生成的解釋還不完美,尤其要解釋比GPT-2更大的模型時,表現效果很差。

神經元復雜行為無法用簡短的自然語言描述,OpenAI解釋了神經元的這種行為,卻沒有試圖解釋產生這種行為的機制,而且整個過程算力消耗極大等。

OpenAI希望在未來的工作中可以解決上述這些問題,最終OpenAI希望使用模型來形成、測試和迭代完全一般的假設,從而比肩人類大腦的想法和行為,以及將其大模型解釋為一種在部署前后檢測對齊和安全問題的方法。

然而在這之前,OpenAI還有很長的路要走。

“我們希望這將開辟一條有前途的途徑。”JeffWu表示,這一技術可以讓其他人可以在此基礎上構建并做出貢獻的自動化方案,從而解決AI模型可解釋性問題,很好地解釋這些模型行為,比如AI如何影響人類大腦中的神經元等。

嚴正聲明:本文為元宇宙簡史原創,未經授權禁止轉載!內容僅供參考交流,不構成任何投資建議。任何讀者若據此進行投資決策,風險自擔。

Tags:OPENPENGPTNAIICO OpenLedgerThrupennyGenerative GPTBrainAI

BTC
金色早報 | BRC-20 代幣市值四天內縮水 6 億_比特幣

頭條 ▌數據:BRC-20代幣市值四天內縮水6億金色財經報道,隨著比特幣銘文鑄造數量趨于平穩,交易數量和活躍地址逐漸走低,每個比特幣區塊支付的平均費用也已經從6BTC降至1BTC.

1900/1/1 0:00:00
Cere Network獲得3100萬美元融資,Republic、Polygon領投_API

據CoinDesk9月9日消息,波卡生態去中心化數據云平臺CereNetwork獲得3100萬美元融資,Republic、Polygon領投.

1900/1/1 0:00:00
NFT資產瀏覽器NFTSCAN發布公測版_ANK

巴比特訊,7月22日,NFT資產瀏覽器NFTSCAN發推宣布發布公開測試版。據悉,NFTSCAN是基于以太坊網絡的NFT資產瀏覽器產品,測試階段已收錄40個熱門NFT項目,例如OpenSea、R.

1900/1/1 0:00:00
民進中央:積極穩妥推進元宇宙技術和產業發展,建立相關監管治理體系_加密貨幣

來源:科技日報 2022年全國兩會即將召開,記者從民進中央了解到,民進中央擬向全國政協十三屆五次會議提交《關于積極穩妥推進元宇宙技術和產業發展的提案》。元宇宙是當下的熱詞.

1900/1/1 0:00:00
誰堵了比特幣網絡?寫給十字路口的比特幣_BRC

5月8日,比特幣異常擁堵,幣安甚至不得不暫停BTC提現交易,這擁堵背后的主要原因是什么?BRC-20代幣早在3月時便被提出.

1900/1/1 0:00:00
深入推測:第一個回復比特幣白皮書人的是中本聰本人嗎?_ALD

自從比特幣的匿名發明者中本聰(SatoshiNakamoto)于2011年失蹤以來,關于他的身份一直有各種各樣的猜測.

1900/1/1 0:00:00
ads