比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > 波場 > Info

達摩院貓頭鷹 mPLUG-Owl 亮相:模塊化多模態大模型,追趕 GPT-4 多模態能力_PLU

Author:

Time:1900/1/1 0:00:00

來源:機器之心

純文本大模型方興未艾,多模態領域也開始涌現出多模態大模型工作,地表最強的GPT-4具備讀圖的多模態能力,但是遲遲未向公眾開放體驗,于是乎研究社區開始在這個方向上發力研究并開源。MiniGPT-4和LLaVA問世不久,阿里達摩院便推出mPLUG-Owl,一個基于模塊化實現的多模態大模型。

今天要介紹的是mPLUG-Owl,該工作不僅通過大量cases展示出優秀的多模態能力,還第一次針對視覺相關的指令理解提出一個全?的測試集OwlEval,通過人工評測對比了已有模型,包括LLaVA、MiniGPT-4、BLIP-2以及系統類MM-REACT等工作,實驗結果表明mPLUG-Owl展示出更優的多模態能力,尤其在多模態指令理解能力、多輪對話能力、知識推理能力等方?表現突出

外媒:Tether資金曾存放于多家銀行:6月17日消息,Tether在2021年3月將其資金存放在四家銀行、兩家投資管理公司、兩家黃金保管庫和一家黃金經紀商以及Bitfinex中。此外它還持有由卡塔爾國民銀行(QPSC)、巴克萊銀行(PLC)、德意志銀行(AG)、阿聯酋NBD銀行PJSC和Natwest Group PLC等各種實體發行的商業票據和其他債券,而其發行人中有大部分是中國各大銀行和金融機構,包括中國農業銀行、中國銀行(香港)、中國交通銀行、中國工商銀行、招商銀行、中國建設銀行、中國光大銀行。[2023/6/18 21:44:23]

論文鏈接:https://arxiv.org/abs/2304.14178

代碼鏈接:https://github.com/X-PLUG/mPLUG-Owl

Binance.US宣布上架Floki Inu (FLOKI):金色財經報道,Binance.US 宣布上架 Floki Inu (FLOKI),用戶現在可以存入 FLOKI,FLOKI/USD 和 FLOKI/USDT 交易對將于 2023 年 4 月 25 日美國東部時間早上 8 點開始。[2023/4/25 14:25:53]

ModelScope體驗地址:

https://modelscope.cn/studios/damo/mPLUG-Owl/summary

HuggingFace體驗地址:

https://huggingface.co/spaces/MAGAer13/mPLUG-Owl

多模態能力展示

我們把mPLUG-Owl與現有工作進行對比來感受一下mPLUG-Owl的多模態效果,值得一提的是,該工作中評比的測試樣例基本上都來自已有工作,避免了cherrypick問題。

FTX在申請破產前將巴哈馬資產中的77億美元資產轉移給FTX美國實體:金色財經報道,特拉華州一家破產法庭在周三獲悉,FTX在去年申請破產前,將這家加密公司巴哈馬資產中的77億美元資產轉移給了FTX的美國實體。

法院任命的巴哈馬聯合臨時清算人表示,56億美元從巴哈馬FTX Digital的托管賬戶轉移到美國實體FTX Trading,另有21億美元轉移到FTX的美國交易機構Alameda Research。

FTX的新管理層于1月初與巴哈馬法院指定的清算人達成合作協議,以消除分歧并解決有爭議的資產。但FTX的代表表示,資產屬于巴哈馬資產還是屬于美國資產仍是懸而未決的問題。(CoinDesk)[2023/2/16 12:09:27]

下圖6展示了mPLUG-Owl很強的多輪對話能力。

藍色光標:公司正在積極試用ChatGPT技術:金色財經報道,藍色光標在互動平臺表示,公司正在積極試用ChatGPT技術,自有虛擬人蘇小妹已經介入了AI多輪對話,AI作詩能力已經進入技術測試階段,未來會結合AIGC和終端交互做更多數字化拓展;同時,公司也在做其他ChatGPT產品的試用和調試。AI技術在藍色光標已早有應用,并且在藍色宇宙布局伊始,AI化就是三條技術主線之一。[2023/2/7 11:52:20]

從圖7中可以發現,?mPLUG-Owl具有很強的推理能力。

如圖9展示了一些笑話解釋例?。

加密對沖基金Arca關閉曾有UST風險敞口的數字收益基金,資金已返還給投資者:金色財經報道,加密對沖基金 Arca 已關閉其數字收益基金,該數字收益基金于2021年8月份推出,尋求投資波動性較小的數字資產,在關閉時管理的資產略高于 2000 萬美元,資金已返還給投資者。截至 6 月 30 日,該基金的總資產價值為 5300 萬美元。

Arca此前透露,該數字收益基金持有TerraUSD (UST) Stablecoin。但知情人士稱,這并不是迫使基金關閉的主要原因。Arca目前還管理著旗艦數字資產基金、專注于風險投資的 Arca Endeavor 和 NFT 基金。[2022/11/5 12:18:40]

在該工作中,除了評測對比外,該研究團隊還觀察到mPLUG-Owl初顯一些意想不到的能力,比如多圖關聯、多語?、文字識別和文檔理解等能力。

如圖10所示,雖然在訓練階段并沒有進行多圖關聯數據的訓練,mPLUG-Owl展現出了一定的多圖關聯能力。

如圖11所示,盡管mPLUG-Owl在訓練階段僅使用了英文數據,但其展現出了有趣的多語?能力。這可能是因為mPLUG-Owl中的語?模型使用了LLaMA,從而出現了這一現象。

盡管mPLUG-Owl沒有在帶有標注的文檔數據上進行訓練,但其仍然展現出了一定的文字識別和文檔理解能力,測試結果如圖12所示。

方法介紹

該工作提出的mPLUG-Owl,其整體架構如圖2所示。

模型結構:它由視覺基礎模塊(開源的ViT-L)、視覺抽象模塊以及預訓練語?模型(LLaMA-7B)組成。視覺抽象模塊將較?的、細粒度的圖像特征概括為少量可學習的Token,從而實現對視覺信息的?效建模。?成的視覺Token與文本查詢一起輸?到語?模型中,以?成相應的回復。

模型訓練:采用兩階段的訓練方式

第一階段:主要目的也是先學習視覺和語?模態間的對?。不同于先前的工作,?mPLUG-Owl提出凍住視覺基礎模塊會限制模型關聯視覺知識和文本知識的能力。?因此mPLUG-Owl在第一階段只凍住LLM的參數,采用LAION-400M,?COYO-700M,?CC以及MSCOCO訓練視覺基礎模塊和視覺摘要模塊。

第?階段:延續mPLUG和mPLUG-2中不同模態混合訓練對彼此有收益的發現,Owl在第?階段的指令微調訓練中也同時采用了純文本的指令數據(52kfromAlpaca+90kfromVicuna+50kfromBaize)和多模態的指令數據(150kfromLLaVA)。作者通過詳細的消融實驗驗證了引?純文本指令微調在指令理解等方?帶來的收益。第?階段中視覺基礎模塊、視覺摘要模塊和原始LLM的參數都被凍住,參考LoRA,只在LLM引?少量參數的adapter結構用于指令微調。

實驗結果

SOTA對比

為了比較不同模型的多模態能力,該工作構建一個多模態指令評測集OwlEval。由于?前并沒有合適的自動化指標,參考Self-Intruct對模型的回復進行人工評測,打分規則為:A="正確且令人滿意";B="有一些不完美,但可以接受";C="理解了指令但是回復存在明顯錯誤";D="完全不相關或不正確的回復"。

對比結果如下圖3所示,實驗證明Owl在視覺相關的指令回復任務上優于已有的OpenFlamingo、BLIP-2、LLaVA、MiniGPT-4。

多維度能力對比

多模態指令回復任務中牽扯到多種能力,例如指令理解、視覺理解、圖?上文字理解以及推理等。為了細粒度地探究模型在不同能力上的?平,本文進一步定義了多模態場景中的6種主要的能力,并對OwlEval每個測試指令人工標注了相關的能力要求以及模型的回復中體現了哪些能力。

結果如下表格6所示,在該部分實驗,作者既進行了Owl的消融實驗,驗證了訓練策略和多模態指令微調數據的有效性,也和上一個實驗中表現最佳的baseline—MiniGPT4進行了對比,結果顯示Owl在各個能力方?都優于MiniGPT4。

Tags:OWLPLUPLUGMPLSOWL價格PLUT幣PLUG幣Ampleforth

波場
小紅書,要量產AI美女了?_XMO

來源:深瞳商業,作者:河馬君、楚青舟眾所周知,小紅書已經籌備“大模型”團隊。據36氪5月6日消息,小紅書自3月起開始籌備建立獨立的大模型團隊,核心員工來自廣告業務的NLP技術團隊.

1900/1/1 0:00:00
Bittrex申請破產?實為退出美國市場,將反擊SEC指控_ITT

原文作者:Nancy,PANews加密行情動蕩之際,成立于?2015?年的加密交易所?Bittrex?宣布于?5?月?9?日在美國特拉華州申請破產,引發了市場恐慌和猜測.

1900/1/1 0:00:00
奧斯汀獨家對話:從機構的「拉扯」中成長的美國加密監管_加密貨幣

原文來源:歐科云鏈研究院 原文作者:畢良寰 前言 4?月?25?日,在美國得克薩斯州的首府奧斯汀,這座充滿活力和創造力的城市.

1900/1/1 0:00:00
頂上戰爭:以太坊主流ZK系Layer 2對比_ROL

以ZKrollups技術展開的項目不難看出最終目標都是zkEVM,而從去年至今將是日常加密貨幣用戶將能夠首次嘗試zkEVM的一年.

1900/1/1 0:00:00
為什么推特KOL都在BRC賺錢 我一沖就虧?_Maker

近日的市場熱度令人焦慮,但真的這么多人在BRC-20上賺錢了嗎?縱覽推特,眾多KOL號稱在BRC-20大賺了一筆,紛紛分享心得,目前,領漲的ORDI?單價已突破27?美元.

1900/1/1 0:00:00
13條meme coin交易心得_MEME

原文作者:Zeneca,加密研究員最近的幣圈,除了meme還是meme,玩NFT的賣猴子去買PEPE、擼毛的用Gas、炒幣的賣主流幣去買PEPE,目前來看,meme狂潮還是不會短時間平息.

1900/1/1 0:00:00
ads