比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

完全基于Transformer的目標檢測器,ICLR匿名論文視覺、檢測統一_DET

Author:

Time:1900/1/1 0:00:00

機器之心報道

編輯:陳萍

一種新的集成視覺和檢測Transformer的目標檢測器ViDT。

Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。

ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。

游戲公鏈Oasys計劃到2028年推出完全去中心化的自治組織結構:1月19日消息,游戲公鏈Oasys宣布已建立作為去中心化決策過程的治理體系,旨在在謀求項目去中心化的同時,討論針對鏈游行業的發展,包括制定專門用于游戲和元宇宙的NFT的互操作性標準。Oasys的目標是在2028年之前實現完全去中心化自律組織(DAO)。

該項目計劃首先建立治理體系是去中心化過程,并在未來逐步完善公共運營制度。將來,OAS代幣持有者可以參與項目的各種決策,Oasys網絡將被去中心化。2023年是治理體系的試運行期,有關網絡的改善提案僅限于以Oasys的合作伙伴企業為中心的Genesis理事會。另外,關于投票,一般代幣持有者也能參與的功能預定在年內實現。到2024年,Genesis理事會將任命正式的Council成員,一般代幣持有者也可以在治理中提出提案。(Coinpost)[2023/1/19 11:20:58]

在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。

Harmony已與Ethereum EVM完全兼容:據Harmony官方推特,Harmony已與Ethereum工具(Metamask,web3.js / ether.js)完全兼容EVM。Harmony的互操作性解決方案可實現即時結算和節能交易。[2021/4/15 20:22:06]

論文地址:https://openreview.net/pdf?id=w4cXZDDib1H

ViDT:視覺與檢測Transformer

ViDT架構如下圖2(c)所示:

首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;

聲音 | 比特幣核心開發者:已將Parity2.6.8完全同步到以太坊區塊9,390,000:比特幣核心開發者、Casa的技術總監Jameson Lopp今日發推特稱,我的基準測試計算機花了9天2個小時將Parity2.6.8完全同步到以太坊區塊9,390,000。它執行超過47TB的磁盤讀取和42TB的磁盤寫入。[2020/2/2]

其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;

最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。

金色晨訊 | Tether官網刪除代幣完全由美元支撐的說法 GateCoin交易所宣布停運并清算:1.CBOE暫停添加新比特幣期貨。

2.歐洲央行:比特幣不是貨幣。

3.Bittrex取消了首個IEO銷售。

4.Tether官網刪除代幣完全由美元支撐的說法。

5.美國CETC主席:區塊鏈和加密貨幣是當今市場轉型的兩個關鍵。

6.比特幣第四大巨鯨錢包地址開始拆分比特幣 或在進行拋售。

7.工信部將支持利用區塊鏈等技術推進物流業降本增效項目。

8.數字貨幣交易所GateCoin宣布停運并清算。

9.IBM發布了關于在區塊鏈中抵制重播攻擊的專利。[2019/3/15]

RAM模塊

該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:

聲音 | ShapeShift CEO:加密貨幣達1000倍時將是加密貨幣完全接管金融系統之時:加密貨幣交易所 ShapeShift CEO Erik Voorhees于14日,在接受cointelegraph(日本版)的采訪時表示,如果加密貨幣達到1000倍,將是將是加密貨幣完全接管金融系統之時,這可能需要十幾年的時間。[2018/9/14]

ENCODER-FREEneck結構

為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。

解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖

中采樣的一小組關鍵內容:

用于目標檢測的token匹配知識蒸餾

雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。

匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:

評估

表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。

實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。

表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。

表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。

為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。

下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。

研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。

Tags:DETETRRAMDET幣是什么幣ETR價格ETR幣RAM幣RAM價格

中幣下載
小學生數學日記「精心整理」_胡蘿卜

小學生數學日記 小學生數學日記(匯編15篇) 小學生數學日記1 在我們的生活中,處處都要用到數學。不信?今天發生的事就證明了這一點。下午,媽媽給我二十元錢叫我到超市去買一瓶醬油和一瓶蜂蜜.

1900/1/1 0:00:00
《蒲田進行曲》幕后冷知識:蒲田是指什么?松坂慶子到底是哪國人_GUY

作者|林小野 “攝影廠的攝影棚,真是一個奇妙而又不可思議的世界。在這個世界里,能把虛假的愛變成真正的愛,至于把白天變成黑夜一類的事,那更是家常便飯了……” 《蒲田進行曲》是大家非常喜愛的一部日本.

1900/1/1 0:00:00
山寨幣浮云(五)|剛蹭上中國女足的ZGNZ幣,還沒熱乎就跑了?_狗狗幣

每逢熱點事件,總要警惕山寨幣出入。繼EDG幣、Pi幣、魷魚幣、奧密克戎幣后,近日幣圈趁著春晚熱度,火了一個名為DogeKing的山寨幣,很快隨著中國女足奪冠事件刷屏,又亂入了一個名為“ZGNZ”.

1900/1/1 0:00:00
分享一個玩FIL的寶藏平臺,可挖礦可理財收益還高_FIL

需要先說明下,我是一個Filecoin項目的堅定信仰者,從項目測試網上線期就一直在關注IPFS/Filecoin領域。這也讓我養成了持續囤幣,然后找合適的DeFi平臺做資金管理的習慣.

1900/1/1 0:00:00
專利申請材料要怎么樣寫 專利申請材料附圖有什么要求_

申請專利不但想法很重要,撰寫專利材料還需要有一定的條件和要求,申請專利的材料撰寫的格式和好壞有時候會決定著這個專利的通過率,無論申請專利的是企業還是個人一定都不想自己的專利申請不通過.

1900/1/1 0:00:00
一年級人教版數學說課稿_

一年級人教版數學說課稿 一年級人教版數學說課稿3篇一年級人教版數學說課稿篇1 一、說教材: 教材簡析: 《數學課程標準》指出:“強調學生通過實踐,增強探究和創新意識,學習科學研究的方法.

1900/1/1 0:00:00
ads