假設您是web3新手,開始建立web3分析團隊,或者剛剛對web3數據感興趣。無論哪種方式,您都應該已經大致熟悉了API、數據庫、轉換和模型在web2中的工作方式。
對于這本就職指南,我將盡量保持簡潔,并突出我對以下三個重要的想法:
1.思考:為什么開放數據管道會重塑數據工作的完成方式
2.工具:web3數據堆棧中工具的概述,以及如何利用它們
3.團隊:在web3數據團隊中應具備的基本注意事項和技能
關于數據思維
讓我們首先總結一下在web2中如何構建、查詢和訪問數據。
對于簡化的數據管道,我們有四個步驟:
事件API觸發
攝取到數據庫
特定產品/分析用例的數據轉換
模型訓練和部署
數據有時是開源的唯一步驟是在轉換完成之后。Kaggle和HuggingFace等社區使用暴露數據的一部分來幫助企業構建更好的模型。有一些特定領域的案例,例如在前三個步驟中打開數據的開放街道地圖,但這些仍然有寫權限的限制。
Crypto 1宣布成立C1二級基金,計劃向加密貨幣和Web3公司投資5億美元:3月28日消息,Crypto 1宣布成立C1二級基金,目標是向區塊鏈、加密貨幣、Web3和金融科技公司的二級市場投資5億美元。C1二級基金是受監管的私人投資基金,旨在收購二級市場資產,即購買現有私人成長型公司的股份。(businesswire)[2023/3/28 13:31:27]
并不是說web2根本沒有任何開源。與大多數其他工程角色一樣,web2數據擁有大量用于構建其管道的開源工具。我們仍然在web3中使用所有這些工具。總之,他們的工具是開放的,但他們的數據是封閉的。
Web3也將數據開源——這意味著它不再只是數據科學家在開源中工作,分析工程師和數據工程師也是如此!每個人都參與到一個更連續的工作流程中,而不是一個黑盒數據循環。
工作的形式已經從web2數據大壩轉變為web3數據的河流、三角洲和海洋。同樣重要的是要注意,這個新周期會同時影響生態系統中的所有產品/協議。
資產管理公司Maitri Capital推出兩支Web3加密基金:12月9日消息,英國資產管理公司Maitri Capital宣布推出兩支受FCA監管的Web3加密基金,一支專注于股權和代幣投資,包括鎖定和解鎖代幣、質押和流動性代幣等;另一支將投資NFT、DeFi和元宇宙相關項目,以進行多元化投資。
Maitri Capital表示希望為投資者提供一種更加審慎的Web3投資渠道,并且將與傳統風險投資結合起來以支持有前途的早期區塊鏈初創公司。(nftgators)[2022/12/9 21:32:56]
讓我們看一個web3分析師如何協同工作的示例。有幾十個DEX使用不同的交換機制和費用,允許你將通證A換成通證B。如果這些是典型的交易所,比如納斯達克,每個交易所都會以10k或一些API報告自己的數據,并且然后像capIQ之類的其他服務會將所有交換數據放在一起,并收取費用讓您訪問他們的API。也許偶爾,他們會舉辦一場創新比賽,這樣他們就可以在未來擁有額外的數據/圖表功能來收費。
使用web3交換,我們有這個數據流:
dex.trades是Dune上的一張表,其中匯總了所有DEX交換數據-因此您可以非常輕松地搜索所有交易所中單個代幣的交換量之類的東西。
Aptos發布v1.0版白皮書《安全、可拓展和升級的Web3基礎設施》:據官方消息,公鏈項目Aptos發布白皮書,稱Aptos區塊鏈是安全、可擴展和可升級的Web3基礎設施。
據悉,Aptos是Diem原團隊成員成立的公鏈項目,激勵測試網3將于8月19日啟動注冊,預計在9月底左右推出主網。[2022/8/12 12:20:30]
一位數據分析師出現并使用一堆社區開源查詢創建了一個儀表板,現在我們對整個DEX行業有了一個公開的了解。即使所有的查詢看起來都是一個人寫的,你可以打賭,在某個不和諧的地方有大量的討論可以準確地拼湊起來。
一位DAO科學家查看儀表板并開始在他們自己的查詢中分割數據,查看特定的配對,例如穩定通證。他們研究用戶行為和商業模式,并開始建立假設。
由于科學家可以看到哪個DEX占據了更大的交易量份額,因此他們將提出一個新模型并提出對治理參數的更改,以在鏈上進行投票和執行。
之后,我們可以隨時查看儀表板,了解該提案如何創造出更具競爭力的產品。
未來,如果有另一個DEX出來,這個過程會提升產品的功能。有人會創建插入查詢來更新此表。這將反過來反映在所有儀表板和模型中。任何其他分析師/科學家都可以在Alex已經完成的工作的基礎上再接再厲。
掌柜調查署|鐘庚發:IPFS是Web3.0的底層協議,Filecoin是Web3.0的基礎設施:在今日舉行的掌柜調查署中,針對“IPFS和Filecoin未來會帶來什么革命性的創新“的問題,ChainUP創始人兼CEO鐘庚發表示,我之前是做互聯網的,所以經歷過2.0時代,也研究過1.0時代的互聯網。我把它定義為三個階段:第一個階段Web1.0:信息單向的提供,比如說代表產品是之前的三大門戶。2.0時代,我把它定位為信息的雙向互動,除了有機構、平臺的信息提供,還有是個人可以提供內容,比如說微博、社交產品抖音,大家現在玩的很火。Web3.0我把它定義為下一代的互聯網。3.0有幾個特點:
1.Web3.0用戶會掌握自己的數據。我們知道在2.0、1.0時代,我們都把數據交給中心化平臺,比如說微信數據在騰訊在那里,交易數據在阿里巴巴那里,數據不是我們自己掌握,數據的收益也歸屬于平臺,而個人在里面所能分到收益非常少。
2.Web3.0解決數據安全的問題。基于IPFS的數據存儲,它能夠很好解決數據安全的問題。
3.Web3.0一定是基于分布式的網絡去運行。
4.Web3.0需要有一個統一的數字身份ID,我們現在所有的平臺,因為各個平臺是割裂的,沒有統計的數據身份ID。總結一下:IPFS是Web3.0的底層協議,Filecoin是Web3.0的基礎設施。[2020/7/4]
由于共享生態系統,討論、協作和學習發生在更緊密的反饋循環中。這有時會變得非常壓倒性,而且我認識的分析師基本上都在輪換數據時表現得倦怠。然而,只要我們中的一個人不斷推動數據前進,那么其他所有人都會受益。
Web3基金會:Polkadot主網將按原計劃于2020年中上線:據官方消息,Web3基金會Qinwen在近期的線上活動中表示Polkadot主網即將完成安全審計,將繼續按計劃推進主網發布。因為當下全球正在經歷的疫情團隊也做出了相應的時間調整。主網發布時間按原計劃2020年中上線。[2020/3/31]
它也不一定總是復雜的抽象視圖,有時它只是實用功能,例如可以輕松搜索ENS反向解析器或改進工具,例如使用單個CLI命令自動生成大部分graphQL映射!所有這些都可以被每個人重用,并且可以適應某些產品前端或您自己的個人交易模型中的API使用。
雖然這里解鎖的可能性是驚人的,但是程序還沒有那么順利地運行。與數據工程相比,數據分析師/科學方面的生態系統仍然非常不成熟。我認為這有幾個原因:
數據工程多年來一直是web3的核心焦點,從客戶端RPCAPI改進到基本的SQL/graphQL聚合。在theGraph和Dune等產品上的工作確實體現了他們為此付出的努力。
對于分析師來說,理解web3獨特的跨協議關系表是一個艱難的過程。例如,分析師可以理解如何僅分析Uniswap,但隨后難以將聚合器、其他DEX和不同的代幣類型添加到組合中。最重要的是,完成所有這些工作的工具直到去年才真正意義上出現。
數據科學家基本上習慣于進入原始數據轉儲并獨自完成所有工作。我認為他們不習慣在項目早期與分析師和工程師如此密切和公開地合作。這需要一段時間才能適應這樣的環境。
除了學習合作之外,web3數據社區還在學習如何在這個新的數據堆棧中工作。您不再需要控制基礎架構或從excel中慢慢構建到數據湖或數據倉庫-只要您的產品上線,那么您的數據就會無處不在。您的團隊基本上進入了數據基礎架構的精華部分。
關于數據工具
這就是你們大多數人來這里的目的:?
這些工具并不全面——它們只是我發現自己或其他人在以太坊生態系統中一直使用和引用的工具。
“去中心化”標簽意味著有一個基礎設施網絡或指導框架來阻止單方面發生的變化。我喜歡將其視為解耦基礎設施與云基礎設施,但這需要有自己的文章。
讓我們來看看您何時需要使用每個圖層/類別:
交互+數據源:這主要用于前端、錢包和數據攝取到較低層。客戶端:雖然以太坊的底層實現是相同的,但每個客戶端都有不同的額外功能。例如,Erigon針對數據存儲/同步進行了大量優化,Quorum支持啟動隱私鏈。
節點即服務:您無法選擇它們運行的客戶端,但使用這些服務將為您省去自己維護節點和API正常運行時間的麻煩。節點有很多復雜性,具體取決于您要捕獲多少數據。
查詢+數據映射:該層中的數據要么在合約中作為URI引用,要么來自使用合約ABI將交易數據從字節映射到表模式。合約ABI告訴我們合約中包含哪些功能和事件,否則我們只能看到已部署的字節碼。交易數據:這些是最常用的,主要用于儀表板和報告。theGraph和FlipsideAPI也用于前端。有些表是合約的1:1映射,有些表允許在模式中進行額外的轉換。
元數據“協議”:這些不是真正的數據產品,但存在用于存儲DID或文件存儲。大多數NFT將使用其中的一個或多個,我認為今年我們將開始越來越多地使用這些數據源來增強我們的查詢功能。
專業提供商:其中一些是非常強大的數據流產品,用于內存池數據的Blocknative和用于鏈上交易數據的Parsec。其他人聚合鏈上和鏈下數據,例如DAO治理或財務數據。
高頻數據提供者:您無法查詢/轉換他們的數據,但他們已經為您完成了所有繁重的工作。“企業”服務:如果您是VC、調查員或記者,您會經常使用這些服務。您可以使用Nansen的錢包分析器或Chainanalysis的KYT深入了解錢包和錢包關系。或者使用Tolken終端在大量項目/鏈上獲得漂亮的開箱即用圖表。
增強的那些API:這些產品將許多查詢捆綁到一個中,例如ERC20代幣的所有代幣余額或為給定地址提取合約ABI。
數據團隊
不言而喻,您希望在這些社區中尋找可以雇用到您團隊的人。讓我們進一步分解重要的web3數據技能和經驗,以便您真正知道自己在搜索什么。如果您想被錄用,請將其視為您追求的技能和經驗!
分析師至少應該是使用Etherscan的高手,并且知道如何閱讀Dune儀表板。這可能需要1個月的時間才能慢慢升級,如果您真的預訂并狂歡學習,則需要2周。
您還應該考慮更多背景信息,特別是關于時間分配和技能可轉移性的內容。
在web3中,數據分析師大約30-40%的時間將用于跟上整個生態系統中的其他分析師和協議。請確保您沒有窒息他們,否則,它將成為對每個人的長期損害。與更大的數據社區一起學習、貢獻和構建是絕對必要的。
關于可轉移性:技能和領域在這個領域都是高度可轉移的。如果我使用不同的協議,那么加速時間可能會很短,因為鏈上數據的表模式都是相同的。如果有的話,我可能在加入之前就已經使用過該協議的數據了!
了解如何使用這些工具并不重要——每個分析師都應該或多或少地能夠編寫SQL或創建儀表板。這一切都是關于知道如何為社區做出貢獻和與社區合作。
Tags:WEBWEB3APIWEB3.0WEBOO幣WEB3COINBoldman Capitalweb3.0幣種有哪些
a16z加密主管ChrisDixon表示,區塊空間是2020年代的“最佳產品”。為此,我們請他來解釋一下原因,以及我們的發展方向.
1900/1/1 0:00:00音樂和Web3的未來不僅取決于基礎技術本身,還取決于市場營銷、文化以及公眾對生態系統的看法。我們圍繞這一主題構建了許多新興的研究議程,強調了意見領袖的核心作用以及他們的行動在推進(或阻礙)音樂/.
1900/1/1 0:00:00CBInsights最新區塊鏈領域投融資報告顯示,2022年一季度融資額連續7個季度穩步增長,平均每個工作日有7筆以上融資,超過1億美元的大額融資有28筆.
1900/1/1 0:00:00在維基百科定義中,網絡釣魚是一種企圖從電子通信中,透過偽裝成信譽卓著的法人媒體以獲得如用戶名、密碼和信用卡明細等個人敏感信息的犯罪詐騙過程.
1900/1/1 0:00:00頭條 ▌Terra:新TerraCore最終版本已發布,已在5月27日啟動新鏈5月25日消息,Terra官方表示,新TerraCore的最終版本已經發布,已準備在5月27日啟動新鏈.
1900/1/1 0:00:00頭條 ▌烏克蘭加密公司正在逐漸重啟業務5月15日消息,在俄烏沖突開始時,烏克蘭使用加密捐款資助戰爭的做法引起了全球加密行業的廣泛關注。現在,許多公司開始重啟業務,并取得了不同程度的成功.
1900/1/1 0:00:00