比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

一張估值20億的“笑臉”,正在拆掉OpenAI的圍墻_ING

Author:

Time:1900/1/1 0:00:00

文|Juny??編輯|VickyXiao

由ChatGPT引發的人工智能風潮還在猛烈地刮著。但從各個角度來看,目前這都是一個巨頭爭霸的戰場:更大的模型、更強的算力、更多的用戶、更雄厚的資金……這些都似乎成為了想要加入這場角逐的門票。與此同時,核心技術的研究也逐漸開放走向封閉。

而在這高墻正在筑起的過程中,也有一些新銳的創業公司想要高舉旗幟來一場革命。其中,尤其引人注目的是一家名為HuggingFace開源創業公司。

目前,HuggingFace已經是全球最受歡迎的開源機器學習社區和平臺,不僅創下了GitHub有史以來增長最快的AI項目記錄,估值也一路沖破了20億美元。近期,微軟和浙江大學聯合發布的一篇關于HuggingGPT的論文更是把HuggingFace推到了舞臺中心,也讓更多人關注到了當前這股與眾不同的人工智能發展力量。

01HuggingGPT火了,Hugging是啥?

本月初,微軟亞洲研究院和浙江大學聯合發布了一項最新的名為HuggingGPT的研究,介紹了一個全新的協作系統,讓開發者能夠在ChatGPT的幫助下快速、準確地去選擇合適的人工智能模型,從而完成包括文字、視頻、語音等多模態在內的復雜任務。

該項目目前已經在Github上開源,還有一個超拉風的名字叫JARVIS。在這個研究中,主要涉及到了兩個主體,一個是眾所周知的ChatGPT,另一個則是AI社區HuggingFace。

EIP-6147已移至最終版本,該標準可分離NFT和SBT持有權和轉讓權:3月7日消息,由10K Universe提出的以太坊改進提議EIP-6147已移至最終版本(Final),該標準是ERC-721的擴展,分離了NFT和靈魂綁定代幣(SBT)的持有權和轉讓權,并定義了一個新的角色,即guard(可設置到期時間)。guard設置的靈活性使得NFT防盜、NFT借貸、NFT租賃、SBT等設計成為可能。以太坊EIP在到達Final狀態前需要經歷構思、草案、審查、LastCall階段。任何處于草案或審查中的EIP如果在6個月或更長時間處于非活動狀態,會被移至停滯狀態。[2023/3/7 12:47:34]

圖片來自HuggingGPT研究論文

那么HuggingFace是做什么的?

簡單來說,HuggingFace是一個針對人工智能的開源平臺,用戶可以在上邊發布和共享預訓練模型、數據集和演示文件等。目前HuggingFace上已經共享了超過10萬個預訓練模型,1萬多個數據集,包括微軟、谷歌、Bloomberg、英特爾等各個行業超過1萬家機構都在使用HuggingFace的產品。

在HuggingGPT中,ChatGPT通過扮演了“操作大腦”的角色,能夠自動解析用戶提出的需求,接著在HuggingFace的“AI模型池”里進行自動模型選擇、執行和報告,為開發者們開發更復雜的人工智能程序提供了極大的便利。

雖然在模型上ChatGPT跟HuggingFace能夠牽手,但從本質上來說,HuggingFace跟OpenAI目前是在做兩個相反方向的事。其中最大的不同點在于,在開發者服務方面,OpenAI現在正在搭建人工智能開發的圍墻,僅允許滿足條件的機構和個人進入,但HuggingFace則希望每個人都可以訪問生成式AI模型,包括各類企業和所有普通開發者。

比特幣波動指數跌至56.52,創自2020年10月以來新低:12月27日消息,由金融指數公司 T3 Index 聯合比特幣期權交易平臺 LedgerX 推出的 BitVol(比特幣波動)指數已跌至 56.52,創自 2020 年 10 月以來新低。據悉,BitVol 指數衡量從可交易的比特幣期權價格中得出的 30 天預期隱含波動率。

注:隱含波動率,是指實際期權價格所隱含的波動率。它是利用 B-S 期權定價公式,將期權實際價格以及除波動率σ以外的其他參數代入公式而反推出的波動率。期權的實際價格是由眾多期權交易者競爭而形成,因此,隱含波動率代表了市場參與者對于市場未來的看法和預期,從而被視為最接近當時的真實波動率。[2022/12/27 22:10:30]

今年2月,OpenAI上線了一個名為Foundry的新開發者平臺,允戶可以在這個平臺上運行OpenAI最新的機器學習模型,但在產品的描述中,OpenAI明確表示Foundry是為運行較大工作負載的尖端客戶設計,而根據一份價格表顯示,即使是GPT-3.5的輕量級版本,三個月費用高達7.8萬美元,一年費用為26.4萬美元。

就在Foundry發布后,Huggingface便立刻宣布了其與AWS的最新合作伙伴關系,并發出了“讓人工智能走向開放”的呼吁。通過該合作,任何開發人員都將能夠使用AWS的托管服務并處理HuggingFace上可用的任何模型。

圖片來自HuggingfaceCTO推特

在現在巨頭林立的人工智能戰場上,HuggingFace就像是一支強有力的民間力量。當巨頭們都在努力保持自己生成式AI的霸主地位的時候,HuggingFace的目標則是尋找各種途徑來保持AI研究空間的開放。

Solana從抵押合約中釋放了8000萬枚SOL:金色財經報道,Solana 從抵押合約中釋放了8000萬枚 SOL,幸運的是,市場還沒有受到本次大規模代幣釋放的沖擊,巨鯨很可能會在各個交易平臺上重新分配 SOL。另據交易量情況顯示,零售交易者不再像 FTX 破產前那樣大規模交易 SOL,此舉可能是想觀望本次釋放 SOL 對市場產生的后續影響,目前尚不清楚這些 SOL 是否會被市場上的某個實體吸收或是在零售投資者之間被重新分配。據 Coingecko 數據顯示,當前 SOL 約為 14.22 美元,過去 7 天跌幅高達 41.3%。(u.today)[2022/11/16 13:10:51]

而這樣特點也讓HuggingFace目前頗有一些“中立”的色彩。無論微軟、谷歌、亞馬遜、Meta這些大公司打得再激烈,但它們幾乎全都是HuggingFace的支持者。

那么,HuggingFace究竟是如何發展起來的,它具體做著什么樣的業務?

02一次歪打正著的創業,造就AI界的頂流“笑臉”

在普通人的眼中,人工智能一向都屬于“冷感”很強的技術領域,無論是充斥著大量數字、模型的算法,還是由各種機械零件組裝成的機器人,都不免讓人感到有些距離感。但作為專為人工智能開發者服務的HuggingFace卻主打了一個反差萌,笑臉Emoji再加上一雙攤開的小手,logo甚至有點過份可愛。

之所以有這樣一個可愛的logo,是因為一開始HuggingFace做的產品其實是一款針對青少年群體的聊天機器人。

澳大利亞央行將啟動為期一年的CBDC研究項目:8月9日消息,澳大利亞央行周二在一份聲明中表示,澳大利亞儲備銀行、財政部和其他機構將監督旨在探索在澳大利亞引入央行數字貨幣(CBDC)的潛在經濟利益的研究工作。該項目預計將運行一年左右。這項工作將涉及開發一個“將在一段時間內在封閉環境中運行的有限規模試點”。該國央行補充說,將邀請感興趣的行業參與者開發特定用例,展示如何使用數字貨幣為家庭和企業提供創新和增值的支付和結算服務。

該國央行表示,未來幾個月將發表一篇論文,更詳細地解釋該項目的目標和方法。該國央行重申,這項研究是在澳大利亞已經擁有“相對現代且運作良好的支付和結算系統”的背景下進行的。(彭博社)[2022/8/9 12:11:51]

當時HuggingFace的想法是基于自然語言處理(NLP)的人工智能技術,來為年輕人們開發一個帶有娛樂性、類似于電子寵物一樣的個性化聊天機器人,讓大家可以在無聊的時候跟它聊八卦、問它問題、讓它生成一些有趣的圖片之類的事情。

這種新穎的人機社交模式得到了一些關注。2017年3月9號,HuggingFaceApp在iOSAppStore正式推出,并拿到了包括SVAngel、NBA球星杜蘭特在內的120萬美元的天使投資。此后一年多,HuggingFace都一直圍繞著自己的聊天機器人業務在做著自然語言理解的相關訓練并發布相關的產品,高峰時期每天處理的消息數量達到了1百萬條。在2018年5月,它又獲得了400萬美元的種子輪融資。

HuggingFace聊天軟件界面

The Sandbox域名Sand.eth過期被人搶注:金色財經報道,據社交媒體用戶 @address_eth 透露,7個月前有人以 4.9 ETH 價格購買的“sand.eth”已經過期,現在該域名已經被其他人以 6.4 ETH 價格購買并搶注。據悉,Web3 社區發現 7 個月前購買該域名的是 The Sandbox,當時的購買價格約為 2.1 萬美元。( nftevening)[2022/6/3 4:00:43]

雖然發展的還算不錯,但由于當時的人工智能的理解能力和聊天水平遠不及ChatGPT這樣智能有趣,再加上并非剛需的業務場景,HuggingFace的規模一直都難以擴大。

但為了開發這個聊天機器人,HuggingFace的團隊做了一個很重要的事,那就是構建了一個底層庫來容納各種機器學習模型和各種類型的數據集。包括幫助訓練聊天機器人檢測文本消息情緒、生成連貫的響應、理解不同對話主題等,并且在GitHub上始終以開源項目的形式持續發布該底層庫的一些內容。

就這樣不溫不火地發展了一段時間后,2018年底,HuggingFace迎來了一個重要的轉折。

當年11月,谷歌宣布推出基于雙向Transformer的大規模預訓練語言模型BERT,瞬間成為了自然語言理解領域最受開發者關注的模型。但一開始,Google只發布了BERT的TensorFlow版本,HuggingFace就想為啥沒有Pytorch版本呢?于是HuggingFace創始人之一的ThomasWolf就用幾天的時間完成并開源了PyTorch-BERT,但沒想到,就是這么一個“無心插柳”的項目讓HuggingFace一炮而紅。

借著BERT的東風,HuggingFace的Pytorch-pretrained-BERT發布3個多月后,快速達成了在Github上5000+星標的成就,到了7月份其Star數量已經超過了1萬,發展速度遠超其他同類開源項目,在Github的AI項目領域里一飛沖天。

在這樣的發展勢頭下,HuggingFace的產品戰略開始發生了調整。他們將更多精力放到了開源模型的建設上,將Pytorch-pretrained-BERT項目正式命名為Transformers,同時支持Pytorch和Tensorflow2.0。

借助Transformers庫,開發者可以快速使用BERT、GPT、XLNet、T5、DistilBERT等NLP大模型,并使用這些模型來完成文本分類、文本總結、文本生成、信息抽取、自動QA等任務,節省大量時間和計算資源,此后HuggingFace在人工智能開源領域的名氣也越來越大。

HuggingFace在Github上的Star曲線,圖片來自于LuxCapital

到了2019年12月,HuggingFace拿到了由LuxCapital領投的A輪融資,融資額也比上一輪上了一個量級達到了1500萬美元。值得注意的是,從這一輪開始,HuggingFace的標簽開始不再是聊天機器人,而是把AI開源業務放在了首位。這張可愛的笑臉emoji也開始被廣大人工智能開發者們所熟知。

03朝著人工智能界的Github前進

在2019年底AllinAI開源之后,HuggingFace開始著手構建一套完整的開源產品矩陣。用HuggingFace自己的話來講,他們所做的事情,就是要架起人工智能科研和應用的橋梁。

過去這些年,人工智能領域的科研和商業應用是相對獨立的兩個板塊,科研部門的任務就是對前沿技術進行研究,搞模型、發論文,應用部門的人則是要將最新技術用到產品中探索商業變現。如何將科研成果進行系統性的整合成為開源產品,讓開發者們能夠很快上手去應用轉化是長期困擾業界的一個問題。

HuggingFace之前歪打正著地摸到了這個痛點,接著開始認真向下挖掘。簡單來說,HuggingFace就是承擔了人工智能科研走向應用這個過程中幾乎所有復雜、繁瑣、細碎的工作,然后方便任何人工智能從業者都可以去便捷地使用這些研究模型和資源。

目前,除了頭號產品Transformers之外,HuggingFace還建立了Tokenizers、Datasets、Accelerate等庫,從模型到數據集、從托管平臺到性能優化,以開源社區為載體,HuggingFace已建立起了完整的人工智能開發生態,涵蓋了NLP、計算機視覺、語音、時間序列、生物學、強化學習等各個領域。

值得注意的是,HuggingFace并不是因為ChatGPT帶火的。2022年5月,當市場的注意力都還停留在Web3、元宇宙之上時,HuggingFace拿到了有紅杉、LuxCapital參與的1億美元融資,讓其估值一舉突破了20億美元。

HuggingFace的融資歷史,圖片來自于企查查

HuggingFace當前的目標是想成為人工智能領域的Github。其創始團隊認為,只有將那些少數人掌握的技術推廣給更多人使用,才能真正最大程度地推進整個行業的進步。而從商業的角度來說,HuggingFace認為賦能整個AI社區所可能產生的價值可能比一個專有的工具高出千倍,而只要將其中的1%變現就能夠足以撐起一個高市值的公司,類似的例子包括MongoDB、Elastic等等。

除了蓬勃發展的開源社區,從2020年開始,HuggingFace也開始做面向企業的定制自然語言模型,其客戶涵蓋彭博社、高通、英特爾等各類大中小型公司,并推出了包括AutoTrain、InferenceAPI&Infinity、PrivateHub、ExpertSupport等針對不同開發者類型的產品。據報道顯示,從2021年開始HuggingFace就一直處于正現金流的狀態。

HuggingFace的的產品服務,圖片來自于其官網

HuggingFace在當前的人工智能領域中能夠以開源社區的模式異軍突起,有一些偶然也有必然。首先,過去這些年,人工智能技術所取得的進步都是由全世界的科研和產業領域共同協作所推動的,它的技術基因里其實就帶著開放,因此建立起一個平臺來鏈接研究者和開發者順應了行業發展的歷史和趨勢。

此外,HuggingFace通過完成大量的基礎性工作,來幫助彌補在人工智能領域里長期存在的科學與生產之間的鴻溝,這是過去很多開源平臺沒有關注和做到的。

在此前的一個采訪中HuggingFace的CEOClémentDelangue表示,機器學習技術仍然還處于早期發展階段,開源社區的能力將是巨大的。他認為,在未來5到10年,我們一定還會看到更多開源機器學習公司的崛起。

巴比特園區開放合作啦!

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchinaDiscord社區:https://discord.gg/defidao電報頻道:https://t.me/Mute_8btc電報社區:https://t.me/news_8btc

Tags:INGGINHUGACEhotcoinglobalGinza NetworkSHUGGIWin Space Ticket

火必下載
對話加密詐騙者:如何保護自己的加密資產_TOKE

錢包是Web3用戶最基礎的設施,但無論大家多么謹慎,還是會被一些詐騙網站掌握錢包的私密數據,加密研究員RektFencer采訪了一個詐騙加密資產的人員,并梳理了該他的作案方式.

1900/1/1 0:00:00
DeFi牛市發動機:LSD如何引領史詩級狂暴大牛市_DEF

LSD將是DeFi生態系統的催化劑,通過合理利用LSD資本效率,可以撬動ETH的資產杠桿,這些釋放出來的流動性杠桿將大幅增加鏈上的資產價值和TVL,帶來第二個DeFiSummer.

1900/1/1 0:00:00
Multicoin Capital聯創親述:我們和FTX如何結下“孽緣”_OIN

FTX?的崩潰是2022年加密貨幣行業中最沉重的話題,對那些因此遭遇了經濟損失的個人及機構而言更是如此.

1900/1/1 0:00:00
Web3 媒體行業的機遇、挑戰和創新_DAO

介紹 盡管比特幣的主要功能是作為金融工具,但它與媒體產業的聯系從一開始就很明顯。比特幣區塊鏈的創世區塊不僅記錄了交易細節,還包括了《泰晤士報》的一條新聞.

1900/1/1 0:00:00
LSD賽道系列二:LybraFinanceLSD_穩定幣

注:本文來自@Yuuki_7788推特,MarsBit整理如下:LSD賽道系列二:@LybraFinanceLSD以ETH/LSDETH為抵押品的生息穩定幣項目#LSDFi 項目功能拆解: 鑄造.

1900/1/1 0:00:00
香港見聞:香港幾無「全球加密中心」可能,為什么_AXO

撰文|ThePrimediaDAO發起人Jerry熱鬧的喧囂之后,我們有必要停下來冷靜一下。我們如何把握香港政策機會的前提是「香港能夠把握加密市場局勢」,以成就香港全球加密中心地位.

1900/1/1 0:00:00
ads