在此之前,AI大模型開發商都在低成本地使用互聯網公開的內容數據訓練自家的大模型,如今,各種科技巨頭們加持的大模型紛紛開始商業化,互聯網內容平臺們突然反應過來,不能讓這些巨頭們嚕羊毛「白嫖」數據了。
「現在是訴訟時間。」4月20日,推特被微軟踢出其數字營銷平臺后,新掌門人馬斯克立馬發推回擊稱,微軟用推特的數據做「非法訓練」。這一懟,直接揭開了AI大模型開發商與數據源的利益之爭。
此前,在線社區論壇Reddit與程序員社區StackOverflow先后宣布,將向使用平臺API訓練數據的公司收費;環球音樂集團直接表示,將阻止AI從其版權歌曲中抓取歌手的聲音。
在此之前,AI大模型開發商都在低成本地使用互聯網公開的內容數據訓練自家的大模型,如今,各種科技巨頭們加持的大模型紛紛開始商業化,互聯網內容平臺們突然反應過來,不能讓這些巨頭們嚕羊毛「白嫖」數據了。????????
LongHashX宣布推出Filecoin虛擬機Genesis加速器:金色財經報道,LongHash Ventures旗下加速器LongHashX宣布與ProtocolLabs和Filecoin合作推出Filecoin虛擬機(FVM)Genesis加速器,這是上第一個專注于Web3和人工智能交叉的加速器之一。通過利用數據可編程性,FVM為在Filecoin網絡上構建各種應用程序帶來了可能性,涵蓋人工智能(AI)、DeFi、DAO等垂直領域。
LongHashX稱,最近人工智能的突破,如DALL-E2和GPT-4等強大的深度學習模型的發布,需要大量數據的輸入。然而,這引起了人們對數據隱私、集中化和創新限制的嚴重擔憂。除了AI之外,通過積極推動Filecoin經濟上鏈,FVM還支持和增強其他垂直領域,例如DeFi、去中心化社交、DataDAO等。[2023/8/4 16:17:32]
當推特將API收費門檻擺在微軟面前時,AI大模型訓練要給付的成本就不止芯片算力和研發算法的人才了,現在還要加上「為數據付費」。
0x0b89開頭地址花費60萬USDT加倉499875枚ARB:5月28日消息,據鏈上分析師余燼監測,某短線投資者(0x0b89開頭地址)再次加倉ARB,該地址用60萬USDT買入499875枚ARB。此前其花費119萬USDT買入1002673枚ARB,均價為1.187美元。
據悉,此前該地址已進行過九次大額短線操作,每次均以虧損告終,其中多次的投資標的均為ARB。[2023/5/29 9:47:41]
馬斯克直懟微軟「非法訓練」
「他們非法使用推特的數據進行訓練。現在是訴訟時間。」4月20日,「宇宙頂流」馬斯克直接在推特上明示要告微軟。他以推特CEO的身份親自下場,以此直懟微軟把推特踢出MicrosoftDigitalMarketingCenter的做法。
這個「中心」是干嘛的呢?它其實是微軟利用大數據和AI技術開發的一個廣告和營銷的管理平臺,聚合了包括推特、臉書、Ins等海外所有主流的社交平臺,方便企業主們在一個平臺上完成廣告和營銷活動的推送,還能管理各種賬號、分析推流數據。你刷微博、微信朋友圈時突然冒出的廣告,就有類似微軟這種工具的貢獻。
SBF愿意在國會就FTX的崩潰作證:金色財經報道,FTX前首席執行官SBF愿意在國會就FTX的崩潰作證,他覺得有義務與立法者討論FTX的崩潰,但他可能不會在他們計劃的時間表上這樣做。SBF表示,他需要更多地了解導致FTX崩潰的原因并申請破產保護,然后才能出席有關該主題的國會聽證會。
據此前消息,美國眾議院金融服務委員會邀請SBF于12月13日在有關FTX事件的聽證會上作證。[2022/12/5 21:22:28]
微軟這個數字營銷中心能實現這些功能,很重要的一環是接入了這些社交平臺的API,這是企業主推送廣告、分析數據的基礎。
結果,馬斯克收購推特后,直接把推特API的企業套餐初始訂閱費用定為4.2萬美元/月,折合人民幣28.9萬元,以這個價格能獲得2,500萬條推文,一條差不多1塊多錢了。如果每月支付12.5萬美元,能獲得1億條推文,后續還會按照使用量加錢。
推特API的新收費標準直接勸退了不少小公司,連財大氣粗的微軟數字營銷中心都直言「要價太高」,于是,直接把推特踢出了管理庫。這意味著,借助微軟這個平臺執行廣告和營銷計劃的廣告主們,沒法在推特上搞投放了。
報告:多數NFT持有者不會擁有其所購資產IP的所有權:8月25日消息,Galaxy Digital Research在其發布的一份名為《NFT授權調查:事實與虛構》的報告稱,絕大多數NFT持有者不會擁有他們所購買資產IP的所有權。報告指出,許多發行商,包括最大的Yuga Labs,似乎在他們所出售內容的知識產權方面誤導了NFT購買者。在Galaxy Digital調查的市值前25的NFT項目中,發現只有一個項目,World of Women (WoW)試圖將知識產權授予其NFT購買者。知識共享授權雖然被視為大多數項目使用的限制性授權的解決方案,但從法律角度來看,NFT授權已經過時,因為它將IP完全轉移到公共領域,使NFT持有者無法在法庭上捍衛其所有權。
該報告稱,如果不改進鏈上表現,不將知識產權從NFT發行者轉移到NFT持有者,Web3的廣闊愿景將無法實現。
Galaxy Digital研究主管Alex Thorn向CoinDesk表示,目前市場上大多NFT授權可以隨時在完全沒有理由的情況下更改、撤銷或修改,甚至是在沒有通知NFT持有者的情況下。[2022/8/25 12:47:28]
原本這是企業主、分發平臺、渠道商之間的廣告業內事,馬斯克跳出來了,直指微軟用推特的數據搞非法訓練。
隱私計算網絡Oasis公布路線圖:首個EVM兼容隱私ParaTime Sapphire即將上線:8月22日消息,隱私計算網絡Oasis公布2022年Q3、Q4季度發展路線圖,推動行業首個EVM兼容隱私ParaTime Sapphire主網上線將是下一階段發展重點。此外,Oasis 網絡還將進行主網升級以加強現有的隱私ParaTime Cipher,以實現基于WebAssembly的隱私智能合約功能,并將發布對SGXv2和基于DCAP的證明的支持,以實現TEE的性能改進和對最新一代CPU的支持。未來兩個季度的其他工作重點包括ParaTime之間的通信和穩定Oasis SDK。[2022/8/22 12:41:09]
誰都知道,爆火的ChatGPT背后有微軟的資本加持。而馬斯克和GPT大模型的開發方OpenAI不僅淵源頗深,還積怨許久。
2015年,馬斯克與SamAltman等6人共同創立OpenAI人工智能實驗室,致力于建設開源的、研發人工智能的非營利機構,來抗衡當時在人工智能領域大有一家獨大之勢的谷歌。為此,馬斯克捐了1億美元,承諾未來繼續捐9億。結果不到2年,馬斯克就退出了OpenAI董事會,這里既有燒錢開發大模型短期沒燒出成果的問題,也有馬斯克和Altman對OpenAI的管理權之爭。
馬斯克退出1年后,即2019年3月,OpenAI成立子公司OpenLP,將其定位為「有限營利機構」,重組后的OpenAI很快拿到了來自微軟的10億美元投資。誰也沒想到又一個3年過去后,OpenAI站上了全球科技舞臺的最前沿。
ChatGPT爆火后,當初為OpenAI掏過錢、站過臺的馬斯克頻頻表達怨念。
2月17日,馬斯克發推指稱OpenAI從開源、非營利變成了微軟控制的「閉源、追求利益最大化」的公司;后來還多次在公開場合強調人工智能對人類社會的潛在危害,甚至認為「風險比飛機、汽車、更大」;3月29日,那封科技大佬聯署簽名「暫停AI巨型實驗」的公開信上,他也第一時間簽名表態。
馬斯克為人工智能的健康發展操碎了心,看上去,這位將巨型載人飛船送入太空的現實版「鋼鐵俠」似乎不打算跟風人工智能了。
然而,4月17日,馬斯克在媒體采訪中披露,將推出一款生成式AI大模型TruthGPT。很快就有媒體爆料,馬斯克買了1萬個英偉達A100芯片。這是AI大模型訓練的重要硬件。
撕微軟非法訓練數據,懟OpenAI變成逐利公司,無論馬斯克如何批評這兩家公司,這下也難掩他對人工智能的興趣了。左手攔下推特數據低成本外流,右手高價囤芯片,在AI大模型賽道上,馬斯克開始跑馬圈地。
多平臺API擬收費,AI訓練成本被推高
不過,最近要向AI大模型開發商們收取API費用的平臺不止推特。
4月18日,海外最大的社區論壇Reddit宣布,將向使用其API做數據訓練的公司收取數據使用費。
Reddit暫未公布具體收費標準,業內推測,Reddit很可能會按數據數量分等級收費,這也是業內的常規做法。此外,程序員問答網站StackOverflow也計劃向AI巨頭收取訓練數據費用。
要知道,研發AI大模型,算法、算力和算據這「三算」缺一不可。以OpenAI訓練GPT-3.5為例,這個模型容納了多達45TB的文本語料,這些語料既包括書籍期刊等出版物的內容,也包括社交平臺、問答網站、論壇小組等在線數據中的用戶生成內容。而從OpenAI的公開信息看,該公司并沒有提及獲取線上數據是否支付過費用。用「爬蟲」爬、和第三方合作、以及購買都有可能是OpenAI獲得數據的方式。
此前,各個生成式大模型似乎都在沒啥限制地使用互聯網上的公開內容,影響大模型性能的要素就集中在算法和算力差異上。從推特、Reddit等平臺明確為API收費后,大模型開發商自在地使用數據的好日子到頭了。
2019年之前,OpenAI是非營利機構,如今,ChatGPT都有Plus收費版了,更別提該公司還開通了API的付費渠道。當前,OpenAI的估值接近300億美元,研究機構PitchBook預測,該公司今年的收入將達到2億美元,明年會翻五番。
社交平臺們明確API收費,劍指大模型開發商,雙方也正式變成了「商業對商業」的關系,收費與付費實屬正常。這也意味著,AI大模型成為科技巨頭們狂卷的賽道后,像Reddit這樣的海量內容平臺將增加商業來源,數據將成為重要要素。
以成立于2008年的Reddit為例,它是全球互聯網中最有活力的社區之一,目前日活達到3.3億,大量的用戶創建了超過14萬個活躍社區,帖子總量超3.6億。尤其在很多小眾領域,Reddit論壇貢獻了很多有價值的討論內容。換句話說,Reddit提供了英語互聯網中最重要的語料庫。
OpenAI的CEOSamAltman也表示,公司在積極與內容公司進行合作,并愿意「為高質量數據支付高價」。
盡管Altman宣稱「目前沒在訓練GPT-5」,但OpenAI應該不會停下數據訓練的腳步,因為GPT-4仍有很多需要打磨的地方,比如通識知識的準確性、對人類語言的理解進化等等,這些仍然需要語料數據的持續投入。
放眼全球,研究AI大模型的公司還不止OpenAI一家,海外有谷歌,國內有百度、華為、阿里。可以預見,切入大模型賽道的公司,都將面對數據所有者的收費關卡,訓練成本將水漲船高。
另一個值得深思的問題是,Twitter也好,Reddit也罷,他們手握數據向大模型開發公司收取價格不菲的費用,那么,為這些平臺貢獻了海量內容和數據的用戶又得到了什么?
歡迎私信進交流群,今天的分享到此結束了,非常感謝各位朋友們百忙之中抽出時間來看這篇文章,希望文章對你有幫助,可以關注我和給我留言評論,一起交流Billions項目組
Tags:馬斯克APIGPT馬斯克五大發明改變世界馬斯克什么星座馬斯克資產多少億美元API價格API幣GPT價格GPT幣
美國非農就業數據今晚公布,預期數字是多少?而即將到來的消費者物價指數、FOMC升息會議又在何時? 5月大事件回顧 6月到來,簡單回顧過去一個月的時間,升息幅度、CPI皆符合市場預期.
1900/1/1 0:00:00加密貨幣市場一直是投資者關注的焦點,近期柴犬和以太坊展現出了一些積極的跡象,引起了投資者的注意和興趣。 根據最新的Santiment報告,柴犬正在吸引更多的關注.
1900/1/1 0:00:00比特幣的減半將于2024年4月8日進行。歷史上,減半引發了三個相似而令人興奮的牛市周期。距離下一個減半還有9個月的時間,讓我們再來討論一些有趣的地方.
1900/1/1 0:00:00比特幣價格在周末交易中受到的影響較小,市場出現了新的看跌趨勢。盡管多次嘗試,但價格未能恢復至31,000美元以上的水平,預計將出現新的看跌浪潮.
1900/1/1 0:00:00依據APTOS的代幣經濟計算籌碼分布,依據新公鏈歷史行情計算APT自然增長率,輔助私募價格和投資機構背景,構建APT價值模型,并給出定價.
1900/1/1 0:00:00在貝萊德、富達等一種傳統資產管理巨頭,申請比特幣現貨ETF后,市場在上周迎來一波小高潮。但在周一早上,市場開始出現回調趨勢,比特幣更一度跌破3萬美元.
1900/1/1 0:00:00