起步
1993年,常年身披黑夾克的黃仁勛不顧分析師的勸阻,毅然決定和伙伴創立英偉達。那一年,黃仁勛剛好30歲,他面對的市場環境并不樂觀,在九十年代,圖形處理器、或者說圖形加速卡領域群雄混戰,上百家企業在場上短兵相接。
更重要的是,彼時圖形加速卡并未受到重視,聚光燈都投射在CPU上。在1993年前后,意氣風發的CPU戰場上,算力主角是老牌傳奇英特爾和AMD,雙方正在酣戰。
1991年英特爾成為當時全球最大的半導體企業,1993年英特爾又推出了80586芯片,為了與AMD芯片進行區別,又將其命名為奔騰;1991年的AMD推出了Am386微處理器系列,打破了英特爾的市場壟斷,在1993年,AMD又推出Am486微處理器。
而在英特爾和AMD為代表的x86架構的CPU之外,蘋果和Arm也已經聯手進入芯片界。1993年,蘋果推出NewtonMessagePad,就首次搭載了Arm架構處理器。與此同時,蘋果還和IBM、摩托羅拉結成聯盟,來對抗“Wintel”,三者聯合研發出芯片PowerPC,在1994年用于蘋果的臺式機上。
正如黃仁勛在近期的一場采訪中所言:“30年前,個人電腦革命才剛剛開始,微處理器CPU開始起飛,當時大家認為CPU是解決計算的最好方式。”但是,黃仁勛則一直認為需要有加速計算。
后來,大家都逐漸知道圖像處理、視頻處理、游戲處理、計算處理等等都需要GPU,不過當時英偉達仍在苦苦尋求技術的應用市場。
幸運的是,英偉達很快找到了計算機圖像和電子游戲結合的場景。在研發過程中,一家日本游戲公司世嘉向英偉達投來橄欖枝,愿意提供給700萬美元的資金。
視頻游戲的風口似乎就在眼前,當時PC和游戲是最主要的消費電子市場,英偉達趕上了班次。但是好景不長,英偉達在3D圖像技術上選擇了錯誤的路線,不能兼容微軟制定的新主流標準,初代產品NV1最終銷量慘淡,眼看著為世嘉研發的芯片也要面臨著被淘汰的局面。
Web3設計實驗室Kondux加入英偉達初創加速計劃:金色財經報道,Web3設計實驗室Kondux宣布已加入英偉達初創加速計劃NVIDIA Inception,雙方將合作創建可互操作性的3D資產,并且構建與NVIDIA Omniverse相關軟硬件所需的應用程序接口(API)工具,所有這些技術都將作為安全的數字資產分層,提供最高級別的所有權保護。(globenewswire)[2022/9/17 7:03:07]
如果不能完成芯片開發,公司將陷入絕境。黃仁勛在日前的演講中也提到了創業初期的這次危機,最終他和世嘉說明實情,而世嘉竟然同意支付研發費用,拯救了在倒閉邊緣徘徊的英偉達。
經歷過此番波折后,黃仁勛在1997年提出了業界知名的“黃式定律”,其預測顯卡性能每六個月就提升一倍,遠超摩爾定律的速度。當年這更像是黃仁勛對外的一次宣言,是為自己定下的標準和目標,而現在這已經變成了現實。這也是黃仁勛在演講中多次提及的“跑得快”,他說當道路很長時,跑得快是唯一的策略。
時運
很快,英偉達迎來更大的轉機。
1997年,英偉達推出的新款圖形加速芯片RIVA129成功逆襲,開售后四個月內出貨量就超過100萬臺。1998年,英偉達又和臺積電牽手合作,在圖形加速領域更上一層樓,在競爭無比激烈的PC和游戲市場上,英偉達快跑進入了決賽圈。
1999年,英偉達順利上市,并率先提出了GPU概念,推出全球首款GPU——Geforce256。這是一款關鍵性產品,至此,GPU已經不僅僅是輔助CPU的角色,其出色的并行計算能力將提供更強勁的算力。
2000年,微軟Xbox搭載了來自英偉達的GPU,英偉達還在2002年底和索尼達成了合作,為游戲主機PlayStation3提供顯示芯片。可以說,接下來英偉達在游戲界大殺四方,當然這其中也歷經了兼并收購、大魚吃小魚,起起落落,最終才殺出重圍。
英偉達:元宇宙將很快成為現實:11月2日消息,GPU制造商英偉達高管Richard Kerris接受彭博采訪時表示元宇宙作為相互連通的虛擬世界,將很快成為現實。他說:你可能認為你不會進入元宇宙,但我保證在五年內,我們所有人都會以這樣或那樣的方式進入其中。頂級公司也將建立在相互連接的虛擬世界之上。目前,英偉達正積極布局該領域,包括利用其芯片幫助渲染元宇宙世界。英偉達還打造了一個用于創建虛擬空間的軟件平臺Omniverse。該公司也在推動最早由動畫公司皮克斯開發的通用場景描述標準(USD),以統一虛擬世界的物理規則,實現設備和軟件的相互兼容。(彭博社)[2021/11/2 6:26:04]
在游戲、PC市場上登頂的過程中,英偉達也一直在尋找新的場景,也曾在蓬勃的手機市場鎩羽而歸,也面臨著PC市場沒有那么性感的現實。然而,在2010年后,人工智能、云計算的浪潮在慢慢靠近,從自動駕駛到神經網絡深度學習,GPU展現出了強大而專一的加速計算能力。
深度學習崛起的過程中,GPU提供的卷積運算、并行運算等特性,恰好可以滿足AI計算的需求;在全球云化的趨勢之下,數據中心的計算背后都需要GPU提供算力支持。
英偉達又一次在新領域中崛起,就像是它碰巧有絕世的武功,武林江湖環境變換,它卻始終能以獨門秘籍開啟新路。誰能料想,后來的事實證明,GPU不僅能用于AI、還能用于挖礦。要知道,AI的概念在AlphaGo熱潮后陷入沉寂,恰逢區塊鏈站上風口,GPU憑借礦機需求一路走高。
眾所周知,此后區塊鏈熱度下滑,瘋狂的礦機需求回落,英偉達的股價也應聲而落,然而到了2022年末,人工智能重返科技舞臺中心,生成式AI成為英偉達市值的新動能,英偉達的產品也是生成式AI的主引擎。
潮起潮落間,黃仁勛也從外界眼中的“游戲小子”成為“AI教主”。一路以來,英偉達抓住了計算設備需求的關鍵時機,從圖形渲染、到人工智能、乃至區塊鏈領域的計算都表現得十分突出,應用場景也覆蓋了PC、數據中心、汽車等市場。到2023財年,英偉達數據中心的營收占比首次超過了游戲,達55.6%。
觀點:使用英偉達GeForce RTX 3080顯卡挖礦可在十月內實現收支平衡:金色財經報道,領先的PC出版物“Tom’s Hardware”最近估計,如果使用英偉達新發布的GeForce RTX 3080顯卡(價格為699美元)挖掘加密貨幣,可以在大約十個月內實現收支平衡。而使用之前發布的GeForce RTX 2080則需要三年。GeForce RTX 3080能夠實現115MH\\s的算力,是GeForce RTX 2080的三倍。[2020/9/9]
談及數據中心業務,黃仁勛說:“盡管我們需要更多算力,但是數據中心消費并沒有那么快速的增長,因為摩爾定律到現在已經發生變化,已經結束了,如果我們想要更多的算力,所有數據中心都需要加速,區別于ASIC芯片用于特定程序,英偉達是通用加速計算平臺。”
超越
英偉達最初的標簽就是GPU,但僅僅是圖像領域的應用,并不足以支撐英偉達后來高漲的市值。在練就絕技的過程中,英偉達早已超越了最初GPU的概念,進入到更廣泛的產業之中。
其中,業內人士提及最多的兩大內功是GPGPU和CUDA,它們在為人熟知的芯片之上,為產業制定了一整套軟硬件標準,強大的軟件生態也讓英偉達當前立于不敗之地。
首先,回到GPU和CPU的區別上,GPU到底有何特色?為何能從配角成為主角?
GPU和CPU是現代計算機中不可或缺的兩個組成部分,但它們在運算方式、功能等方面卻存在著明顯的差異。簡單來說,CPU主要負責執行指令集中的算術邏輯操作,而GPU則更擅長于并行計算。這是因為GPU擁有大量的核心,每個核心都可以獨立地進行計算任務,從而實現高效的計算。
做個粗糙的比喻,在電腦上繪制一張圖時,CPU的運算方式更加講究邏輯,需要按照順序去繪制像素,而GPU可以同時去繪制多個像素。而繪制背后主要是GPU在進行矩陣運算,就像一個矩陣運算界的頂尖高手。
動態 | 英偉達首席財務官宣布正式終止加密貨幣業務:據CCN報道,英偉達首席財務官Colette Kress宣布正式終止其加密貨幣業務,Kress表示“相信我們已經到達了一個正常的時期,而我們期待在前進的過程中基本上沒有加密貨幣,我們的營收預期是,加密貨幣的專用產品本季度帶來約1億美元收入,但實際營收為1800萬美元,而我們現在預計未來的貢獻可以忽略不計。”Nvidia的首席執行官Jensen Huang 對Kress的負面情緒表示贊同,并補充說,隨著加密貨幣的價格下降趨勢,其以加密貨幣為主的采礦芯片的盈利能力大幅下降。[2018/8/22]
一開始,GPU正如其名“GraphicProcessingUnit”,專供圖像顯示。一個重要跨越是在2007年,英偉達提出了GPGPU架構,即用于通用計算的GPU,將GPU從傳統的圖像處理器,廣泛普及應用到計算訓練當中。
GPU在圖像處理、視頻編碼等領域表現優秀,而在一些特定的應用場景中,如科學計算、工程仿真等,需要更高的計算能力和更大的內存帶寬,這時就需要使用更為強大的GPGPU進行更大規模的并行運算。
這是英偉達擴大市場版圖的一個重要節點。更為重要的是,英偉達還在2006年推出了自己的CUDA平臺,構建了強大的AI算力生態。
CUDA是英偉達的并行計算平臺和編程模型,CUDA可以通過利用GPU的處理能力大幅提升計算性能,讓GPU擁有解決復雜計算問題的能力。而通過CUDA平臺,開發者們可以在編程時更方便地調度底層的GPU算力。
可以說,CUDA平臺是英偉達建立的并行運算的一整套軟硬件生態標準,所有英偉達的GPU都兼容CUDA,并且大多數AI芯片均與之匹配兼容,尤其是訓練端芯片。因此,盡管GPU或者AI的創業公司層出不窮,大多都兼容英偉達的CUDA平臺,要再創建自有生態的壁壘和成本都很高。
有產業鏈人士向21世紀經濟報道記者表示,CUDA擁有400多萬開發者,軟件生態的護城河非常高,目前要遷移到國內較為成熟的AI芯片平臺上,可能需要2、3年的時間。
英偉達首席財務官:加密貨幣市場的需求非常強勁:英偉達首席財務官:加密貨幣市場的需求非常強勁,超過預期。就英偉達產品總體需求而言,加密貨幣市場所作貢獻很難量化,但相信這個季度的百分比貢獻要高于之前一個季度。[2018/2/9]
當前在全球的GPU市場上,主要玩家是英偉達和AMD,英特爾近年也在發力GPU產品線,而英偉達目前仍占據主要市場份額。對標CUDA來看,AMD也在打造開放的ROCm平臺,ROCm平臺于2016年推出,AMD也在不斷優化ROCm套件。
亞馬遜創始人杰夫·貝索斯曾在一次訪談中說道:“如果產品做得優秀,并且足夠幸運,一般會有兩年的領先優勢,在AWS業務上亞馬遜領先了七年,七年沒有勢均力敵的競爭對手。”
再看英偉達和AMD,CUDA比ROCm整整超前了10年,CUDA十年磨一劍,挑戰者們仍在追趕之中。
“通吃”
回顧GPU和AI的發展史,黃仁勛說道:“2012年,計算機視覺模型AlexNet就使用GeForceGTX580進行訓練,使用1400萬張圖像訓練了AlexNet,每秒可處理262PetaFLOPS。經過訓練的模型以壓倒性優勢贏得了ImagNet挑戰賽,并引發了AI的大爆炸。”
這時,GPU和AI的相擁就已經深埋種子,十年之后,Transformer模型面世,OpenAI基于Transformer開發了GPT-3。
此前的演講中,黃仁勛談到,GPT-3的訓練需要323ZettaFLOPS的算力,相當于AlexNet的100萬倍,從而創造了ChatGPT這個震驚全世界的AI。在他看來,嶄新的計算平臺已經誕生,AI的“iPhone時刻”已經來臨,加速計算和AI技術已經走進現實。
今年的GTC大會上,黃仁勛公布了諸多與生成式AI相關的進展,隨后又在臺北國際電腦展COMPUTEX上繼續放出王炸,他宣布GH200GraceHopper超級芯片正式投產,并公布由256個GH200驅動的新型DGXGH200AI超級計算機。
而此前英偉達就已經做足了功課。2022年,英偉達推出了多款重磅產品,分別是基于全新Hopper架構的H100GPU、CPU和GPU的合體GraceHopper、兩個CPU組合的GraceCPUSuperchip,CPU的產品在2023年上市。
其中,設計GPU新架構Hopper時,英偉達增添了一個Transformer引擎,專門為Transformer算法做了硬件優化,加快AI計算的效率。
一位國內芯片從業者向21世紀經濟報道記者直言:“H100出來,其實就是一個新時代了,Grace-Hopper再一個組合,加上高配的互聯,完全不給活路,英偉達贏家通吃,AMD、Intel繼續苦追。”
同時他也表示:“目前國內一些企業還是在盯著CNN做優化,英偉達已經有Transformer引擎,然后AIGC火熱,恰好能做支持。這個眼光,只能佩服他們的科學家們對這個領域深刻的認識。”
一位學術界人士也向21世紀經濟報道記者分析道:“從H100上,包括專用的Transformer引擎以及對FP8格式的支持,可以看到計算硬件在向應用定制的方向前進。GraceCPU說明了整合異構計算系統的重要性。單純的加速器優化和設計已經不能夠滿足現在對于計算系統的算力和能效比的要求,需要各個部分的協同優化和設計。”
他還表示,GraceCPU通過提高通信帶寬和在CPU和GPU之間建立一致的內存模型來解決運算中的瓶頸,這也和學界與業界一直在關注的方向是一致的。
總而言之,在GPU和CPU的各種排列組合中,英偉達又將算力提升到了新高度。正如黃仁勛所言:“我們正在重新發明計算機,加速計算和人工智能標志著計算正在被重新定義。”
黃仁勛在采訪中還提到,數據中心需要用的CPU越來越少,不再是傳統上購買數百萬個CPU,而是轉而購買數百萬個GPU。換言之,在他看來,AI算力江湖已經是GPU的主場。
野心
英偉達的布局還不止于此。
一個現實問題是,高性能的算力也意味著高昂的價格。大模型訓練成本動輒成千上百萬美元,并不是所有公司都能承受。
而英偉達同時提出了云服務的解決方案NVIDIAAIfoundations,黃仁勛表示要做“AI界的臺積電”。臺積電大大降低了芯片設計公司生產門檻,英偉達也要做代工廠的角色,通過和大模型廠商、云廠商合作提供高性價比的云服務。
前述芯片從業者對記者解析道:“賣云服務,就是聯合大模型方提供Pretraining的模型,小企業直接Finetuning就有自己的了。”
在幫助下游企業降低大模型訓練成本的同時,英偉達還在逐步參與到上游的產業鏈升級中。今年,英偉達牽手臺積電、ASML、新思,發布了計算光刻庫cuLitho。
前述學術界人士向記者介紹道,計算光刻是在芯片設計和制造領域的關鍵步驟,也是最大的計算負載之一。計算光刻庫的技術突破就在于,可以通過部署有大量GPU的DGXAI計算系統對計算光刻進行加速,使其達到原有的基于CPU的計算速度的幾十倍,同時降低計算過程的總能耗。這將有助于晶圓廠縮短原型周期時間、提高產量、減少碳排放,為2nm及更先進的工藝奠定基礎,并為曲線掩模、高數值孔徑極紫外、亞原子級光刻膠模型等新技術節點所需的新型解決方案和創新技術提供更多可能性。
新思方面向21世紀經濟報道記者表示,此次研發合作中,cuLitho集成了新思科技Proteus全芯片掩膜合成解決方案和新思科技ProteusILT反向光刻圖形技術,并進行了優化,以便在最新一代NVIDIAHopper架構GPU上運行。如今,在cuLitho平臺上運行Proteus解決方案只需要500個NVIDIADGXH100GPU,替代此前用于計算光刻的40000臺CPU服務。計算光刻過程的所有部分都可以并行運行,將電力能耗需求和運行時間從幾周減少到幾天。
在多位產業界人士看來,雖然短期內不會影響到下游的應用方面,但是這些上游的研發和升級將長期影響產業的發展,累積形成代際差。
“英偉達在GPU架構的迭代上,一直都有屬于自己的發展路徑,這幾年的發展,也讓英偉達躍居AI算力芯片領域的領導者,也因為領先,所以英偉達會思考如何做更多元的布局與行業內的深度合作,這樣更能了解行業的需求,比方和臺積電等合作便是很好的例子。”芯片行業專家姚嘉洋向21世紀經濟報道記者表示。
在2008年的電視采訪中,黃仁勛說:“希望有一天大家都認識英偉達,就像大家都認識微軟、英特爾一樣。”如今,英偉達幾乎是家喻戶曉,擁有絕世的武功,比大夢想更加重要。
2023年,英偉達30周年之際,黃仁勛在采訪中說:“直到現在才真正起飛。”生成式AI助力英偉達成為算力的新王。
當然,英特爾和AMD都已經吹響反攻的號角。7月,英特爾面向中國市場推出了AI芯片HabanaGaudi2;6月,AMD推出AI芯片InstinctMI300X,兩者都直接對標英偉達100系列。圍繞著算力、納米的權力游戲還將繼續。
SFC
本期編輯江佩佩實習生章寶怡
21君薦讀
英偉達放大招!市值飆漲至近萬億美元
英偉達“炸場”后,這些A股公司也宣布出手!
英偉達最失意收購落幕,孫正義官宣Arm尋求重新上市
Tags:CPUROC人工智能CPU幣CPU價格ROC幣ROC價格人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目
近幾年,隨著經濟的快速發展,我們看到了空前的蓬勃發展和蓬勃發展,但同時也出現了一批嚴重危害人民群眾的問題,被稱作“新四害”.
1900/1/1 0:00:00作者|丁臻宇,編輯|wjx來源:巨豐投顧、好股票應用 熱點 1、科技部等七部門:推動生成式人工智能基礎設施和公共訓練數據資源平臺建設七部門聯合公布《生成式人工智能服務管理暫行辦法》.
1900/1/1 0:00:00廣電網絡(600831)07月14日在投資者關系平臺上答復了投資者關心的問題。投資者:公司一季度傳統有線電視業務繼續下滑,未來將如何培育新的業務增長點?廣電網絡董秘:尊敬的投資者,您好.
1900/1/1 0:00:00近日,“充值700元仍看不完一部網文”的詞條登上了微博熱搜。一位消費者投訴稱,孩子讀一部網絡小說,半個月內已經續費700元。這部小說已經更新到3000多章還沒完結,不知還要再花費多少.
1900/1/1 0:00:00嘉賓參觀了解寧夏農特產品。 主辦方供圖中新網銀川7月15日電(記者李佩珊)時下,正是枸杞、菜心、黃花菜、硒砂瓜等產品豐收的季節.
1900/1/1 0:00:00智通財經獲悉,7月13日,國務院新聞辦公室舉行新聞發布會,海關總署新聞發言人、統計分析司司長呂大良介紹2023年上半年進出口情況,并答記者問.
1900/1/1 0:00:00