2015年前后,全球掀起了AI芯片的創(chuàng)業(yè)熱潮。這波AI浪潮不僅吸引了眾多頂尖芯片人才創(chuàng)業(yè),也讓眾多科技巨頭紛紛進入芯片行業(yè)。然而,AI技術仍在快速發(fā)展,AI芯片的評估體系仍在完善,AI芯片領域還沒有公認的領導者。
此時一個非常關鍵的問題是,如何衡量一顆AI芯片的好壞?通過寒武紀科技回復上交所問詢函(以下簡稱問詢函)報告,我們可以從多個角度了解如何衡量。多層面綜合衡量AI芯片競爭力的答案。當然,這個答案還包含了很多關于寒武紀科技以及它如何與英偉達和華為海思競爭的關鍵信息。
先發(fā)優(yōu)勢
在問詢函的回復報告中,寒武紀表示,與華為海思相比,公司的競爭優(yōu)勢體現(xiàn)在:
該公司專注于人工智能芯片,進入該領域較早,具有先發(fā)優(yōu)勢。芯片架構針對人工智能應用和各類算法進行了優(yōu)化,積累了多項核心技術和關鍵專利。其技術創(chuàng)新能力得到了業(yè)界的廣泛認可。
在新技術的研究中,成為先行者的優(yōu)勢在于,研究是在業(yè)界對新技術不太關注的時候開始的。雖然挑戰(zhàn)更大,但可以更早排除陷阱,更早積累積累。有了更多的經(jīng)驗,當行業(yè)對新技術的關注度大大提高時,新技術就能更快地產(chǎn)業(yè)化。
然而,實現(xiàn)技術的方法有很多種。先發(fā)優(yōu)勢并不一定是最終的技術優(yōu)勢。技術的選擇也非常關鍵。
架構選擇
在與NVIDIA等老牌芯片巨頭的競爭中,寒武紀在回復問詢函時表示,其優(yōu)勢在于:
英偉達在開發(fā)人工智能芯片時,更多地基于公司原有的技術儲備和設計理念來適配人工智能應用和算法。不過,GPU和CPU本身并不是專門為人工智能相關運算而開發(fā)的芯片產(chǎn)品。公司芯片架構針對人工智能應用和各類算法進行優(yōu)化,有效提升產(chǎn)品的性價比和性價比。
目前,對于AI芯片的定義還沒有嚴格且公認的標準。更廣泛的觀點是,用于人工智能應用的芯片可以稱為AI芯片。因此,CPU、GPU、DSP、FPGA、ASIC都屬于AI芯片的范疇。
這里需要單獨介紹的是專門為AI設計的芯片。此類芯片通常被統(tǒng)稱為AI專用芯片。如果再細分的話,可以分為通用芯片和專用芯片。兩者的區(qū)別在于,通用型提取和抽象了各種智能應用和算法的計算和內存訪問特性,定義了相對靈活的適合智能算法的指令級和處理器架構,廣泛支持各種人工智能化算法和應用。當然,通用AI芯片是專門針對AI算法設計的,其通用性無法與CPU和GPU相比。
專用AI芯片(ASIC)是專門針對特定的、特定的、相對單一的AI應用而設計的芯片。
關于CPU、GPU、FPGA、DSP、ASIC的特點以及AI計算的優(yōu)缺點,可以參考詢價信中的表格。
市場定位
AI芯片的架構各有特點。不同架構的芯片可用于對性能要求較高的云訓練和推理市場,也可用于對功耗和成本較為敏感的邊緣和終端市場。因此,在比較AI芯片選擇產(chǎn)品時,首先要明確是否是同級別競品,市場定位是否相似。
寒武紀在選擇同類競爭對手時有兩個標準:
1、已針對終端、云、邊緣等智能計算市場發(fā)布一種或多種芯片產(chǎn)品的芯片公司;
2、相關芯片產(chǎn)品銷售規(guī)模較大,公開披露的經(jīng)營、財務信息較多。
基于以上原則,在智能計算市場,行業(yè)內各大公司的具體情況如下:
寒武紀科技總結認為,綜合考慮公司在介紹業(yè)務和技術板塊時,綜合考慮了主要產(chǎn)品或主營業(yè)務的相似性、行業(yè)知名度和地位、產(chǎn)品銷量、信息披露透明度等因素。英偉達、英特爾、AMD、Arm、華為海思等5家公司入選同行業(yè)可比公司。
不過雷鋒網(wǎng)認為,AMD雖然擁有高性能CPU和GPU產(chǎn)品,但并沒有專門優(yōu)化AI算法。 AMD在對外宣傳中并未提及其AI性能,因此在比較AI芯片產(chǎn)品時,AMD往往不被列入對比名單。
選擇了可比的同類型競品后,接下來需要比較的就是產(chǎn)品技術,包括直接影響芯片最終性能的硬件技術和軟件技術。
芯片關鍵技術指標
在對問詢信的回復中,寒武紀使用NVIDIA和華為海思的產(chǎn)品進行了詳細的比較,涵蓋了從底層處理器微架構、指令集、SoC芯片設計、芯片功能驗證到高級工藝物理設計的芯片物理和技術方面、芯片封裝設計和量產(chǎn)測試以及硬件系統(tǒng)設計選型標準進行了詳細比較。
軟件層面,從編程框架適配與優(yōu)化、編程語言、編譯器、高性能數(shù)學庫、虛擬化軟件、核心驅動、云邊端集成開發(fā)環(huán)境七個方面選取衡量標準進行對比。
7大關鍵硬件技術對比:
7種基礎系統(tǒng)軟件技術對比:
軟硬件關鍵技術的特點以及軟硬件的融合程度直接決定了AI芯片的單核和多核性能以及不同數(shù)據(jù)精度和算法支持的性能。也是影響業(yè)界對芯片PPA(Power、Performance、Area)評價的關鍵。根據(jù)AI芯片開發(fā)的應用范圍,AI芯片還從性能功耗比、制造工藝、軟件成熟度和未來發(fā)展趨勢等方面劃分為主流技術水平和未來技術發(fā)展趨勢。
注1:性能功耗比是根據(jù)理論峰值性能和芯片整體功耗估算得出的。
注2:INT2/4/8/16 分別代表2 位、4 位、8 位和16 位定點運算。 FP16/32分別代表16位和32位浮點運算。 BF 16 代表16 位腦浮點運算。點操作。
注3:表中提到的終端芯片均指具有專業(yè)化、本土化人工智能處理能力的SoC芯片。
注4:上表沒有比較專用智能芯片(ASIC),因為此類芯片功能相對單一,通常不需要采用Fin FET等先進制造工藝。通用智能芯片的行業(yè)特征與通用智能芯片存在顯著差異,并非公司主營業(yè)務的重點。
注5:訓練和推理的性能/功耗比是根據(jù)理論峰值性能計算的。
資金實力和人才實力
無論是傳統(tǒng)芯片還是AI芯片,持續(xù)的研發(fā)投入和產(chǎn)品迭代是保持芯片競爭力的關鍵。尤其是芯片行業(yè)是一個長周期、高投入的行業(yè)。因此,資金實力和人才也是AI芯片競爭力的關鍵。
與英偉達、華為海思相比,寒武紀在資金實力上存在明顯差距,這也是寒武紀在科創(chuàng)板上市的重要原因。根據(jù)英偉達2020財年財務報告,截至2020財年末,英偉達現(xiàn)金及現(xiàn)金等價物為108.96億美元,英偉達2020財年研發(fā)費用為28.29億美元。華為海思并未上市,根據(jù)公開報道,其2019年研發(fā)投入約為24.39億美元。
除了資金實力與巨頭之間的巨大差距之外,寒武紀還在人才方面上下功夫,因此寒武紀的人員支出不斷增加。寒武紀員工人數(shù)由2017年底的80人增加至2019年底的868人。2017年、2019年,公司分別向員工支付現(xiàn)金1,512.7萬元、9,300.64萬元、為員工支付現(xiàn)金29,818.82萬元,快速增長。
截至2019年底,寒武紀研發(fā)人員人數(shù)達680人,其中碩士以上學歷546人。
單位:人、萬元
市場地位及銷售網(wǎng)絡
繼產(chǎn)品、技術、人才之后,AI芯片的市場前景、AI芯片企業(yè)的市場地位和銷售網(wǎng)絡將在很大程度上影響其芯片產(chǎn)品能否推出并得到市場認可。市場方面,據(jù)IDC報告顯示,云推理和訓練產(chǎn)生的云智能芯片市場需求預計將從2017年的26億美元增長到2022年的136億美元,年均復合增長率為39.22 %。
數(shù)據(jù)來源:IDC
在一個有前景的市場中,現(xiàn)有的市場地位和銷售網(wǎng)絡的影響力非常關鍵,但這是初創(chuàng)公司需要從頭開始構建的東西,難度極大。
英偉達2020財年營業(yè)收入為109.18億美元,華為海思2018年營業(yè)收入為75.73億美元(據(jù)DIGITIMES報道),均遠超寒武紀的銷售規(guī)模。就人工智能芯片產(chǎn)品而言,2020財年英偉達數(shù)據(jù)中心業(yè)務銷售收入超過30億美元,在全球市場份額中占據(jù)絕對主導地位。
華為海思的云和邊緣智能芯片產(chǎn)品已經(jīng)推出很久了。這些業(yè)務2019年的整體銷售規(guī)模可能與寒武紀銷售規(guī)模相差不大,但在國產(chǎn)終端智能SoC芯片領域優(yōu)勢顯著。
從銷售網(wǎng)絡來看,英偉達和華為海思都擁有成熟、完善的銷售網(wǎng)絡??蛻魧Ξa(chǎn)品的認知度和市場知名度優(yōu)于公司。
因此,無論是在寒武紀的招股書(申請稿)還是上市問詢函的回復中,寒武紀失去了大客戶華為海思的訂單以及是否對曙光有較強的依賴,以及從2019年開始營收的大幅增長珠海橫琴新區(qū)管委會商務局和西安風動易翔科技服務有限公司獲得的信息成為關注的焦點。
寒武紀回應稱,其與華為海思的四份技術許可合同中,三份已履行完畢,一份正在履行中。此外,不存在對中科曙光訂單的依賴,從珠海橫琴新區(qū)管委會商務局和西安風動易翔科技服務有限公司獲得的訂單也合理。
產(chǎn)品定價策略
最后,還有非常關鍵的定價。寒武紀表示,其加速卡產(chǎn)品的定價差異主要是由于支撐公司向客戶交付的硬件產(chǎn)品的系統(tǒng)軟件的復雜性、公司向客戶提供技術服務的工作量、競爭者的預計定價范圍等因素造成的。同期產(chǎn)品、市場銷售折扣等因素綜合確定。
此外,寒武紀云智能芯片和加速卡產(chǎn)品定價及銷售政策均由公司自主確定。產(chǎn)品定價基于目錄價格和配套軟件的復雜程度、為客戶提供的技術服務工作量以及預計同期競爭情況。與產(chǎn)品的定價范圍有關,根據(jù)客戶性質、訂單數(shù)量等給予一定的銷售折扣。
Cambrian 還列出了與Nvidia Telsa P4 和T4 加速卡的差異。
單位:萬元/塊
注1:由于無法從公開渠道獲得NVIDIA相同或類似產(chǎn)品的官方銷售價格,因此NVIDIA相關產(chǎn)品的銷售價格范圍是基于市場信息的推測或估計。
寒武紀認為,其加速卡的銷售價格與同行業(yè)可比公司Nvidia相關產(chǎn)品的預估銷售價格接近,并無重大差異。
數(shù)據(jù)來源:各公司官方網(wǎng)站、年報等公開披露信息
雷鋒網(wǎng)總結
寒武紀科技科創(chuàng)板掛牌申請(申請稿)以及上市問詢函的回復讓寒武紀科技揭開了神秘面紗。寒武紀科技還必須回應上海證券交易所的尖銳質疑。這通常是寒武紀不太可能回答并且會盡量避免回答的問題。
這兩份文件總計500多頁,不僅包含了寒武紀本身的關鍵信息,還包含了大量的基礎信息和行業(yè)信息。例如,本文從問詢函的回復中梳理了AI芯片企業(yè)及產(chǎn)品的競爭要點,包括技術、產(chǎn)品、市場、渠道、定價等。通過寒武紀的回復,我們不僅可以了解寒武紀的技術實力,還可以觸類旁通地判斷一款AI芯片的性能。
關注雷鋒網(wǎng)公眾號并回復問詢函,即可獲取寒武紀科技回復上交所問詢函報告全文。
注:本文表格均來自回信報告