神經(jīng)網(wǎng)絡(luò)引擎是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。該網(wǎng)絡(luò)依賴于系統(tǒng)的復(fù)雜性,通過調(diào)整大量?jī)?nèi)部節(jié)點(diǎn)之間的互連關(guān)系來實(shí)現(xiàn)信息處理。目的。
神經(jīng)網(wǎng)絡(luò)引擎通過對(duì)人腦基本單元神經(jīng)元進(jìn)行建模和連接,探索模擬人腦神經(jīng)系統(tǒng)功能的模型,開發(fā)具有學(xué)習(xí)、聯(lián)想、記憶、模式等智能信息處理功能的人工系統(tǒng)認(rèn)出。神經(jīng)網(wǎng)絡(luò)引擎的一個(gè)重要特點(diǎn)是它可以從環(huán)境中學(xué)習(xí),并將學(xué)習(xí)結(jié)果存儲(chǔ)在網(wǎng)絡(luò)的突觸連接中。它的學(xué)習(xí)是一個(gè)過程。在環(huán)境的刺激下,它陸續(xù)向網(wǎng)絡(luò)輸入一些信息。樣本模式,并根據(jù)一定的學(xué)習(xí)算法規(guī)則調(diào)整網(wǎng)絡(luò)各層的權(quán)重矩陣。當(dāng)網(wǎng)絡(luò)各層的權(quán)值收斂到一定值時(shí),學(xué)習(xí)過程結(jié)束,然后生成的神經(jīng)網(wǎng)絡(luò)就可以用來對(duì)真實(shí)數(shù)據(jù)進(jìn)行分類。
蘋果A11神經(jīng)網(wǎng)絡(luò)引擎
在最新的發(fā)布會(huì)上,蘋果發(fā)布了十周年紀(jì)念款iPhone X,極大地吸引了人們的關(guān)注。 iPhone 的眾多功能之一
FaceID利用人工智能技術(shù)完成三維人臉建模中的特征提取,并利用這些特征配合算法實(shí)現(xiàn)人臉識(shí)別。在現(xiàn)場(chǎng)演示中,F(xiàn)aceID面部識(shí)別的用戶體驗(yàn)非常流暢,而流暢體驗(yàn)背后的功臣就是A11 Bionic SoC上集成的人工智能加速器,蘋果官方稱之為神經(jīng)引擎。
什么是人工智能加速器?
我們先來了解一下什么是AI加速器。要了解人工智能加速器的概念,不妨先回顧一下GPU。 20世紀(jì)90年代,隨著多媒體應(yīng)用尤其是3D游戲的興起,人們發(fā)現(xiàn)傳統(tǒng)的CPU架構(gòu)不足以滿足此類需要高速圖形渲染的應(yīng)用。原因是CPU在芯片上放置了大量的控制邏輯和緩存單元。真正留給計(jì)算單元的芯片面積已經(jīng)不多了。
這時(shí),人們?cè)O(shè)計(jì)了3D加速卡。以3dfx、Nvidia、ATI為代表的芯片公司在當(dāng)時(shí)可以說是叱咤風(fēng)云。隨著時(shí)間和市場(chǎng)的變化,3D加速卡的概念慢慢過渡到處理通用圖形計(jì)算甚至通用并行計(jì)算的GPU,而目前市場(chǎng)上唯一的獨(dú)立顯卡制造商只有Nvidia和ATI。
人工智能加速器和GPU很相似,只不過當(dāng)年的駕駛應(yīng)用是多媒體和3D游戲,而現(xiàn)在的駕駛應(yīng)用是人工智能,包括語音助手、人臉識(shí)別、物體識(shí)別等。這波人工智能的基本算法智能是神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)會(huì)大量使用矩陣乘法和卷積運(yùn)算。人們?cè)僖淮伟l(fā)現(xiàn)CPU的計(jì)算能力無法支撐現(xiàn)在的人工智能運(yùn)算。 GPU雖然也能實(shí)現(xiàn)高速人工智能運(yùn)算,但功耗太大(專為移動(dòng)應(yīng)用設(shè)計(jì)的Nvidia TX2功耗高達(dá)10W)。消費(fèi)),所以為了讓更多的移動(dòng)設(shè)備能夠使用人工智能,人工智能加速器應(yīng)運(yùn)而生。
人工智能加速器通常是專用硬件單元,可以以單獨(dú)芯片或IP的形式存在于SoC上。由于它是專門為人工智能加速而設(shè)計(jì)的,因此在處理此類操作時(shí)可以實(shí)現(xiàn)非常高的性能并且消耗非常少的功耗。這樣的人工智能加速器被集成到華為之前發(fā)布的麒麟970中。可見,人工智能加速器正越來越多地進(jìn)入移動(dòng)芯片市場(chǎng)。華為麒麟970還集成了人工智能加速模塊
蘋果在人工智能硬件加速方面的布局
蘋果自然不甘落后于人工智能大趨勢(shì),在人工智能加速領(lǐng)域早已有所布局。
縱觀目前的市場(chǎng),英偉達(dá)之所以能夠在人工智能硬件領(lǐng)域占據(jù)領(lǐng)先地位,與其開放且易于使用的CUDA接口不無關(guān)系,方便程序員使用GPU來加速人工智能。在移動(dòng)端,如何充分利用SoC上的GPU來加速人工智能一直是令開發(fā)者頭疼的問題。蘋果此前宣布了兩種不同級(jí)別的接口:Metal 和Core ML,開發(fā)者可以使用它們來加速iOS 平臺(tái)上的人工智能應(yīng)用。發(fā)布軟件接口的另一個(gè)目的是為專用硬件的開發(fā)積累經(jīng)驗(yàn),實(shí)現(xiàn)軟硬件的協(xié)同優(yōu)化。今年5月,有消息稱,蘋果專用的人工智能加速硬件——神經(jīng)網(wǎng)絡(luò)引擎已經(jīng)基本完成。今天,蘋果實(shí)際上公開宣布了神經(jīng)網(wǎng)絡(luò)引擎。
A11 神經(jīng)網(wǎng)絡(luò)引擎分析
蘋果在發(fā)布會(huì)上發(fā)布的神經(jīng)網(wǎng)絡(luò)引擎的信息包括:
采用雙核設(shè)計(jì)。由于缺乏其他支持信息,我們從該信息可以推斷出,蘋果可能會(huì)允許神經(jīng)網(wǎng)絡(luò)引擎的幾種使用模式,包括完全關(guān)閉、僅打開一個(gè)核心、以及打開兩個(gè)核心以滿足不同情況的需要。性能/功率要求。
性能可達(dá)0.6TOPS。這樣的性能已經(jīng)可以處理當(dāng)前主流的神經(jīng)網(wǎng)絡(luò)模型計(jì)算。可見目前1TOPS左右的處理性能將成為人工智能加速器的標(biāo)準(zhǔn)配置。
實(shí)時(shí)處理。 GPU處理人工智能運(yùn)算時(shí)另一個(gè)被詬病的問題是高延遲。由于GPU往往基于塊數(shù)據(jù)(批)處理,因此不適合需要實(shí)時(shí)響應(yīng)的移動(dòng)終端。蘋果的神經(jīng)網(wǎng)絡(luò)引擎強(qiáng)調(diào)它是實(shí)時(shí)處理的,顯然是為了與GPU區(qū)分開來,以滿足實(shí)時(shí)移動(dòng)應(yīng)用的需求。
另外,我們還可以猜測(cè),神經(jīng)計(jì)算引擎是SoC上的一個(gè)IP模塊,而不是一個(gè)單獨(dú)的芯片。
我們可以將其與包含類似加速模塊的其他芯片進(jìn)行比較。華為的麒麟970包含類似于蘋果神經(jīng)網(wǎng)絡(luò)引擎的人工智能加速模塊。其峰值性能可達(dá)1.93TOPS(是蘋果神經(jīng)網(wǎng)絡(luò)引擎的三倍多)。然而,實(shí)際性能并不等于峰值性能,而是取決于軟件。硬件協(xié)同優(yōu)化效果。高通驍龍系列包含神經(jīng)處理引擎軟件SDK,可以幫助開發(fā)者更好地利用高通芯片上的GPU/CPU/DSP來完成人工智能加速??梢哉f高通的方案比華為和蘋果更加保守(之前推出了Zeroth人工智能硬件加速模塊但后來被放棄),但隨著人工智能的大潮,估計(jì)高通也會(huì)加入相關(guān)的人工智能到未來的芯片。智能加速器。
雖然發(fā)布會(huì)上公布了很多信息,但仍有更多的未知數(shù),需要時(shí)間來澄清。
最有趣的問題恐怕是除了FaceID之外,神經(jīng)網(wǎng)絡(luò)引擎還能用在什么地方呢?由于FaceID對(duì)實(shí)時(shí)性要求不高(延遲估計(jì)在1秒以內(nèi)就可以滿足客戶需求),僅僅為了這個(gè)目的配備0.6TOPS的加速器就太奢侈了,所以神經(jīng)計(jì)算引擎應(yīng)該用于其他情況。那么,還有哪些應(yīng)用場(chǎng)景呢?它會(huì)專門由蘋果操作系統(tǒng)內(nèi)的本機(jī)應(yīng)用程序使用,還是會(huì)向第三方應(yīng)用程序開放?目前,這一切都還不得而知,但蘋果打造神經(jīng)網(wǎng)絡(luò)引擎的野心肯定不會(huì)止步于FaceID。
A11 Bionic 有多少個(gè)版本?如果只有一個(gè)版本包含神經(jīng)網(wǎng)絡(luò)引擎,那么在不包含F(xiàn)aceID 的iPhone 8 上,神經(jīng)網(wǎng)絡(luò)引擎一定在做其他事情。如果A11有兩個(gè)版本(帶神經(jīng)網(wǎng)絡(luò)引擎的iPhone X版本和不帶神經(jīng)網(wǎng)絡(luò)引擎的iPhone 8版本),那么只能說蘋果有太多錢可以同時(shí)設(shè)計(jì)兩個(gè)版本的芯片!