榮格工業(yè)資源APP
了解工業(yè)圈,從榮格工業(yè)資源APP開始。
當(dāng)手機(jī)AI攝影卡頓、智能汽車環(huán)境感知延遲時,很少有人知道,問題根源可能藏在計算機(jī)半個多世紀(jì)前的架構(gòu)設(shè)計里。
傳統(tǒng)馮·諾依曼架構(gòu)將計算與存儲分離,就像工廠與倉庫分處兩地,數(shù)據(jù)每次運(yùn)算都要在“倉庫”(內(nèi)存)和“車間”(計算單元)間來回搬運(yùn)——這一被稱為“內(nèi)存墻”的瓶頸,如今已成為制約AI性能提升的關(guān)鍵,尤其在需要海量數(shù)據(jù)處理的場景中,數(shù)據(jù)搬運(yùn)的能耗甚至占整體能耗的90%,效率短板愈發(fā)明顯。
而存算一體芯片的出現(xiàn),正以“車間建在倉庫里”的創(chuàng)新思路,為破解這一難題提供了新方向。
存算一體的核心邏輯,是讓計算“靠近”數(shù)據(jù)。它通過將計算單元直接嵌入存儲陣列,省去數(shù)據(jù)反復(fù)搬運(yùn)的步驟,就像在貨架旁直接完成分揀,大幅降低能耗與延遲。
實(shí)現(xiàn)這一突破的關(guān)鍵,在于憶阻器(ReRAM)等新型存儲器件的應(yīng)用:憶阻器既能像傳統(tǒng)內(nèi)存一樣存儲數(shù)據(jù),又能通過電阻變化完成邏輯運(yùn)算,天然具備“存儲-計算融合”的物理特性。比如在AI推理中,傳統(tǒng)架構(gòu)需要將權(quán)重數(shù)據(jù)從內(nèi)存讀取到CPU/GPU,而基于ReRAM的存算芯片可直接在存儲陣列內(nèi)完成矩陣乘法運(yùn)算,數(shù)據(jù)“零搬運(yùn)”即可輸出結(jié)果。
當(dāng)前存算一體技術(shù)主要分為三大路線,各有側(cè)重。SRAM-CIM(靜態(tài)隨機(jī)存儲器存算一體)速度快、可靠性高,像“快遞站”一樣適合小容量、低延遲的端側(cè)場景,比如手機(jī)AI降噪,但成本較高、容量有限;
DRAM-PIM(動態(tài)隨機(jī)存儲器近存計算)容量大、成本低,更像“大型倉庫”,適合數(shù)據(jù)中心的大規(guī)模數(shù)據(jù)處理,不過運(yùn)算速度略遜于SRAM路線;
而ReRAM為代表的新型非易失性存算路線,則兼顧了高容量、低功耗與較快速度,是當(dāng)前業(yè)界關(guān)注的重點(diǎn)方向,尤其適配AI端側(cè)與邊緣計算場景。
實(shí)際性能數(shù)據(jù)更能體現(xiàn)存算一體的突破。知存科技的WTM系列芯片,在端側(cè)AI推理場景中,能效比達(dá)到傳統(tǒng)GPU的30倍以上,單芯片可支持語音識別、圖像分類等多任務(wù);后摩智能M50芯片則將算力密度提升至每平方毫米1TOPS,延遲較傳統(tǒng)架構(gòu)降低80%,能滿足智能駕駛對實(shí)時性的嚴(yán)苛要求。
更具創(chuàng)新性的是北京大學(xué)團(tuán)隊研發(fā)的存算一體化排序芯片——它跳出傳統(tǒng)排序依賴比較器的思路,創(chuàng)新設(shè)計出無需比較器的排序架構(gòu),在處理北京地鐵路徑規(guī)劃等復(fù)雜任務(wù)時,數(shù)據(jù)處理效率較傳統(tǒng)芯片提升10倍,且能耗僅為后者的1/20,讓“復(fù)雜計算低功耗化”成為現(xiàn)實(shí)。
圖片來源:豆包
這種“高能效、低延遲”的特性,讓存算一體在多個場景中展現(xiàn)出巨大潛力。在端側(cè)AI領(lǐng)域,它能讓手機(jī)、智能家居設(shè)備在本地完成復(fù)雜AI運(yùn)算——比如手機(jī)拍照時實(shí)時優(yōu)化人像虛化效果,無需依賴云端,既保護(hù)隱私又提升響應(yīng)速度;在機(jī)器人領(lǐng)域,存算芯片可支持機(jī)器人實(shí)時識別環(huán)境障礙物,避免傳統(tǒng)架構(gòu)因數(shù)據(jù)搬運(yùn)延遲導(dǎo)致的反應(yīng)滯后。而在邊緣計算場景中,智能汽車的激光雷達(dá)、攝像頭需要每秒處理海量環(huán)境數(shù)據(jù),存算一體芯片能以低功耗實(shí)現(xiàn)毫秒級數(shù)據(jù)處理,為自動駕駛的安全決策提供保障。
不過,存算一體技術(shù)的普及仍需跨越認(rèn)知與技術(shù)的雙重門檻。一方面,需用更通俗的方式解讀技術(shù)原理,避免因“存算融合”“憶阻器”等術(shù)語讓普通讀者望而卻步;
另一方面,不同應(yīng)用場景對芯片的算力、容量、成本需求差異較大,如何實(shí)現(xiàn)技術(shù)路線與場景的精準(zhǔn)匹配,仍是業(yè)界需要探索的方向。
但不可否認(rèn)的是,隨著技術(shù)不斷成熟,存算一體芯片正從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用,它不僅打破了“內(nèi)存墻”的束縛,更將成為AI算力的新引擎,推動智能設(shè)備向“更輕、更快、更節(jié)能”的方向發(fā)展,為零碳社會與智能生活的落地提供核心技術(shù)支撐。