【2021年01月08日,北京】1月8日,在與中科院計算所和中科院計算所南研院的通力合作基礎上,北京中科睿芯科技集團有限公司(簡(jiǎn)稱(chēng)中科睿芯)正式發(fā)布了一款圖神經(jīng)網(wǎng)絡(luò )加速芯片的IP核(即制備芯片的知識產(chǎn)權核),并宣布面向全球開(kāi)展商用授權。據該團隊介紹,目前市場(chǎng)上尚無(wú)任何類(lèi)似IP核可供授權。因此,該IP核是全球首款圖神經(jīng)網(wǎng)絡(luò )加速I(mǎi)P核,專(zhuān)注于高效加速圖神經(jīng)網(wǎng)絡(luò )的推斷階段。
適合圖神經(jīng)網(wǎng)絡(luò )的算力
此款圖神經(jīng)網(wǎng)絡(luò )加速I(mǎi)P核代號為“GCU Zero”,主要研究人員之一是中科院計算所特別研究助理嚴明玉博士,其畢業(yè)于中科院計算所,曾在美國加州大學(xué)圣巴巴拉分校 SEAL 實(shí)驗室訪(fǎng)學(xué),主要從事圖計算和圖神經(jīng)網(wǎng)絡(luò )加速結構研究。嚴明玉介紹說(shuō),“Zero”寓意著(zhù)團隊從0號“認知智能”芯片開(kāi)始,期望實(shí)現機器與人類(lèi)在智能上的“零差距”;“G”和”U”取圖處理單元(Graph Unit)之義,代表滿(mǎn)足圖神經(jīng)網(wǎng)絡(luò )特殊算力需求的計算單元,而“C”則表示計算單元賦予機器認知智能(Cognitive Intelligence)。

GCU Zero
Homosapiens系列
基于混合結構設計思想,GCU Zero分別為圖神經(jīng)網(wǎng)絡(luò )的兩個(gè)主要執行階段——圖遍歷階段和神經(jīng)網(wǎng)絡(luò )變換階段設計相應的加速引擎,并流水兩個(gè)引擎的執行。這一設計思路可匹配圖神經(jīng)網(wǎng)絡(luò )對算力的特殊要求,大幅提升圖神經(jīng)網(wǎng)絡(luò )的執行效率。
例如,在為圖神經(jīng)網(wǎng)絡(luò )中的一個(gè)重要分支——圖卷積神經(jīng)網(wǎng)絡(luò )的執行進(jìn)行加速的過(guò)程中,GCU Zero可提供低延遲獨立執行模式(低延遲模式)和高并發(fā)融合執行模式(高并發(fā)模式)兩個(gè)工作模式,具有“四高三低四少”的優(yōu)點(diǎn)。
“四高”是指高可配性(面向不同應用場(chǎng)景配置不同執行模式)、高可拓展性(可多個(gè)IP核互聯(lián)執行更大規模的圖神經(jīng)網(wǎng)絡(luò ))、高并發(fā)(可數十個(gè)圖節點(diǎn)處理任務(wù)同時(shí)并發(fā)執行)、高能效(比傳統處理器能效更高);“三低”是指在低延遲模式下,用所有資源共同執行單個(gè)圖節點(diǎn)的處理任務(wù),能實(shí)現低延遲、低開(kāi)銷(xiāo)、低能耗;“四少”是指在高并發(fā)模式下,多個(gè)圖節點(diǎn)的處理任務(wù)同時(shí)執行,并且兩個(gè)主要的階段可流水,能夠減少中間數據的計算和訪(fǎng)存,從而實(shí)現更少計算、更少訪(fǎng)存、更少功耗、更少運行時(shí)間。
開(kāi)啟圖神經(jīng)網(wǎng)絡(luò )加速時(shí)代
圖神經(jīng)網(wǎng)絡(luò )被認為是推動(dòng)“認知智能”發(fā)展強有力的推理方法,有望解決深度學(xué)習無(wú)法處理的關(guān)系推理、可解釋性等一系列問(wèn)題,讓機器“能理解、會(huì )思考”。
不過(guò),盡管目前在國際學(xué)術(shù)界已有團隊開(kāi)展了基于圖神經(jīng)網(wǎng)絡(luò )加速的相關(guān)研究,工業(yè)界也有了基于圖神經(jīng)網(wǎng)絡(luò )的落地應用,但目前圖神經(jīng)網(wǎng)絡(luò )加速芯片在國際上還是一片“無(wú)人區”。
2020年初,嚴明玉博士在國際計算機體系結構頂會(huì ) HPCA 上發(fā)表了國際第一個(gè)圖神經(jīng)網(wǎng)絡(luò )的加速結構設計“HyGCN”。嚴明玉稱(chēng),GCN即圖卷積神經(jīng)網(wǎng)絡(luò ) (Graph Convolutional Network, GCN為其縮寫(xiě)),作為圖神經(jīng)網(wǎng)絡(luò )最重要的一個(gè)分支,GCN將深度學(xué)習算法和圖計算算法相融合,對搜索、推薦、風(fēng)險控制在內的等諸多重要領(lǐng)域有著(zhù)更優(yōu)的認知與問(wèn)題處理等能力;HyGCN寓意向圖神經(jīng)網(wǎng)絡(luò )的加速說(shuō)“Hi”,寓意圖神經(jīng)網(wǎng)絡(luò )加速的時(shí)代即將開(kāi)啟。
完整芯片進(jìn)入投片倒計時(shí)
“GCU Zero IP核是我們Homosapiens系列的首個(gè)IP!眹烂饔癫┦客嘎,面向高性能和超高性能的圖神經(jīng)網(wǎng)絡(luò )訓練和推斷,Homosapiens系列在今明兩年陸續還會(huì )有新產(chǎn)品發(fā)布。
Homosapiens取自生物學(xué)上的“智人”,得益于高度發(fā)展的大腦帶來(lái)的推理與語(yǔ)言能力,智人最終在殘酷的生存競爭中成為萬(wàn)物之靈。將圖神經(jīng)網(wǎng)絡(luò )系列芯片命名為Homosapiens,表明了研究團隊將“認知智能”賦予機器的信念和決心。
當前,人工智能正從由數據驅動(dòng)的“感知智能”階段邁入由數據與知識雙驅動(dòng)的“認知智能”階段。在“認知智能”階段,機器被期待獲得基于知識的邏輯推理能力。而圖神經(jīng)網(wǎng)絡(luò )技術(shù)的發(fā)展和應用就是關(guān)鍵之匙,其效果也在工業(yè)界已有的落地應用中得到了驗證。接下來(lái),人們期待可直接用于圖神經(jīng)網(wǎng)絡(luò )計算的加速器件。
嚴明玉介紹,GCU Zero IP核在基于臺積電先進(jìn)的12 nm制程工藝下,運行頻率可達1.2 GHz。在Reddit 數據集和GraphSage圖神經(jīng)網(wǎng)絡(luò )模型下,GCU Zero IP基于64 GB/s的片外存儲帶寬,在10毫秒內完成的圖節點(diǎn)處理任務(wù)數是英偉達最先進(jìn)人工智能推理GPU TESLA T4的兩倍以上。他進(jìn)一步透露,基于GCU Zero,該研究團隊設計了完整的芯片并計劃投片,將在今年第二季度搭載在中科睿芯“金剛”高通量計算機上。