湖南大學(xué)在“存算一體”分子動力學(xué)高速芯片領(lǐng)域取得進展
近日,湖南大學(xué)電氣與信息工程學(xué)院劉杰教授課題組自主研制出了“存算一體”非馮·諾依曼類腦芯片架構(gòu),用于加速分子動力學(xué)高性能科學(xué)計算。相較主流Intel CPU、NVIDIA GPU芯片,在保持計算高精度前提下,實現(xiàn)了約2個數(shù)量級提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”為題,發(fā)表在《npj Computational Materials》期刊。第一作者為電氣院博士生莫平輝,通訊作者為劉杰教授。 自1946年發(fā)明至今,馮·諾依曼架構(gòu)一直占據(jù)統(tǒng)治地位,是CPU、GPU等主流芯片的基礎(chǔ),也是手機、臺式機、筆記本、計算服務(wù)器、超級計算中心的底層基礎(chǔ)架構(gòu)。目前,需要運行分子動力學(xué)等高性能科學(xué)計算時,使用馮·諾依曼架構(gòu)的計算機是幾乎所有研究人員的唯一選擇,這已成為一種“固有范式”(paradigm)。遺憾的是,馮·諾依曼架構(gòu)中,計算單元(例如CPU/GPU)和存儲單元(例如內(nèi)存)是互相獨立的(即“存算分離”),導(dǎo)致計算總耗時和計算總功耗中的絕大部分(>90%)消耗于存儲單元、計算單元之間的頻繁數(shù)據(jù)搬運,俗稱“存儲墻(memory wall)”和“功耗墻(power wall)”瓶頸。這嚴(yán)重制約了計算性能的提升。 為解決該問題,劉杰教授團隊自主設(shè)計了“存算一體”的類腦芯片架構(gòu),并基于FPGA研制出了基于新型非馮·諾依曼芯片架構(gòu)的分子動力學(xué)計算系統(tǒng)“NVNMD”(第一版),實現(xiàn)了從傳統(tǒng)馮·諾依曼芯片架構(gòu)向新型非馮·諾依曼芯片架構(gòu)的“范式轉(zhuǎn)移(paradigm shift)”。NVNMD的核心計算模塊中,存儲單元和計算單元緊密融為一體(即“存算一體”),避免了頻繁的數(shù)據(jù)搬運,極大緩解了計算中的“存儲墻”和“功耗墻”瓶頸。實測表明,相較主流CPU、GPU等傳統(tǒng)馮·諾依曼架構(gòu)芯片,可將計算速度提升大約2個數(shù)量級;并可將計算功耗降低大約3個數(shù)量級。 長期以來,受制于馮·諾依曼芯片架構(gòu)內(nèi)稟的“存儲墻”等瓶頸,在“速度”和“精度”這兩個核心指標(biāo)上,分子動力學(xué)存在“魚與熊掌不可兼得”的問題——經(jīng)典分子動力學(xué)(classical molecular dynamics, CMD)速度快,但精度低,難以滿足高精度計算要求;第一性原理分子動力學(xué)(ab-initio molecular dynamics, AIMD)精度高,但速度慢,難以計算大系統(tǒng)。該成果提出的新型NVNMD兼具AIMD級別的高精度、CMD級別的高速度,在物理、化學(xué)、生物、制藥、地質(zhì)、材料、半導(dǎo)體、納米技術(shù)等領(lǐng)域有廣泛應(yīng)用前景。 |