湖南大學(xué)在“存算一體”分子動(dòng)力學(xué)高速芯片領(lǐng)域取得進(jìn)展
近日,湖南大學(xué)電氣與信息工程學(xué)院劉杰教授課題組自主研制出了“存算一體”非馮·諾依曼類腦芯片架構(gòu),用于加速分子動(dòng)力學(xué)高性能科學(xué)計(jì)算。相較主流Intel CPU、NVIDIA GPU芯片,在保持計(jì)算高精度前提下,實(shí)現(xiàn)了約2個(gè)數(shù)量級(jí)提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”為題,發(fā)表在《npj Computational Materials》期刊。第一作者為電氣院博士生莫平輝,通訊作者為劉杰教授。 自1946年發(fā)明至今,馮·諾依曼架構(gòu)一直占據(jù)統(tǒng)治地位,是CPU、GPU等主流芯片的基礎(chǔ),也是手機(jī)、臺(tái)式機(jī)、筆記本、計(jì)算服務(wù)器、超級(jí)計(jì)算中心的底層基礎(chǔ)架構(gòu)。目前,需要運(yùn)行分子動(dòng)力學(xué)等高性能科學(xué)計(jì)算時(shí),使用馮·諾依曼架構(gòu)的計(jì)算機(jī)是幾乎所有研究人員的唯一選擇,這已成為一種“固有范式”(paradigm)。遺憾的是,馮·諾依曼架構(gòu)中,計(jì)算單元(例如CPU/GPU)和存儲(chǔ)單元(例如內(nèi)存)是互相獨(dú)立的(即“存算分離”),導(dǎo)致計(jì)算總耗時(shí)和計(jì)算總功耗中的絕大部分(>90%)消耗于存儲(chǔ)單元、計(jì)算單元之間的頻繁數(shù)據(jù)搬運(yùn),俗稱“存儲(chǔ)墻(memory wall)”和“功耗墻(power wall)”瓶頸。這嚴(yán)重制約了計(jì)算性能的提升。 為解決該問(wèn)題,劉杰教授團(tuán)隊(duì)自主設(shè)計(jì)了“存算一體”的類腦芯片架構(gòu),并基于FPGA研制出了基于新型非馮·諾依曼芯片架構(gòu)的分子動(dòng)力學(xué)計(jì)算系統(tǒng)“NVNMD”(第一版),實(shí)現(xiàn)了從傳統(tǒng)馮·諾依曼芯片架構(gòu)向新型非馮·諾依曼芯片架構(gòu)的“范式轉(zhuǎn)移(paradigm shift)”。NVNMD的核心計(jì)算模塊中,存儲(chǔ)單元和計(jì)算單元緊密融為一體(即“存算一體”),避免了頻繁的數(shù)據(jù)搬運(yùn),極大緩解了計(jì)算中的“存儲(chǔ)墻”和“功耗墻”瓶頸。實(shí)測(cè)表明,相較主流CPU、GPU等傳統(tǒng)馮·諾依曼架構(gòu)芯片,可將計(jì)算速度提升大約2個(gè)數(shù)量級(jí);并可將計(jì)算功耗降低大約3個(gè)數(shù)量級(jí)。 長(zhǎng)期以來(lái),受制于馮·諾依曼芯片架構(gòu)內(nèi)稟的“存儲(chǔ)墻”等瓶頸,在“速度”和“精度”這兩個(gè)核心指標(biāo)上,分子動(dòng)力學(xué)存在“魚(yú)與熊掌不可兼得”的問(wèn)題——經(jīng)典分子動(dòng)力學(xué)(classical molecular dynamics, CMD)速度快,但精度低,難以滿足高精度計(jì)算要求;第一性原理分子動(dòng)力學(xué)(ab-initio molecular dynamics, AIMD)精度高,但速度慢,難以計(jì)算大系統(tǒng)。該成果提出的新型NVNMD兼具AIMD級(jí)別的高精度、CMD級(jí)別的高速度,在物理、化學(xué)、生物、制藥、地質(zhì)、材料、半導(dǎo)體、納米技術(shù)等領(lǐng)域有廣泛應(yīng)用前景。 |