湖南大學(xué)在“存算一體”分子動(dòng)力學(xué)高速芯片領(lǐng)域取得進(jìn)展

發(fā)布：cyqdesign 2022-05-18 11:42 閱讀：1150

近日，湖南大學(xué)電氣與信息工程學(xué)院劉杰教授課題組自主研制出了“存算一體”非馮·諾依曼類腦芯片架構(gòu)，用于加速分子動(dòng)力學(xué)高性能科學(xué)計(jì)算。相較主流Intel CPU、NVIDIA GPU芯片，在保持計(jì)算高精度前提下，實(shí)現(xiàn)了約2個(gè)數(shù)量級(jí)提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”為題，發(fā)表在《npj Computational Materials》期刊。第一作者為電氣院博士生莫平輝，通訊作者為劉杰教授。

自1946年發(fā)明至今，馮·諾依曼架構(gòu)一直占據(jù)統(tǒng)治地位，是CPU、GPU等主流芯片的基礎(chǔ)，也是手機(jī)、臺(tái)式機(jī)、筆記本、計(jì)算服務(wù)器、超級(jí)計(jì)算中心的底層基礎(chǔ)架構(gòu)。目前，需要運(yùn)行分子動(dòng)力學(xué)等高性能科學(xué)計(jì)算時(shí)，使用馮·諾依曼架構(gòu)的計(jì)算機(jī)是幾乎所有研究人員的唯一選擇，這已成為一種“固有范式”（paradigm）。遺憾的是，馮·諾依曼架構(gòu)中，計(jì)算單元（例如CPU/GPU）和存儲(chǔ)單元（例如內(nèi)存）是互相獨(dú)立的（即“存算分離”），導(dǎo)致計(jì)算總耗時(shí)和計(jì)算總功耗中的絕大部分（>90%）消耗于存儲(chǔ)單元、計(jì)算單元之間的頻繁數(shù)據(jù)搬運(yùn)，俗稱“存儲(chǔ)墻（memory wall）”和“功耗墻（power wall）”瓶頸。這嚴(yán)重制約了計(jì)算性能的提升。

為解決該問(wèn)題，劉杰教授團(tuán)隊(duì)自主設(shè)計(jì)了“存算一體”的類腦芯片架構(gòu)，并基于FPGA研制出了基于新型非馮·諾依曼芯片架構(gòu)的分子動(dòng)力學(xué)計(jì)算系統(tǒng)“NVNMD”（第一版），實(shí)現(xiàn)了從傳統(tǒng)馮·諾依曼芯片架構(gòu)向新型非馮·諾依曼芯片架構(gòu)的“范式轉(zhuǎn)移（paradigm shift）”。NVNMD的核心計(jì)算模塊中，存儲(chǔ)單元和計(jì)算單元緊密融為一體（即“存算一體”），避免了頻繁的數(shù)據(jù)搬運(yùn)，極大緩解了計(jì)算中的“存儲(chǔ)墻”和“功耗墻”瓶頸。實(shí)測(cè)表明，相較主流CPU、GPU等傳統(tǒng)馮·諾依曼架構(gòu)芯片，可將計(jì)算速度提升大約2個(gè)數(shù)量級(jí)；并可將計(jì)算功耗降低大約3個(gè)數(shù)量級(jí)。

長(zhǎng)期以來(lái)，受制于馮·諾依曼芯片架構(gòu)內(nèi)稟的“存儲(chǔ)墻”等瓶頸，在“速度”和“精度”這兩個(gè)核心指標(biāo)上，分子動(dòng)力學(xué)存在“魚(yú)與熊掌不可兼得”的問(wèn)題——經(jīng)典分子動(dòng)力學(xué)（classical molecular dynamics, CMD）速度快，但精度低，難以滿足高精度計(jì)算要求；第一性原理分子動(dòng)力學(xué)（ab-initio molecular dynamics, AIMD）精度高，但速度慢，難以計(jì)算大系統(tǒng)。該成果提出的新型NVNMD兼具AIMD級(jí)別的高精度、CMD級(jí)別的高速度，在物理、化學(xué)、生物、制藥、地質(zhì)、材料、半導(dǎo)體、納米技術(shù)等領(lǐng)域有廣泛應(yīng)用前景。

帖子

湖南大學(xué)在“存算一體”分子動(dòng)力學(xué)高速芯片領(lǐng)域取得進(jìn)展