國產(chǎn)超算產(chǎn)業(yè)的相關(guān)新聞在2018年10月之后開始持續(xù)發(fā)酵。
首先是三個E級超算的原型機系統(tǒng)——神威E級原型機、天河三號E級原型機和曙光E級原型機系統(tǒng)在10月中全部完成交付。其后,中國高性能計算100強全面實現(xiàn)國產(chǎn)化。
而進入11月,中國部署超算數(shù)量達(dá)到美國兩倍又開始引發(fā)國內(nèi)外關(guān)注。近幾日,清華大學(xué)超算競賽實現(xiàn)第二次大滿貫、清華博士后成為獲得高性能專委會杰出新人獎首位中國人的新聞也開始不斷刷屏。
創(chuàng)新的技術(shù)架構(gòu)、領(lǐng)先的算力、高速增長的市場、持續(xù)積累的人才都正在成為中國超算產(chǎn)業(yè)的閃光點。
E級超算自主可控
2015年初,美國商務(wù)部決定對中國四家國家超級計算機中心禁售Intel至強處理器,采用了至強處理器的天河二號不得不走上自主研發(fā)路線。
2016年,高性能計算重點專項正式立項,明確要“依托自主可控技術(shù)”,研制滿足應(yīng)用需求的E級(百億億次級)高性能計算機系統(tǒng),使我國高性能計算機的性能在“十三五”末保持世界領(lǐng)先水平。
根據(jù)目前公開信息,三臺E級原型機均從芯片、網(wǎng)絡(luò)、操作系統(tǒng)層面實現(xiàn)自主可控。
之前因至強處理器禁售遭受打擊的天河超算,在天河三號E級原型機中采用了自主的飛騰FT2000+處理器、邁創(chuàng)MAtrix 2000+加速器、天河高速互聯(lián)通信以及基于Linux開發(fā)的麒麟操作系統(tǒng)。事實上,早在2006年,飛騰團隊就開發(fā)過兩代國產(chǎn)CPU,飛騰第一款兼容ARM指令集的FT 1500A在2014年問世。除了超算領(lǐng)域,飛騰系列CPU目前已經(jīng)擴展到服務(wù)器、PC等領(lǐng)域。
曙光E級原型機的核心芯片、加速器則是使用了海光公司的X86 CPU、DCU。2016年,AMD與曙光子公司海光成立合資公司,向后者授權(quán)X86處理器架構(gòu)。目前,經(jīng)過兩年的研發(fā)周期,其X86芯片產(chǎn)品已經(jīng)投入量產(chǎn)。
神威系列超算則是國內(nèi)最早實現(xiàn)全部采用國產(chǎn)CPU的超算系統(tǒng),其申威系列產(chǎn)品在2006年就推出了第一代處理器SW-1,現(xiàn)在已經(jīng)進入到第四代SW26010處理器。2011年,國家超級計算濟南中心就采用申威第三代產(chǎn)品SW1600搭建了國內(nèi)首個全部采用國產(chǎn)CPU的千萬億次超算。此次安裝在濟南超算中心的神威E級原型機,在處理器、高速網(wǎng)絡(luò)系統(tǒng)、存儲等核心器件全部采用了申威系列芯片構(gòu)建,全面實現(xiàn)了國產(chǎn)化,而且使用了基于Linux開發(fā)的睿思操作系統(tǒng),目前已經(jīng)擁有20多款自主開發(fā)的應(yīng)用軟件,覆蓋了大部分應(yīng)用場景。
不過,需要指出的是,雖然三大超算體系都實現(xiàn)了自主可控,但中國高性能處理器的工藝、性能,高速互聯(lián)、存儲器件、大規(guī)模并行系統(tǒng)軟件、并行算法等基礎(chǔ)性研究領(lǐng)域,與美日國家依然存在較大差距。
中國需要依托龐大的超算市場推動自主超算產(chǎn)業(yè)鏈逐步成熟,但橫在市場與自主產(chǎn)業(yè)之間的,是中國超算包括應(yīng)用軟件、人才、長效發(fā)展機制等諸多生態(tài)系統(tǒng)層面的短板。
應(yīng)用軟件生態(tài)建設(shè)
“中國現(xiàn)在擁有全世界規(guī)模最大渲染農(nóng)場,除了美國之外,印度、俄羅斯、非洲、東南亞等國家的影視、廣告渲染業(yè)務(wù)基本都是中國企業(yè)承接的?!彼{(lán)海創(chuàng)意云總經(jīng)理高鵬東告訴21世紀(jì)經(jīng)濟報道記者,“視頻渲染,是目前超算領(lǐng)域增速最快的市場?!?/p>
目前,幾乎所有的影視、廣告等視頻內(nèi)容都需要經(jīng)過渲染給虛擬場景實現(xiàn)更真實的觀賞體驗,真實度與使用的渲染資源基本成正比,渲染農(nóng)場是指為視頻渲染提供高性能計算資源的云平臺。高鵬東告訴記者,“渲染農(nóng)場,就相當(dāng)于影視工業(yè)的生產(chǎn)線?!毕啾扔诿绹呀?jīng)成熟的影視工業(yè),中國影視行業(yè)目前仍停留在影視作坊階段,高鵬東認(rèn)為,成熟的渲染農(nóng)場,是中國影視實現(xiàn)工業(yè)化轉(zhuǎn)型的切入點。
目前,國內(nèi)視頻渲染市場規(guī)模約幾十億元,總計約需要10萬個超算節(jié)點,且仍在持續(xù)高速增長。但需要指出的是,看似高價值含量的超算并沒有給國內(nèi)的渲染農(nóng)場帶來太多收益。
一個超算節(jié)點成本基本在3萬元左右,但目前國內(nèi)渲染農(nóng)場每個節(jié)點的使用費大多低于1.5元/小時,每個節(jié)點的年收入低于1萬元。考慮到電費、維護費支出,需要較長的投資回報周期。除此之外,國內(nèi)渲染農(nóng)場均需要從3ds Max、Maya高價進口渲染管理軟件。
事實上,國內(nèi)整個商業(yè)超算行業(yè)幾乎都處于微利狀態(tài)。“有一年阿里采購了130億元的高性能計算服務(wù)器,全部是浪潮中標(biāo)。但互聯(lián)網(wǎng)公司采購超算的時候,設(shè)備價格已經(jīng)打成了白菜價。”知情人士向記者介紹,“超算這塊的利潤,基本都流到了Intel、英偉達(dá)手里?!?/p>
而且,部署超算的企業(yè)還需要把大量的預(yù)算留給進口軟件。目前,國內(nèi)的石油石化、制造業(yè)的CAE/CAD等商業(yè)軟件,幾乎完全依賴進口,售價都在百萬、千萬元級,且每年需要交納高昂的許可費。
此外,上述知情人士介紹,“國外的超算已經(jīng)廣泛在金融、工業(yè)制造、社會安全等領(lǐng)域應(yīng)用,而中國在這些領(lǐng)域基本才剛剛起步?!蹦壳?,全球TOP 500超算系統(tǒng)中,有超過30%系統(tǒng)用于金融、工業(yè)制造領(lǐng)域。但在中國,云計算、深度學(xué)習(xí)等行業(yè)占據(jù)了絕大多數(shù)份額,用于金融、工業(yè)領(lǐng)域的超算只有個位數(shù)。
雖然中國在超算的硬件、系統(tǒng)、核心器件領(lǐng)域與發(fā)達(dá)國家的差距在迅速縮小,甚至實現(xiàn)反超,相比于高性能計算的應(yīng)用卻不盡如人意。除了商業(yè)軟件幾乎完全依賴進口之外,國內(nèi)科研院所使用的科研、仿真等應(yīng)用,也主要來自國外開源軟件,開源軟件占比超過75%,國產(chǎn)高性能軟件任重道遠(yuǎn)。
此前,中國對超算的投入主要集中在硬件系統(tǒng)上,通過機器性能提升帶動整體科研實力進步。但現(xiàn)在,中國正在轉(zhuǎn)向市場需求驅(qū)動的發(fā)展模式,這也就需要中國加大對應(yīng)用軟件的生態(tài)環(huán)境建設(shè),并且擴大在金融、工業(yè)領(lǐng)域的超算應(yīng)用,而這需要政府部門制定比此前更長期的規(guī)劃、更持久穩(wěn)定的投入。