通信世界網(wǎng)消息(CWW)近兩年,大模型發(fā)展突飛猛進(jìn),大算力需求被充分激發(fā),數(shù)據(jù)中心正經(jīng)歷著前所未有的變革。如果說(shuō)大模型發(fā)展的第一步帶火了GPU,那么放眼下一步發(fā)展,作為數(shù)據(jù)中心第三顆“主力芯片”的DPU,又將如何與時(shí)俱進(jìn),迎接大算力發(fā)展挑戰(zhàn)?
近日,業(yè)界目光再次聚焦于DPU行業(yè)最新進(jìn)展,中科馭數(shù)正式發(fā)布國(guó)內(nèi)首顆量產(chǎn)全功能DPU芯片K2 Pro,無(wú)疑為國(guó)產(chǎn)DPU發(fā)展注入了一針“強(qiáng)心劑”。
我們知道,產(chǎn)業(yè)發(fā)展有賴于技術(shù)創(chuàng)新,但衡量創(chuàng)新突破是否合于時(shí)勢(shì),還需要到產(chǎn)品和應(yīng)用場(chǎng)景中去檢驗(yàn),此次中科馭數(shù)一系列發(fā)布背后,為DPU行業(yè)帶來(lái)了哪些新思考?已有創(chuàng)新實(shí)踐又能為國(guó)產(chǎn)DPU破局提供哪些借鑒?
重新定義DPU,旨在價(jià)值提升
迎接大算力挑戰(zhàn),算效亟待提升,究其根本還是芯片性能有待提升。作為當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,DPU作為數(shù)據(jù)中心第三大支柱芯片的地位也逐漸凸顯。
就其重要性來(lái)看,DPU與CPU、GPU密不可分。如果把CPU比作大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞,負(fù)責(zé)數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。
近年來(lái),DPU的關(guān)鍵性也在行業(yè)實(shí)踐中得到驗(yàn)證。放眼全球,國(guó)外芯片廠商英偉達(dá)、英特爾、AMD等都推出了相應(yīng)的DPU產(chǎn)品。國(guó)內(nèi)市場(chǎng)除了阿里巴巴、華為與騰訊等云計(jì)算龍頭發(fā)展符合自身要求的DPU產(chǎn)品線外,其他DPU新興企業(yè)亦蓄勢(shì)待發(fā),除中科馭數(shù)外,云豹智能、云脈芯聯(lián)等也紛紛入局。
中國(guó)工程院院士、清華大學(xué)教授鄭緯民認(rèn)為,DPU產(chǎn)業(yè)作為國(guó)內(nèi)外競(jìng)爭(zhēng)的新焦點(diǎn),在未來(lái)數(shù)據(jù)中心、智算中心等高帶寬、低延遲、高吞吐率產(chǎn)品都將發(fā)揮重要作用,為“東數(shù)西算”、算力網(wǎng)絡(luò)等重要新型算力基礎(chǔ)設(shè)施建設(shè)提供核心組件。
面對(duì)當(dāng)前行業(yè)對(duì)于DPU創(chuàng)新,助力算力發(fā)展的期待,中科馭數(shù)也試圖通過(guò)技術(shù)與應(yīng)用的雙重創(chuàng)新來(lái)解答DPU的發(fā)展方向。如何重新定義DPU的價(jià)值,中科馭數(shù)創(chuàng)始人、CEO鄢貴海認(rèn)為,當(dāng)前已經(jīng)不能僅將DPU視為單一芯片,而是結(jié)合行業(yè)需求去重新定義其價(jià)值。
具體來(lái)看,可分為三個(gè)方面,其一即架構(gòu)決勝,用最先進(jìn)的芯片架構(gòu)來(lái)重新定義DPU芯片架構(gòu)。其二為軟件護(hù)城,用最高兼容性來(lái)重新定義DPU的軟件系統(tǒng)。其三則是平臺(tái)上門(mén),用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗(yàn)證。
此次,中科馭數(shù)發(fā)布的第三代DPU芯片K2-Pro即為重新定義DPU之作,專為破解大規(guī)模數(shù)據(jù)中心性能瓶頸而生的高效能數(shù)據(jù)處理芯片,采用自主研發(fā)的KPU架構(gòu),集網(wǎng)絡(luò)、存儲(chǔ)、安全及計(jì)算等多業(yè)務(wù)卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網(wǎng)絡(luò)帶寬,具備高度可編程性,確保了系統(tǒng)的靈活擴(kuò)展性,為數(shù)據(jù)中心的業(yè)務(wù)增長(zhǎng)和算力擴(kuò)容提供堅(jiān)實(shí)基礎(chǔ)。
目前K2-Pro已經(jīng)成功搭載在中科馭數(shù)三大產(chǎn)品系列的6款DPU卡產(chǎn)品中,精準(zhǔn)支撐細(xì)分業(yè)務(wù)場(chǎng)景。鄢貴海預(yù)計(jì),2024年K2-Pro的出貨量將累計(jì)達(dá)1萬(wàn)顆。
“軟硬”合璧,3U一體值得期待
正如上文所提,重新定義GPU,其提供的思路即不能單一地強(qiáng)調(diào)架構(gòu),與之相對(duì)應(yīng)的要有軟件與平臺(tái)支撐,從而推動(dòng)DPU實(shí)踐落地。
針對(duì)DPU規(guī)模應(yīng)用需要面對(duì)的集群升級(jí)遷移成本大周期長(zhǎng)、學(xué)習(xí)門(mén)檻高,大規(guī)模使用、部署和運(yùn)維難度大,安全性與高可用極具挑戰(zhàn)的難關(guān)。發(fā)布會(huì)當(dāng)天,中科馭數(shù)也透露了自身的應(yīng)對(duì)之策,將自研軟件開(kāi)發(fā)平臺(tái)HADOS升級(jí)到3.0版本。
image.png
據(jù)了解,目前,HADOS已突破萬(wàn)卡級(jí)別的落地部署,適配了8 款CPU平臺(tái)以及10大主流操作系統(tǒng),成為業(yè)內(nèi)適配最完全、最具競(jìng)爭(zhēng)力、在國(guó)內(nèi)實(shí)際落地部署最多的DPU軟件平臺(tái)之一。
對(duì)標(biāo)國(guó)外基礎(chǔ)開(kāi)發(fā)軟件,HADOS 3.0在高性能云原生網(wǎng)絡(luò),尤其是微服務(wù)治理、運(yùn)維管控、仿真模擬、生態(tài)適配、國(guó)內(nèi)安全加解密、以及最重要的人工智能場(chǎng)景下,國(guó)產(chǎn)AI和GPU適配均占據(jù)了明顯的優(yōu)勢(shì)。
與此同時(shí),承接算力時(shí)代需求,深度洞察算力技術(shù)發(fā)展趨勢(shì),中科馭數(shù)還推出了基于DPU的馭云高性能云底座來(lái)釋放云端算力。
image.png
馭云解決方案采用“IaaS on DPU”技術(shù)路線,依托于DPU的卸載能力,將云計(jì)算體系中的基礎(chǔ)設(shè)施層面完全下沉,為集群提供網(wǎng)絡(luò)轉(zhuǎn)發(fā)、存儲(chǔ)服務(wù)、安全防護(hù)、管理調(diào)度等能力,完成了整個(gè)云計(jì)算環(huán)境的構(gòu)建與運(yùn)轉(zhuǎn),將服務(wù)器側(cè)的CPU與GPU算力全部預(yù)留給業(yè)務(wù)系統(tǒng)應(yīng)用,為云計(jì)算提供高性能、高吞吐、高安全的算力底座。
值得一提的是,避免對(duì)于單一芯片的過(guò)度依賴,更好地協(xié)調(diào)平衡性能,3U一體架構(gòu)也逐漸為行業(yè)認(rèn)可并落地實(shí)踐。目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開(kāi)放平臺(tái),集成了超400臺(tái)高性能服務(wù)器,采用創(chuàng)新的3U一體架構(gòu),深度融合CPU、GPU與DPU技術(shù),不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強(qiáng)大的算力支撐,還廣泛向用戶及生態(tài)伙伴開(kāi)放。
瞄準(zhǔn)商業(yè)化未來(lái),建強(qiáng)產(chǎn)業(yè)生態(tài)
就行業(yè)應(yīng)用來(lái)看,目前DPU已經(jīng)可以廣泛應(yīng)用于超低延遲網(wǎng)絡(luò)、云和數(shù)據(jù)中心、金融計(jì)算、大數(shù)據(jù)處理、5G邊緣計(jì)算、高性能計(jì)算等場(chǎng)景。
注重DPU產(chǎn)業(yè)價(jià)值發(fā)揮,中科馭數(shù)也在云計(jì)算,5G通信、證券基金、銀行等重點(diǎn)場(chǎng)景實(shí)現(xiàn)商用落地。
在云計(jì)算領(lǐng)域,中科馭數(shù)的DPU產(chǎn)品已經(jīng)在某頭部云計(jì)算廠商的云數(shù)據(jù)中心中落地。實(shí)際應(yīng)用當(dāng)中,基于DPU的方案可以大幅縮短裸金屬服務(wù)的交付時(shí)間,實(shí)現(xiàn)虛擬網(wǎng)絡(luò)功能的全面卸載,同時(shí)也可為存算分離相關(guān)的多種存儲(chǔ)技術(shù)提供統(tǒng)一的接口。
在5G通信領(lǐng)域,中科馭數(shù)是國(guó)內(nèi)三大運(yùn)營(yíng)商的硬件合作伙伴,共同探索DPU在5G通信和云計(jì)算領(lǐng)域的技術(shù)解決方案。在5G通信網(wǎng)絡(luò)快速發(fā)展的過(guò)程中,算力和網(wǎng)絡(luò)融合發(fā)展需要更加綠色高效的數(shù)據(jù)處理硬件加速技術(shù),亟待借助DPU提升系統(tǒng)性能。由此可以預(yù)見(jiàn),DPU將在高性能數(shù)據(jù)處理、低延遲數(shù)據(jù)傳輸、網(wǎng)絡(luò)管理、存儲(chǔ)以及安全等基礎(chǔ)設(shè)施底層建設(shè)發(fā)揮關(guān)鍵作用。
在證券基金領(lǐng)域,目前,中科馭數(shù)的DPU系列產(chǎn)品已經(jīng)在金融證券領(lǐng)域?qū)崿F(xiàn)規(guī)模化落地,同時(shí)也是上交所天相實(shí)驗(yàn)室,以及申萬(wàn)宏源、東證期貨等低時(shí)延實(shí)驗(yàn)室參與方,助力超過(guò)30家金融機(jī)構(gòu)完成核心超低時(shí)延系統(tǒng)替換,有力保障金融系統(tǒng)的平穩(wěn)運(yùn)行。
本著生產(chǎn)一代,預(yù)研一代的前瞻性布局,據(jù)介紹,2025年中科馭數(shù)將完成K3芯片的發(fā)布,采用最新KPU架構(gòu)以及KISA 2.0指令集,集成RISC-V輕量級(jí)控制核,處理帶寬將是K2-Pro的四倍,達(dá)到800G,延遲低于1微秒,功耗比K2-Pro下降40%。
正所謂獨(dú)行快,眾行遠(yuǎn),中科馭數(shù)在增強(qiáng)自身作戰(zhàn)能力的同時(shí),也在積極做大“朋友圈”。在軟件方面,中科馭數(shù)將逐步向各大開(kāi)源社區(qū)開(kāi)源HADOS教育版,同時(shí)推出企業(yè)版HADOS-4.0。
在云平臺(tái)方面,中科馭數(shù)也將進(jìn)一步擴(kuò)容——馭云,推出馭云2.0,將DPU的規(guī)?;渴?、運(yùn)維、調(diào)優(yōu)可視化、一體化。
從架構(gòu)、到軟件,再到云平臺(tái),構(gòu)成了中科馭數(shù)在算力基礎(chǔ)設(shè)施領(lǐng)域的“芯云計(jì)劃”,也展示了其重新定義DPU后的發(fā)展方向。
迎接算力之挑戰(zhàn),亦借算力之東風(fēng),期待DPU在其新發(fā)展內(nèi)涵下,為算力乃至新質(zhì)生產(chǎn)力發(fā)展帶來(lái)更多驚喜。
- QQ:61149512