在近期召開(kāi)的中共中央政治局常務(wù)委員會(huì)會(huì)議上,中央明確提出要加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。這是近年來(lái),數(shù)據(jù)中心首次被國(guó)家列入加快建設(shè)的條目,數(shù)據(jù)中心作為“新基建”中的一個(gè)亮點(diǎn),引起了業(yè)界的高度關(guān)注。
區(qū)別于傳統(tǒng)基建,“新基建”主要發(fā)力于科技端,主要包括5G建設(shè)等七大領(lǐng)域。隨著互聯(lián)網(wǎng)進(jìn)入云2.0時(shí)代,行業(yè)云興起,更多的企業(yè)成為云化、數(shù)字化的主角,5G、云計(jì)算、工業(yè)互聯(lián)網(wǎng)等新一代信息技術(shù)的應(yīng)用離不開(kāi)海量數(shù)據(jù)的處理、存儲(chǔ)和軟件的云化。隨著“新基建”的推進(jìn),云計(jì)算服務(wù)部署提速,相關(guān)設(shè)備及服務(wù)需求增加,數(shù)據(jù)中心作為底層基礎(chǔ)設(shè)施有望持續(xù)增長(zhǎng),數(shù)據(jù)中心建設(shè)及擴(kuò)容的步伐也會(huì)相應(yīng)加快。
從中長(zhǎng)期看,數(shù)據(jù)中心等數(shù)字經(jīng)濟(jì)領(lǐng)域的基礎(chǔ)設(shè)施應(yīng)該在技術(shù)和資金允許的情況下適度超前布局,帶動(dòng)應(yīng)用市場(chǎng)的繁榮。在當(dāng)前大國(guó)科技競(jìng)爭(zhēng)的大背景下,加大對(duì)新基建領(lǐng)域的投入,有助于穩(wěn)增長(zhǎng)、穩(wěn)就業(yè),釋放國(guó)內(nèi)經(jīng)濟(jì)增長(zhǎng)潛力,有效緩解新冠肺炎疫情對(duì)全國(guó)經(jīng)濟(jì)的沖擊,縮小與發(fā)達(dá)國(guó)家的數(shù)字鴻溝??梢灶A(yù)見(jiàn),“新基建”來(lái)襲會(huì)對(duì)數(shù)據(jù)中心產(chǎn)業(yè)產(chǎn)生重大影響,勢(shì)必將開(kāi)啟新一輪增長(zhǎng)期。
數(shù)據(jù)中心規(guī)?;б嫱癸@,
超大規(guī)模組網(wǎng)亟需破局
互聯(lián)網(wǎng)行業(yè)的蓬勃發(fā)展帶動(dòng)了數(shù)據(jù)和流量不斷向數(shù)據(jù)中心聚集。為充分發(fā)揮數(shù)據(jù)中心的規(guī)模效益,大幅降低業(yè)務(wù)部署成本和維護(hù)成本,運(yùn)營(yíng)商、互聯(lián)網(wǎng)、云服務(wù)提供商等行業(yè)中的大型公司紛紛建設(shè)了超大規(guī)模數(shù)據(jù)中心。自2013年以來(lái),超大規(guī)模數(shù)據(jù)中心的數(shù)量增長(zhǎng)了兩倍,其中以亞馬遜、蘋(píng)果、谷歌、Facebook和微軟為首,單園區(qū)最大服務(wù)器規(guī)模已經(jīng)突破30萬(wàn)臺(tái),很多大型園區(qū)服務(wù)器規(guī)模在2萬(wàn)臺(tái)到10萬(wàn)臺(tái)之間。到2019年第三季度末,這些大型數(shù)據(jù)中心中有504個(gè)正在運(yùn)營(yíng),還有超過(guò)150個(gè)新的超大規(guī)模中心正在建設(shè)中。
可以預(yù)見(jiàn),在“新基建”的推動(dòng)下,“撒胡椒面”式數(shù)據(jù)中心投資建設(shè)方式或?qū)⒊蔀檫^(guò)去,更多的集中式、大手筆的投資方式將加速超大規(guī)模數(shù)據(jù)中心的建設(shè)。在這個(gè)大背景下,如何繼續(xù)提高數(shù)據(jù)中心規(guī)模化效益,構(gòu)建更大規(guī)模的數(shù)據(jù)中心網(wǎng)絡(luò),是每個(gè)數(shù)據(jù)中心架構(gòu)設(shè)計(jì)師都要面對(duì)的挑戰(zhàn)。
組建超大規(guī)模數(shù)據(jù)中心主要受限于兩方面的因素:一個(gè)是業(yè)界主流的交換網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力和端口密度;另一個(gè)則是網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)思想,需具備極高的可擴(kuò)展性和可管理性,以期能按POD(Point of Delivery,最小交付單元)進(jìn)行數(shù)據(jù)中心網(wǎng)絡(luò)的交付,并最終具備靈活擴(kuò)展到承載更大規(guī)模集群的能力。目前業(yè)界主流設(shè)備已經(jīng)可以提供基于12.8T芯片、支持32個(gè)400G端口的TOR交換機(jī),預(yù)計(jì)2022年將會(huì)出現(xiàn)50T以上的大容量芯片,支持64個(gè)800G端口以及最新的112G SerDes技術(shù)。
同時(shí),數(shù)據(jù)中心網(wǎng)絡(luò)已經(jīng)從最初傳統(tǒng)的3-Tier架構(gòu)演進(jìn)到扁平化、無(wú)阻塞的葉脊(Leaf-Spine)架構(gòu),并基于這種架構(gòu)還在不斷進(jìn)行迭代演進(jìn)。Facebook去年公開(kāi)了其新一代的數(shù)據(jù)中心架構(gòu)F16,在spine平面對(duì)其上一代數(shù)據(jù)中心架構(gòu)F4進(jìn)行擴(kuò)展,把4個(gè)128端口、400Gbit/s交換機(jī)升級(jí)為16個(gè)128端口、100Gbit/s架構(gòu)的交換機(jī),并采用Minipack spine交換機(jī)和基于Tomahawk-3(Minipack)、Tomahawk-2(Wedge 100S)ASIC的Wedge 100S交換機(jī),據(jù)稱(chēng)可以擁有4倍于F4架構(gòu)的容量,更加方便升級(jí)和使用。可以預(yù)見(jiàn),未來(lái)在業(yè)界的共同努力下,數(shù)據(jù)中心在網(wǎng)絡(luò)架構(gòu)、設(shè)備轉(zhuǎn)發(fā)能力以及端口密度等方面有望取得新的突破,以支持更超大規(guī)模的數(shù)據(jù)中心組網(wǎng)。
無(wú)損、智慧、開(kāi)源或成為數(shù)據(jù)中心網(wǎng)絡(luò)能力的“三駕馬車(chē)”
新基建勢(shì)必將推進(jìn)5G、AI、大數(shù)據(jù)、云計(jì)算等業(yè)務(wù)飛速發(fā)展,這些新業(yè)務(wù)對(duì)網(wǎng)絡(luò),尤其是數(shù)據(jù)中心網(wǎng)絡(luò)在轉(zhuǎn)發(fā)效率、高效運(yùn)維、開(kāi)放架構(gòu)等諸多方面提出了更為苛刻的需求,未來(lái)數(shù)據(jù)中心網(wǎng)絡(luò)需要在無(wú)損、智慧、開(kāi)源這三大方面全面提升能力,為新一代業(yè)務(wù)應(yīng)用保駕護(hù)航。
無(wú)損數(shù)據(jù)中心提升網(wǎng)絡(luò)確定性和高效轉(zhuǎn)發(fā)能力
未來(lái)在公有云、人工智能等應(yīng)用中將廣泛采用語(yǔ)音交互、圖像交互等新型的技術(shù),這些交互服務(wù)通過(guò)訪問(wèn)線上數(shù)據(jù)庫(kù)、云數(shù)據(jù)中心等來(lái)滿足不同需求,諸如浸入式體驗(yàn)、全息通信、機(jī)器人看護(hù)等應(yīng)用。由于這些應(yīng)用需要通過(guò)網(wǎng)絡(luò)傳輸和處理大規(guī)模多媒體信息,且設(shè)備密度和總信息量巨大,需要數(shù)據(jù)中心網(wǎng)絡(luò)在極短時(shí)間內(nèi)將大量的數(shù)據(jù)轉(zhuǎn)換成實(shí)時(shí)的信息以及行為,保證交互服務(wù)在后臺(tái)訪問(wèn)的時(shí)候能夠避免丟包,減少時(shí)延并提高吞吐量,由此對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)提出了無(wú)損轉(zhuǎn)發(fā)的需求。
目前,無(wú)損網(wǎng)絡(luò)技術(shù)已經(jīng)在互聯(lián)網(wǎng)、金融等行業(yè)得到應(yīng)用。以某銀行為例,其基于無(wú)損網(wǎng)絡(luò)技術(shù),在數(shù)據(jù)中心引入智能擁塞調(diào)度手段來(lái)加速網(wǎng)絡(luò)通信,經(jīng)實(shí)測(cè)最終存儲(chǔ)集群IOPS性能提升了20%,單卷性能達(dá)到35萬(wàn)IOPS,可以為用戶提供像訪問(wèn)本地盤(pán)一樣的使用體驗(yàn)。隨著人工智能的飛速發(fā)展,工業(yè)控制、遠(yuǎn)程醫(yī)療、自動(dòng)駕駛等越來(lái)越多的應(yīng)用將走入我們的生活,而無(wú)損數(shù)據(jù)中心網(wǎng)絡(luò)無(wú)疑為我們提供了一個(gè)極佳選擇。
智慧化能力有望解決海量數(shù)據(jù)中心運(yùn)維困境
數(shù)據(jù)中心規(guī)模擴(kuò)張以后,設(shè)備數(shù)量呈倍數(shù)增長(zhǎng),設(shè)備種類(lèi)也大大增多,如何實(shí)現(xiàn)海量設(shè)備的統(tǒng)一管理,實(shí)現(xiàn)業(yè)務(wù)到網(wǎng)絡(luò)的聯(lián)動(dòng),提高運(yùn)維效率,降低運(yùn)維成本,是大規(guī)模數(shù)據(jù)中心亟需解決的問(wèn)題之一。此外隨著云、SDN、NFV等技術(shù)在數(shù)據(jù)中心加速落地,轉(zhuǎn)控分離、三層解耦以及統(tǒng)一編排等技術(shù)引入也使得數(shù)據(jù)中心業(yè)務(wù)邏輯愈加復(fù)雜,故障排障難度大幅提升,傳統(tǒng)運(yùn)維模式已經(jīng)難以為繼。
基于AI和Telemetry的智能運(yùn)維是利用數(shù)據(jù)智能替換人工經(jīng)驗(yàn),期望在自動(dòng)化的基礎(chǔ)上實(shí)現(xiàn)遙測(cè)、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和網(wǎng)絡(luò)引導(dǎo)等功能,監(jiān)控和管理潛在的網(wǎng)絡(luò)安全問(wèn)題,幫助數(shù)據(jù)中心更快地適應(yīng)不斷變化的業(yè)務(wù)需求,提高運(yùn)營(yíng)的洞察力,最終實(shí)現(xiàn)基于意圖的網(wǎng)絡(luò)。
當(dāng)前網(wǎng)絡(luò)智慧化產(chǎn)業(yè)處于蓬勃發(fā)展中,重點(diǎn)集中在網(wǎng)絡(luò)開(kāi)局部署、網(wǎng)絡(luò)變更校驗(yàn)、故障智能定界/定位、故障預(yù)測(cè)、業(yè)務(wù)分析以及預(yù)測(cè)等方面,尋求在數(shù)據(jù)采集、大數(shù)據(jù)分析、AI、決策閉環(huán)等環(huán)節(jié)實(shí)現(xiàn)精細(xì)化檢測(cè)和可視化管理,變被動(dòng)運(yùn)維為主動(dòng)運(yùn)維。雖然目前還受制于AI學(xué)習(xí)模型的精確、網(wǎng)絡(luò)設(shè)備特性不足等制約因素,但人工智能的發(fā)展必將引發(fā)再一次網(wǎng)絡(luò)運(yùn)維的變革。
開(kāi)放架構(gòu)設(shè)備催生數(shù)據(jù)中心新的產(chǎn)業(yè)生態(tài)
數(shù)據(jù)中心開(kāi)放式的架構(gòu)給白盒交換機(jī)提供了發(fā)展良機(jī),白盒交換機(jī)與傳統(tǒng)交換機(jī)的區(qū)別在于:白盒交換機(jī)采用開(kāi)放的體系架構(gòu),可實(shí)現(xiàn)硬件與軟件的解耦,需要部署一套集中的網(wǎng)絡(luò)操作系統(tǒng)。
目前SONIC操作系統(tǒng)逐漸成為白盒交換機(jī)的事實(shí)標(biāo)準(zhǔn),SONIC通過(guò)SAI層,將交換機(jī)進(jìn)行接口抽象設(shè)計(jì),向上提供統(tǒng)一的API接口,向下對(duì)接不同ASIC芯片,徹底解決了上層軟件需適配不同ASIC芯片的問(wèn)題。此外,芯片層面也不斷開(kāi)放,通過(guò)可編程接口來(lái)自定義芯片對(duì)于數(shù)據(jù)包的處理邏輯,實(shí)現(xiàn)按需添加新功能、新協(xié)議或者對(duì)原有協(xié)議進(jìn)行優(yōu)化等能力,極大提升了靈活性。
隨著白盒交換機(jī)生態(tài)系統(tǒng)的發(fā)展,硬件、網(wǎng)絡(luò)操作系統(tǒng)以及協(xié)議軟件等逐步成熟,越來(lái)越多的客戶投入到白盒交換機(jī)的研發(fā)和使用中,尤其在互聯(lián)網(wǎng)行業(yè),基于開(kāi)放架構(gòu)的白盒交換機(jī)已經(jīng)在大型互聯(lián)網(wǎng)公司的云數(shù)據(jù)中心規(guī)模部署。隨著業(yè)務(wù)的精細(xì)化發(fā)展,對(duì)網(wǎng)絡(luò)的定制化的需求越來(lái)越多,自主可控的開(kāi)源設(shè)備將會(huì)發(fā)揮出更大的作用。




