中國(guó)儲(chǔ)能網(wǎng)訊:對(duì)于國(guó)產(chǎn)算力芯片來說,“紙面上的指標(biāo)不重要,真正能用、好用才重要”,幾乎成為業(yè)界默認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)。然而,近日記者從產(chǎn)業(yè)活動(dòng)中了解到,算力的“高性能”和“易用”之間似乎存在著一道“看不見的鴻溝”。
好算力不易用,廠商有意為之?
“好用和用得好似乎是天然的矛盾?!蹦柧€程聯(lián)合創(chuàng)始人首席技術(shù)官?gòu)堚暡硎尽?duì)于用戶而言,“好用”首先意味著使用和遷移成本低。要實(shí)現(xiàn)“好用”,讓用戶先在自己的平臺(tái)上“用起來”,算力芯片企業(yè)就得將自己的計(jì)算平臺(tái)包裝得非常簡(jiǎn)單,非常標(biāo)準(zhǔn)化,甚至做得跟國(guó)際主流一模一樣?!斑@樣開發(fā)者確實(shí)不需要做太多的額外學(xué)習(xí),能夠最小化學(xué)習(xí)和遷移成本?!睆堚暡f。
然而,單純與國(guó)際主流保持一致,將平臺(tái)包裝得容易上手,則國(guó)產(chǎn)算力具備的諸多創(chuàng)新性的性能優(yōu)勢(shì)無法發(fā)揮出來。
針對(duì)這一問題,北京硅基流動(dòng)科技有限公司創(chuàng)始人、首席執(zhí)行官袁進(jìn)輝解釋道:算力芯片中往往會(huì)設(shè)計(jì)很多細(xì)節(jié),存在很多復(fù)雜的結(jié)構(gòu)和功能,充分調(diào)用其功能需要一定的經(jīng)驗(yàn)和技巧。如果想讓更多的人盡快地用起來,芯片就要盡可能地把細(xì)節(jié)隱藏起來,用簡(jiǎn)單而抽象的指令,盡可能讓使用的方式簡(jiǎn)單一些。也就是說,把軟件接口做簡(jiǎn)單,使用戶能“傻瓜式”地把芯片用起來,便實(shí)現(xiàn)了芯片的“好用”。
但算力芯片應(yīng)用的場(chǎng)景是多樣化的,場(chǎng)景覆蓋AI、圖形處理、科學(xué)計(jì)算等等諸多類型,每一種任務(wù)的工作負(fù)載不盡相同,對(duì)底層芯片的使用方式也各不相同。在不同的場(chǎng)景中,工程師如果發(fā)現(xiàn)了需要解決的問題,需要從上到下,逐層把一些工作負(fù)載細(xì)化、分解,以匹配硬件上的規(guī)格。
因此,所謂算力芯片“好用的沒用”“有用的不好用”的爭(zhēng)論,其實(shí)一定程度上是算力芯片企業(yè)為提升本品牌芯片使用率,“有意為之”的結(jié)果。
“好用不好用”,軟件棧很重要
為了使用戶先“用起來”而故意隱藏部分信息,既反映出算力芯片企業(yè)對(duì)用戶的重視,也反映出用戶習(xí)慣仍然在國(guó)產(chǎn)算力芯片普及化過程中扮演著相當(dāng)重要的角色。軟件棧的成熟度和“好用”程度,也很大程度上決定了開發(fā)者對(duì)算力芯片品牌的信賴度。
當(dāng)前,用戶期待算力基礎(chǔ)設(shè)施能夠承載包括大規(guī)模訓(xùn)練、推理在內(nèi)的諸多職能。與此同時(shí),國(guó)產(chǎn)算力芯片存在代際迭代,超智融合的算力中心還存在異構(gòu)情況。上述這些需求,都對(duì)底層軟件棧的穩(wěn)定性帶來很大的挑戰(zhàn)。
“我們期待的狀態(tài)是,上層應(yīng)用跑得好?!眴⒃獙?shí)驗(yàn)室助理研究員王豪杰在接受采訪時(shí)表示。英偉達(dá)的芯片之所以受到歡迎,穩(wěn)定、高效且簡(jiǎn)易的軟件棧發(fā)揮了很大的作用。王豪杰舉例,一個(gè)在A100芯片上訓(xùn)練的模型,可以部署在4090顯卡上,整個(gè)過程非常順利,不需要對(duì)軟件做任何修改?!斑@是英偉達(dá)好用的本質(zhì)核心?!蓖鹾澜苷f。
反觀國(guó)產(chǎn)芯片生態(tài):一方面,同一品牌的產(chǎn)品存在代際差異;另一方面,不同品牌之間、底層軟件棧之間也存在差異。在某一款產(chǎn)品上進(jìn)行訓(xùn)練,再到另一款算力芯片上推理,模型在不同的軟件和底層硬件遷移之后,精度損失會(huì)非常嚴(yán)重。甚至可能出現(xiàn),某些接口在一款產(chǎn)品上適配了,但在另一款產(chǎn)品上沒有適配,模型跑不起來的可能。
“在單點(diǎn)算力不足的情況下,為了滿足算力規(guī)模需求,我們需要調(diào)用異構(gòu)算力。底層軟件是支撐實(shí)現(xiàn)這一切的基礎(chǔ)?!蓖鹾澜芊Q。
基于此,國(guó)產(chǎn)算卡要實(shí)現(xiàn)“更好用”,就得使任務(wù)能夠輕易地調(diào)用不同品牌的算力卡。如果存在嚴(yán)格的適配機(jī)制和驗(yàn)證機(jī)制,能夠通過中間層統(tǒng)一的架構(gòu),保障在上層代碼不作修改的情況下,任務(wù)也能夠在不同品牌的算力芯片上運(yùn)轉(zhuǎn)起來,便能推動(dòng)我國(guó)智能算力進(jìn)一步朝著產(chǎn)業(yè)化、規(guī)?;较蛲卣埂?/span>




