“產(chǎn)業(yè)應(yīng)用會(huì)驅(qū)動(dòng)底層技術(shù)的創(chuàng)新,在大模型出現(xiàn)之前,AI的發(fā)展本身就推動(dòng)了很多底層技術(shù),比如HBM高帶寬的存儲(chǔ)技術(shù),算力從傳統(tǒng)計(jì)算到AI計(jì)算產(chǎn)生。大模型相比于之前的AI計(jì)算,它對(duì)算力、存儲(chǔ)、帶寬的需求又往上提升了比較大的臺(tái)階。我們認(rèn)為它會(huì)催生更多的底層技術(shù)的創(chuàng)新,包括硬件、軟件等。”7月6日,曦智科技創(chuàng)始人兼CEO沈亦晨在2023世界人工智能大會(huì)芯片主題論壇發(fā)言稱。
ChatGPT催化下,芯片領(lǐng)域迎來(lái)下行周期中少有的細(xì)分利好市況,帶動(dòng)高算力芯片需求顯著增長(zhǎng)。隨著ChatGPT引領(lǐng)的AI大模型熱潮興起,以GPU廠商英偉達(dá)為代表的芯片公司成為最大的受益者,計(jì)算資源近期被熱搶。
但這一市場(chǎng)現(xiàn)狀并不為所有人滿意,AI算力“僧多粥少”,價(jià)格昂貴且面臨技術(shù)瓶頸和地緣政治風(fēng)險(xiǎn),產(chǎn)業(yè)上下游需積極尋找解決方案,但這一進(jìn)度并不令人滿意。沈亦晨認(rèn)為,從當(dāng)前市場(chǎng)形勢(shì)來(lái)看,一方面英偉達(dá)獨(dú)自推進(jìn)解決AI計(jì)算的存儲(chǔ)、帶寬、計(jì)算解決方案,在整體效果上遠(yuǎn)超市場(chǎng)其他玩家。另一方面,在非英偉達(dá)生態(tài)中,存儲(chǔ)、帶寬、計(jì)算作為IT基礎(chǔ)設(shè)施的三大問(wèn)題,通常由不同廠商各自解決,難以形成合力。
“如何讓多個(gè)不同廠商,不同技術(shù)能夠共享一個(gè)語(yǔ)言,共同遵循一個(gè)通訊協(xié)議,這樣才能夠更好地把總體算力解放出來(lái)。”沈亦晨稱。
軟件端,英偉達(dá)地技術(shù)能力依然一騎絕塵。目前,在GPU領(lǐng)域,英偉達(dá)占據(jù)主導(dǎo)地位。英偉達(dá)在GPU領(lǐng)域的壟斷地位主要通過(guò)CUDA平臺(tái)上的軟件生態(tài)實(shí)現(xiàn)。國(guó)內(nèi)GPU/GPGPU創(chuàng)業(yè)公司的產(chǎn)品大多兼容CUDA,以確保用慣了英偉達(dá)產(chǎn)品的客戶在遷移時(shí)沒(méi)有障礙。中國(guó)GPU初創(chuàng)公司沐曦聯(lián)合創(chuàng)始人兼CTO兼首席軟件架構(gòu)師楊建表示,由于英偉達(dá)在軟件端幾乎沒(méi)有對(duì)手,推動(dòng)應(yīng)用生態(tài)遷移將是一個(gè)循序漸進(jìn)的過(guò)程,沐曦將會(huì)從小的市場(chǎng)嘗試切入。
沐曦作為GPU企業(yè),深感行業(yè)在大模型火熱下的瓶頸。楊建稱,大模型對(duì)計(jì)算精度要求極高,學(xué)術(shù)界對(duì)如何用低精度實(shí)現(xiàn)令人滿意的推理仍有難度,“精度降低之后,成本自然就降低了,這個(gè)問(wèn)題在學(xué)術(shù)界現(xiàn)在也沒(méi)有給出一個(gè)很好的答案。”
此外,行業(yè)普遍關(guān)注到HBM(高帶寬內(nèi)存芯片)供應(yīng)對(duì)GPU出貨的限制。楊建稱,目前所有大模型推理用的GPU芯片都需要HBM,“HBM很貴,差不多1GB要20美元,賣到最終用戶差不多1GB要60美元,能不能把HBM成本給下降?其實(shí)是更大的挑戰(zhàn)。”他設(shè)想,全球應(yīng)出現(xiàn)第三家HBM供應(yīng)商,打破現(xiàn)有僅有兩家公司提供HBM芯片的格局。
GPU短缺情況下,針對(duì)大模型需求,產(chǎn)業(yè)上下游嘗試多種新型技術(shù)方向。曦智科技從事硅光芯片開發(fā),后者被認(rèn)為是AI計(jì)算的一大潛在技術(shù)方向。光子作為電中性粒子,相互之間可交叉行進(jìn)而不會(huì)相互作用,因此可在光纖中處理同步數(shù)據(jù)信號(hào),且不產(chǎn)生熱量,最終硅光芯片在處理數(shù)據(jù)時(shí)可減少耗電。沈亦晨認(rèn)為,光電混合技術(shù)將是催生下一代大模型發(fā)展的底層技術(shù)之一,因?yàn)樗軌蛱峁└叩膸挘偷墓模尭嗟挠?jì)算節(jié)點(diǎn)更有效的聯(lián)合起來(lái),去完成更大規(guī)模的計(jì)算。
然而,該技術(shù)亦有自身難點(diǎn)。楊建即提及,將硅芯片的電子和光子整合為硅光芯片的過(guò)程中,如何實(shí)現(xiàn)不同芯片架構(gòu)的異構(gòu)封裝,將是一大挑戰(zhàn),“光對(duì)于溫度要求是很嚴(yán)苛的,但是硅不嚴(yán)苛(105或108攝氏度),但是光需要工作在50攝氏度左右。”
“過(guò)去絕大部分應(yīng)用創(chuàng)新都來(lái)自于軟件,現(xiàn)在越來(lái)越多的看到軟件跟硬件結(jié)合的創(chuàng)新,不管AIOT還是車網(wǎng)融合,硬件跟軟件會(huì)深度耦合。”奇異摩爾產(chǎn)品及解決方案副總裁祝俊東稱,硬件無(wú)論是開發(fā)成本和開發(fā)周期都遠(yuǎn)遠(yuǎn)的跟不上應(yīng)用跟軟件的發(fā)展。過(guò)去大家以功能來(lái)定義硬件,后來(lái)以算法或者需求來(lái)定義。
奇異摩爾從事Chiplet通用產(chǎn)品解決方案,隨著硬件變得越來(lái)越復(fù)雜,進(jìn)一步推動(dòng)架構(gòu)和制程創(chuàng)新已經(jīng)很不容易。而Chiplet能夠通過(guò)硬件的組合來(lái)降低硬件創(chuàng)新門檻。能夠更好的實(shí)現(xiàn)軟硬件相互之間的協(xié)同。
與CPU(中央處理器)一樣,由于對(duì)算力要求較高,GPU也需要使用最先進(jìn)的工藝,處于風(fēng)口當(dāng)中的Chiplet技術(shù),也是被不少業(yè)內(nèi)人士視為摩爾定律放緩之后、中國(guó)半導(dǎo)體企業(yè)彎道超車的機(jī)會(huì)。
Chiplet即“小芯片”或“芯粒”,是芯片制造領(lǐng)域近年備受熱議的技術(shù)路線,通過(guò)把不同芯片的能力模塊化,利用新的設(shè)計(jì)、互聯(lián)、封裝等技術(shù),在一個(gè)封裝的產(chǎn)品中使用來(lái)自不同技術(shù)、不同制程甚至不同工廠的芯片。
然而,Chiplet是系統(tǒng)工程,涉及到芯片設(shè)計(jì)、晶圓制造、封裝、測(cè)試等多個(gè)環(huán)節(jié)。具體到封測(cè)上,鄭力認(rèn)為,整體來(lái)看,與全球領(lǐng)先廠商相較,大陸企業(yè)在先進(jìn)封裝領(lǐng)域差距較小,但在先進(jìn)的晶圓級(jí)封裝,全球范圍內(nèi)仍由臺(tái)積電、三星和英特爾主導(dǎo),這和半導(dǎo)體工業(yè)的整體水平有關(guān)。
本文標(biāo)題: 大模型時(shí)代,2023WAIC上有哪些AI 芯片設(shè)想?
本文地址: http://www.cybfk.com/brand/news-6f30fa79a0.html
內(nèi)容均來(lái)源于網(wǎng)絡(luò),錯(cuò)誤糾正或刪除請(qǐng)發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁(yè)88版權(quán)所有 京ICP備2023012932號(hào)-1 │ 京公網(wǎng)安備 11010802023561號(hào) 京ICP證100626
內(nèi)容均來(lái)源于網(wǎng)絡(luò),錯(cuò)誤糾正或刪除請(qǐng)發(fā)郵件,收件郵箱kefu@huangye88.com