關(guān)注宇力半導(dǎo)體資訊,了解最新動(dòng)態(tài)
last news
在以AI為代表的計(jì)算密集型時(shí)代,芯片功耗已不再只是一個(gè)成本問題,而是關(guān)乎系統(tǒng)穩(wěn)定性、產(chǎn)品壽命乃至環(huán)境可持續(xù)性的核心議題。
ProteanTecs提出的基于每芯片、每系統(tǒng)實(shí)時(shí)可見性和預(yù)測(cè)模型的VDDmin自適應(yīng)優(yōu)化方案,為行業(yè)提供了一種切實(shí)可行的低功耗高可靠性解決路徑。
通過(guò)片上嵌入式監(jiān)控器與機(jī)器學(xué)習(xí)技術(shù)的協(xié)同,突破了傳統(tǒng)以最壞情況設(shè)計(jì)為基礎(chǔ)的冗余設(shè)計(jì)邏輯,實(shí)現(xiàn)了生產(chǎn)與使用階段的持續(xù)動(dòng)態(tài)調(diào)節(jié),從而在保障系統(tǒng)可靠性的前提下,有效降低了芯片功耗并延長(zhǎng)使用壽命。
Part 1
芯片功耗控制的現(xiàn)實(shí)困境
與傳統(tǒng)方法的局限
芯片設(shè)計(jì)中電壓設(shè)定通常依據(jù)靜態(tài)最壞情況原則,即根據(jù)溫度、老化、制程波動(dòng)、負(fù)載波動(dòng)等多重變量中的最大應(yīng)力條件設(shè)定最低工作電壓VDDmin。
雖然這種方式能夠覆蓋所有潛在極端情況,但也帶來(lái)明顯弊端:
◎ 一方面多數(shù)芯片在日常運(yùn)行中并未真正遭遇這些極端工況,導(dǎo)致電壓冗余和功耗浪費(fèi);
◎ 另一方面,在功能測(cè)試階段精確判定每顆芯片Vmin的測(cè)試流程復(fù)雜、耗時(shí)、成本高,迫使廠商在精度與效率間取舍,最終選擇相對(duì)保守的電壓設(shè)定。
傳統(tǒng)的自適應(yīng)電壓調(diào)節(jié)(AVS)機(jī)制雖能實(shí)現(xiàn)一定程度的動(dòng)態(tài)電壓調(diào)整,但通常依賴靜態(tài)校準(zhǔn)曲線和固定裕度,難以對(duì)運(yùn)行中實(shí)際負(fù)載、路徑延遲變化做出精準(zhǔn)響應(yīng)。
因此,傳統(tǒng)方法不僅在功耗控制方面存在結(jié)構(gòu)性浪費(fèi),也在產(chǎn)品可靠性與壽命管理方面缺乏個(gè)性化支撐。
proteanTecs提出的節(jié)能解決方案,正是對(duì)這一長(zhǎng)期矛盾的根本性重構(gòu)。
其核心機(jī)制在于:通過(guò)嵌入式片上代理(embedded agents)對(duì)芯片關(guān)鍵路徑進(jìn)行實(shí)時(shí)監(jiān)測(cè),結(jié)合機(jī)器學(xué)習(xí)模型預(yù)測(cè)每顆芯片、每一運(yùn)行環(huán)境下的最優(yōu)VDDmin,從而實(shí)現(xiàn)更為精細(xì)的動(dòng)態(tài)供電控制。
Part 2
技術(shù)實(shí)現(xiàn):
片上代理、實(shí)時(shí)可見性
與機(jī)器學(xué)習(xí)預(yù)測(cè)模型
proteanTecs的技術(shù)路線圍繞三個(gè)核心組件展開:
◎ 第一,嵌入式片上監(jiān)視器。這些代理布設(shè)在芯片內(nèi)部關(guān)鍵路徑處,實(shí)時(shí)記錄延遲、負(fù)載、溫度等動(dòng)態(tài)數(shù)據(jù),構(gòu)成芯片當(dāng)前運(yùn)行狀況的高精度快照。相較于傳統(tǒng)仿真或批量測(cè)試所得統(tǒng)計(jì)數(shù)據(jù),這種細(xì)粒度監(jiān)測(cè)能夠反映芯片在實(shí)際工作負(fù)載下的真實(shí)狀態(tài)。
◎ 第二,基于AI的預(yù)測(cè)模型。在量產(chǎn)測(cè)試階段,proteanTecs不再通過(guò)反復(fù)測(cè)試逼近芯片最小工作電壓,而是通過(guò)代理獲取有限樣本數(shù)據(jù)后,訓(xùn)練預(yù)測(cè)模型來(lái)估算每顆芯片的最優(yōu)VDDmin。這一方式兼顧了測(cè)試效率與個(gè)體差異精度,避免了傳統(tǒng)方法中普遍存在的"一刀切"電壓配置。
◎ 第三,系統(tǒng)級(jí)運(yùn)行時(shí)優(yōu)化。在芯片部署于實(shí)際系統(tǒng)后,proteanTecs可繼續(xù)通過(guò)代理在現(xiàn)場(chǎng)運(yùn)行過(guò)程中監(jiān)測(cè)功能性負(fù)載下的時(shí)序裕度變化,并結(jié)合預(yù)測(cè)模型調(diào)整供電電壓。這種按需、按場(chǎng)景的自適應(yīng)供電機(jī)制,真正實(shí)現(xiàn)了生命周期全程的動(dòng)態(tài)功耗調(diào)節(jié)。
方案的最大優(yōu)勢(shì)在于其打通了芯片設(shè)計(jì)、生產(chǎn)、測(cè)試、運(yùn)行的全鏈路閉環(huán):
從預(yù)測(cè)性VDDmin建模到現(xiàn)場(chǎng)電壓調(diào)節(jié)形成自學(xué)習(xí)、自適應(yīng)體系,使功耗控制不再依賴靜態(tài)裕度而轉(zhuǎn)向以運(yùn)行數(shù)據(jù)為驅(qū)動(dòng)的精細(xì)優(yōu)化。
實(shí)踐中,proteanTecs方案已可實(shí)現(xiàn)8%至14%的功耗下降,芯片溫度顯著降低,并進(jìn)一步將使用壽命延長(zhǎng)20%至90%。
在高性能計(jì)算、邊緣AI等場(chǎng)景中,芯片熱管理與系統(tǒng)可靠性日益成為設(shè)計(jì)瓶頸。溫度下降不僅減少了漏電、遷移和介質(zhì)擊穿等失效機(jī)制發(fā)生概率,也優(yōu)化了整個(gè)封裝散熱設(shè)計(jì)的要求,帶來(lái)系統(tǒng)級(jí)能效改進(jìn)。
小結(jié)
面對(duì)AI驅(qū)動(dòng)的算力爆發(fā)、先進(jìn)工藝節(jié)點(diǎn)的電壓窗口壓縮與可靠性挑戰(zhàn),芯片功耗不再只是一個(gè)能源指標(biāo),更是系統(tǒng)工程的核心變量,通過(guò)片上代理與機(jī)器學(xué)習(xí)結(jié)合,實(shí)現(xiàn)了芯片個(gè)體差異的可見性與功耗優(yōu)化的可操作性。
這種細(xì)粒度、實(shí)時(shí)化的供電調(diào)節(jié)機(jī)制有望與更廣泛的chiplet架構(gòu)、彈性計(jì)算調(diào)度及系統(tǒng)層功耗調(diào)控協(xié)同,成為下一代高性能、長(zhǎng)壽命、綠色計(jì)算系統(tǒng)的關(guān)鍵。
Copyright ? 2015-2023 紹興宇力半導(dǎo)體有限公司
浙公網(wǎng)安備33060202001577
浙ICP備2020037221號(hào)-1
技術(shù)支持:藍(lán)韻網(wǎng)絡(luò)