久久亚洲色www成人-久久亚洲色www成人男男-久久亚洲色www成人欧美-久久亚洲色一区二区三区-久久亚洲视频-久久亚洲私人国产精品

/ EN
13922884048

技術(shù)交流

Technology Exchange
/
/

Chiplet助力AI芯片實(shí)現(xiàn)算力跨越

發(fā)布時(shí)間:2024-05-30作者來(lái)源:薩科微瀏覽:1847

圖片


芯粒英文是Chiplet,是指預(yù)先制造好、具有特定功能、可組合集成的晶片(Die),Chiplet也有翻譯為“小芯片”,中科院計(jì)算所韓銀和等2020年時(shí)建議將Chiplet翻譯為“芯粒”



2010年,蔣尚義先生提出通過半導(dǎo)體公司連接兩顆芯片的方法,區(qū)別于傳統(tǒng)封裝,定義為先進(jìn)封裝。2015年Marvell創(chuàng)始人之一周秀文(Sehat Sutardja)博士曾提出Mochi (Modular Chip,模塊化芯片)架構(gòu)的概念,這是芯粒早期雛形。AMD率先將芯粒技術(shù)大規(guī)模應(yīng)用于商業(yè)產(chǎn)品。2019年,國(guó)內(nèi)華為等公司也在產(chǎn)品中使用芯粒技術(shù)。2022年基金委雙清論壇上,孫凝暉院士、劉明院士、蔣尚義先生等討論提出了“集成芯片”概念,也是對(duì)芯粒集成芯片的概括和定義。

關(guān)于芯粒技術(shù),網(wǎng)上有多篇寫的比較全面的介紹。如54所的許居衍院士的報(bào)告,ARM的邵博士寫的文章《多Die封裝:Chiplet小芯片的研究報(bào)告》,華為的夏博士的文章,成都電子科大的黃樂天的文章,清華大學(xué)研究組提出的芯粒設(shè)計(jì)成本估算模型。不過,網(wǎng)上也有一些值得關(guān)注的觀點(diǎn)。清華大學(xué)少軍教授指出,Chiplet處理器芯片是先進(jìn)造工藝的“補(bǔ)充”,而不是替代。“其目標(biāo)還是在成本可控情況下的異質(zhì)集成。”


圖片

隨著AI、HPC等高算力需求日新月異,作為算力載體的高性能芯片的需求也隨之水漲船高。先進(jìn)封裝因能提升芯片的集成密度與互聯(lián)速度、降低芯片設(shè)計(jì)門檻,并增強(qiáng)功能搭配的靈活性,故而已成為超越摩爾定律、提升芯片系統(tǒng)性能的關(guān)鍵途徑。Chiplet既是先進(jìn)封裝技術(shù)的重要應(yīng)用,亦是后道制程提升AI芯片算力的[敏感詞]途徑之一。

01

AI芯片技術(shù)架構(gòu)不斷演進(jìn)


隨著人工智能技術(shù)的飛速發(fā)展,AI芯片的技術(shù)架構(gòu)也在不斷演進(jìn)和升級(jí)。科技芯聞社介紹,中央處理器(CPU,Central Processing Unit)是計(jì)算機(jī)的核心,現(xiàn)代計(jì)算機(jī)發(fā)展所遵循的基本結(jié)構(gòu)形式始終是馮·諾依曼機(jī)結(jié)構(gòu),需要CPU從存儲(chǔ)器取出指令和數(shù)據(jù)進(jìn)行相應(yīng)的計(jì)算,CPU負(fù)責(zé)承擔(dān)運(yùn)算器和控制器這兩個(gè)核心功能。CPU通常由運(yùn)算器、控制器、時(shí)鐘、寄存器等多個(gè)模塊構(gòu)成。


圖片

AI芯片按照技術(shù)架構(gòu)主要可以分為圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、專用集成電路(ASIC)與類腦芯片

圖形處理器(GPU,Graphics Processing Unit)是顯卡的核心。CPU的定位是通用計(jì)算芯片,而GPU的定位是并行計(jì)算芯片,主要是將其中非常復(fù)雜的數(shù)學(xué)和幾何計(jì)算抽出,變成一個(gè)超高密度、能夠并行計(jì)算的方式。

目前,GPU已經(jīng)發(fā)展到較為成熟的階段,谷歌、FACEBOOK、微軟、Twtter和百度等公司都在使用GPU分析圖片、視頻和音頻文件,以改進(jìn)搜索和圖像標(biāo)簽等應(yīng)用功能。

現(xiàn)場(chǎng)可編程門陣列(FPGA,F(xiàn)ield Programmable Gate Array)是在PAL(可編程陣列邏輯)、GAL(通用陣列邏輯)等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。

由于FPGA具有可編程靈活性高、開發(fā)周期短以及并行計(jì)算效率高等特點(diǎn),F(xiàn)PGA的應(yīng)用場(chǎng)景非常廣泛,遍布航空航天、汽車、醫(yī)療、廣播、測(cè)試測(cè)量、消費(fèi)電子、工業(yè)控制等熱門領(lǐng)域。

專用集成電路(ASIC ,Application Specific Integrated Circuit )是針對(duì)用戶對(duì)特定電子系統(tǒng)的需求,從根級(jí)設(shè)計(jì)、制造的專有應(yīng)用程序芯片,其計(jì)算能力和計(jì)算效率可根據(jù)算法需要進(jìn)行定制,是固定算法最優(yōu)化設(shè)計(jì)的產(chǎn)物。

目前,ASIC在通信領(lǐng)域、圖像與視頻處理、汽車電子、醫(yī)療設(shè)備、人工智能等領(lǐng)域都有廣泛應(yīng)用。


類腦計(jì)算芯片(Neuro-inspired computing chips)就是用電路模擬人腦神經(jīng)網(wǎng)絡(luò)架構(gòu)的芯片,它結(jié)合微電子技術(shù)和新型神經(jīng)形態(tài)器件,模仿人腦神經(jīng)系統(tǒng)計(jì)算原理進(jìn)行設(shè)計(jì),實(shí)現(xiàn)類似人腦的超低功耗和并行信息處理能力。

作為新一代的人工智能處理器,類腦芯片具有并行計(jì)算、低功耗設(shè)計(jì)和自適應(yīng)學(xué)習(xí)等特點(diǎn),為人工智能領(lǐng)域帶來(lái)了許多新的機(jī)遇。目前,在模式識(shí)別與圖像處理、自動(dòng)機(jī)器人、大數(shù)據(jù)分析、醫(yī)學(xué)與生物科學(xué)研究等領(lǐng)域,類腦芯片具有巨大的潛力,將推動(dòng)人工智能技術(shù)的更大突破和進(jìn)步。

華福證券認(rèn)為,隨著AI、HPC等高算力需求日新月異,作為算力載體的高性能芯片的需求也隨之水漲船高。然而,先進(jìn)制程的進(jìn)階之路已困難重重,一方面,摩爾定律迭代進(jìn)度的放緩使芯片性能增長(zhǎng)的邊際成本急劇上升;另一方面,受限于光刻機(jī)瓶頸,前段制程的微縮也愈發(fā)困難。在此背景下,先進(jìn)封裝因能提升芯片的集成密度與互聯(lián)速度、降低芯片設(shè)計(jì)門檻,并增強(qiáng)功能搭配的靈活性,故而已成為超越摩爾定律、提升芯片系統(tǒng)性能的關(guān)鍵途徑。

02

Chiplet面臨機(jī)遇與挑戰(zhàn)


隨著摩爾定律走到極限,Chiplet被行業(yè)普遍認(rèn)為是未來(lái)5年算力的主要提升技術(shù)。

半導(dǎo)體產(chǎn)業(yè)縱橫介紹,Chiplet俗稱芯粒,也叫小芯片,它是將一類滿足特定功能的die(裸片),通過die-to-die內(nèi)部互聯(lián)技術(shù)實(shí)現(xiàn)多個(gè)模塊芯片與底層基礎(chǔ)芯片封裝在一起,形成一個(gè)系統(tǒng)芯片,以實(shí)現(xiàn)一種新形式的IP復(fù)用。簡(jiǎn)單來(lái)說(shuō),可以理解為將每個(gè)小的芯片用“膠水”縫合在一起,形成一個(gè)性能更強(qiáng)的大芯片。

去年,大部分廠商或許還沉浸在Chiplet技術(shù)的未來(lái)應(yīng)用上,如今Chiplet已經(jīng)成為各大廠商的產(chǎn)品中的必選角色。英特爾、AMD、英偉達(dá)都在自家的CPU、GPU上使用了Chiplet技術(shù),這將Chiplet推入了一個(gè)全新的商業(yè)化階段。

圖片


總體來(lái)看,Chiplet有四大優(yōu)點(diǎn)

[敏感詞],通過將功能塊劃分為小芯片,那么不需要芯片尺寸的持續(xù)增加。這就提高了良率并簡(jiǎn)化了設(shè)計(jì)和驗(yàn)證的流程。

第二,每個(gè)小芯片是獨(dú)立的,那就可以選擇[敏感詞]工藝。邏輯部分可以采用[敏感詞]工藝制造,大容量SRAM可以使用7nm左右的工藝制造,I/O和外圍電路可以使用12nm或28nm左右的工藝制造,這就大大降低了制造的成本。

第三,組合多樣,適合定制化,輕松制造衍生類型。比如說(shuō)采用相同的邏輯電路但是不一樣的外圍電路,或相同外圍電路但不同的邏輯電路。

第四,不同制造商的小芯片可以混合使用,而不僅僅是局限在單個(gè)制造商內(nèi)。

這些特點(diǎn)都非常適合用在大算力芯片上。相較于傳統(tǒng)消費(fèi)級(jí)芯片,算力芯片面積更大,存儲(chǔ)容量更大,對(duì)互連速度要求更高。采用Chiplet既可以降低成本提升良率,又可以允許更多計(jì)算核心的“堆料”,還能便于引入HBM存儲(chǔ)。

不過,目前的Chiplet仍存在一些門檻問題。電子發(fā)燒友網(wǎng)指出,Chiplet在成本、開放生態(tài)等方面仍面臨挑戰(zhàn)。目前基本只有大公司才用到這一先進(jìn)技術(shù),且主要集中在通信、大規(guī)模數(shù)據(jù)處理等領(lǐng)域,反倒是設(shè)計(jì)周期長(zhǎng)的汽車、成本敏感的消費(fèi)電子和可靠性要求高的工業(yè)領(lǐng)域,比較缺乏Chiplet設(shè)計(jì)的參與。

如今的Chiplet并沒有大規(guī)模普及,尤其是在某些基于成熟工藝的芯片設(shè)計(jì)上,還是因?yàn)殚T檻問題。先進(jìn)封裝的成本還沒有降低到設(shè)計(jì)公司可以考慮Chiplet方案的程度,這些較高的門檻阻止了Chiplet的普及。在設(shè)計(jì)公司看來(lái),行業(yè)需要像現(xiàn)在的云服務(wù)一樣,打造一個(gè)多供應(yīng)商、多選擇和開放的生態(tài),這樣才能徹底發(fā)揮Chiplet用于降低設(shè)計(jì)成本、提高綜合性能的優(yōu)勢(shì)。

03

高性能多模態(tài)AI大模型

NPU+CPU異構(gòu)解決方案


當(dāng)前,大模型的應(yīng)用如日中天,其使用場(chǎng)景正在從云端迅速向邊緣端延伸。不論是在云端還是邊緣端,CPU與NPU之間更加緊密的互聯(lián)集成,已成為新一代AI計(jì)算硬件發(fā)展的顯著趨勢(shì)。AI PC等新穎概念和產(chǎn)品的涌現(xiàn),正是這一趨勢(shì)的生動(dòng)體現(xiàn)。得益于Chiplet技術(shù)和先進(jìn)封裝技術(shù)的快速發(fā)展,CPU與NPU的集成得以實(shí)現(xiàn)更高的帶寬、更出色的靈活性,同時(shí)降低了研發(fā)成本,縮短了研發(fā)周期。

近日,原粒半導(dǎo)體與超摩科技攜手宣布達(dá)成戰(zhàn)略合作,雙方將圍繞原粒半導(dǎo)體領(lǐng)先的高性能NPU Chiplet產(chǎn)品與超摩科技的高性能CPU Chiplet產(chǎn)品,共同致力于開發(fā)集高性能與高集成度于一身的多模態(tài)AI大模型解決方案

超摩科技成立于2021年,是高性能Chiplet設(shè)計(jì)的先行者與領(lǐng)導(dǎo)者,專注于通用Chiplet CPU及高性能Chiplet互聯(lián)解決方案。超摩科技提供基于從智算中心、數(shù)據(jù)中心、邊緣計(jì)算、數(shù)據(jù)網(wǎng)絡(luò)通信、自動(dòng)駕駛等領(lǐng)域的系列高性能Chiplet解決方案。

歷經(jīng)三年產(chǎn)品打磨,超摩科技已成為國(guó)內(nèi)高性能Chiplet互聯(lián)解決方案的主力方案商,產(chǎn)品得到客戶認(rèn)可,已有眾多客戶導(dǎo)入量產(chǎn)并形成規(guī)模營(yíng)收,商業(yè)已達(dá)成落地閉環(huán)。下一步,超摩科技將推動(dòng)高性能CPU Chiplet產(chǎn)品持續(xù)商業(yè)落地,助力產(chǎn)業(yè)新的價(jià)值成長(zhǎng)。

目前,原粒半導(dǎo)體與超摩科技已經(jīng)對(duì)雙方的AI Chiplet和CPU Chiplet產(chǎn)品的互聯(lián)適應(yīng)性進(jìn)行了驗(yàn)證,雙方將聯(lián)合開發(fā)推出高性能、高靈活性、高性價(jià)比的AI大模型解決方案,市場(chǎng)前景廣闊,眾多行業(yè)客戶對(duì)此方案表現(xiàn)出濃厚的興趣。

超摩科技創(chuàng)始人兼CEO范靖認(rèn)為,AI大模型當(dāng)前的形勢(shì)十分活躍且富有潛力。在政策、技術(shù)和市場(chǎng)的三重驅(qū)動(dòng)下,AI大模型產(chǎn)業(yè)得到了快速發(fā)展。原粒半導(dǎo)體的AI Chiplet憑借領(lǐng)先的技術(shù)實(shí)力和獨(dú)特的產(chǎn)品定位,能夠?yàn)閺V大客戶提供卓越的高性能通用AI Chiplet解決方案。雙方的合作將推動(dòng)AI大模型CPU+NPU的高性能異構(gòu)解決方案邁向新的高峰,為行業(yè)帶來(lái)更多的價(jià)值創(chuàng)新與突破。


04 
—————— 大算力芯片,正在擁抱Chiplet ——————


首先來(lái)看AMD,AMD是選擇Chiplet最積極的廠商之一


在2019年的時(shí)候,AMD就初次嘗試了Chiplet封裝,將不同工藝節(jié)點(diǎn)的CPU內(nèi)核且I/O規(guī)格不同的芯片封裝在一起,顯著提高了能效和功能。
之后,AMD又發(fā)布了實(shí)驗(yàn)性產(chǎn)品,即基于3D Chiplet技術(shù)的3D V-Cache。使用的處理器芯片是Ryzen 5000,采用臺(tái)積電3D Fabric先進(jìn)封裝技術(shù),成功地將包含有64MB L3 Cache的Chiplet以3D堆疊的形式與處理器封裝在了一起。
從數(shù)據(jù)性能來(lái)看,采用3D Chiplet的原型芯片將性能平均提高了12%。從這一點(diǎn)上,也能看到3D Chiplet對(duì)實(shí)際工作負(fù)載的提升有實(shí)質(zhì)性的貢獻(xiàn)。

不止在CPU,AMD在GPU方面也選擇了Chiplet技術(shù)。目前,AMD發(fā)布的[敏感詞]MI300系列芯片時(shí),同樣采用Chiplet技術(shù),8個(gè)GPU Chiplet加4個(gè)I/O內(nèi)存Chiplet的設(shè)計(jì),總共12個(gè)5nm Chiplet封裝在一起,使其集成的晶體管數(shù)量達(dá)到了1530億,高于英偉達(dá)H100的800億晶體管。這款芯片在推出時(shí),也是打出了對(duì)標(biāo)英偉達(dá)H100的口號(hào)。

此外,AMD含Chiplet技術(shù)的CPU銷量占比也在不斷提高。根據(jù)德國(guó)電腦零售商Mindfactory數(shù)據(jù),2021年10月至2022年12月間AMD CPU的銷量中,含Chiplet技術(shù)的CPU銷量占比不斷提高,從約80%上升至約97%。

圖片 

再來(lái)看英特爾。英特爾的首次推出基于Chiplet設(shè)計(jì)的處理器是Sapphire Rapids,時(shí)間在2023年1月。
具體來(lái)看,通過兩組鏡像對(duì)稱的相同架構(gòu)的building blocks,組合4個(gè)Chiplets,獲得4倍的性能和互聯(lián)帶寬。每個(gè)基本模塊包含計(jì)算部分(CHA & LLC & Cores mesh, Accelerators)、memory interface部分(controller, Ch0/1)、I/O部分(UPI,PCIe)。通過將上述高性能組件組成基本的building block,再通過EMIB技術(shù)進(jìn)行Chiplet互聯(lián),可以獲得線性性能提升和成本收益。
最后,來(lái)看英偉達(dá)。英偉達(dá)坐穩(wěn)GPU領(lǐng)域霸主這一點(diǎn)毋庸置疑,而霸主英偉達(dá)在今年推出的“最強(qiáng)”GPU B200也同樣采用Chiplet技術(shù)。GB200超級(jí)芯片是由2顆B200 GPU和1顆Arm架構(gòu)的Grace CPU(中央處理器)組合而來(lái)。
由此可見,英特爾、AMD、英偉達(dá)都在自家的CPU、GPU上使用了Chiplet技術(shù)。這將Chiplet推入了一個(gè)全新的商業(yè)化階段。
Chiplet這一錘,算是重重砸下了。

Chiplet從CPU到GPU

在之前傳統(tǒng)的GPU也是由一個(gè)中央工作負(fù)載處理器,將渲染任務(wù)發(fā)送到芯片內(nèi)的多個(gè)著色器塊之一。每個(gè)單元都被賦予一塊幾何體來(lái)處理、轉(zhuǎn)換為像素,然后對(duì)它們進(jìn)行著色。

后來(lái)AMD發(fā)現(xiàn),Chiplet 用在CPU上效果很好,并且降低了制造成本。于是在GPU上也選擇了放棄中央處理器,用多個(gè)小芯片取代單個(gè)硅塊,每個(gè)小芯片處理自己的任務(wù)。渲染指令以稱為命令列表的長(zhǎng)序列發(fā)送到 GPU,其中所有內(nèi)容都稱為繪制調(diào)用。

圖片AMD 2019年Chiplet專利

該文件于 2019 年 6 月發(fā)布,即提交近兩年后,該功能已在 RDNA 2 中實(shí)現(xiàn)。AMD 于 2020 年開始推廣該架構(gòu),并于同年 11 月推出了[敏感詞]配備全新 RT-texture 處理器的產(chǎn)品。

圖片不同制程及封裝技術(shù)下的芯片良率、成本、面積的關(guān)系 注:D為缺陷密度,c為負(fù)二項(xiàng)分布中的集群參數(shù)或Seed’s model中臨界值數(shù)量

摩爾定律沒死,但確實(shí)是老了,在14nm之后成本曲線就變了。5nm工藝的成本相比7nm工藝增長(zhǎng)了近1倍,3nm工藝相比5nm工藝預(yù)計(jì)將增長(zhǎng)近1倍。在半導(dǎo)體工藝、規(guī)模限制越來(lái)越大的情況下,傳統(tǒng)大芯片的策略確實(shí)是寸步難行。

圖片

免責(zé)聲明:本文采摘自“大印藍(lán)海科技”公眾號(hào),本文僅代表作者個(gè)人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識(shí)產(chǎn)權(quán),轉(zhuǎn)載請(qǐng)注明原出處及作者,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。

logo

服務(wù)熱線

0755-83044319

霍爾元件咨詢

肖特基二極管咨詢

TVS/ESD咨詢

獲取產(chǎn)品資料

客服微信

微信服務(wù)號(hào)

主站蜘蛛池模板: 网曝门精品国产事件在线观看| 国产一区精品视频| 国产成人综合自拍| 国产第一亚洲| 在线观看精品91老司机| 香蕉免费在线视频| 日本高清不卡视频| 久久亚洲私人国产精品va| 激情综合网五月激情| 国产不卡网| 中文字幕影院| 特级毛片s级全部免费| 欧美123| 久草视频在线免费播放| 国产精品久久久久久久久99热| 综合网色| 午夜看一级特黄a大片| 前任4在线观看| 精品哟啊呦v视频在线观看| 国产成人精品视频免费大全| 综合色播| 四虎精品影院4hutv四虎| 欧美日本三级| 精品在线小视频| jizz中国妇女| 亚洲精品一区二区三区婷婷| 日本叼嘿| 精品日产| 操美女模特| 亚洲精品视频观看| 欧美专区亚洲| 久久se精品一区二区影院| 成人欧美一区在线视频在线观看| 伊人a.v在线| 四虎免费在线| 久久综合给合久久狠狠狠色97| 国产系列欧美系列日韩系列在线| 99热这里只有精品国产在热久久| 亚洲国产视频一区| 秋霞伊人| 久久99精品久久久久久噜噜丰满|
请您留言

感谢您的关注,当前客服人员不在线,请填写一下您的信息,我们会尽快和您联系。

提交