芯片面臨的新挑戰

隨著芯片打入汽車、雲計算和工業物聯網等市場,芯片的可靠性逐漸成為開發者關注的重要問題。事實也證明,隨著時間的推移,芯片想要達到目標的功能將會變得越來越難以實現。

在過去,芯片的可靠性一般被歸結為代工問題。那些專為電腦和手機設計的芯片可以在最高性能下正常使用平均兩到四年,兩到四年後,芯片功能開始下降,用戶升級到產品的下個版本,後者具有更多功能、更好的性能以及更長的待機時間。

但是隨著芯片打入新的市場或過去不太成熟的電子產品市場,如汽車、機器學習、物聯網(IoT)和工業物聯網(IIoT)、虛擬和增強現實、家庭自動化、雲、加密貨幣挖掘等,這不再是一個簡單的問題。

每個終端市場都有其獨特的需求和特點,影響芯片的使用方式和條件,而芯片的使用方式和條件又會對老化、安全等其它問題產生重大影響。考慮以下幾個問題:

  • 可靠性不再僅僅以年計量。用例正在發生巨大的變化。現在的汽車在90%到95%的時間是閒置的,但自動駕駛汽車可能只有5%到10%的時間在閒置。這會影響電子產品的架構和開發技術的潛在商業模式。

  • 隨著邊緣電子設備變得更加複雜,人們對功能性和「足夠好」的定義也有所不同。過去,如果無人機或機器人上的攝像頭被損壞或弄髒,通常會被換掉。但隨著邊緣設備中的電子產品變得越來越複雜,可以保證其有足夠功能的條件下,補償已破裂的攝像頭。另一方面,由於更嚴格的系統容差,在不太複雜的系統中可被接受的部分在複雜的系統中可能不會被接受。

  • 影響老化和質量建模的因素比過去更多。雖然其中一些在開發芯片時可能不明顯,但與在PCB上相比,一個已知良好的芯片與其它芯片封裝在一起時可能有不同的表現。

整個電子產品領域,用例(use cases)在發生變化。即使在數據中心內部也是如此,儘管歷史上在採用新技術和新方法時數據中心也非常保守。

Arm首席執行官Simon Segars說:「老化是時鐘速度和功耗的函數,過去在運行過程中偶爾會用到服務器,大部分時間它們處於閒置狀態。但當你轉移到雲端時,設計標準需要有所不同,因為這取決於其使用時間。這引發了很多關於如何設計可以延長壽命的問題。」

在千禧年開始的時候,服務器的平均利用率約為5%到15%,這一趨勢在20世紀90年代一直存在,因為IT管理人員為了避免設備故障,不願意在單個商品服務器上運行一或兩個應用程序。後來兩件事改變了這種情況,首先,能源成本開始上升,其次,也許更重要的是,為了使公司的IT部門而不是其設備部門負責其能源成本,公司進行了重組。這兩個因素都導致了虛擬化軟件銷售的猛增,以提高服務器的利用率,這意味著更少用來供電和降溫的服務器機架。

雲將這種運營效率提升到了更高的水平。雲操作的目的是通過平衡整個數據中心的計算作業來最大化利用率。這將數據中心內而不是一個機架上的所有服務器的利用率顯著提高,並可以在不需要時快速關閉它們。這種方法節約了能源,但卻對電子電路的退化和老化造成了很大影響。

Helic市場副總裁Magdy Abadir表示:「芯片正在加速老化從而發生故障。它們時鐘可能會缺失或發生額外的抖動,或是發生電介質擊穿。任何時候都有可能發生一件什麼事讓你擔心。在偶爾使用電子產品的時代許多老化模型是先進的,但現在芯片一直在運行,在芯片內部,模塊也在升溫,因此老化加速,而老化的芯片會出現各種奇怪的現象。許多公司目前還沒有修改他們的老化模型。他們假設這些設備可以持續三到四年,但它們可能很快就失效。考慮到從開始設計時的利潤就很小,老化可能將他們拋棄。」

在汽車領域芯片利用率趨勢也在發生變化,並且會持續到可以取代人類司機的全自動汽車出現的時候。汽車正在處理越來越多的數據,其中一些從雷達、激光雷達和照相機等傳感器流式傳輸而來。所有這些數據處理的時間都需要比過去更短,準確度更高,這些給電子設備帶來了巨大的壓力。

ADAS的首席技術專家Norman Chang說:「與過去的兩到五年不同,ADAS的可靠性至少為十五年。老化不僅僅指時間上的老化,也與負偏置溫度不穩定性(NBTI)、與熱量有關的電遷移率、靜電放電(ESD)和熱耦合有關。」

芯片面臨的新挑戰

雖然許多汽車一級供應商都構建可以承受極端溫度、機械震動和各種噪聲的芯片,但使用較長時間的先進節點CMOS從未有過這類壓力。許多業內人士證實,汽車製造商正在開發10 / 7nm芯片來管理所有這些數據,並在前沿節點工作,避免他們的設計過時,這些設計通常用於近幾代的汽車。問題在於實際數據非常少,無法證明隨著時間的推移,這些設備在任何環境條件下可以可靠運行。

Segars說:「你必須做不同的設計。有一種想法是,你將需要更少的汽車,因為它們不會一直處於閒置狀態。但另一派認為自動駕駛汽車將跑得越來越快,也將會快地磨損,最後所有東西都會磨損。挑戰在於,確保電子部件不會比機械部件先磨損,這就要求設計有所不同。這包括從嚴肅對待噪聲到減小峰值電流的所有事情。」

更薄的絕緣層,更薄的襯底

增加芯片可靠性的一個諷刺之處在於它與50年來半導體發展相矛盾,因為為了降低成本每兩年尺寸就會縮小,也就意味著更薄的電介質、更細的線以及更大的動態功,而且,襯底也會越來越薄。在最先進的節點工藝,這會導致更高的漏電流、更多的噪聲、更大的電遷移率和其它電學效應。

Fraunhofer EAS質量和可靠性的部門經理André Lange說:「從電路角度來看,你知道必須考慮工藝變化。但從設計功能的角度來看,這與處理系統中已知缺陷時可能發生什麼有關。如果你看一下自動汽車,有一箇中央處理單元來決定從哪個傳感器中使用哪些信息。其中一個可能會很髒或不能運行。」

這使退化模型變得更加複雜,因為它需要在系統環境中完成。Lange說:「許多情況都會導致電路退化,無論是NBTI還是指定面積上的更多缺陷,或是更大的工藝偏差。」他指出,一個很大的挑戰是確定導致缺陷的原因,而不是所有可用的龐大的數據。

芯片面臨的新挑戰

不同的方法

每個新的節點下工藝偏差都會增加。在過去的十年裡,智能手機推動了縮小路線圖(iPhone於2007年推出)的前進。現在,先進節點技術的最大用戶是用於數據挖掘、機器學習、AI和雲的服務器。

工藝偏差和可靠性之間的聯繫已有詳細的記錄,但偏差的存在使老化模型更難準確地建立。為解決這個問題,提出過許多不同的方法,從複雜的統計建模和仿真到將傳感器放在芯片上或對其進行封裝。

Synopsys 5nm相關的首席研發工程師Ralph Iverson說:「有熱源時,你必須使用本地和全球「隨機漫步」的方法來跟蹤溫度。隨機漫步的情況下,電壓是其周圍電壓的平均值,因此增量是零。」

這有助於建模,但據Iverson說中,在5nm及以下的工藝下,電阻率並不總是乾淨的。有表面效應存在,數據並不一定代表銅的連通,我們還需要更多的本地化數據來判斷。因此,混合類的方法開始出現,因為這種不確定性很難去抽象。

西門子商業公司Mentor的AMS產品營銷總監Mick Tegethoff表示:「汽車行業對雙極CMOS DMOS(BCD)進行了很好的調查,但我們也看到了對先進CMOS的要求和需求。我們看到了代工廠更多的興趣, EDA公司正在模擬壓力造成的 老化。這夠了嗎?任何一種建模都是對現實世界的近似,所以你要進行電路仿真,並儘可能構建一個可持續使用的芯片,但之後你需要進行物理測試或類似的事情,比如把它放在烤箱裡來製造物理壓力。現在有許多電子產品都要進行這種測試。」

模擬與數字

到目前為止,大多數老化/退化建模都集中在數字電路上。模擬為老化提供了一個不同的視角。

Moortec首席技術官Oliver King表示:「由於產品核心部件有領先的芯片,因此公司對老化和工藝偏差有很好的理解,所以它們不會盲目前進。模擬有許多可變的效應。數字芯片可能會不能使用,但對於模擬來說,它可能稍微不好或電路稍有缺陷,所以你必須對此進行調整。傳統模擬開發人員不像數字開發人員那樣推動幾何效應的增長。電遷移仍是一個問題,電流密度也是問題,但並沒有出現很多老化效應。儘管如此,芯片也需要更積極的維修,以及是否要採取行動。」

Rambus產品管理高級總監Frank Ferro觀點類似:「有了物理層(PHY),最大的挑戰是環境溫度。隨著溫度的升高,性能發生漂移,所以你需要重新校準。對於消費者來說,有「聖誕節測試」這種東西。在天冷的時候,你在車庫裡存放一臺Playstation或其他電子設備,然後在聖誕節早上開啟它,電路需要能夠從冷開始馬上運作。這與汽車或基站的存儲系統類似。老化會對這些系統產生影響,你需要重新校準系統來減弱這些影響。」

Ferro說,物理層經過與數字元件相同的資格認證,包括老化和電壓和溫度變化的測試。但物理層的設計目的是隨著這些變化而變化,這些很難被設計成數字電路,特別是在先進的節點工藝,先進的節點工藝下,margining對功率和性能有一定的影響。

模擬電路通常基於所謂的「任務概況」而設計。因此,自動駕駛汽車中的特定功能將代表為自動駕駛汽車IP設計的任務概況。

Cadence的IC和PCB部門高級營銷經理Art Schaldenbrand說:「我們看到的一個重要問題是,根據它們的運作方式,不僅有一種情況。設備失效有很多可能,所以我們看不同的壓力下什麼可能會失效。10%的設備偏置溫度不穩定性(BTI)可能會導致失效,但這是最糟糕的壓力。所以我們需要更好的方式來表達退化。finFET與平面器件的應力不同,所以需要模擬不同的現象。」

封裝和其他未知

隨著摩爾定律的減緩,越來越多的公司開始採用先進的封裝來提高性能,並提供更多的設計靈活性。目前為止,,如何對先進的包裝進行建模以確定壓力和老化尚不完全清楚。一部分原因在於,有很多的封裝可供選擇,沒有人能確定哪一個是最好的。還有一部分的原因在於,許多這些封裝都相對較新,封裝內部需要隨著時間去探究。

Helic Abadir說:「封裝層可能太靠近其他組件或來自另一側的應力。這需要建模。及時在其老化之前,它也必須建立其老化模型,因為效應在增多。所以放置方式尤其重要,如果你移動一下,那你就改變了共振頻率。沒有簡單的方法。你必須通過分析和設計,如果發現了問題,你可能需要移動。」

複雜設計中還有其他異常會隨著時間的推移影響可靠性。例如,一些使用模型可能比其他模型更頻繁地開啟和關閉電路,這會給電路帶來壓力。

Cadence高級軟件架構師Jushan Xie說:「如果有些東西閒置太久,就會與其它電路經歷不同的老化。設備越小,老化效應越強。壓力越大,老化越快。」

所有這些將如何處理尚不完全清楚。至少其中一些將涉及新材料和新技術。

Mentor電子產品市場經理John Parry表示:「對於電力電子產品,這推動了從硅基器件到碳化硅和氮化鎵(GaN)的轉變,這種器件可以以更高的開關頻率工作,具有更高的效率和更高的溫度。在某些應用中,在某些應用中,這可以使電力電子器件更靠近電機驅動器,從而進入更高溫度的環境。在其他情況下,半導體能夠承受更高的溫度意味著需要更少的冷卻。但是,半導體必須進行封裝,封裝也必須能夠承受較高的溫度。在新技術方面有巨大的投資,比如燒結銀用作芯片附著材料,不使用傳統的引線鍵合,所以IGBT等功率器件的封裝在材料、加工技術和設計方面經歷了巨大的變化。 ”

結論

隨著設計轉移到先進的節點或出於安全考慮新市場中使用時間的增加,老化、壓力和其他效應變得越來越成問題。

Fraunhofer的 Lange 說:「這取決於客戶今天提出的問題。談話的對象不同,他們的出發點不同,但問題的頻率有更大的。許多人只在開始,他們看到了更高的電壓和更高的溫度,並在進行一些實驗來推斷過應力。但瞭解退化如何影響整個電路更困難。 對於複雜的芯片還有很多工作要做。」

但隨著對它的重視,解決這些問題的投資也會增加。芯片設計師剛剛注意到退化建模和老化問題。 與十年前的功耗一樣,這一切都將改變。

原文鏈接:https://semiengineering.com/chip-aging-accelerates/


分享到:


相關文章: