02.28 FPGA最有影響力的25個研究成果 – 系統架構篇

很多世界頂尖的“建築師”可能是你從未聽說過的人,他們設計並創造出了很多你可能從未見過的神奇結構,比如在芯片內部的複雜體系。製造芯片的基本材料源於沙子,但芯片本身已經成為人們當代生活不可或缺的東西。如果你使用手機、電腦,或者通過互聯網收發信息,那麼你就無時無刻不在受益於這些建築師們的偉大工作。

FPGA是芯片的其中一種,從上世紀八十年代誕生起,FPGA已經從簡單的可編程門陣列,發展成為了有著大量可編程邏輯的複雜片上系統。除了硬件結構之外,FPGA的開發工具和應用場景也都取得了長足的進步和擴展,FPGA在整個半導體行業的重要性也在不斷增強。FPGA芯片的演進,離不開這些“建築師”的不斷髮明創造。

幾年前,這些FPGA的頂級建築師們選出了自上世紀九十年代起的20年以來FPGA領域最有影響力的25個研究成果。通過這些重要的成果,我們會理解FPGA是如何發展至今,並且知道FPGA技術未來將會發展向何處。

這25個研究成果按研究領域分為架構、EDA工具、電路、應用等大類,每項成果都由一名該領域的頂級學者做推介。接下來,我將在幾篇文章裡,分別介紹這這些改變了FPGA發展進程的重要研究成果。本文是系統架構篇

(本文介紹的5項成果原文,均已上傳至知識星球:老石談芯進階版,請在文末掃碼進入星球查看)

1.FPGA與SIMD陣列的結合與統一

一句話總結:FPGA作為並行計算加速器的開山之作英文名:Unifying FPGAs and SMID Arrays作者:Michael Bolotski, André DeHon, Thomas F. Knight, Jr.發表時間:1994年推介人:Jonathan Rose(多倫多大學)

FPGA最有影响力的25个研究成果 – 系统架构篇

André DeHon(現任賓夕法尼亞大學教授)

這項成果在哲學的角度重新審視了FPGA這種計算“介質”,並將其與單指令多數據(SIMD)方法聯繫起來,以進行常規計算的並行加速。這個工作最早揭示了FPGA和SIMD這兩種計算方法如何被看成是一個連續的整體,並在某種意義上將二者結合和統一

這項成果提出了一種混合架構,名為“動態可編程門陣列(DPGA)”。在這種架構中,用來配置邏輯和佈線的比特流(bitstream)位於特殊設計過的本地存儲單元中,並會不斷的快速變化。在DPGA裡,有一箇中央上下文標識器(central context identifier),負責決定從本地內存中加載哪些配置,如下圖所示。

FPGA最有影响力的25个研究成果 – 系统架构篇

通過使用這種方法,使DPGA架構在某種程度上類似於SIMD。具體來說,如果這些本地內存裡的內容相同,那麼就會執行相同的“指令”;反之,如果本地內存中的內容不同,那麼每個處理單元就會各自為戰。這使得DPGA既可以並行處理數據,也可以串行處理數據。

此外,這項成果還對這種新的計算體系架構的成本和收益進行了深入的分析。

這項成果是關於DPGA的一系列富有影響力的成果的開山之作,也是第一批探討FPGA編程裡上下文的工作之一。雖然這種可編程架構並未成為業界主流,但它啟發了諸多後續的高質量工作,併為來者奠定了堅實的理論基礎。

2.一種高速的層次化同步可編程陣列

一句話總結:高性能、高時鐘頻率FPGA架構設計與時序優化算法的開創性探索英文名:HSRA: High-Speed, Hierarchical Synchronous Reconfigurable Array作者:William Tsu, Kip Macy, Atul Joshi, Randy Huang, Tony Tung, Omid Rowhani, Varghese George, John Wawrzynek, André DeHon發表時間:1999年推介人

:Carl Ebeling(華盛頓大學)

這項工作專注於解答這樣的一個問題:是否有可能設計一個FPGA架構,使其能和處理器或ASIC的時鐘頻率一較高下?

通常情況下,FPGA比CPU或ASIC的時鐘頻率要慢5到10倍,這主要受制於於FPGA內部的邏輯延時與互連延時。而這項工作則希望通過結合FPGA架構創新和CAD工具創新兩方面,使得FPGA的性能上升到一個新的臺階。

總體而言,這項工作採用的方法是根據特定的時鐘頻率設計系統架構。事實上,這與傳統的FPGA設計方法完全相左。然而通過這種方式,設計者可以精確的定義一個時鐘週期中邏輯層的數量、互聯和距離等,這樣可以得到一個包括可編程互聯在內的高度流水化的結構。

HSRA最新穎的地方在於它的樹形分層互聯結構,如下圖所示。這種架構允許連接通過點對點的方式完成,因此就可以得到任意兩點間的距離和延時。利用這些信息,就可以從時序的角度解決很多佈局和佈線問題。

FPGA最有影响力的25个研究成果 – 系统架构篇

另一方面,並不是所有設計都可以按照HSRA架構進行深度流水線優化。為了解決這個問題,這項工作創造性的採用了名為C-slowing的方法,通過在電路中引入額外的並行性,來處理和補償當設計中包含較大反饋時帶來的延時。C-slowing也在後來逐漸成為了retiming的主流方法之一。

綜上所述,這項工作在FPGA體系結構這個領域中開拓出了一個新的方向,那就是針對時序和高性能的FPGA架構設計。HSRA架構本身由於與傳統FPGA的差別太大,從而沒有在商業化的道路上走遠,但這個工作中的很多思路和方法,都對現代FPGA架構的演進產生了深遠的影響。

3.Virtex-II FPGA的動態功耗

一句話總結:現代FPGA動態功耗分析、建模與優化方法的開山之作英文名:Dynamic Power Consumption in Virtex-II FPGA Family作者:Li Shang, Alireza Kaviani, Kusuma Bathala發表時間:2002年推介人:Russ Tessier(馬薩諸塞大學)

在這項工作之前,很少有研究專門討論FPGA的功耗問題。因此,

這項成果為研究者深入理解FPGA的功耗、並進行功耗優化邁出了重要的第一步

關於功耗,業界一直假設互聯功耗是FPGA動態功耗的主要來源。這項工作通過實驗證明了這一假設是正確的。在對動態功耗的分析過程中,這項工作研究了FPGA中不同結構對功耗的影響,從而為後來針對功耗優化的CAD算法的出現提供了理論基礎。同時,通過仿真和物理實測,這項成果提出的功耗分佈結果是非常可信的,見下圖。

FPGA最有影响力的25个研究成果 – 系统架构篇

業界對於FPGA功耗優化的興趣始於大約十年之前,在當時FPGA的功耗優化剛剛成為僅次於面積和延時優化之外的另一個主要的優化方向。這項工作不僅提供了在FPGA上動態功耗的分佈結果,還為今後十年間的功耗分析和優化算法提供了詳細的方法論支持。

這項工作還是一個工業界與學術界緊密合作的典型代表。在這項工作中,賽靈思提供了FPGA器件的模型和數據集,並提供了先進的動態功耗分析方法和技術。由於學術界對Virtex II FPGA架構比較熟悉,因此不需要FPGA廠商公佈額外的機密信息,使得這項工作使用的方法論有著很強的通用性。

4.Stratix FPGA的佈線和邏輯架構

一句話總結:奠定五代Stratix核心架構的基石之作英文名:The Stratix Routing and Logic Architecture作者:David Lewis, Vaughn Betz, David Jefferson, Andy Lee, Chris Lane, Paul Leventis, Sandy Marquardt, Cameron McClintock, Bruce Pedersen, Giles Powell, Srinivas Reddy, Chris Wysocki, Richard Cliff, Jonathan Rose發表時間:2003年推介人:Herman Schmit(卡耐基梅隆大學)

FPGA最有影响力的25个研究成果 – 系统架构篇

Vaughn Betz(現任多倫多大學教授)

在過去的很多年中,由Jonathan Rose教授領導的多倫多大學團隊構建了名為VPR的FPGA設計工具套件,並用來設計和探索簡化過的FPGA系統架構和微架構。VPR包含FPGA後端設計的很多算法和流程,包含邏輯封裝、佈局和佈線等等,這使得很多的FPGA架構問題都可以藉助VPR進行量化分析。而這也使得多倫多大學成為了全球最重要的FPGA學術研究中心之一。

在1998年,Jonathan Rose教授創辦了一個名為RightTrack CAD的初創公司,其主旨就是將VPR進行商業轉化。與此同時,Altera也在努力改進他們的FPGA架構,以應對賽靈思成功的Virtex系列帶來的競爭。在2000年,Altera收購了RightTrack,並開發了Altera FPGA建模工具包(Modelling Toolkit),用來優化他們的第一代Stratix FPGA架構。

這項成果就詳細介紹了Stratix架構的技術細節,見下圖。更重要的是,它系統闡述了架構師在設計Stratix時所作決策的具體過程。這項工作證明了VPR所採用的定量分析方法同樣適用於分析實際的性能和設計指標,如FPGA的物理面積和關鍵路徑延時等。這些方法和工具已經被用於至少5代Stratix FPGA的設計。而這項工作也成功的展示了學術研究與工業界技術發展之間的緊密聯繫與合作。

FPGA最有影响力的25个研究成果 – 系统架构篇

5.量化FPGA與ASIC的區別

一句話總結:FPGA基準測試的標杆之作英文名:Measuring the Gap between FPGAs and ASICs作者:Ian Kuon, Jonathan Rose發表年份:2006推介人:Herman Schmit(卡耐基梅隆大學)

FPGA最有影响力的25个研究成果 – 系统架构篇

Jonathan Rose(現任多倫多大學教授)

自發表以來,這項工作已被引用超過1400次。它的最主要貢獻之一,就是對可編程性的成本進行了量化。這項工作表明,FPGA的核心面積要比一個標準的ASIC單元大40倍。對於所有致力於提升和改進FPGA架構的工作來說,這就是它們最主要的動力之一。

在這項工作之前,FPGA與ASIC之間大多數的比較都基於小型電路,並且傾向於比較FPGA與掩膜可編程門陣列(mask-programmable gate arrays)。在這種情況下,FPGA只消耗大概10倍的額外面積。然而,到了2006年,ASIC CAD工具已經得到了長足的發展和進步。基於可綜合的邏輯單元的ASIC設計已經成為了業界的常見選擇。

從客觀上講,這裡所說的40倍面積大小實際上不夠合理,因為這裡只考慮了FPGA核心區域的面積,同時很多邏輯和算術運算單元都沒有使用固化的乘法器幫助實現。在這項成果中,它根據電路中是否包含算術運算、內存單元、結構化邏輯以及寄存器,將待研究的基準電路集分成了四大類,見下圖。在包含邏輯單元和算術運算單元的電路設計中,如果FPGA架構裡包含固化的乘法器,那麼相比ASIC而言FPGA的面積會大28倍。

FPGA最有影响力的25个研究成果 – 系统架构篇

這項工作更重要的貢獻是向人們揭示了FPGA的架構特性(如固化的內存單元和DSP等)與基準測試結果的相關性。同時,這項工作深入分析了FPGA裡固化的邏輯結構對性能和成本的影響與關聯,而這也直接對現代FPGA的架構設計產生了深遠影響。在現代FPGA中,關於將哪些IP或邏輯電路採用硬核的方式實現已經成為了影響FPGA發展的重要命題。這與諸如LUT大小、佈線拓撲結構等傳統FPGA架構問題同樣重要。

在學術界,像這樣的基準測試工作總是充滿爭議的。因為它們要麼在比較時採用了不同的衡量標準,要麼對比較的標準進行了抽象,使得結果不具有擴展性和通用性。然而,這項成果為這類工作樹立了典範,它展示瞭如何客觀的做比較,以及如何細緻的描述比較的具體細節,這樣使得研究者可以從結果中得到自己的結論,並將這種思想應用到今後的研究工作中。

結語

這五個FPGA系統架構的重要工作,有的奠定了現代商用FPGA的基礎架構,如賽靈思的Virtex和Altera的Stratix,有的開創了FPGA作為並行硬件加速器的重要使用方向,有的統一了FPGA架構基準測試的規範和標準。更重要的是,這些工作所採用的方法論、思維方式、前瞻性與實用性的結合、以及嚴謹的治學態度,都為之後的學術和工業研究樹立了最高的典範。

(本文介紹的5項成果原文,均已上傳至知識星球:老石談芯進階版,請在文末掃碼進入星球查看)

(注:本文僅代表作者個人觀點,與任職單位無關。)

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第2233期內容,歡迎關注。

★半導體制造企業開啟軍備競賽

★高通射頻,前景幾何?

★康佳回應“1億顆芯片”質疑揭示了哪些信息?

“芯”系疫情|功率半導體|TWS|華為|存儲|Fab|MCU|小米


分享到:


相關文章: