中國芯首發硬核評測,全面揭祕龍芯3A4000處理器真實性能

在過年休假前一天,我收到了在寧美國度下單的龍芯3A4000主機。

關於這臺主機的來歷,我之前的文章已經提過了:

和國內大部分的國產處理器廠商不同,龍芯對愛好者群體還是很友好的。愛好者們真的可以買到採用龍芯處理器的產品。寧美國度、龍芯中科以及航天龍夢合作推出了面向開發者的龍芯3A4000主機,原價7800元的主機,賣給開發者的只要3900元。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

龍夢主板上的龍芯3A4000實拍(由龍芯愛好者 Windows1809提供)

我關注的重點,依然是龍芯3A4000處理器本身。

國產龍芯性能疑雲

在我拿到主機之前,網上已經流傳了關於3A4000處理器性能的一些評測。其中,看上去最專業的,是2019年12月28日知乎網友“原來如此”發佈的評測,根據他的評測,主頻1.8GHz的龍芯3A4000的SPEC CPU 2006性能只有整數13.5分,浮點13.3分。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

關於測試環境,知乎網友只是簡單的描述了一下:

1、龍芯整機:3A4000四核,1.8GHz,內存8G,SATA機械硬盤

2、飛騰整機:FT2000四核,2.6GHz,內存8G,SATA機械硬盤

對於編譯選項,只是簡單的說:“用的編譯開關是通用的”。知乎網友“原來如此”甚至都沒有說這兩臺整機的操作系統是什麼,也沒有說內存頻率是多少。


兩週以後,龍芯中科正式發佈了一個澄清聲明,對知乎上的評測進行了簡短的回應。在此,我截取其中一部分數據。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

龍芯中科給出了測試環境,雖然比知乎測試給的詳細一些,但幾個關鍵的細節問題還是被隱藏了:測試使用的編譯器是什麼編譯器,用了哪些選項,內存的頻率是多少?

既然我已經拿到了3A4000的主機,那麼我將用我的評測結果一步一步的告訴大家龍芯3A4000的性能究竟如何。

這一次,以我為準。

測試環境介紹

為了能夠獲得龍芯3A4000處理器的峰值性能,我嘗試了多個Linux操作系統,包括UOS,Loongnix,Debian,龍夢Fedora以及Linux From Scratch。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

寧美主機自帶的操作系統是UOS。在使用上,UOS我用起來很不習慣,所以我並沒有在UOS上進行測試。在UOS之外我安裝了Loongnix、龍夢版Fedora 28 、Debian、Linux From Scratch(LFS)這四個操作系統。

在操作系統內核的選擇上,我使用了由龍芯內核開發者flygoat提供的最新版的5.4內核。在該內核中,增加了處理器主頻調節功能,處理器的主頻可以提高到2.2GHz。

事實證明,龍芯3A4000是可以比較穩定工作在2.1GHz甚至2.2GHz的。我的主機曾經在2.2GHz主頻下連續運行了11天。 當然,這可能會導致處理器壽命減少,降低系統的穩定性,不推薦普通用戶長時間超頻使用。龍芯處理器的主頻已經穩穩的超過了2.0 GHz。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

2.2GHz下運行的龍芯3A4000

寧美主機的內存頻率為1600MHz,而且主機上只帶有一根內存條。

幸運的是,航天龍夢的工程師譚工提供了主板的新固件,內存頻率從1600MHz提高到了2400MHz。為了進一步提高系統的訪存性能,我自行購買了一根8GB DDR4 2666 MHz鎂光內存條,與原有的紫光內存一同組成雙通道。

測試表明,以上這些操作大大提高了主板的訪存性能。我使用Loongnix、Debian、龍夢Fedora28以及LFS系統進行了SPEC CPU 2006的測試。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

SPEC CPU 20006測試環境

在測試中,為了儘可能提高程序的性能,我對編譯器的優化選項進行了詳細的測試,摸索了對於每個項目最為合適的選項。

需要指出的是,在所有的這四種操作系統中,編譯器都缺少針對龍芯3A4000進行優化。儘管龍芯3A4000在去年12月24日發佈,但龍芯官方並沒有提供處理器的指令集手冊,也沒有提供針對3A4000的性能優化手冊。

目前,GCC編譯器中也沒有支持龍芯3A4000的一些黑科技,比如原子內存操作 (AMO),龍芯指令集擴展Loongson-EXT3等。希望龍芯能夠加快生態建設,主動向GCC等開源社區提供代碼,使愛好者能夠早日用上趁手的開發工具。

為了保證測試結果可靠,在每個操作系統上都進行了reportable的基準測試,即每個測試項目都要完整無誤的運行三遍,最後對每一項測試,選擇三次測試的中位數結果作為最終的測試成績,最後對所有的測試成績取幾何平均,作為最終的成績。

測試結果


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

過得去的浮點性能和整數性能

評價一個CPU的性能,可以用浮點和整數得分簡單評估。

從整數性能來看,Debian、龍夢Fedora,LFS、Loongnix系統下的SPEC CPU 2006成績分別為19.2,19.9,19.7,16.9。

這表明FC28系統及其工具鏈能夠最好的的發揮出龍芯3A4000的性能。

原生的Loongnix操作系統存在諸多弊端,比如Loongnix 系統基於2014年11月發佈的Fedora 21,距今已經有5年多了,而且早已停止維護了。

Loongnix系統中默認的編譯器為GCC 4.9,太古老了,無法支持MSA指令。

當然,我相信龍芯中科的工程師手上有更適合龍芯3A4000的編譯器,但很遺憾作為普通愛好者我無法獲得這樣的編譯器。據傳龍芯中科準備對Loongnix進行升級,也許升級以後的Loongnix會稍微不那麼落後了吧!

從浮點性能來看,Debian、龍夢Fedora、LFS、Loongnix下的分數分別為18.0, 17.6,19.3,15.0分。

LFS系統明顯優於FC28、Debian等系統。可能有兩個原因:第一,LFS系統構建時針對GS464E處理器核進行了優化,使各種庫函數速度有所提升;第二,龍芯3A4000的浮點數標準為IEE-754-2008,而Debian和FC28系統的浮點標準是針對IEEE-754-1985。

和Debian操作系統相比,LFS系統可以針對龍芯3A4000做更多的優化。比如,在編譯軟件的時候,可以默認開啟針對GS464E處理核的優化選項,並指定浮點NAN=2008。Loongnix系統下的測試成績依然是最低的。

以上的基準測試成績,距離龍芯官方的成績21分/2GHz還有一些差距。畢竟,作為愛好者,我無法獲得針對龍芯處理器的最優的編譯器,只能使用操作系統內置的GCC編譯器和數學庫,大概只能做到這個程度了。

不提升工藝做到了相較前代性能翻倍,和Intel還差多少?

和上一代龍芯3A3000相比,龍芯3A4000確確實實做到了性能翻倍。那麼,和Intel的主流處理器相比,龍芯3A4000還有多大差距?

我手上只有一個使用七代i5的Intel主板。

作為對比,我在i5-7200U處理器上運行了SPEC CPU 2006測試。由於時間有限,我沒有對i5-7200U處理器上的SPEC CPU 2006測試做過多的優化, 只加了-O3 -march=native兩個選項,因為即使這樣,i5-7200U可以比龍芯3A4000處理器更強。


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能


中國芯首發硬核評測,全面揭秘龍芯3A4000處理器真實性能

和龍芯3A3000處理器相比,龍芯3A4000真正做到了性能翻倍。

不更新工藝,而硬生生靠著對處理器核的優化改進而取得如此巨大的進步,這個成績非常了不起!

仔細查看每一個測試項目,你會發現在有些測試項目中,龍芯3A4000的速度超過了3A3000的三倍,比如hmmer測試,3A4000的速度是3A3000的3.6倍,這是因為龍芯3A4000的向量指令在發揮作用。

和Intel i5-7200U處理器相比,龍芯3A4000處理器性能還有很大的差距。

從測試結果可以看到,3A4000處理器單核整數性能只有i5-7200U的60%, 浮點性能只有後者的50%。考慮到Intel i5-7200U睿頻頻率高達3.1GHz,處理器的每GHz性能為整數10.64分,浮點12.6分;GS464V處理器核的同主頻性能已經能夠達到i5-7200U處理器的80%~90%了。

需要承認的是,這種測試方法並不嚴謹,因為我在Intel處理器下並沒有使用最優的編譯器以及最優的編譯選項。

3A5000很可能再次實現性能翻倍!

經過數年的努力研發,龍芯公司新發布的龍芯3A4000處理器在性能上有了很大的進步。

在繼續使用28納米工藝的前提下,和3A3000處理器相比,龍芯3A4000處理器主頻從1.5GHz提升到了2 GHz以上,綜合性能提高了一倍,SPEC CPU 2006成績從10分提高到了20分。龍芯處理器的訪存性能從3A3000的10GiB/s提升到了3A4000的18GiB/s。

在此,提前預測下3A5000處理器的性能。

既然3A4000能夠穩定運行在2.2GHz主頻下,我大膽的推測採用臺積電12納米工藝流片的3A5000能夠穩定的運行在2.8GHz以上的主頻下。3A5000的SPEC CPU 2006分數將從21分/2GHz,提高到30分/2.8 GHz,與Intel、AMD的差距將會進一步縮小。

同時,我們依然需要看到,龍芯處理器在生態建設上還有很長的路要走。編譯器、操作系統、應用軟件等基礎設施都需要進行建設。

龍芯選擇了一條少有人走的路,祝福龍芯能夠走通這條路。也許,在不久的將來,我們就能夠用著龍芯inside的筆記本、臺式機、手機來工作、娛樂、生活了。

致謝

在本測評的進行中,得到了很多龍芯愛好者的支持。航天龍夢孫海勇老師提供了LFS系統,航天龍夢譚工提供了實驗版的龍夢主板固件,龍芯內核開發者flygoat、陳華才等提供了帶有超頻功能的5.4版linux內核。龍芯愛好者Windows1809提供了龍芯3A4000實拍照片。特此致謝!


分享到:


相關文章: