865有沒有990好?哪個5G手機好?

鑽石眼淚69452017


先說製程

臺積電N7P是不如N7+的,前者是第二代DUV改進,後者是第一代EUV,按照臺積電線路圖,N7+相對N7P在紙面上最大擁有3%的同功耗性能優勢,或者同性能5%的功耗優勢

回到問題,首先得看盧偉冰這張圖到底有沒有問題

圖上我們可以看出來,盧偉冰的發言內容主要集中在這幾個方面

CPU架構,A77對A76

GPU性能,以GFX Bench曼哈頓3.1來說,一個90幀一個75幀

AI算力,以operation per second計算,一個15Tops,一個12Tops不到

內存,一個支持到LPDDR5,一個支持到LPDDR4X

wifi規格,一個支持到wifi6,一個支持到wifi5

基帶理論速率,一個支持到4.6Gbps,一個支持到2.3Gbps

這個問的是如何看待全面領先一代的說法,但是配的圖很顯然沒有描述出全面,有點像考完試拿出卷子給家長看,說我做題全面正確,實際上只是拿出來正確的題目一樣。

領先,你說的都對,但是全面領先一代,你如何證明你全面呢?

就得分析每一個項目的具體問題。

比如一個SOC,日常使用最多的部分就是CPU,GPU,基帶,外圍

外圍就包含ISP,DSP,NPU/APU/xx加速器這類機器學習的加速處理器,還有一些配套的藍牙,wifi,電源管理芯片等等的支持

這些部分都有各自的指標,比如CPU通常測試的指標就包含整數,浮點,混合,加密,壓縮,以及這些測試時的功耗數據,完成特定任務所消耗的能量數據,架構,緩存,緩存延遲,內存延遲等等來整體決定一個CPU的性能參數

GPU呢,一般是完成特定多種壓力多種條件的複雜渲染工作,例如GFX Bench數十個項目,3D Marks的幾個場景,安兔兔的GPU壓力場景等等測試,根據幀率,能耗,計算能效

扔在一起呢,還有功耗牆,整體能耗,待機耗電,電壓控制分配機制,頻率調整機制,調度機制,細節還有跟多諸如各家對於整數,浮點的優化等等。

但是大部分人能看懂的,能傳播出去的東西,太少了,你覺得我可能給CPU列一個三面的表格,GPU列一個兩面的表格,AI算力列一個兩面的表格,包含多批量多次測試的數據幾十個測試項目和95%CI區間讓你在幾百個項目裡面根據 不同的差異找到更好的東西?

不可能的。

所以廠商肯定會挑選出對自己有利的東西來宣傳,我們消費者要做的就是兩件事

瞭解這個宣傳點和我的實際需求點是不是對標的

瞭解這個宣傳是不是虛假宣傳或者糊弄我智商的

你是個科技愛好者,你肯定關注的是CPU性能功耗,GPU性能功耗

你是個拍照愛好者,你估計不在乎這個

你是個日常刷刷視頻看看新聞的人,你肯定關注低壓力下SOC的功耗,續航長不長

你是個遊戲愛好者,你肯定更關注GPU的性能功耗

先看A77吧

這是ARM的官方PPT,首先要明確一點,就是這些IC廠商買的IP核是沒有自主修改的權力的,再說一遍,是沒有隨便自己修改的權力的,你可以給ARM提要求做修改,比如讓核心偏重整數運算,偏重浮點運算,調整IPC調整最佳頻率區間等等

A76相對於A75,在製程從10nm提升到7nm,頻率從2.8Ghz提升到3.0Ghz後,SPEC2006的整數性能提升了35%,換算成IPC,忽略支撐提升絕對性能的因素,就是提升了26%,在排除掉製程對於性能的影響後,可以認為A75到A76的提升,類似於A77到A76的提升。

剛好這裡細節講一下A77的提升,這裡先看看華為方面的說法

以及官方說法

當然看完了官方的發言,我們看看事實是什麼樣的。

CPU

A77性能提升是怎麼來的?是通過微架構升級和IP核心的升級來的,而不是簡單增加功耗增加性能的超頻。

可以看到,A77架構在整數,浮點,GB4和內存測試中相對於同頻率的A76平均提升達到了25%,最大提升甚至接近35%

同時ARM依然可以保證峰值能效比維持不變。

換句話說,A77可以用更低的頻率更強的能耗比達到A76相同的性能。

在同一個SOC中,頻率(性能)和能耗的關係不是線性的,而是隨著頻率(性能)的提升,能耗指數級提升的提升,能耗指數級提升

這是9820的測試圖,可以看到三種核心,A75 A55 M4都遵從著類似的曲線,隨著輸出性能提升,功耗飆升,其斜率可以簡單類比為能耗比。

很顯然,性能提升根本不代表功耗就必須同步提升,A77架構相對於A76架構的提升,可以是在能耗比不變的前提下提升性能,或者在同性能下用更低的頻率換取更高的能耗比。

A77的整體架構如圖所示,黃色內是A77的升級部分,主要可以表述為以下幾點:

1,分支預測的帶寬翻倍,達到64B/週期,提早重獲L1中錯過的指令

2,新一代分支預測機制,增加分支預測精度

3,提升33%的分支目標緩衝器(BTB)容量,dL1的BTB直接四倍達到64路,單週期延遲

A76內本身是16路 nano BTB,64路micro BTB,直接提升到64路 L1 BTB

這是用於根據分支指令歷史狀態動態預測的東西

4,增加微操作緩存(macro-op cache),這個緩存在A77中被當做L0指令緩存,有效降低分支錯誤預測的週期延遲,大小1.5KB,ARM預測在正常工作負載下命中率85%以上

在解碼-寄存器重命名-分發-提交的階段

ARM耍了雞賊,在前面說的命中了macro-op cache的前提下,可以達到6指令/週期

相對於A76提升了50%,沒命中就和A76一樣了

執行階段,整數執行的帶寬提升50%,增加第二條分支,第四個ALU,並且額外增加了一個AES編碼流水線。

Load-Store單元,增加25%的in-flight數據,Store-data流水線翻倍,有了專門的發射口

L1L2和數據預取又雙叒叕性能增強了,多了動態管理並且增強了對於不同cache層級的預取,提升了性能。

還有些其他升級我看不懂的就不說了,小米這邊說A77比A76強,這是沒問題,但是具體調教,策略,應用,我們還不知道,但是對手這邊直接開始造謠A77性能強了功耗也高了所以沒啥區別 ,甚至

這就是吹啥不好非要侮辱粉絲智商了,

865工程機的性能都快頂出一半個格子了,又不是855時代36.87對33.97這樣的性能差異

在25%的性能差前提下,865工程機完成同樣任務消耗的能量是4728焦耳,對應990的消耗是4597焦耳,做到同樣的性能需要超頻25%,這時候功耗能不能維持住還是一個嚴肅的問題,更別說消耗能量的問題了,這裡就能看出A77顯著的優勢

但是要注意一點,865的CPU滿載功耗高達3.06w,雖然可以通過降低頻率達到略微強的性能和更低的功耗,但是在性能面前如何平衡這個功耗還是一個顯著的問題。

不過好在日常的工作都是固定總負載的情況,例如轉碼特定文件,解壓縮特定文檔,打開特定大小的軟件。

而固定即時負載的場景例如遊戲,主要考驗GPU性能,這裡後面說。

GPU

這部分就比較簡單了,直接有數據對比。

這裡直接引用A社的數據

Mate30Pro 4G的持續性能弱於主流855旗艦,但是峰值性能(不考慮過熱)是強於所有855旗艦的

和865差距在20%左右

國內微博貼吧測試和國外A社測試互相印證,也可以看到,990的GPU峰值性能強於855大約7%,持續性能則會因為降頻低於855。990 4G和5G之間沒有GPU的性能差異,能效比差距在5%左右,可能並沒有很好的發揮7nm 第一代EUV的能力,沒有達到理論的能效提升

而根據A社對於865工程機的測試,在峰值性能強約20%的前提下,峰值能效比865的GPU稍強於990 4G約10%,

華為這張圖是明顯的造謠了。

華為方面一直強調GFX Bench Aztec Ruin下的場景作為代表性能,實際上是因為ARM 的Mali系列GPU在Aztec Ruin這個場景所調用的一些計算中擁有優勢

和Adreno系列GPU差距最小。

AI

再來看看AI部分,首先看一下華為方面認為權威的ETH Zurich AI Benchmark,這是蘇黎世大學一個機器學習實驗室的研究員創立的測試網頁

可以看到現在的成績如圖所示

這也是華為方面判斷990 5G的AI性能遠超865的依據

但是根據上圖驍龍855和865平臺僅有12%的分數差異,完全不符合高通官方宣傳的AI性能提升一倍的承諾。

仔細看測試的權重可以發現

測試的絕大多數權重在FP16成績與定量計算分數

FP16指的是16位浮點數精度的張量計算

但是根據高通在865發佈會上關於平臺AI能力的描述和其他機構的研究可以發現

865平臺和蘋果A系列一樣,其機器學習相關開發套件和硬件優化的主要關注是int8的性能提升,也就是8位整數精度的張量計算性能提升,而在華為挑選的測試中,根本不測試int8的性能。

目前來說,因為精度不同,所以不同平臺之間的測試結果意義不大,但是如果都用Tops,也就是Trillion Operation Per Second 作為指標的話

865平臺的15Tops算力領先30% 問題不大,相對990 5G落後一倍的宣傳顯然是造謠式宣傳了。

基帶

基帶這方面其實也是爭議最大的點:

外掛還是集成

這個問題其實不好回答,因為大家第一代5G都是外掛基帶,但是後面都變成集成基帶了。

很顯然,因為成本(單片芯片面積變大,成本平方倍提升),技術(有限的面積內能不能塞下足夠的性能)和使用的規劃不一樣(比如高通要給蘋果提供5G基帶,因此這一代5G基帶必須外掛來滿足蘋果的需求,單獨再做一個旗艦5G基帶成本得不償失),在行業技術成熟以前,都只是互相取捨的選擇

例如990 5G集成的5G基帶,就去掉了毫米波功能,同時在5G上行下行的規格和4G基帶的規格上就做了閹割,性能甚至不及高通中端平臺765G所集成的基帶性能

Sub6G下 990 5G的集成基帶提供最大下行2.3Gbps,上行1.25Gbps的峰值速率

同樣Sub6G下 765G的集成基帶同樣提供最大2.3Gbps(3GPP R15下帶寬100Mhz提供最大2.34Gbps下載速度),上行1.25Gbps的峰值速度

但是在毫米波下765G的基帶支持400Mhz的帶寬,同時在LTE和5G NR的混合加速下可以達到3.7Gbps的最大下行速率和1.6Gbps的上行速率。

但是這也正是華為的取捨,在製程技術沒有理想的前提下,降低一定基帶性能將基帶集成到soc中,可以降低基帶和SOC的額外通訊成本,降低額外的能量浪費,同時減小一塊芯片,方便終端的主板設計。

這樣的缺點只有一個,就是可能導致熱量的堆積,所以這也一方面解釋了990 5G的5G基帶性能甚至不如前代的巴龍5000,兩個發熱大戶在一起可能扛不住獎牌。

而高通則更加追求極限性能,同時考慮到要外賣蘋果大量的X55基帶,因此並沒有和中端735G一樣集成一個性能閹割的基帶進去,而是直接外掛基帶,無形中增加了基帶和SOC通訊的額外成本,造成了終端主板設計的壓力和額外的耗電壓力。

但是需要注意的是,無論是製程也好,集成/外掛也好,其對性能的影響都是累積性而非壟斷性的,製程只能影響最終的性能/能效表現,同樣的集成外掛的取捨也僅僅是影響最終能效表現的因素,根據幾個因素是無法判斷最終結果的,需要等待實際測試。

很顯然,在基帶和製程上,有人又說了假話。

wifi6

這個爭議點也挺奇妙的,不知道為什麼華為方面一直在闡述自身在wifi6上的地位,但是就是不談wifi6本身

wifi6相對wifi5主要有三個提升,分別是

速率提升

設備續航提升

擁堵時性能提升

很顯然後面兩個功能被刻意忽視了

根據華為方面描述,麒麟990 5G配套的wifi套片擁有最大1.7Gbps的峰值下載速率,遠高於友商wifi6套片QCA6390在5Ghz下最大80Mhz帶寬支持的1.2Gbps

但是這看起來不太對

QCA6390的datasheet描述其支持的最大速率為1.774Gbps,因為在5Ghz下80Mhz帶寬卻支持1024QAM,而不是通常的256QAM,當然具體還要依靠實測決定。

但是在沒有得到具體終端,只能依靠data sheet判斷的前提下名正言順的歪曲數據,這不好。

但是說實在的,這些數字都是虛的,根本用不到最大速率,90% 的家庭wifi甚至沒有超過百兆,何談這些上Gbps的速率?

爭論點差不多結束了

兩者各有各的優勢,990集成度更好,體積更小,需要的能量更小,在手機狹小的空間裡,這種優勢很有實用,865性能更強,更好的cpu和gpu,處理器加基帶需要的能量更大,功耗更高。865旗艦機首選三星s20系列,不解釋,995的話首選p40系列。




攀枝花北緯26度


可以這麼說,在華為麒麟990面前,高通驍龍865已經徹底的淪為小弟(如圖)。

美國高通近日發佈的最新高端手機芯片驍龍865。作為明年的旗艦產品,在大家都這麼熱切期待的情況下,最終還是“掉了鏈子”。我估計還是由於體積,功耗,性能上無法兼顧,只能選擇外掛5G基帶芯片。

毫無疑問,就高通這種技術水平,在華為麒麟990面前,已徹底淪為小弟。

而國內眾多望眼欲穿,對高通寄予厚望的友商真是啞巴吃黃連,心裡苦啊。

在核心技術上的巨大差距讓我們的選擇不再困難,畢竟友商一直鼓吹的“芯片高於一切”論還猶在耳邊。


貧窮的本質


\n

{!-- PGC_VIDEO:{"thumb_height": 360, "vposter": "http://p0.pstatp.com/origin/2ef84000d8754e25aa962\

米斯特姚


性價比好的vivoiqoo pro,我也比較了好多。現在我也買了這款,各方面都挺好的,價格也是性價比高


分享到:


相關文章: