Go 程序的持續分析

Go 程序的持續分析

編譯自: https://medium.com/google-cloud/continuous-profiling-of-go-programs-96d4416af77b

譯者: geekpi

Google 最有趣的部分之一就是我們規模龐大的持續分析服務。我們可以看到誰在使用 CPU 和內存,我們可以持續地監控我們的生產服務以爭用和阻止配置文件,並且我們可以生成分析和報告,並輕鬆地告訴我們可以進行哪些有重要影響的優化。

我簡單研究了 Stackdriver Profiler ,這是我們的新產品,它填補了針對雲端用戶在雲服務範圍內分析服務的空白。請注意,你無需在 Google 雲平臺上運行你的代碼即可使用它。實際上,我現在每天都在開發時使用它。它也支持 Java 和 Node.js。

在生產中分析

pprof 可安全地用於生產。我們針對 CPU 和堆分配分析的額外會增加 5% 的開銷。一個實例中每分鐘收集 10 秒。如果你有一個 Kubernetes Pod 的多個副本,我們確保進行分攤收集。例如,如果你擁有一個 pod 的 10 個副本,模式,那麼開銷將變為 0.5%。這使用戶可以一直進行分析。

我們目前支持 Go 程序的 CPU、堆、互斥和線程分析。

為什麼?

在解釋如何在生產中使用分析器之前,先解釋為什麼你想要在生產中進行分析將有所幫助。一些非常常見的情況是:

  • 調試僅在生產中可見的性能問題。
  • 瞭解 CPU 使用率以減少費用。
  • 瞭解爭用的累積和優化的地方。
  • 瞭解新版本的影響,例如看到 canary 和產品級之間的區別。
  • 通過 關聯 分析樣本以瞭解延遲的根本原因來豐富你的分佈式經驗。

啟用

Stackdriver Profiler 不能與 net/http/pprof 處理程序一起使用,並要求你在程序中安裝和配置一個一行的代理。

go get cloud.google.com/go/profiler

在你的主函數中,啟動分析器:

if err := profiler.Start(profiler.Config{

Service: "indexing-service",

ServiceVersion: "1.0",

ProjectID: "bamboo-project-606", // optional on GCP

}); err != nil {

log.Fatalf("Cannot start the profiler: %v", err)

}

當你運行你的程序後,profiler 包將每分鐘報告給分析器 10 秒鐘。

可視化

當分析被報告給後端後,你將在 https://console.cloud.google.com/profiler 上看到火焰圖。你可以按標籤過濾並更改時間範圍,也可以按服務名稱和版本進行細分。數據將會長達 30 天。

你可以選擇其中一個分析,按服務,區域和版本分解。你可以在火焰中移動並通過標籤進行過濾。

閱讀火焰圖

Brendan Gregg 非常全面地解釋了火焰圖可視化。Stackdriver Profiler 增加了一點它自己的特點。

Go 程序的持續分析

我們將查看一個 CPU 分析,但這也適用於其他分析。

  1. 最上面的 x 軸表示整個程序。火焰上的每個框表示調用路徑上的一幀。框的寬度與執行該函數花費的 CPU 時間成正比。
  2. 框從左到右排序,左邊是花費最多的調用路徑。
  3. 來自同一包的幀具有相同的顏色。這裡所有運行時功能均以綠色表示。
  4. 你可以單擊任何框進一步展開執行樹。
Go 程序的持續分析

你可以將鼠標懸停在任何框上查看任何幀的詳細信息。

過濾

你可以顯示、隱藏和高亮符號名稱。如果你特別想了解某個特定調用或包的消耗,這些信息非常有用。

Go 程序的持續分析

  1. 選擇你的過濾器。你可以組合多個過濾器。在這裡,我們將高亮顯示 runtime.memmove。
  2. 火焰將使用過濾器過濾幀並可視化過濾後的框。在這種情況下,它高亮顯示所有 runtime.memmove 框。

via: https://medium.com/google-cloud/continuous-profiling-of-go-programs-96d4416af77b


分享到:


相關文章: