程序員技術選型:寫Go還是Java?

老實說,我很喜歡 Java。我在 Spiral Scout 工作的那幾年,使用了 EJB2、DB2 和 Oracle 等後端技術,積累了很多軟件開發方面的專業知識。過去幾年,我轉向基於自然語言處理的機器人項目,涉及的技術包括 Spring Boot、Redis、RabbitMQ、Open NLP、IBM Watson 和 UIMA。一直以來,我選擇的語言是 Java,它一直很高效,有時還會覺得它很有趣。

初遇 Go

2017 年初,我接手了一個非常有趣的項目,一個用於監控和種植水培植物的自動化編程系統。項目的原始代碼裡包含了一個使用 CGo 開發的支持三個不同系統(Windows、MacOS 和 ARM)的網關。

因為對 Go 不熟悉,我一邊學習,一邊用它來實現功能。因為已有代碼庫的結構非常複雜,對我來說是難上加難。用 Go 開發的支持三種不同操作系統的程序意味著需要針對三種不同的系統進行部署、測試和運行維護。此外,代碼採用了單例設計模式,導致系統嚴重相互依賴,難以預測會出現什麼問題,而且難以理解。最後,我選擇使用 Java 來實現新版本,但最終也變得非常醜陋和令人困惑。

在加入 Spiral Scout 後,我嘗試停止使用 Java。我決定擁抱 Go,並儘可能多地使用 Go 來開發。我發現它是一種創新且全面的語言,我們的團隊現在仍然每天在各種項目中使用它。

但是,與任何一門編程語言一樣,Go 也有它的缺點,而且我不想撒謊——有時候我真的很想念 Java。

如果說我的編程經驗教會了我什麼,那一定是——軟件開發沒有銀彈。我將在這篇文章裡詳細分享我使用一門傳統語言和一門新語言的經歷。

簡潔性

Go 和 Java 都是 C 家族語言,所以它們具有相似的語法。因此,Java 開發人員可以很容易讀懂 Go 代碼,反之亦然。Go 不需要在語句末尾使用分號(’;’),只有少數情況例外。對我來說,Go 的行分隔方式更清晰,更易讀。

Go 和 Java 都使用了我最喜歡的功能之一,即垃圾收集器(GC),用來幫助防止內存洩漏。與 C++ 不同,C 家族的程序員需要處理內存洩漏問題。垃圾回收器是自動化內存管理的一個特性,減輕了程序員的負擔。

Go 的 GC 並未使用“弱世代假設”,但它的表現仍然非常出色,並且 STW(Stop-the-World)的時間非常短。在 1.5 版中,STW 降得更多,並且很穩定,而在 1.8 版中,它降到了 1 毫秒以下。

程序員技術選型:寫Go還是Java?

Go 的 GC 只有少量的一些選項,即用於設置初始垃圾回收目標百分比的 GOGC 變量。而 Java 有 4 個不同的垃圾回收器,每個垃圾回收器都有大量的選項。

儘管 Java 和 Go 都被認為是跨平臺的,但 Java 需要 Java 虛擬機(JVM)來解釋編譯後的代碼,而 Go 是將代碼編譯成目標平臺的二進制文件。但我認為,與 Go 相比,Java 對平臺的依賴程度更低,因為 Go 每次都需要為新平臺編譯二進制文件。從測試和 DevOps 的角度來看,分別為不同的平臺編譯二進制文件非常耗時,並且跨平臺的 Go 編譯在某些情況下不起作用,尤其是在使用 CGo 時。而對於 Java,你可以在安裝了 JVM 的任何地方使用相同的 jar。Go 需要的 RAM 更小一些,並且不需要安裝和管理虛擬機。

反射。Java 的反射更方便、更流行也更常用,而 Go 的反射似乎更復雜。Java 是一種面向對象的編程語言,因此除原始類型之外的所有東西都被視為對象。如果要使用反射,可以創建一個類,並從類中獲取所需的信息,如下所示:

<code>Class cls = obj.getClass(); Constructor constructor = cls.getConstructor(); Method[] methods = cls.getDeclaredFields();/<code>

這樣就可以訪問構造函數、方法和屬性,然後調用或對它們賦值。

Go 沒有類的概念,並且結構體只包含了已聲明的字段。因此,我們需要藉助“reflection”包來獲得所需的信息:

<code>type Foo struct {       A int `tag1:"First Tag"   tag2:"Second Tag"`       B string } f := Foo{A: 10, B: "Salutations"} fType := reflect.TypeOf(f) switch t.Kind(fType)     case reflect.Struct:                 for i := 0; i < t.NumField(); i++ {                       f := t.Field(i)                       // ...                 }     }/<code>

我覺得這不是一個大問題,但由於 Go 中沒有結構體的構造函數,所以很多原始類型必須單獨處理,並且需要考慮到指針。在 Go 中,我們可以進行指針傳遞或值傳遞。Go 的結構體可以將函數作為字段。所有這些都讓 Go 的反射變得更加複雜。

可訪問性。Java 有 private、protected 和 public 修飾符,為數據、方法和對象提供了不同的訪問作用域。Go 有與 Java 的 public 和 private 相似的 exported/unexported,但沒有修飾符。以大寫字母開頭的所有內容都將被導出,對其他包可見,未導出(小寫)的變量或函數僅在當前包中可見。

Go 與 Java 的大不同

Go 不是面向對象編程語言。Go 沒有類似 Java 的繼承機制,因為它沒有通過繼承實現傳統的多態性。實際上,它沒有對象,只有結構體。它可以通過接口和讓結構體實現接口來模擬一些面向對象特性。此外,你可以在結構體中嵌入結構體,但內部結構體無法訪問外部結構體的數據和方法。Go 使用組合而不是繼承將一些行為和數據組合在一起。

Go 是一種命令式語言,Java 是一種聲明式語言。Go 沒有依賴注入,我們需要顯式地將所有東西包裝在一起。因此,在使用 Go 時儘量少用“魔法”之類的東西。一切代碼對於代碼評審人員來說都應該是顯而易見的。Go 程序員應該瞭解 Go 代碼如何使用內存、文件系統和其他資源。

Java 要求開發人員更多地地關注程序的業務邏輯,知道如何創建、過濾、修改和存儲數據。系統底層和數據庫方面的東西都是通過配置和註解來完成的(比如通過 Spring Boot 等通用框架)。我們儘可能把枯燥乏味的東西留給框架去做。這樣做很方便,但控制也反轉了,限制了我們優化整個過程的能力。

變量定義的順序。在 Java 中,你可以這樣定義變量:

<code>String name;/<code>

而在 Go 中,你得這麼寫:

<code>name string/<code>

在我剛開始使用 Go 時,這也是令我感到困惑的一個地方。

Go 好的方面

簡單優雅的併發。Go 具有強大的併發模型,叫作“通信順序進程”或 CSP。Go 使用 n-to-m 分析器,允許在 n 個系統線程中執行 m 個併發。啟動併發例程非常簡單,只需使用 Go 的一個關鍵字即可,例如:

<code>go doMyWork()/<code>

這樣就可以併發執行 doMyWork()。

進程之間的通信可以通過共享內存(不推薦)和通道來完成。我們可以使用與環境變量 GOMAXPROCS 定義的進程數一樣多的核心,並帶來非常健壯和流暢的並行性。默認情況下,進程數等於核心數。

Go 提供了一種特殊模式來運行二進制文件,並可以檢測執行竟態條件。我們可以通過這種方式測試並證明自己的程序是不是併發安全的。

<code>go run -race myapp.go/<code>

應用程序將在競態檢測模式下運行。

Go 提供了很多開箱即用且非常有用的基本功能,例如用於併發的“sync”包。“Once”類型的單例可以這麼寫:

<code> package singleton import ("sync")type singleton struct { }var instance *singleton var once sync.Once func GetInstance() *singleton {      once.Do(func() {            instance = &singleton{}      })      return instance }/<code>

sync 包還為併發 map 實現、互斥鎖、條件變量和 WaitGroup 提供了一種結構體。 atomic 包支持併發安全轉換和數學運算——它們基本上是編寫併發代碼所需的一切。

指針。藉助指針,Go 可以更好地控制如何分配內存、垃圾回收器負載以及其他在 Java 中無法實現的性能調優。與 Java 相比,Go 更像是一種低級的語言,並且支持更容易、更快的性能優化。

鴨子類型(Duck Typing)。“如果它走路像鴨子,並且像鴨子一樣嘎嘎叫,那它一定就是鴨子”。在 Go 中就是這樣的:無需定義某種結構體是否實現了給定的接口,只要這個結構體具有與給定接口相同的方法簽名,那它就是實現了這個接口。這非常有用,作為代碼庫的調用端,你可以定義外部庫結構體所需的任意接口。而在 Java 中,對象必須顯式聲明實現了哪些接口。

性能分析器。Go 的性能分析工具讓性能問題分析變得便捷和輕鬆。Go 的分析器可以揭示程序的內存分配和 CPU 使用情況,並在可視化圖形中展示出來,讓性能優化變得非常容易。Java 也有很性能分析器,比如 Java VisualVM,但它們都比 Go 的複雜,而且依賴 JVM 的運行情況,因此它們提供的統計信息與垃圾回收器的運行相關。

CGO。Go 可以與 C 語言集成,因此你可以在 Go 項目中開發帶有 C 代碼片段的應用程序。開發人員可以使用 CGo 創建調用 C 代碼的 Go 程序包。Go 為 exclude/include 給定平臺的 C 代碼片段提供了各種構建選項。

將函數作為參數。Go 函數可以作為變量傳遞給另一個函數或作為結構體的字段。這種多功能性令人耳目一新。Java 8 引入了 lambda,但它們不是真正的函數,只是單函數對象。

清晰的代碼風格準則。Go 社區提供了很多示例和說明。

函數可以返回多個參數,這個也非常有用。

<code> package main import "fmt" func returnMany() (int, string, error) {       return 1, "example", nil }func main() {       i, s, err := returnMany()       fmt.Printf("Returned %s %s %v", i, s, err) }/<code>

Go 不好的方面

沒有多態性(除非通過接口來實現)。在 Go 中,如果在同一個包中有兩個函數具有不同的參數但含義相同,必須給它們指定不同的名字。例如這段代碼:

<code>func makeWorkInt(number int) {     fmt.Printf(“Work done number %d”, number) }func makeWorkStr(title string) {     fmt.Printf(“Work done title %s”, title) }/<code>

這樣一來,你就會得到很多方法,它們做的事情差不多,但名字都不一樣,而且看起來很“醜”。

另外,Go 也沒有繼承多態性。被嵌入到結構體裡的結構體只知道其自己的方法,對“宿主”結構體的方法一無所知。對於像我這樣的開發人員來說,這尤其具有挑戰性,因為我們是從其他 OOP 語言(最基本的概念之一就是繼承)過渡到 Go 的。

不過,隨著時間的推移,我開始意識到這種處理多態性的方法只是另一種思維方式,而且是有道理的,因為組合比繼承更加可靠,並且運行時間是可變的。

錯誤處理。在 Go 中,完全由你來決定返回什麼錯誤以及如何返回錯誤,因此作為開發人員,你需要負責返回和傳遞錯誤。毫無疑問的是,錯誤可能會被隱藏掉,這是一個痛點。時刻要記得檢查錯誤並把它們傳遞出去,這有點煩人,而且不安全。

當然,你可以使用 linter 來檢查隱藏的錯誤,但這只是一種輔助手段,不是真正的解決方案。在 Java 中,處理異常要方便得多。如果是 RuntimeException,甚至不必將其添加到函數的簽名中。

複製代碼

<code>public void causeNullPointerException() {     throw new NullPointerException("demo"); }/*...*/try {     causeNullPointerException(); } catch(NullPointerException e) {     System.out.println("Caught inside fun().");     throw e; // rethrowing the exception}/<code>

沒有泛型。雖然泛型很方便,但它會增加複雜性,而且從類型系統和運行時方面來看,泛型的成本很高。在構建 Go 代碼時,你需要處理各種不同的類型或使用代碼生成。

沒有註解。儘管可以用代碼生成替換一部分編譯時註解,但運行時註解是不能替換的。這是有道理的,因為 Go 不是聲明式的,並且代碼裡不應該包含任何“魔法”。我喜歡在 Java 中使用註解,因為它們讓代碼更優雅、簡單和簡約。

在為 HTTP 服務器端點生成 swagger 文件時,註解會非常有用。目前在 Go 中需要手動編寫 swagger 文件,或者為端點提供特別的註釋。每次 API 發生改動時,這都是一件很痛苦的事情。但是,Java 中的註解就像是一種魔法一樣,人們通常都不用去關心它們是怎麼實現的。

Go 的依賴管理。我之前曾寫過一篇關於如何使用 vgo 和 dep 在 Go 中進行依賴管理的文章。Go 的依賴管理的演變之路充滿了坎坷。最初,除了“ Gopgk”之外沒有其他依賴管理工具,後來發佈了實驗性的“Vendor”,後被“vgo”取代,然後又被 1.10 版“go mod”取代。如今,我們可以手動或者使用各種 Go 命令(例如“go get”)來修改 go.mod 文件描述符,但這也讓依賴關係變得不穩定。

Java 有 Maven 和 Gradle 之類的聲明式工具,用來進行依賴關係管理,也用於構建、部署和處理其他 CD/CI 任務。但是,在 Go 中,我們必須使用 Makefile、docker-composes 和 bash 腳本自定義構建所需的依賴管理,這隻會使 CD/CI 的過程和穩定性變得更加複雜。

包的名稱裡包括了託管域名。例如:

<code>import "github.com/pkg/errors"/<code>

這真的很奇怪,而且很不方便,因為你不能在不修改項目代碼庫導入的情況下用自己的實現替換別人的實現。

在 Java 中,導入通常以公司名稱開頭,例如:

<code>import by.spirascout.public.examples.simple.Helper;/<code>

區別在於,在 Go 中,go get 會向 by.spirascout.public 獲取資源。在 Java 中,包名和域名不一定是相關聯的。

我希望所有與依賴管理有關的問題都是暫時的,將來會得到妥善的解決。

寫在最後

Go 最有趣的一個地方是它所遵循的代碼命名規則——基於代碼可讀性心理學。

你可以用各種方法寫出清晰且可維護的代碼,儘管 Go 是多單詞的編程語言,但寫出來的代碼仍然很清晰。

Go Web 開發經驗讓我看到了 Go 的快速、強大和易於理解,它非常適用於小型服務和併發處理。對於大型複雜的系統、功能複雜的服務以及單服務器系統,Java 目前仍然是王者。

英文原文

When to Use Go vs. Java | One Programmer’s Take on Two Top Languages

關注我並轉發此篇文章,私信我“領取資料”,即可免費獲得InfoQ價值4999元迷你書,點擊文末「瞭解更多」,即可移步InfoQ官網,獲取最新資訊~


分享到:


相關文章: