25,000,000 行的代碼就問你敢不敢動?!

你經歷過絕望嗎?

25,000,000 行的代碼就問你敢不敢動?!

近日,Hacker News 上發起了一個名為“你見過最糟糕的代碼是什麼?”(https://news.ycombinator.com/item?id=18442637)的話題,引發了無數網友回憶討論,甚至還再次讓軟件巨頭 Oracle 登上頭條。

1.25,000,000 行的代碼就問你敢不敢動?!

日前,我們還在說如今的 Oracle

慘遭亞馬遜、Salesforce 棄用

,究其根本原因,不是因為亞馬遜等企業為了省錢,而是因為 Oracle 數據庫逐漸滿足不了他們業務的發展需求。在 Oracle 內部,相比每隔六個月就更新一次的 Java,Oracle 數據庫版本的更新頻率可以用 2-3 年甚至更久來表示。就在上文所述的 Hacker News 話題中,來自 Oracle 的程序員為我們解釋了其中的緣由,龐大的 Oracle 數據庫並不像外人看得那麼簡單,修復 Bug 可以分分鐘讓人奔潰。

該程序員以 Oracle 數據庫 12.2 版本為例,它擁有了近 2500 萬行的 C 代碼。

每次更新,你需要在不破壞現有測試 1000 次的情況下更改產品中的單行代碼。就 Oracle 數據庫產品而言,是好幾代程序員在有限的期限內編寫的這些代碼,但與此同時,這些代碼中也充斥著大量的垃圾代碼。

非常複雜的邏輯、內存管理、上下文切換等都與數千個 flag 一起保存。整個代碼都帶有神秘的宏命令,如果沒有使用筆記本而是手動擴展相關的宏,那麼你就無法清楚地明白這些宏。甚至可能需要一天到兩天才能真正理解某個宏的作用。

有時你需要了解 20 個不同 flag 的值和效果來預測代碼在不同情況下的行為方式。有時多達數百個 flag!“我並不誇張。”該程序員表示道。

Oracle 這個產品仍然存活並且可以供企業和開發者使用的唯一原因是數百萬次測試!

接下來,該程序員分享了 Oracle 數據庫開發人員的日常:

- 開始處理一個新的 Bug。

- 花兩週的時間試圖瞭解 20 種不同的 flag,這些 flag 以神秘的方式相互作用,造成了這個困境。

- 再添加一個 flag 來處理新的特殊情況。添加幾行代碼來檢查此 flag 並解決有問題的情況,避免該 Bug。

- 將更改提交到包含大約 100 到 200 臺服務器的測試服務器集群,這些服務器將編譯代碼,構建新的 Oracle 數據庫,並以分佈式方式運行數百萬個測試。

- 下班回家。第二天來上來,繼續做其他事情。測試可能需要 20 小時到 30 小時才能完成。

- 一天結束,下班回家。再來上班時,檢查前天的集成測試結果。如果幸運的話,將會大約有 100 個失敗的測試。如果運氣不好,將大約會有 1000 個失敗的測試。隨機選擇一些測試並嘗試瞭解你的假設出了什麼問題。也許還有 10 多個 flag 要考慮才能真正理解 Bug 的本質。

- 添加一些 flag 來嘗試解決問題。再次提交更改以進行測試。再等 20 到 30 個小時。

- 另外,重複以上步驟大概兩週左右,直到你能得到將這些 flag 組合起來的“神秘咒語”(沒有錯誤發生)。

- 終有一天,你會成功,帶來測試失敗為零的結果。

- 針對你新更改的部分添加 100 多個測試,以確保下一個不幸接觸這段新代碼的開發人員永遠不會破壞你的修復程序。

- 完成最後一輪的測試提交工作。然後提交以供審核。審查本身可能還需要 2 周到 2 個月。所以現在繼續討論下一個 Bug。

- 在 2 周到 2 個月之後,當一切都完成後,代碼將最終合併到主分支中。

以上是在 Oracle 修復 Bug 的程序員日常的非誇張描述。現在想象一下開發新功能會有多麼恐怖。開發一個小功能需要 6 個月到一年(有時是兩年!比如添加一種新的身份驗證模式,比如支持 AD 身份驗證),現在也可以理解為什麼 Oracle 數據庫的更新速度永遠追不上 Java 了。

而對於這款產品可以商用也真的是一個奇蹟。到了最後,這名程序員崩潰地說:我不再為 Oracle 工作了。永遠不會再為 Oracle 工作了!

25,000,000 行的代碼就問你敢不敢動?!

對於這一現狀,更有不少網友表示了同情:

@nathan_f77:這絕對是瘋了。 我甚至無法想象代碼庫的複雜性。我認為我的 Rails 測試套件已經很慢了,因為它需要 4 分鐘。如果我用 C 或 C ++ 編寫它可能是 10 秒。

我無法想象一個 C / C ++ 的應用程序,其中測試套件在具有 100-200 臺服務器上需要 20-30 小時。如果你僅更改一次之後突破 100-1000 次測試,那麼它就不像獨立的模塊化那樣了。

測試運行間隔 30 小時! 我絕對不會接受這份工作, 因為光聽起來,就像是地獄。

2.rm -rf 的怨念

那如果說在 2500 萬行的代碼上動刀,光是測試就已經如此複雜了,除了之外,是否還有比這更可怕的代碼?

必須有!

讓很多程序員後悔到想剁手的“rm -rf”絕對要算一個,糟糕的不是命令行本身,而是它帶來的後果。此前,不僅有

順豐程序員的刪庫跑路

事件,就連前MegaEase 創始人&CTO 陳浩(微博@左耳朵耗子)也未能逃脫該命令行帶來的魔咒。那年寫 Unix Shell 腳本,本想刪除一些臨時的子目錄,如:rm -rf ${mydir}/ ,結果呢,我沒檢查 ${mydir} 這個變量是否為空,於是呢,在某種情況下,這變量真的為空了,於是,我成了團隊的千古罪人。

25,000,000 行的代碼就問你敢不敢動?!

3.那些年,我們見過和創造的“渣渣”代碼

論起是否遇到過糟糕的代碼時,天下的程序員似乎有著極高的相似性,在此,更有知乎網友(https://www.zhihu.com/question/30776912)吐槽:

@小豬:

if (b == true) {...}

我不常寫 C,不知道 C 程序員是不是覺得這種寫法是理所當然的,但當我在 Java 代碼中頻繁的看到這種代碼的時候,我真的很無力。

@周越:

(a != b) ? b : a

@侯傑:

enum FiveLine
{
Gold,
Wood,
Water,
Fire,
Earth,
};

看枚舉名字不知道五行(hang)是什麼鬼,看了枚舉內容恍然大霧,原來是五行(xing)……

@玻璃杯中的魚:

// 以下所有left代表右

// 以下所有right代表左

4.寫在最後

在程序員的日常生活中,面對參差不齊的代碼,Debug 成功了叫創新,改 Bug 失敗叫掉坑,但是,如今的大牛哪一個又不是在寫 Bug 與 Debug 中博弈過來的呢,也正是有了這些糟糕的代碼才能讓彼時的菜鳥們真正得以歷練,而對於歷練過程中需要注意什麼,對此,CSDN 也曾發文從代碼的基本規範和約束、編程思想、版本迭代與重構、設計模式等角度,為大家一一講清如何才能成長為優雅的大牛程序員。你曾經又寫過哪些讓你後來捂臉的糟糕代碼?歡迎下方留言,分享那些年的菜鳥歲月。

徵稿啦

CSDN 公眾號秉持著「與千萬技術人共成長」理念,不僅以「極客頭條」、「暢言」欄目在第一時間以技術人的獨特視角描述技術人關心的行業焦點事件,更有「技術頭條」專欄,深度解讀行業內的熱門技術與場景應用,讓所有的開發者緊跟技術潮流,保持警醒的技術嗅覺,對行業趨勢、技術有更為全面的認知。

如果你有優質的文章,或是行業熱點事件、技術趨勢的真知灼見,或是深度的應用實踐、場景方案等的新見解,歡迎聯繫 CSDN 投稿,

聯繫方式:微信(guorui_1118,請備註投稿+姓名+公司職位),郵箱([email protected])。


分享到:


相關文章: