谷歌SRE--前言

Google的故事是一個擴大規模的故事。它是計算機行業成功的典範之一,標誌著向以IT為中心的業務的轉變。Google是最早定義業務與IT協調在實際中意味著什麼的公司之一,並繼續為更廣泛的IT社區提供了DevOps的概念。這本書是由使這一轉變成為現實的許多人撰寫的。

Google的成長是在系統管理員的傳統角色發生轉變的時候。它質疑係統管理,好像是在說:我們負擔不起傳統作為權威,我們必須重新考慮,而且我們沒有時間等待其他所有人追趕。在《網絡和系統管理原理》 [Bur99]的簡介中我聲稱系統管理是人機工程學的一種形式。一些評論者對此表示強烈反對,他們說:“我們還沒有處於工程化階段。” 當時,我覺得這個領域已經迷路了,陷入了自己的巫師文化中,無法看到前進的方向。然後,谷歌在硅片上劃了一條線,迫使這種命運成為現實。修改後的角色稱為SRE,或站點可靠性工程師。我的一些朋友是新一代工程師中的第一個。他們使用軟件和自動化將其形式化。最初,它們是秘密的,在Google內部和外部發生的變化非常不同:Google的體驗是獨特的。隨著時間的流逝,信息和方法雙向流動。

在這裡,我們不僅看到Google如何構建其傳奇的基礎設施,而且還了解了Google如何研究,學習和改變其對工具和技術的看法。我們也可以以開放的精神面對艱鉅的挑戰。IT文化的部落性質通常會使從業人員陷入教條式立場,從而阻礙了該行業的發展。如果Google克服了這種慣性,我們也可以做到。

這本書是一家公司的論文集,具有相同的願景。貢獻與單個公司目標一致的事實使得它與眾不同。在幾章中會再次出現一些共同的主題和共同的特徵(軟件系統)。我們從不同的角度看待選擇,並且知道它們相互關聯以解決利益衝突。文章不嚴謹,學術作品;它們是個人賬戶,以個人風格和各種個人風格自豪地編寫。它們寫得很勇敢,並且具有在行業文獻中令人耳目一新且不常見的知識上的誠實。有些人聲稱“永遠不要這樣做,總要那樣做”,另一些人則更具哲學性和嘗試性,反映了IT文化中各種個性,以及它在故事中的作用。反過來,我們則以觀察者的謙卑態度來閱讀它們,他們不是旅程的一部分,並且沒有關於無數衝突挑戰的所有信息。我們的許多問題是該卷的真正遺產:為什麼不這樣做X?如果他們做了Y怎麼辦?在未來的幾年中,我們將如何回顧?通過將自己的想法與此處的推理進行比較,我們可以衡量自己的想法和經驗。

這本書最令人印象深刻的就是它的存在。今天,我們聽到了一種粗魯的文化,即“只給我看代碼”。在開源周圍已經形成了一種“不問問題”的文化,在這種文化中,倡導社區而不是專業知識。Google是一家敢於從第一條原則思考問題的公司,並聘用了擁有高比例博士學位的頂尖人才。工具只是流程中的組件,與軟件,人員和數據鏈協同工作。這裡沒有任何內容告訴我們如何普遍解決問題,但這就是重點。這樣的故事比它們產生的代碼或設計要有價值得多。實現是短暫的,但是記錄在案的推理是無價的。我們很少有機會獲得這種見解。

那麼,這就是一家公司如何做到的故事。它有許多重疊的故事,這一事實向我們表明,縮放遠遠不只是教科書計算機體系結構的攝影放大。它與擴展業務流程有關,而不僅僅是機械。僅此一課就值得在電子紙中應用。

在IT領域,我們沒有進行過多的自我審查。因此,有很多重塑和重複。多年來,只有USENIX LISA會議社區討論IT基礎架構,還有一些有關操作系統的會議。今天的情況已經大不相同了,但本書仍然感覺像是一種難得的產品:有關Google跨越分水嶺的詳細記錄。這個故事不是為了複製,儘管可能是為了模仿,但它可以激發我們所有人的下一步。這些頁面有一個獨特的知識誠實,表達了領導能力和謙卑感。這些都是關於希望,恐懼,成功和失敗的故事。我對允許這種坦率的作者和編輯的勇氣表示敬意,以使我們(不是實踐經驗的參與者)也可以從繭中汲取的教訓中受益。

馬克·伯吉斯

《尋找確定性》的作者,奧斯陸,2016年3月

谷歌SRE--前言


分享到:


相關文章: