“阿波羅”登月中的工程管理一瞥

上世紀60年代,NASA(美國航空航天局)完成了“阿波羅”登月,整個計劃持續十餘年,涉及員工2.4萬人,三大航天中心,承包商幾十上百家。要知道,上世紀60年代的計算機水平乃至整體科技水平,今天看來都相當原始。就在這種條件下,NASA確實兌現了肯尼迪“十年內登月”的誓言,而且11次“阿波羅”載人航天任務全部安全返回——大部分宇航員出發時都相信,自己只有2/3的幾率生還。能取得這樣的成就,科技當然很重要,工程管理也相當重要。

更麻煩的是,“阿波羅”是一系列的任務,從1968年開始,肯尼迪航天中心採用流水線作業,任何時候至少都有三項任務在同時開展:

  • 一枚“阿波羅”/“土星5”航天器在發射工位進行最後的組裝和測試
  • 一枚或兩枚“土星5”火箭在垂直總裝廠房進行組裝和測試
  • 一枚“土星5”火箭的各子級在低頂區進行檢測
  • 至少一次任務的指令艙/服務艙、登月艙在載人航天器操作廠房進行組裝和測試
  • 另一次任務的指令艙/服務艙、登月艙在載人航天器操作廠房或垂直總裝廠房檢測

換句話說,哪怕最近要發射的是“阿波羅9”,但“阿波羅10”和“阿波羅11”也在緊張的準備之中,所有工作必須相互協調,不能出任何差錯。

在當時,計算機還是剛出世不久的玩意兒,更多用於“計算”,用計算機和軟件來管理項目根本還是沒影的事情。當時NASA是怎麼管理這一切的呢?

答案是:靠PERT圖。

學過計算機專業課程的同學們大概還記得PERT圖,這是美國海軍在20世紀50年代為了管理“北極星”潛艇和導彈系統的開發任務而發明的工具。它將複雜任務分解為不同的活動,用網絡結構清晰描述每項任務需要的人力、時間、資源的量和依賴關係。通過PERT圖分析,可以一眼看到複雜任務中的關鍵路徑,看到每項任務的前驅-後繼條件,看到任何一項任務的提前或延後對其它任務的影響。

如果你不記得PERT圖也不要緊,下面這個簡單的例子用PERT圖分析了做飯的過程。

假設要解決的問題是做飯,我們首先窮舉所有的步驟,比如淘米、洗菜、炒菜、煮飯、切菜等等。然後,把每一步的時間估計出來。接下來整理出各步驟之間的依賴關係,比如煮飯要在淘米之後,切菜要在炒菜之前,洗菜之前要先浸泡而且是用淘米水浸泡最好……

下圖可以清楚看到各步驟之間的依賴關係(哪一步必須依賴哪一步),以及各步驟的耗時時間。經過現成算法,可以提煉出關鍵路徑(用紅色標註)。

“阿波羅”登月中的工程管理一瞥

做飯的PERT圖

可以看到,能吃上飯的最短時間就是2+30=32分鐘,最關鍵的兩步是淘米和煮飯。關鍵路徑上的任何延遲,都會導致整體目標的延遲,所以必須嚴格保障。非關鍵路徑上的步驟也不能無限拖延,同樣可以通過算法計算出其富裕度,包括最早開始時間、最晚開始時間,最早結束時間、最晚結束時間。實際執行的時候不必反覆過問,只要所有步驟都在預計的時間內,整體進度就可以保證。


“阿波羅”登月中的工程管理一瞥

實際的PERT圖類似這樣,紅色標註關鍵路徑。來源:Bourton Group


在肯尼迪航天中心的4號發射控制室,牆上貼著面積超過100平米的PERT圖。其中A級活動表是總綱,主要是由NASA總部和肯尼迪航天中心的高級官員設定的里程碑;B級含超過7400個事件,追蹤為了達成里程碑所需要的各重要事件,主要由肯尼迪航天中心的各級官員使用;C級則對B級做了進一步分解,包含超過4萬個事件,標明瞭順序和預計完成時間(以便後續工作開展),它主要由NASA一線人員和各供應商自行維護。

任何時候,B級和C級都必須對齊A級中的里程碑。所有活動按照WBS(工作分解結構)編號,通過編號可以方便地發現各事件之間的聯繫,這樣就保證了B級中的一個事件最多可以關聯C級中的15個事件。

因為當時還沒有計算機,一共有幾十名分析人員來協調和跟蹤所有的活動。

“阿波羅”登月中的工程管理一瞥

A級PERT圖,提供整個項目的總攬。來源:NASA


“阿波羅”登月中的工程管理一瞥

4號發射控制室的巨型PERT圖。來源:NASA

階梯會議室共有90個座位,另外還可以容納50人站立。前方的金屬牆面有21m x 5m大小,用磁性標貼標示了整套火箭工作流程。如果要調整計劃,就召集大家開會,重新安排這些標貼。會議室前方中間有一個跟蹤狀態欄,相當於程序中的“指針”,用來保證大家都知道當前的狀態和將要完成的任務。

在整個任務管理中,最關鍵的問題是對關鍵路徑的管理。只要能時刻盯住關鍵路徑,整體的任務目標就在把握之中。下圖是1966年1月20日的發射場活動關鍵路徑圖,圖上部的信息來自具體工作,彙總之後得到最重要的答案:

LC-39發射平臺什麼時候可以投入使用?


“阿波羅”登月中的工程管理一瞥

圖中列名了若干延誤事件

上圖對應若干延誤事件,信息總結如下表


“阿波羅”登月中的工程管理一瞥

可以以第一行為例來說明項目的管理協調:第一行內容是“將LUT 1移動到VAB”,其中LUT代表發射臍帶塔,是移動發射平臺的一部分,VAB代表垂直總裝廠房。

在1965年8月,移動發射車才開始建造了六個月,比預期延後了一年。所以在LC-39發射平臺最初交付時無法進行飛船測試。但是最初交付時只會使用500-F訓練箭,本來不需要搭配飛船,因此延遲不會有影響。不過如果持續延遲,就會影響“土星5”火箭的第一次發射。

在8月5日的會議上,馬歇爾航天中心的代表承認,電氣設備的交付將要延遲1周。雖然當時LC-24發射平臺有更高的優先權,但是LC-39的裝備交付時間也必須提前。工程總部指出,如果不提供更多的資金給垂直總裝廠房,其高頂區在10月1日就不能就緒,會影響500-F訓練箭的使用,而使用日期是已經確定的重要節點。所以,管理層一致同意加速。

另外還有一條好消息,Bagnulo的工程代表宣佈找到了解決移動發射平臺擺臂的“迂迴方案”。伯明翰的Hayes International公司將按已延誤時間節點向亨茨維爾的馬歇爾航天中心交付第一套擺臂。LC-39初次交付時,擺臂將被運送到肯尼迪航天中心用於500-F訓練箭。如果到時沒有足夠的時間進行測試,肯尼迪航天中心就不從馬歇爾航天中心獲得擺臂,直接從Hayes獲得第二套擺臂。等肯尼迪航天中心完成500-F訓練箭項目之後,再從馬歇爾航天中心獲得已經測試過的第一套擺臂。

這樣調整之後,就可以保證移動發射平臺能趕上第一個里程碑——1966年1月28日,關鍵流程1和PERT分析結果的日期相符,可以認為最終目標不受影響。

除了PERT圖,NASA還需要一套關鍵的系統:零配件記錄系統。NASA在亨茨維爾維護著零配件列表,數據來自三處航天中心的工程部門,信息包括:名稱、數量、預計就緒日期(預計送達肯尼迪航天中心的日期),必須就緒日期(肯尼迪航天中心必須用到的日期)。零配件記錄系統扮演著肯尼迪航天中心與零配件供應商之間的終結角色。航天中心設備工程和構建部門的代表負責彙報核心構建里程碑的當前狀態,各供應商負責將當前狀態與自己的組織對齊,並彙報所有問題。如果出現情況,調度員必須在一週內在PERT圖的網絡中標註出來,並準備好一份C級事件的前期報告。

在肯尼迪航天中心,最上層的,發射總指揮(Director of Launch Operation,DLO)的任務計劃表是固定的,也造就公佈給NASA和新聞界,除非有重大事件,否則不會調整計劃表。對於前無古人的挑戰來說,這有點不可思議,但他們也確實做到了這一點。“阿波羅15”的指令長Dave Scott曾說:

在發射前幾個月,他們就會說,“我們將在7月26日上午9點36分發射”。到那個時間點一切都會準備就緒?這真是難以置信。甚至到今天,你都不一定能這樣做,也做不到。
當時能做到這一點,靠的就是卡納維拉爾角強有力的項目管理和異常龐大細緻的流程圖,所有工作全部納入其中,所有工作都必須按時完成。外面的人都不知道,這一切究竟是如何發生的。

要保證登月任務準時順利完成,光有計劃和系統還不夠,還需要強有力的執行。肯尼迪航天中心採用72小時/11天計劃表來監視任務的執行進度。該表格的72小時部分顯示了未來3天內,每個小時要完成的工作任務;11天的部分預測了接下來兩個工作周的關鍵事件,這些時間表均按一天三班來劃分。

飛船、火箭、地面支持機構每次任務中都必須制定各自的72小時/11天計劃表(The 72-HOUR/11-DAY Schedules)。每天下午1:00,在4號發射控制室召開會議,飛船、火箭、地面支持機構的負責人彙報重要節點的狀態變化,並確定下一個階段的關鍵活動和需求。所有信息最後輸入彙總到綜合計劃表裡,行程整個發射場的72小時/11天計劃表。

可能有人注意到了,雖然任務緊張,但是對應“兩週”的竟然是11天,而不是滿滿當當的14天。根據我看到的材料,在項目緊張的時候,大家確實是每天12小時,每週7天工作的,但這不是常態——比如“阿波羅11”發射之前的半年。NASA在“阿波羅1”的資料裡提供了一份數據可供參考:

(把飛船轉移到肯尼迪航天中心的火工品裝配大樓)改進工作條件之後,NASA判斷每天兩班8小時輪換,一週工作六天,就可以保證整個分析和解體的任務進度。唯一的例外是在拆除隔熱盾時,實行了每天三班8小時的輪換,這項任務在1967年3月28日完成。


“阿波羅”登月中的工程管理一瞥

美蘇合作的“阿波羅-聯盟”計劃的72小時/11天計劃表。來源:NASA

如果你留意看上面的圖,會發現另一個有趣的點,這就是右下角的“史努比”卡通圖案。這可不是普通的塗鴉,在卡納維拉爾角,北美-羅克韋爾公司的調度員Al Tinnirello把“用史努比作為團隊代言人”的想法變成了現實,後來陸續又有多人加入,把當前的工作畫成了史努比漫畫,並加上有趣的對話。

在緊張、高壓的工作環境下,史努比的出現確實受到了大家的歡迎。它的人氣極高,甚至高級管理人員每天都會去看計劃圖,甚至會抗議自己的形象畫得不對。但是能夠出現在史努比卡通圖案裡,常常被視為一種榮譽。它不僅反映了工作的繁瑣,也體現了員工的無奈、困難和同情。“史努比”的漫畫逐漸成為一種亞文化現象,成了管理層和員工之間重要的非正式溝通工具。

“阿波羅”登月中的工程管理一瞥

在阿波羅航天計劃中,史努比漫畫無處不在。如今eBay上還有當年的漫畫海報出售。來源:NASA


要緩解工作壓力,除了史努比漫畫,許多巧妙的比喻說法也相當有用。對於項目管理中的變動,肯尼迪航天中心流傳著三種說法:插隊、沙包、打傘。

項目管理中的潛規則是,所有環節彙報的工時預估都是保守的,而且具體執行人員都很不喜歡被插隊。好在載人登月是史無前例的工程,各項目發生變動也是難免的事情,於是總會留出一些餘量,這就讓插隊成為可能。但總的來看,插隊終歸是不正常現象,對工程質量和員工情緒都會有影響,所以必須嚴控。

“沙包”指的是把任務的延期藏起來,具體執行人可以躲在沙包背後,不到最後一刻不做彙報。在具體執行人看來,稍微延期一點並不重要,只要後期能趕上就行。相反,及時彙報延期往往只會招來一頓責罵。這種“沙包”可不是“把頭往沙堆裡一紮就萬事大吉”的鴕鳥戰術那麼簡單,如果運氣好,你會遇上“打傘”的人,那你就得救了。

所謂“打傘”,指的是雖然你延期了,但還有更倒黴的傢伙延期了,而且率先被暴露出來,而你的工作恰好依賴他,於是你如釋重負,可以心安理得地延期。沒有人希望成為打傘的人,但大家都希望有其他人能為自己打傘。

無論事業多麼激動人心,項目延期都是無可避免的事情,“報喜不報憂”,把延期消息藏起來,也是人之常情。但是如果遲遲沒有遇到“打傘”的人,沙袋最後藏不住往往就會釀成大禍,甚至導致發射中止。肯尼迪航天中心的項目管理團隊花了非常多的精力,終於把“沙袋”控制在了合理的範圍之內。

同樣不容忽視的是大量的文書工作。雖然各零配件在出廠時都號稱經過了測試,但到發射現場之後,仍然需要再次核驗。這方面最突出的例子是,有一個子系統號稱經過了供應商的確認,但運到發射現場之後才發現,有個接插件的兩端都是母插頭,這顯然是有問題的。但是,“阿波羅”計劃要解決的問題不止於此,發射規範甚至詳細到了要求每一個螺絲的擰緊力度,並且必須有詳細記錄在案。

“阿波羅”計劃中的挑戰不止於此。在之前的“水星”和“雙子星”的任務期間,NASA的員工如果在現場發現問題,可以直接動手修正,然後告知供應商。但到了“阿波羅”計劃期間,因為系統過於複雜,涉及因素過多,NASA要求員工不能直接動手處理,必須以書面形式告知供應商,由供應商修復,並且全程都必須留下記錄。可以想見的是,一開始大家都很不適應這種“哪怕問題近在咫尺也必須剋制動手,書面描述”的做法。

最終,這些“繁瑣”的規定對保證整個項目的質量至關重要。肯尼迪航天中心有一句笑話:當文件的高度和火箭一樣的時候,發射就沒有問題了。這雖然是玩笑,但也毫不誇張。

當然,以上說的都只是手段,最終目的是為了培養所有2.4萬名參與人員的緊迫感,並將其始終保持在高水平。為了做到這一點,密切的溝通是非常關鍵的。

“阿波羅”計劃的特徵之一是,各級員工為了工作或解決問題,有權與任何需要的人溝通,無論他的職級如何。只要管理人員能隨時掌握真正的問題,就不需要興師動眾,找到合適的人來處理。更重要的是,這培養了員工的主人翁意識——不只是負責人知道要做什麼,哪怕是最基層的員工,也清楚在整個項目中自己在做什麼,做的工作有什麼價值,要做什麼才能推動實現下一個目標。如果下面要進行的是一整套測試,那麼誰也不敢隱瞞任何問題,哪怕他發現的不是自己的問題。

能做到這點,另一個因素也不可忽略:在發射前的“漫長”準備工作中,宇航員與地面工作人員的交流很充分,配合很密切。一名“阿波羅”項目的宇航員公開承認:

火箭發射之後,不管遇到什麼故障,只要還有一線希望,宇航員都不願意放棄,因為航天任務太讓我們興奮和期盼了。

許多參與過“阿波羅”項目的人回憶,正因為了解到宇航員的這種熱情,他們才會有高度的責任心:“我們必須一絲不苟,才能保證這些與我們朝夕相處的傢伙們能安全返回”。

“阿波羅”計劃的宇航員同樣深刻意識到,即便在建造的是“自己的”飛船,自己也不能簡單坐享其成。舉世矚目的“阿波羅13”旅程中,飛船進入太空之後一個液氧貯存箱爆炸了,指令長Jim Lowell後來承認,他早就判斷這個液氧貯存箱有問題,在發射之前他完全有權力要求更換的,然而他沒有這麼做。在後來的任務中,從飛船開始建造一直到任務完成,宇航員都要全程密切參與,這樣既建立了信任,也提供了更多的視角,降低了事故概率。

但是,即便“阿波羅”/“土星”項目有這麼強有力的項目管理,仍然無法杜絕一些匪夷所思的問題——這方面最著名的就是“阿波羅13”的二氧化碳過濾器的故事。

眾所周知,“阿波羅13”發射升空之後,液氧貯存罐意外爆炸,所幸沒有影響宇航員的生存。面對這種情況,NASA不得不臨時放棄原定的登月計劃,以順利返回地球為最重要目標。經過緊張計算,地面指揮中心發現可以借用登月艙的資源保證宇航員生存,所以原本設計供兩名宇航員使用兩天的登月艙需要容納三名宇航員生存四天,這會存在風險。

果然,登月艙的二氧化碳氫氧化鋰過濾罐不堪重負,好在天無絕人之路,指令艙有備用的過濾罐。這時候才發現,因為登月艙和指令艙的過濾罐一個接口為方形,一個接口為圓形,並不兼容,只能臨時想辦法,在“每一克重量都極寶貴”的飛船上想出辦法來解決這個問題……


“阿波羅”登月中的工程管理一瞥

看過電影《阿波羅13》的人應該都記得這個畫面。 來源:NASA

雖然NASA最終解決了這個問題,但事後調查發現,之所以會出現這種情況,是因為負責為登月艙和指令艙提供過濾罐的供應商是不同的,之前沒有人知道這回事,更沒有人想過要統一規格……

這樣看來,儘管登月成功了,工程管理卻是永遠沒有止境的事業


分享到:


相關文章: