開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

百度之於陽泉,也許就像亞馬遜之於西雅圖。在陽泉雲計算中心,我管窺到了中國步入ABC時代的宏大遠景。

文/陳紀英

茨威格說,“世間一切偉大的壯舉總是默默完成的,世間一切智者總是深謀遠略的。”

那些閃耀的群星,往往深藏功名——支持全球208億次互動、每分鐘峰值高達10億次的春晚紅包活動不宕機的算力功臣、亞洲單體規模最大的數據中心,潛伏在山西小城陽泉。

當雲計算與大數據、人工智能匯合,世界就發生了翻天覆地的智變:流水線上的質檢女工因為AI質檢機獲得瞭解放,被智能安防追蹤的罪犯再也逃不出恢恢法網;一條重新清澈起來的河流,一片被綠植再次覆蓋的荒漠;自動駕駛汽車開始自由奔馳,擁堵的道路變得通暢無阻;高清視頻不再卡頓,人臉識別開始普及;等等。

01

春晚不宕機和30萬座圖書館

從陽泉上空往下俯瞰,會看到一片形似熊掌的樓群,這就是百度陽泉雲計算中心。

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

在這座以深邃的煤層和蒼涼的高原為底色的山西小城,一座亞洲單體規模最大、技術最先進的數據中心潛伏七年,多少有點類似掃地僧一般的荒誕感,就連陽泉本地人,往往也很難知曉它的價值和能量。

7億百度APP用戶每一次搜索,百度地圖的每一次導航,小度音箱與主人的每次互動,由Apollo系統驅動的自動駕駛汽車的每一次轉彎,可能都與陽泉雲計算中心息息相關。

百度陽泉雲計算中心,也在支持百度智能雲對內對外提供覆蓋內容、能源、金融、工業等領域的外部服務等等。在二手車領域,幫助優信實現了在線VR看車,讓二手車的全國購落地;在金融領域,聯手農業銀行打造的農行金融大腦,成為業內智能金融的探索典範;在旅遊領域,幫助攜程率先實現在線旅遊市場的智能化升級;在短視頻領域,助力百度旗下好看視頻提升運營效率,降低成本,依託AI能力賦能作者,實現火箭速度的高增長;等等。

在常態服務之外,如同驚濤駭浪一般的百度春晚紅包活動,則是陽泉雲計算中心的高光時刻。

今年春節,百度APP的全球觀眾互動次數達到208億次,春晚數據流量為每秒峰值5000萬次,每分鐘峰值10億次——互聯網巨頭都曾先後冠名春晚紅包活動,但唯一不宕機的,只有百度。

這當然要依賴於人力:陽泉雲計算中心的百度員工們,幾乎全部值守;貴州籍高工黃同學,退掉了提前一個月搶來的機票;暖通高工李同學,離家只有三公里,但除夕和初一連續加班30多個小時,不入家門;20多家供應商的代表也在春節期間,從全國各地彙集陽泉,等等。

更依賴的是技術和規模。“百度成為扛住春晚流量的第一家互聯網公司。看似偶然,其實是必然,背後依靠的其實就是百度深厚的技術底蘊,強大的技術硬核以及高效的工程能力。”百度系統部總監張炳華說。

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

第一,在規模上。

作為百度自建的第一個超大規模數據中心項目,陽泉雲計算中心規劃建築面積超過20萬平米,服務器裝機能力超過28萬臺。

現已建成投產12萬平方米,上線服務器超過15萬臺,有超過300萬個CPU核,存儲容量超過了6EB,可存儲的信息量相當於30多萬個中國國家圖書館的藏書總量——後者是亞洲最大、全球第三的圖書館。

這15萬臺服務器,通過大帶寬、低時延、無損網絡,連接成為一個一鍵運行、智能控制、遠程操控的超級計算機。

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

AI 計算集群

第二,在速度上。

全球觀眾一塊搶紅包時,如何保證同步進行,一致體驗?

在數據中心外部,百度網絡構建了三個時延圈:從數據中心覆蓋用戶時延不超過30ms(毫秒),從POP點覆蓋用戶的時延不超過10ms,從CDN覆蓋用戶的時延不超過2ms,確保用戶全面覆蓋和就近接入。

第三,在技術上。

作為數據中心的操盤手,張炳華很篤定也很自信,“陽泉雲計算中心在國內是最大的,在全球也是領先的”。

在支持整機櫃服務器的設計上,陽泉雲計算中心領先了行業五六年。

行業內的慣常做法是架空地板下送風,其短板在於,服務器送到之後,需要現場一臺一臺上架安裝,交付速度慢。但陽泉雲計算中心早在2012年設計時,就全部按照整機櫃交付模式設計,從卸貨平臺、走廊、電梯到機房全程實現無障礙交付設計。整機櫃的交付效率,相比傳統做法提升了20倍,春晚項目中,北京順義機房創造了8小時安裝1萬臺服務器的世界紀錄。

而百度自主研發的“冰山”冷存儲服務器,作為百度自研的高密度存儲技術,實現單U18個大盤的存儲密度,在業界單U存儲密度最高——這是百度網盤實現大規模高速存儲的基礎。

而以X戰警命名的X-MAN 組成的AI超級計算平臺,理論算力比肩IBM研發的全球最強超算Summit——一臺X-MAN服務器的計算性能,相當於幾百臺通用CPU服務器的算力。2016年X-MAN1.0發佈以來,經歷了3次架構升級,創造6項業界第一。

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

X-MAN構建的百度超級AI計算平臺,是百度AI業務不斷進化和領先的基石,如搜索、語音、圖像、自然語言翻譯、無人駕駛等AI場景的訓練、加速、提升等等,預測準確率及訓練耗時成倍級優化,圖像搜索線性加速比倍級增長。

基於上述優勢組成的金三角,百度才能扛出春晚紅包數據帶來的海嘯一般的強大沖擊。

春晚紅包的榮耀已經結束,結束就是新的開始,春晚的新紀錄,未來也不過是明天的新常態。

某種程度上,雲計算中心的迭代,與信息時代向AI時代的進化同頻共振,陽泉雲計算中心,就是百度AI的基石。

以最普遍的圖像識別為例,如何在幾百上千種水果中識別出一個蘋果?這背後需要基於算力,用人工智能深度神經網絡進行持續訓練20萬次,AI就能精準識別出“蘋果”。

正如百度智能雲產業智能化業務負責人李碩所說,“有了百度陽泉等數據中心超大規模的計算能力,不斷降低的存儲成本,加上人工智能的算法和行業的知識,這三者共同促進了人工智能的變革。”

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

02

1.09的PUE和沒有空調的機房

作為開國煤都的陽泉,2018年空氣質量全國倒數第五——脆弱的生態面前,陽泉雲計算中心必須綠色環保,衡量這一指標的關鍵標準就是PUE。

這個拗口的詞彙意為電力使用效率,即數據中心總能耗與IT能耗之比,PUE值越接近於1,表示效率越高。

2018年,百度陽泉雲計算中心年均PUE突破了1.10,達到1.09,能源效率國內第一,比全國數據中心平均1.73的水平,提升了88%,達到國際領先水平。

這意味著該數據中心每年節省電量可達2.5億度,相當於13萬戶居民一年的用電量,加上利用的風能、太陽能,每年可減少二氧化碳減排約30萬噸,相當於1600萬棵樹一年的二氧化碳吸收量。

而從成本維度來看,電能消耗在雲計算中心的運營成本中,佔比高達六七成,更高的能效,更低的耗電,也意味著成本可持續的大幅下降。

陽泉中心是怎麼做到的?

如果你走進陽泉雲計算中心,你會發現,它不太像互聯網企業的基地,更像實體企業,穿著海藍色工服的工程師穿梭其中,他們和智能調度中心,以及高性能服務器人機耦合,在保證安全、穩定、性能的基礎上,不斷把PUE值逼近1。

日夜不停運轉的服務器,會產生大量熱量——進入機房,一股熱浪就會撲面而來,傳統數據中心,通常依靠空調進行散熱。

開國煤都變身AI之城,我在陽泉管窺到了中國走進AI大時代的未來

但你能想到嗎,在陽泉雲計算中心的機房,全年大部分時間幾乎不用開冷水機組,而是利用室外冷源進行免費冷卻。

  • 由百度自主研發的AHU(Air Handle Unit)風牆冷卻技術,全年絕大部分時間可以直接通過引進室外新風,進行風側免費冷卻。
  • 百度自研的“蜂巢”預製模塊,構建了真正意義上的零功耗空調末端,可以充分利用室外自然冷源進行免費冷卻,通過提高整機櫃服務器的送回風溫度,進一步延長免費冷卻時間,再加上仿真分析進行氣流優化,可以實現機房內無熱區、無死角。
  • 基於不斷迭代的設計,陽泉雲計算中心全年超過96%時間實現自然冷卻,每年可節約用電4730萬度,比傳統精密空調地板下送風的空調末端能耗降低90%。
  • 這並非終點,百度2017年上線的X-MAN 2.0,作為國內首個採用液體冷卻技術的GPU解決方案,規模應用後,可以全面實現無冷機運行——有趣的是,Google 2018年Q2發佈的TPU3.0,也採用了相似技術。
  • 除了硬件和設計創新外,陽泉雲計算中心的超低能耗,還依賴於智能散熱控制系統——提前30分鐘預測室外溼球溫度、IT負荷、設備性能等參數,自動輸出當前情況下最佳系統運行策略,精確控制冷機、水泵等的開機臺數和運行頻率,實現製冷量與熱負載的動態平衡,節省空調系統能耗,準確率達到99.3%。

對於一個數據中心來說,安全永遠是第一位的,陽泉雲計算中心的故障預警與定位系統,可以提前故障預判(硬盤、水泵),快速精準定位,縮短故障維修時間(比如網絡,故障處理時間由30min減少到5min),而可自動迭代的故障預測系統,支持硬盤故障預測,準確率超過98%。

當然,儘管系統穩定,但為了確保萬無一失,“N+1”的容災備災機制仍然必要,“你關掉任何一個數據中心,用戶端都不會受影響”,李碩說。

由於系統運轉良好,除了春晚等特殊活動,數據中心技術人員幾乎很少加班,“截至4月8日,陽泉雲計算中心已經安全運行了1744天。”

智能控制系統,還大幅降低了人力成本,未來,陽泉中心的服務器將提升到28萬臺,但人員編制不會增加,碩大的園區裡,除了保潔保安等物業人員外,專業工程師和7*24值班工程師一共只有幾十人。

負責運維管理和招聘的林經理開玩笑說,“我們這裡的人很值錢,人均管理幾億資產”。

03

從煤都到AI之城

當算力成為AI時代的水電煤後,陽泉這所位於黃土高原東部邊緣的煤都,也被反哺而“智變”。

陽泉雲計算中心有三成員工來自陽泉本地,還有另外三成來自山西其他區域。

林經理還記得,2012年陽泉雲計算中心籌建時,數據中心人才奇缺,“不論是陽泉、還是整個山西,甚至北京,都找不到多少合適的人,我們傾向於本地化校招,自主培養”。

年近30歲的陽泉人、高工李同學,就是2012年是林經理校招的第一批應屆生。剛畢業時,李高工的職業選擇,曾是同學中的異類,在這裡,煤礦集團、電力系統才是更穩妥的優選項。

不過,現在,他比他的同學的成長更快、收入更高,讓他成為了眾人羨慕的對象。已經有不少李高工的同學,來到數據中心,或者打探如何跳槽到數據中心了,數據中心的職位,成為了陽泉高收入的標杆。

其實,剛畢業時,李高工並不想留在陽泉工作。他應聘百度,是希望能到北京工作——這種以煤礦立身的小城,對於年輕人,確實並無吸引力。

選擇陽泉總要付出或大或小的代價,比如分離,比如孤獨。

2012年進入百度時,林經理從沒預想過要付出常年分居的代價。入職7年,孩子從兩歲到上小學二年級了,如今,他每月依然有十幾天呆在陽泉。

而李高工有時會感到孤獨,在陽泉,技術人員還是太少,沒地方線下交流,而隨他定居陽泉的妻子,因為找不到就業機會,只能做全職主婦。

但林經理不後悔,“媳婦很支持,我也不後悔,我們各項指標都是國內是第一了”。百度的平臺成就了自己。

一度對家鄉有點失望的李高工,現在頗感自豪。連續五年春節值守加班,守護機房的絕對安全,保障用戶的流暢體驗,李高工覺得很值得。

孤注一擲、初心不悔,如同聖經中的使徒保羅,“那美好的仗我已經打過了;當跑的路我已經跑盡了;所信的道我已經守住了”,一切代價都因參與其中而變得可以接受了。

數據中心的落地,也在改變“煤都”,陽泉逐漸走入雲端,變身為智慧城市。

去年12月,百度與陽泉簽署了戰略合作協議,雙方進一步加深合作。未來,陽泉將成為西部首個AI之城,交通、環保、城管、醫療、旅遊、物流、工業製造等領域,基於百度大腦、自動駕駛、智能交通等技術賦能,都要逐漸實現AI智變。

未來,類似李高工這樣的AI就業新職人,在陽泉也會越來越多,百度正在幫助陽泉孵化一大批AI數據標註企業,帶動一批AI解決方案企業落地陽泉——他或許不會再感到孤獨了。

百度之於陽泉,也許就像亞馬遜之於西雅圖,後者得以成就全球的雲計算之城——早在2013年,陽泉市就被住建部評為首批國家智慧城市試點。

如同不可見的黑洞,吸引力之大連光都無法逃離,ABC(AI、Big Data、Cloud Computing)的洶洶大勢,也是無法逃逸的潮流,而存儲、傳輸、運算著浩瀚數據的雲計算中心,就如同隱藏著AI時代全部數據秘密的黑洞。我們在陽泉雲計算中心,管窺到了中國步入ABC時代的宏大遠景。


分享到:


相關文章: