為什麼任何時間都可以登錄淘寶,淘寶不需要維護服務器嗎?

益清wx


像淘寶這種規模的已經不是簡單幾個服務器的問題了,對於大型網站首先要保證數據的訪問的及時性穩定性,同時還要兼具安全性。服務器本身也是電腦,運行的時間長了也需要停機維護保養,從設計架構上分析即使保養也是分批次的去調整,而且在調整的過程中國留有足夠的餘量,能夠在這臺機器在保養的時候,有另外的機器能夠及時跟上,2019年的雙11阿里巴巴的數據處理已經全部轉移到雲計算上去了,除了銷售額大幅度的提升之外,而且在技術上的確扛住了,其實在阿里巴巴內存對於技術的關鍵已經超出了雙11本身的銷售額。

像阿里巴巴這種架構的服務器,首先具備最穩定的集群概念,而且在單個服務器還有對應的數據備份服務器以及常規備份服務器,同一份數據還會保存在不同的服務器場景裡面,早期的騰訊的QQ遭遇過不穩定的危機,於是拉起了分佈式集群的概念,在全球很多地方都部署了自己的服務器集群點,即使只剩下最後一個集群服務器群也能正常工作起來,這是集群服務器最基礎的抗壓標準。

對於服務器的集中管理的最高級別屬於雲計算,目前在全球範圍內做的最好的屬於亞馬遜,微軟,谷歌和阿里雲爭全球老三的位置,而且處於頭部的雲計算玩家都屬於自主研發的,真正的讓自己的技術揚名立外的當屬於自主的研發,開源的架構只是一種參照的價值,所以阿里巴巴在感覺到自主研發的威力之後,馬雲成了達摩院專注於技術的研發,就是讓阿里巴巴在未來的科技軍備競賽中不至於落伍,說到的服務器的概念常見的有三種概念,分佈式,集群,雲計算,每個概念都是延伸出很多細節的概念,但大致理解起來分佈式主要是把一個任務分解到不同的人去做;集群相當於一堆的人聚力在一起完成一件事情,分佈式的每個結點又可以是集群的方式,一般兩種概念集合在一起共同達到一種效果;雲計算相當於把所有的服務器集中統一管理。

雲計算相當於把軟件和硬件的資源統一整合在一起調配使用,而且還能抽象出很多的虛擬主機來使用,目前大家接觸到的雲計算一個最基本的功能,可以分配出N多的虛擬主機供中小企業來使用,同時針對裡面出現的安全問題進行統一的檢查,省去了很多中小企業自家構建服務器同時還要找專人維護的費用,對於推動科技的進步發展有著非常大的好處,從2019年的雙11開始淘寶商城的數據已經開始調配到雲計算系統上,在國內雲計算市場阿里雲目前佔據絕對的領先優勢,不僅僅是在是在市場份額上的影響,還在技術更新能力上,而且阿里雲技術創新的速度越來越快。

雲計算這個概念更加抽象,同時也是集群和分佈式的一個抽象集合,最現實的意義是把大量的負載不夠的服務器用在虛擬主機銷售給客戶,最早實現這個構想的亞馬遜已經雄踞全球市場第一,對於最簡答的服務器的備份切換無論是單獨的分佈式還是集群方式都能輕鬆的應對,即使沒有云計算的能力單純從服務器管理的角度上,也是很基本的功能存在,希望能幫到你。


大學生編程指南


首先來說,服務器本身也是屬於耗材,長時間的運行、設備升級更換、系統升級等情況下,是需要停機維護的。

現實中,我們很少看見淘寶網、騰訊等這些大型互聯網站打不開的情況,很多人就心生疑問,它們的服務器都不需要維護嗎?其實是需要維護的。

這樣說吧,淘寶網服務器很多,沒人知道其具體數字。但從網絡上的資料來看,淘寶宣稱雙11當天每小時擴容10W臺服務器,足見其服務器規模的龐大了。

這麼多的服務器,它們會以集群的形式來部署,同時淘寶網也是分佈式的。假設它有10臺服務器,當其中一部分需要維護升級時,可以直接停機維護,對於整個集群而言就是少了一個節點而以,還有其餘9個節點可以為用戶提供服務。所以對於用戶而言,是沒有感知的!

集群有很多優點,其中之一就是高可用性。像淘寶網這類的網站都是聲稱全年可用率達99.9%以上,加上其後端服務器規模的龐大,一部分服務器節點需要停機時,對整體網站的穩定性不會產生影響。


網絡圈


1.淘寶有幾十萬臺服務器,就好像人有好多細胞一樣,其他細胞的死亡不會影響人類的生命。

2.淘寶的服務器是集群的,都由中央主機來控制。就好像一張大網,如果有哪一個網格開線了,只要修補一下,是不影響正常服務的。

3.一般正常點的服務器會做到數據硬盤red0,就是說一個數據盤壞了,另外一個盤立馬頂上,服務還可以進行,當然那個壞盤會在最快的時間報警工作人員會替換下來,而這個硬盤會直接粉碎,以防數據洩露,但阿里的服務器數據盤肯定在red0以上,有好幾個數據組硬盤,一組壞了另外一組可以頂上。

4.有人說了,那如果一臺主要服務器癱瘓了,就算硬盤沒壞也停止服務了,理論上是這樣的,但是服務器也可以增加備份機,行話叫做雙機熱備,意思就是說,兩臺甚至兩臺以上的服務器,同步儲存一個內容,一樣的設置,如果其中一臺服務器在服務淘寶用戶賬戶數據管理的時候主板燒了,另外一臺會自動跳轉到另外一臺備份服務器上,因為兩臺服務器都是相同的內容,所以就可以正常服務了,那臺壞的,維修好了,直接插到雙機熱備組裡數據同步,所以你不會感覺到淘寶出問題的,就好像打仗一樣,前邊的士兵倒了,後排的士兵補上。

5.綜上所述,數據盤多組備份加上服務器多組聯合預備服務,就算一半服務器出現另外一半服務器都會頂上,維護只是把備份的機器拆下來維護,所以你感覺不到,兩臺服務器那臺在用哪臺就是服務器,另外一臺就是備用同步,一臺壞掉,備用服務器就自動成為主服務器。


有料科普


我的工作就是做電子商務系統維護,我來回答一下這個問題。任何服務器都需要維護,但是可以做到在用戶無感知的狀態下進行維護。

諸如銀行網銀、電子商務等涉及到互聯網服務的項目現在都能夠做到7*24小時提供服務。實現這個目標主要依靠以下幾個方面:

服務器集群

我們在客戶端(網頁瀏覽器或者手機app)進行瀏覽時訪問的不僅僅只有一個服務器,小的網站3、5臺,大型的如淘寶估計就有數不清的服務器了,每一個向客戶端提供的服務都由多臺服務器同時提供,如果其中一個服務器宕機了,則用戶會自動訪問到其他的服務器上,而且所有的服務器都分佈在不同的機房裡面,即便是某個機房斷電斷網了,也可以保證其他機房能夠持續的提供服務,保證了後臺服務的高可用。

分佈式服務架構

分佈式服務指的是一個系統的所有服務並不一定由一臺服務器或者一個程序完全提供,我們可以根據職責的不同將服務進行歸類劃分(比如把需要高度運算的服務放在一起,把需要訪問數據層的服務放在一起),也可以按服務功能的不同將服務進行歸類劃分(比如把用戶中心獨立成為服務,把訂單獨立成為服務)。分佈式服務架構對於系統穩定性的好處就在於倘若部分服務出現異常情況也不會影響到系統其他職責的服務(比如訂單服務掛了,但是我們仍然可以正常訪問用戶中心)。

運維工程師

無論是服務器集群也好,分佈式服務架構也好,總歸是要有人去維護和管理。目前再高度自動化的運維依然需要人為介入,這就是運維工程師的職責。

綜上所述,我們的運維工程師可以採取分批維護、升級、重啟部分服務器的方式,對系統進行用戶無感知的維護。

我是程序員愛編程,一個資深非專業碼農,科技領域段子手!如本回答能夠討得您的歡心,勞請點贊、轉發、關注我,如有不同看法可以在評論區留言,謝謝!

程序員愛編程


    2019年的雙11已經過去,成交額達到了2684億。很多人可能會有這樣的想法“淘寶網難道不停機維護嗎?為什麼任何時間都可以登陸淘寶呢?”下文具體說一說。


    服務器需要維護

    淘寶網的服務器很多,沒人知道具體的數字,從網上的資料來看,淘寶網聲稱雙11當天,每小時擴容10W臺服務器,足見其服務器規模的龐大了。


    對網絡、服務器等設備來說,冗餘很重要。對於阿里巴巴等這些大型互聯網公司來說,冗餘備份並非是雙服務器那麼簡單,而是需要異地備份。也就是說不同城市、不同的數據機房都會有淘寶的雲服務器,避免突發情況。

    可以說,淘寶的服務器分佈再全國各地,某個地區的網絡中斷或者電力中斷,可以馬上跳轉到別的機房,不會影響其業務,因為有異地備份。在保證正常使用的同時,如果需要維護了,只需要停止一部分服務器就行了,然後進行分批次維護。


    安全性保證

    除了考慮服務器的維護問題外,還需要有安全保障。


    大型互聯網公司的服務器,採用了集群的運行方式,某個節點宕機或者停機維護都不會影響到業務的正常運行。服務器放在機房裡,服務器運行需要網絡的電力的支持,網絡方面接入了電信、聯通、移動的骨幹網,電力除了正常的工業用電外,還有UPS、發電機等設備,保證設備的正常運行。


    總之,淘寶等這些互聯網公司的服務器需要維護,由於服務器數量眾多,採用了集群的工作方式。維護時,只需要停止一部分服務器就行了,然後進行分批維護。

如果覺得對你有幫助,可以多多點贊哦,也可以隨手點個關注哦,謝謝。

Geek視界


雖然我們任何時間都可以登錄淘寶,但是淘寶維護服務器也是需要更新的,只是我們不知道而已。

我們淘寶購物可以隨時登錄。不需要系統升級和維護嗎?我們經常會看到一些網站在清晨更新和維護。事實上,這是正常現象。任何服務器都不可能不維護,淘寶也是 需要維護的。淘寶系統中有大量的服務器集群。阿里巴巴的服務器非常龐大。大量的服務器足以解決這一系列問題。如果多個服務器關閉,則提供給客戶端的每個服務都將自動傳輸到其他服務器。

就像去考試一樣。我們通常得買兩三支鋼筆。事實上,我們只需要一支筆,但是如果一支筆壞了呢?這時,你可以帶上其他好鋼筆。很多時候,待機始終是當今的主流。淘寶的服務器是要更新的,但更新後,會關閉一些需要維護的服務器。關機後,淘寶網仍在正常運行,只是表現不太快,人們睡覺時會選擇晚上去淘寶。晚上去淘寶的人不多,有些服務器可以依次維護和更新。

為了防止意外的突然故障,系統必須定期備份。除了每月備份系統外,修改後的數據也應每週備份一次。同時,它被存儲在不同的服務器上,以便在系統崩潰時能及時恢復到正常狀態。通過監控系統日誌程序,通過分析報告,您可以知道是否有任何異常。

所以無論是淘寶的阿里巴巴系統,還是我們平時用的別的什麼系統,通通都是需要更新的。

——本回答為西安鼎昂數字貨幣智能量化全自動炒幣機器人(歷時收益,數據核對,實況直播)公司整理。


智能炒幣機器人


阿里的技術在國內也算是數一數二的了,所以我們任何時候都可以登錄淘寶,但淘寶的服務器也是需要維護的,只不過我們只是站在使用者的角度去訪問淘寶服務器,而後端服務方面卻處理的毫無痕跡,而用戶是根本感知不到它在何時做了維護。

記得有一次演講中介紹到,現在阿里可以做到僅用一秒鐘即可完服務器遷移,而且因為阿里擁有大量的服務器集群,可以分別在不同的時間段維護不同的服務器,這也不會影響到用戶的正常訪問。所以,作為用戶來說,看到的結果就是任何時候都能訪問淘寶。

所謂的服務器集群,簡單來說就是大量的服務器一起工作。用戶通過一個網址訪問的時候,即使是某一個服務器掛掉了也不會影響到你的訪問,會有其他的服務器提供服務,從而保證用戶可以正常登陸訪問。就好比一個人穿衣服一樣,雖然穿在身上的只有一套,但肯定會有多套衣服存在的。如果不小心把衣服弄髒了、爛了,可以立即去換一套穿著出門。

關於服務器維護的時間問題,這裡也是有學問的。儘管阿里有大量的服務器集群,但阿里的網站訪問量也是非常之大的。在大數據方面,阿里是做的非常好的。各種數據都會有專門的數據報表,自然知道在什麼時間段用戶的訪問量是比較少的,所以,可以在訪問量較低的時候對服務器進行維護。

當然,也並不是說不會有大規模的服務器維護的情況出現。因為阿里服務器上面所承載的服務太多了,比如淘寶、支付寶還有更多其他應用,不管是應用還是每個應用的功能,其實也都是獨立的。一般出現大規模需要服務器維護的話,也是針對負責某一應用的某個功能的服務器做大規模維護。一般出現這種情況的話就屬於比較大維護,所以也都會提前有公告發出來,會指定說在什麼時間段要做維護。

不過隨著技術的不斷升級,像阿里這類財大氣粗的公司,基本可以實現永不宕機,給用戶造成的就是阿里服務器不需要“維護”的假象。


碼農聊科技


感謝您的閱讀!

2019年天貓雙11,每秒訂單峰值54.4萬筆,這麼龐大的數據流量,阿里巴巴核心系統100%上雲,它抗住了。下圖似乎更能證明,阿里巴巴在服務器方面的優勢。

從2009年,400筆/秒,到2019年,54.4萬筆/秒,可以說阿里巴巴十年的進步。其實,我們現在可以慢慢回答這個問題,淘寶需要維護服務器嗎?

瞭解第一個詞:服務器集群。

所謂的服務器集群,指的是眾多服務器集中起來一起進行同一種服務,因此它們能夠在一起提供更好,更高的計算速度,從而帶來系統的運行正常。

而服務器集群最大的好處是,能夠在某一臺服務器進行故障的時候,集群也在工作,並且接管共享磁盤櫃上的數據區,進而使應用重新正常運轉,它可以平衡服務器負荷、卸載服務器,從而讓我們更好的進行維護。

而且一般維護服務器的時候,時間段選擇也很重要,自然不會選擇流量巨大的高峰期,比如雙十一等等,一般選擇在凌晨,流量比較少的時間段。

瞭解第二個詞:公共雲

在2019年3月21日,2019阿里雲峰會·北京站上,阿里雲表示,整個阿里經濟體正在All In Cloud,成為“雲上的阿里巴巴”!

可以說,公共雲已經成為了阿里巴巴的核心,即使在2018年,還是在使用神龍服務器,在2019年,大約9月份左右,阿里巴巴就將數以萬計的物理服務器轉移到雲端,而如今阿里巴巴是將首個交易核心放在了雲上,這就為未來的服務器的維護以及應對像雙11這樣大流量奠定了基礎,阿里雲已經有能力,應對複雜的流量激增等問題。


LeoGo科技


大家有見過淘寶網訪問不了嗎?幾乎沒有吧!淘寶網壓力最大的時候是在每年的雙11,起初幾年還有無法訪問的情形出現,但是今年沒出什麼狀況。

難道淘寶網服務器不需要維護嗎?

網站是建立在計算機上的,計算機提供服務供大家訪問,而計算機是必須要維護的,主要原因如下:

  1. 計算機某些部件,比如內存/硬盤等在24小時不間斷的運行下,會逐漸老化,在出現老化跡象時進行維修/更換是有必要的;
  2. 同樣,是機器就會發生故障,此時也有必要進行維護;
  3. 隨著淘寶網的訪問量越來越大,系統內留存的數據越來越多,有必要對計算機的硬件進行升級。

淘寶網的服務器也是計算機,因此淘寶網是肯定需要維護的。

淘寶網需要維護,那為什麼幾乎任何時間都可以登錄淘寶網?

答案是高可用,上點規模的現代網站,高可用幾乎是一個必備屬性。

業界通常用多個 9 來衡量網站的可用性:

2 個 9 - 基本可用,不可用時間小於 88 小時;

3 個 9 - 較高可用,不可用時間小於 9 小時;

4 個 9 - 具有自動恢復能力的高可用,不可用時間小於 53 分鐘;

5 個 9 - 極高可用,不可用時間小於 5 分鐘。

那麼如何來實現高可用呢?

系統上保證高可用性,避免大規模服務不可用
  1. 將靜態資源緩存至CDN上;
  2. 進入網站所在機房後,先進行負載均衡,將請求分發到後端的多個服務上;
  3. 服務內部:提供緩存支持,避免所有數據都從數據庫查詢,減少數據庫壓力,提升服務響應速度;文件服務器與數據庫服務器都是分佈式的,某一個節點壞了可以馬上切換到可用節點上;
  4. 以上所有節點都是集群化的,每一個節點至少兩臺服務器,避免出現單點故障,導致大規模服務不可用。

進行各種維度的監控與報警,將問題熄滅在星星之火階段

世界上沒有100%的事情,我們所能做到的,只是無限去接近它。對於高可用也是這樣,總會有意外事故發生,我們所能做的,就是完善各種監控,保證第一時間知道系統出了點小問題,從而可以在第一時間去解決它,將問題消滅於萌芽狀態。

總結

淘寶網需要維護,但是現代網站是可以做到高可用的,淘寶網作為行業中的佼佼者,自然也是高可用的,因此它保證絕大部分時間服務可用是沒問題的。

關於這個問題,大家有什麼看法,歡迎在評論區留言。我是閒談架構,持續輸出本質性思考,歡迎關注。


閒談架構


任何服務器都可能會存在問題,而服務器維護自然也是必不可少的內容。通常服務商會選擇在特殊時段(凌晨到次日清晨)進行維護,在用戶無感知的情況下便可完成服務器維護工作。

服務器都需要維護?

就如我們常見的每月月初之時,運營商(電信、聯通、移動)後臺維護的溫馨提示?業務停止查詢和辦理,需隔日再試。

從硬件層面去看,服務器其實也是機器。而機器設備就難免會有損耗的情況,就如硬盤掛盤的情況需要維護更換。再如例行檢修、又或者磁盤分列擴容問題等…因而服務器維護是必須的工作。

而服務器維護期間,為何用戶少有感知,甚至無感知?

維護時段選擇上,選擇用戶訪問量較小的時間段進行維護。常見於凌晨十二點至次日六點。而維護期間服務器的性能是在下降的,夜間維護的好處就在於訪問用戶數量不多,足矣支撐使用。因而用戶也少有遇見訪問超時、系統繁忙等情況。

為何服務器維護期間還可正常訪問?

圖示應該會比較清晰。下面大概用更為通俗的文字表述一下。

數據庫存放在硬盤,然後讀取到機器內存當中,爾後客戶端訪問。數據庫硬盤通常是磁盤分列,成千上萬個硬盤在工作,難免有掛盤的可能的。而內存是同理,內存壞掉後客戶端自然也無法再訪問到後臺數據庫。客戶端--內存實例--數據庫,這就像一條通道,哪個中間環節斷了,用戶通過客戶端自然就無法訪問。

這裡就涉及到一個「服務器集群」的問題。

如下所示,如果將數據庫同時讀取到A、B、C三臺機器中去,當A機器訪問路徑不可用後,只要B、C沒出現故障,此時用戶通過客戶端還仍可以通過B、C去訪問到數據庫,從而不影響到用戶的正常使用。這就是服務器集群。

而服務器集群怎麼體現優勢?

以剛結束的雙11電商狂歡節為例,凌晨整點之時,你能想象到有多少人在同時訪問淘寶麼?

以1000用戶同時訪問為例,如果是隻有一臺機器工作,那這一臺機器就要同時處理1000條請求。而如果是三臺機器集群,而每臺機器所處理的數據就變成了三分之一。這也起到了負載均衡的工作。

到此你可能已經理解了本問題的含義了。服務器維護期間在於維護時間段選擇到位,維護期間服務器性能下降也能正常提供訪問。當然了,由於服務商的服務器性能的差異,服務器所用技術可能差異化都挺大,也遠不止是上述解釋的那麼淺顯。而服務器集群只是其中一面。


分享到:


相關文章: