架構師必懂的 ——網絡編程基本常識


架構師必懂的  ——網絡編程基本常識

一、什麼是網絡模型

網絡編程的本質是兩個設備之間的數據交換,當然,在計算機網絡中,設備主要指計算機。數據傳遞本身沒有多大的難度,不就是把一個設備中的數據發送給另外一個設備,然後接收另外一個設備反饋的數據。現在的網絡編程基本上都是基於請求/響應方式的,也就是一個設備發送請求數據給另外一個,然後接收另一個設備的反饋。

  在網絡編程中,發起連接程序,也就是發送第一次請求的程序,被稱作客戶端(Client),等待其他程序連接的程序被稱作服務器(Server)。客戶端程序可以在需要的時候啟動,而服務器為了能夠時刻相應連接,則需要一直啟動。例如以打電話為例,首先撥號的人類似於客戶端,接聽電話的人必須保持電話暢通類似於服務器。連接一旦建立以後,就客戶端和服務器端就可以進行數據傳遞了,而且兩者的身份是等價的。在一些程序中,程序既有客戶端功能也有服務器端功能,最常見的軟件就是BT、emule這類軟件了。

二、什麼是IP地址與域名

在現實生活中,如果要打電話則需要知道對應人的電話號碼,如果要寄信則需要知道收信人的地址。在網絡中也是這樣,需要知道一個設備的位置,則需要使用該設備的IP地址,具體的連接過程由硬件實現,程序員不需要過多的關心。

  IP地址是一個規定,現在使用的是IPv4,既由4個0-255之間的數字組成,在計算機內部存儲時只需要4個字節即可。在計算機中,IP地址是分配給網卡的,每個網卡有一個唯一的IP地址,如果一個計算機有多個網卡,則該臺計算機則擁有多個不同的IP地址,在同一個網絡內部,IP地址不能相同。IP地址的概念類似於電話號碼、身份證這樣的概念。

  由於IP地址不方便記憶,所以有專門創造了域名(Domain Name)的概念,其實就是給IP取一個字符的名字,例如163.com、sina.com等。IP和域名之間存在一定的對應關係。如果把IP地址類比成身份證號的話,那麼域名就是你的姓名。

  其實在網絡中只能使用IP地址進行數據傳輸,所以在傳輸以前,需要把域名轉換為IP,這個由稱作DNS的服務器專門來完成。所以在網絡編程中,可以使用IP或域名來標識網絡上的一臺設備。

三、什麼是端口?


為了在一臺設備上可以運行多個程序,人為的設計了端口(Port)的概念,類似的例子是公司內部的分機號碼。規定一個設備有2的16次方個,也就是65536個端口,每個端口對應一個唯一的程序。每個網絡程序,無論是客戶端還是服務器端,都對應一個或多個特定的端口號。由於0-1024之間多被操作系統佔用,所以實際編程時一般採用1024以後的端口號。

  使用端口號,可以找到一臺設備上唯一的一個程序。所以如果需要和某臺計算機建立連接的話,只需要知道IP地址或域名即可,但是如果想和該臺計算機上的某個程序交換數據的話,還必須知道該程序使用的端口號。

因此,網絡編程就是使用IP地址,或域名,和端口連接到另一臺計算機上對應的程序,按照規定的協議(數據格式)來交換數據,實際編程中建立連接和發送、接收數據在語言級已經實現,做的更多的工作是設計協議,以及編寫生成和解析數據的代碼罷了,然後把數據轉換成邏輯的結構顯示或控制邏輯即可。對於初學者,或者沒有接觸過網絡編程的程序員,會覺得網絡編程涉及的知識很高深,很難,其實這是一種誤解,當你的語法熟悉以後,其實基本的網絡編程現在已經被實現的異常簡單了。


架構師必懂的  ——網絡編程基本常識

網絡編程


四、什麼是Socket?

Socket就是為網絡服務提供的一種機制。通訊的兩端都有Sokcet,網絡通訊其實就是Sokcet間的通訊,數據在兩個Sokcet間通過IO傳輸。

五、什麼是TCP?

當一臺計算機想要與另一臺計算機通訊時,兩臺計算機之間的通信需要暢通且可靠,這樣才能保證正確收發數據。例如,當你想查看網頁或查看電子郵件時,希望完整且按順序查看網頁,而不丟失任何內容。當你下載文件時,希望獲得的是完整的文件,而不僅僅是文件的一部分,因為如果數據丟失或亂序,都不是你希望得到的結果,於是就用到了TCP。

TCP協議全稱是傳輸控制協議是一種面向連接的、可靠的、基於字節流的傳輸層通信協議,由 IETF 的RFC 793定義。TCP 是面向連接的、可靠的流協議。流就是指不間斷的數據結構,你可以把它想象成排水管中的水流。

  • 1. TCP連接過程

如下圖所示,可以看到建立一個TCP連接的過程為(三次握手的過程):

架構師必懂的  ——網絡編程基本常識

第一次握手

客戶端向服務端發送連接請求報文段。該報文段中包含自身的數據通訊初始序號。請求發送後,客戶端便進入 SYN-SENT 狀態。

第二次握手

服務端收到連接請求報文段後,如果同意連接,則會發送一個應答,該應答中也會包含自身的數據通訊初始序號,發送完成後便進入 SYN-RECEIVED 狀態。

第三次握手

當客戶端收到連接同意的應答後,還要向服務端發送一個確認報文。客戶端發完這個報文段後便進入 ESTABLISHED 狀態,服務端收到這個應答後也進入 ESTABLISHED 狀態,此時連接建立成功。

這裡可能大家會有個疑惑:為什麼 TCP 建立連接需要三次握手,而不是兩次?這是因為這是為了防止出現失效的連接請求報文段被服務端接收的情況,從而產生錯誤。

架構師必懂的  ——網絡編程基本常識

  • 2. TCP斷開鏈接
架構師必懂的  ——網絡編程基本常識

TCP 是全雙工的,在斷開連接時兩端都需要發送 FIN 和 ACK。

第一次握手

若客戶端 A 認為數據發送完成,則它需要向服務端 B 發送連接釋放請求。

第二次握手

B 收到連接釋放請求後,會告訴應用層要釋放 TCP 鏈接。然後會發送 ACK 包,並進入 CLOSE_WAIT 狀態,此時表明 A 到 B 的連接已經釋放,不再接收 A 發的數據了。但是因為 TCP 連接是雙向的,所以 B 仍舊可以發送數據給 A。

第三次握手

B 如果此時還有沒發完的數據會繼續發送,完畢後會向 A 發送連接釋放請求,然後 B 便進入 LAST-ACK 狀態。

第四次握手

A 收到釋放請求後,向 B 發送確認應答,此時 A 進入 TIME-WAIT 狀態。該狀態會持續 2MSL(最大段生存期,指報文段在網絡中生存的時間,超時會被拋棄) 時間,若該時間段內沒有 B 的重發請求的話,就進入 CLOSED 狀態。當 B 收到確認應答後,也便進入 CLOSED 狀態。

  • 3. TCP協議的特點
  • 面向連接面向連接,是指發送數據之前必須在兩端建立連接。建立連接的方法是“三次握手”,這樣能建立可靠的連接。建立連接,是為數據的可靠傳輸打下了基礎。
  • 僅支持單播傳輸

每條TCP傳輸連接只能有兩個端點,只能進行點對點的數據傳輸,不支持多播和廣播傳輸方式。

  • 面向字節流

TCP不像UDP一樣那樣一個個報文獨立地傳輸,而是在不保留報文邊界的情況下以字節流方式進行傳輸。

  • 可靠傳輸對於可靠傳輸,判斷丟包,誤碼靠的是TCP的段編號以及確認號。TCP為了保證報文傳輸的可靠,就給每個包一個序號,同時序號也保證了傳送到接收端實體的包的按序接收。然後接收端實體對已成功收到的字節發回一個相應的確認(ACK);如果發送端實體在合理的往返時延(RTT)內未收到確認,那麼對應的數據(假設丟失了)將會被重傳。
  • 提供擁塞控制

當網絡出現擁塞的時候,TCP能夠減小向網絡注入數據的速率和數量,緩解擁塞

  • TCP提供全雙工通信

TCP允許通信雙方的應用程序在任何時候都能發送數據,因為TCP連接的兩端都設有緩存,用來臨時存放雙向通信的數據。當然,TCP可以立即發送一個數據段,也可以緩存一段時間以便一次發送更多的數據段(最大的數據段大小取決於MSS)

六、什麼是UDP?

UDP協議全稱是用戶數據報協議,在網絡中它與TCP協議一樣用於處理數據包,是一種無連接的協議。在OSI模型中,在第四層——傳輸層,處於IP協議的上一層。UDP有不提供數據包分組、組裝和不能對數據包進行排序的缺點,也就是說,當報文發送之後,是無法得知其是否安全完整到達的。

它有以下幾個特點:

1. 面向無連接

首先 UDP 是不需要和 TCP一樣在發送數據前進行三次握手建立連接的,想發數據就可以開始發送了。並且也只是數據報文的搬運工,不會對數據報文進行任何拆分和拼接操作。

具體來說就是:

  • 在發送端,應用層將數據傳遞給傳輸層的 UDP 協議,UDP 只會給數據增加一個 UDP 頭標識下是 UDP 協議,然後就傳遞給網絡層了
  • 在接收端,網絡層將數據傳遞給傳輸層,UDP 只去除 IP 報文頭就傳遞給應用層,不會任何拼接操作

2. 有單播,多播,廣播的功能

UDP 不止支持一對一的傳輸方式,同樣支持一對多,多對多,多對一的方式,也就是說 UDP 提供了單播,多播,廣播的功能。

3. UDP是面向報文的

發送方的UDP對應用程序交下來的報文,在添加首部後就向下交付IP層。UDP對應用層交下來的報文,既不合並,也不拆分,而是保留這些報文的邊界。因此,應用程序必須選擇合適大小的報文

4. 不可靠性

首先不可靠性體現在無連接上,通信都不需要建立連接,想發就發,這樣的情況肯定不可靠。並且收到什麼數據就傳遞什麼數據,並且也不會備份數據,發送數據也不會關心對方是否已經正確接收到數據了。再者網絡環境時好時壞,但是 UDP 因為沒有擁塞控制,一直會以恆定的速度發送數據。即使網絡條件不好,也不會對發送速率進行調整。這樣實現的弊端就是在網絡條件不好的情況下可能會導致丟包,但是優點也很明顯,在某些實時性要求高的場景(比如電話會議)就需要使用 UDP 而不是 TCP。

架構師必懂的  ——網絡編程基本常識

從上面的動態圖可以得知,UDP只會把想發的數據報文一股腦的丟給對方,並不在意數據有無安全完整到達。

5. 頭部開銷小,傳輸數據報文時是很高效的。

架構師必懂的  ——網絡編程基本常識

UDP 頭部包含了以下幾個數據:

  • 兩個十六位的端口號,分別為源端口(可選字段)和目標端口
  • 整個數據報文的長度
  • 整個數據報文的檢驗和(IPv4 可選 字段),該字段用於發現頭部信息和數據中的錯誤

因此 UDP 的頭部開銷小,只有八字節,相比 TCP 的至少二十字節要少得多,在傳輸數據報文時是很高效的


七、TCP/UDP區別


架構師必懂的  ——網絡編程基本常識


  • 對比
架構師必懂的  ——網絡編程基本常識

  • 總結

TCP向上層提供面向連接的可靠服務 ,UDP向上層提供無連接不可靠服務,雖然 UDP 並沒有 TCP 傳輸來的準確,但是也能在很多實時性要求高的地方有所作為,對數據準確性要求高,速度可以相對較慢的,可以選用TCP。

希望作品能給大家帶來知識與快樂,歡迎關注、轉發、評論。


分享到:


相關文章: