純粹乾貨,萬維網的前世今生

關於爬蟲的知識就告一段落了,在爬蟲的爬取數據

中,學記所記錄的是網頁端的內容,也就是WEB端的內容。由於在爬蟲的知識中web只是其中一個數據源,因此對於 WEB 的知識沒有很詳細的進行講述。


為此,在這篇文章中,我們就來詳細的瞭解一下 web的相關知識。


在瞭解網頁之前,先來了解一下網頁的集合體—萬維網。


萬維網


萬維網(World Wide Web)亦作WWW,是一個通過互聯網訪問,由許多

互相鏈接的超文本組成的系統。英國科學家蒂姆·伯納斯-1989年發明了萬維網。1990年他編寫了第一個網頁瀏覽器。網頁瀏覽器於1991年發行,1991年1月最先向研究機構發行,並於1991年8月在互聯網上向公眾開放。

純粹乾貨,萬維網的前世今生

蒂姆·伯納斯-李

萬維網是信息時代發展的核心,也是數十億人在互聯網上進行交流的主要工具。


萬維網並不等同於互聯網,萬維網只是互聯網所能提供的服務其中之一,是依附於互聯網運行的一項服務


萬維網的起源


萬維網最早的構想可以追溯到遙遠的1980年,蒂姆·伯納斯-李構建的ENQUIRE項目。這是一個類似維基百科超文本在線編輯數據庫

。儘管這個項目與我們現在使用的萬維網大不相同,但是它們之間有許多相同的核心思想。


1989年3月,伯納斯.撰寫了《關於信息化管理的建議》一文,文中提及ENQUIRE並且描述了一個更加精巧管理模型。1990年11月12日他和羅伯特·卡里奧合作提出了一個更加正式的關於萬維網的建議。在1990年11月13日他在一臺NeXT工作站上寫了第一個網頁以實現他文中的想法。

純粹乾貨,萬維網的前世今生

羅伯特·卡里奧設計的web圖標


在1990年的聖誕節,伯納斯-李製作了要讓網頁工作的所有必要工具:第一個網頁瀏覽器WorldWideWeb(同時也是網頁編輯器)和第一個網頁服務器

純粹乾貨,萬維網的前世今生

世界上第一臺作為網頁服務器的NeXT電腦


萬維網上需要單向連接而不是雙向連接,這使得任何人可以在資源擁有者不作任何行動情況下鏈接該資源。和早期的網絡系統相比,這一點對於減少實現網絡服務器網絡瀏覽器的困難至關重要。萬維網不像某些應用軟件,它不是私有的,這使得服務器客戶端能夠獨立地發展擴展,而不受許可限制。


1994年10月,萬維網聯盟(W3C)在麻省理工學院計算機科學實驗室

成立,創建者是萬維網的發明者蒂姆·伯納斯-李。到了1994年底,全球網站數量仍然相對稀少,但是很多著名網站已經相當活躍,這些網站已經預示或者啟發了當今最流行的服務。

純粹乾貨,萬維網的前世今生

萬維工作室的標牌


通過互聯網,世界各地都創建了其他網站。這促進了協議和格式化的國際標準發展。伯納斯-李繼續參與指導萬維網標準的開發,例如編寫網頁的標記語言。萬維網通過一種易於使用和靈活的格式,使信息在互聯網上傳播。因此,萬維網對於互聯網的普及發揮了重要的作用。雖然這兩個詞語有時被混在一起使用,但萬維網並不是互聯網的同義詞。萬維網是一個信息空間(Information space),包含超鏈接文檔和其他資源,由其URIs標識。它使用互聯網協議如TCP/IPHTTP實現為客戶端和服務端服務。


那為什麼World Wide Web 在中文環境中被稱為萬維網呢?


1994年6月,在北美留學的李小文(中國科學院院士)於中國新聞電腦網絡(CND)的電子出版物《華夏文摘》上首次將“World Wide Web”稱為“萬維天羅地網”,簡稱“萬維網”,這樣其中文名稱漢語拼音也是以WWW開始,自此“萬維網”這一名稱開始被廣泛採用。

純粹乾貨,萬維網的前世今生

名副其實的掃地僧


萬維網的核心部分是由三個標準構成的:


  1. 統一資源標識符URI),這是個為資源定位的標識系統。
  2. 超文本傳送協議HTTP),此協議負責規定客戶端和服務器之間的交流規則。
  3. 超文本標記語言HTML),此語言作用是定義超文本文檔的結構和格式。


萬維網由上述三者構成,而網頁主要是由 URI 和 HTML 構成,超文本傳輸協議此前學記曾經詳細的介紹過,因此此次就略過它,繼續介紹 URI 和 HTML。


統一資源標識符URI


統一資源標識符Uniform Resource Identifier)在電腦術語中是一個用於標識某一互聯網資源名稱的字符串


該種標識允許用戶對網絡中(一般指萬維網)的資源通過特定的協議進行交互操作。URI的最常見的形式是統一資源定位符(URL),經常指定為非正式的網址。更罕見的用法是

統一資源名稱(URN),其目的是通過提供一種途徑。用於在特定的名字空間資源的標識,以補充網址。


URL(定位符)和URN(名稱)方案屬於URI的子類,URI可以為URL或URN兩者之一或同時是URI和URN。技術上講,URL和URN屬於資源ID;但是,人們往往無法將某種方案歸類於兩者中的某一個:所有的URI都可被作為名稱看待,而某些方案同時體現了兩者中的不同部分。


URI可被視為定位符(URL),名稱(URN)或兩者兼備。統一資源名(URN)如同一個人的名稱,而統一資源定位符(URL)代表一個人的住址。換言之,URN定義某事物的身份,而URL提供查找該事物的方法


通用URI的格式如下:

[協議名]://[用戶名]:[密碼]@[主機名]:[端口]/[路徑]?[查詢參數]#[片段ID]


EX:https://www.baidu.com/tn=62004195_oem_dg


URI的歷史


URI與URL有著共同的歷史。在1990年,蒂姆·伯納斯-李的關於超文本提案中,間接地引入了使用URL作為一個表示超鏈接目標資源短字符串的概念。當時,人們稱之為“超文本名”或“文檔名”。


在之後的三年半中,由於萬維網的超文本標記語言核心技術、HTTP瀏覽器都得到了發展,區別提供資源訪問

資源標記的兩種字符串的必要性開始顯現。雖然在當時,未被正式定義,但“統一資源定位符”這一術語開始被用於代表URI,而URL則由“統一資源名稱”所表示。


上面的內容就是有關 URI 的知識,構成網頁的一大關鍵已經介紹了,我們來繼續看下一個關鍵知識—超文本。


超文本


超文本(Hypertext)是一種可以顯示在電腦顯示器或其他電子設備的文本,其中的文字包含有可以鏈接到其他字段或者文檔的超鏈接,允許從當前閱讀位置直接切換到超鏈接

所指向的文字。(就是我們在網頁進行瀏覽時可以點擊的字段)超文本文檔通過超鏈接相互鏈接,超鏈接通常通過鼠標點擊按鍵設置觸屏來點閱。


超文本系統


超文本系統是一種提供了複雜格式的解釋的軟件系統,包括文本,圖像,超鏈接一種文字間的跳轉以提供某一個關鍵詞的相關內容。這種系統為出版、更新和搜尋的工作提供了更多的便利。最成功的超文本系統之應用,就是在互聯網上使用的萬維網。


這就是網頁的另一構成部分超文本的知識。


如果想學習更多科技知識,可以點擊關注


如果對文章中的內容有什麼困惑的地方,可以在評論區提出自己的問題,學記同大家一起交流,解決各種問題,一起進步。


青年學記 陪伴著各位青年

純粹乾貨,萬維網的前世今生


作者:青年學記 一名不斷進步的程序


一起學習 一起進步


走向自立


分享到:


相關文章: