HTTP协议系列——网页搜索的全过程_技术 _ 頭條網

首先我们谈到HTTP协议时，最多的最常见的是应用到浏览器的访问过程，在《图解HTTP》协议中更多的只是涉及到HTTP的请求响应过程，再多点就加个代理服务器，那么当你在你的浏览器输入www.baidu.com到底发生了什么呢?

接下来我将从网络基础的角度对这一问题进行说明。

说到这里关于网络通信的东西就更纷繁复杂了，以下是涉及的网络通信的主要协议栈。

F1.协议栈

HTTP具体过程：你访问百度的全过程解析

第一步：

你输入的URL（www.baidu.com)是百度的域名，而互联网中进行信息传输的是IP封装的报文或字节流。所以互联网并不认识你的www.baidu.com,这时它就需要DNS（Domain Name System)域名解析系统，支持UDP和TCP的访问，端口号均是53，主要基于UDP，简单点说DNS就是用于TCP/IP的分布式的数据库，它提供主机名字和IP地址之间的转换及有关电子邮件的选路信息。这里提到的分布式是指在 I n t e r n e t 上的单个站点不能拥有所有的信息。每个站点（如大学中的系、校园、公司或公司中的部门）保留它自己的信息数据库，并运行一个服务器程序供 I n t e r n e t上的其他系统（客户程序）查询。 D N S提供了允许服务器和客户程序相互通信的协议。好了，当你输完URL，DNS协议已经将你的(www.baidu.com)解析为某个IP（因为百度的访问量实在太大，所以他们使用了服务器集群分流，所以当你和外地的老王在命令窗口Ping完显示的IP不同也不用担心。）

第二步：

当你已经解析到IP地址了，那么根据你的目的IP，你的计算机会通过网络（期间不知道经过多少交换机、路由器，可在个人PC的cmd窗口输入netstat -r 去查看路由表，不知道有多少次的封装报文、解析报文）为你的IP地址找到浏览器客户端到服务器的路径。主要通过传输层TCP的封装成数据包，在客户端的传输层，会将HTTP会话请求分成报文段，添加源和目的端口。TCP会给在这一步里面最重要的就是于WEB服务器建立TCP连接。

第三步：

与应用层的HTTP进行会话（在应用层就是我们具体学习到的协议相关）此时会HTTP请求，这就需要回顾请求的全过程了，最主要的方法是GET。

重要的首部字段需要了解的比如HEADER里面涉及到的

user-agent:产生请求的浏览器类型

accept :客户端可识别的内容类型列表

host：请求的主机，允许多个域名同个IP，即虚拟主机

Accept-Language:客户端可接收的自然语言

Accept-Encoding:客户端可接收的编码方式

Accept-Charset :可接收的应答字符集

connection :连接方式（close or keep alive)

Cookie : 存储客户端可扩展字段，向同一域名的服务端发送属于该域的cookie

第四步：

服务器的永久重定向响应（301）

是否带www

响应内容

Location

Connection

第五步：

浏览器跟踪重定向地址

再发一个HTTP get

第六步：

服务器处理请求

第七步

服务器返回个HTML响应

第八步：

释放TCP连接。connection 模式为close，则服务器主动关闭TCP 连接，客户端被动关闭连接，释放TCP 连接;若connection 模式为keepalive，则该连接会保持一段时间，在该时间内可以继续接收请求;

第九步：

客户端解析HTML内容

HTTP报文解析：

网络智能机顶盒开机认证全过程就是典型的HTTP协议

给大家展现一下具体报文：

（在这里又不得不安利一下，我日常使用的wireshark，网络协议与报文相关的真好用）

F2.WireShark抓取

请求与响应部分：

F3.请求响应报文

不过一般设备商的机顶盒，网关一般是面向运营商的定制版本，所以HTTP过程也是必须符合电信规范要求的，首部字段等部分都是规定死的

更细节的说的话，就是从各个层来说了。在客户端的传输层，会将HTTP会话请求分成报文段，添加源和目的端口。在

客户端的网络层，主要任务是通过路由表确定如何到达服务器，客户端的链路层主要是查找IP对应MAC，然后发送ARP请求目的地址。

就像我在上篇所介绍的，网络交流的过程是IP之间的通信沟通。对于通信来说，也可以很简单的理解为发——收。专业一点的说法就是调制解调的过程。

HTTP具体过程：你访问百度的全过程解析

相關文章:

看看这篇5000字的文章，带你看不一样的Android-Http

使用nginx-http-concat优化网站响应

HTTP 协议的前世今生

安全漏洞（二）禁用 http 方法

03.02 一文读懂 HTTP

如何玩转 HTTP 3？

02.21 如何玩转 HTTP 3？

HTTP 消息

前端系列课程（4）-HTTP 协议

02.01 一文带你了解 HTTP 黑科技

带你一步步解析 HTTP

01.20 再谈 HTTP，你还要继续更新不？

01.15 HTTPS、HTTP、TLS

HTTPS、HTTP、TLS

Android网络编程-HTTP/HTTPS

服务之间的调用为啥不直接用 HTTP 而用 RPC？

Go 中 http 超时问题的排查

去哪儿 http 接口自动化测试实践

net包 http

IP、Http、Socket 有何区别与联系？

常用的RPC架构系列---http client和RestTemplate

HTTP/HTTPS抓包工具-Fiddler

2 与 HTTP

10.17 一篇搞懂TCP、HTTP、Socket、Socket连接池

axios 是怎么封装 HTTP 请求的

HTTP API接口测试实践，如何使用Postman工具进行接口测试？

简单的 HTTP 调用，为什么时延这么大？

一文读懂 HTTP

基于 HTTP 协议的几种实时数据获取技术

通讯协议：HTTP 协议极简漫画教程（简洁明了）

通讯协议：彻底弄懂 HTTP 缓存机制及原理（干货）

漫画：HTTP 协议极简教程，傻瓜都能看懂！

HTTP 的前世今生：一次性搞懂 HTTP、HTTPS、SPDY、HTTP2

HTTP 3.0有望抛弃TCP传输层：换用UDP协议

TCP、UDP、HTTP、SOCKET之间的区别与联系

TCP、UDP、HTTP、Socket之间的关系和相关知识

Http 持久连接与 HttpClient 连接池

为什么说 IPFS 将会替代 HTTP

HTTP 与 HTTPS 的区别

计算机网络基础：这是一份详细 HTTP 学习指南

入侵者的眼中理解的 http 协议

HTTP 常用知识记录

图解 HTTP 协议

http session会话保持的几种方式

典型DDOS攻击——HTTP URI CC攻击及防御探讨

《 图解 HTTP 》读书笔记

物联网网关协议选择---HTTP VS MQTT

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

网络工程师职业生涯中，哪两点是最重要的？

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

《图解 HTTP 》读书笔记

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪