http协议是由w3c制定的一种网络应用层协议,定义了浏览器与web服务器之间通信时所使用的数据格式。
其通讯过程为:
1.浏览器建立与web服务器之间的连接
2.浏览器将请求数据打包(生成请求数据包)并发送到web服务器
3.web服务器将处理结果打包(生成响应数据包)并发送给浏览器
4.web服务器关闭连接
可以总结为:
建立连接——>发送请求数据包——>返回响应数据包——>关闭连接
而我们今天要介绍的就是其中的请求数据包(Request)和响应数据包(Response)。
那么一个数据包里包含哪些部分,分别有代表啥呢?
Request请求数据包数据格式:
请求数据包有四个部分组成:请求行、请求头、空行、请求体。
下面是使用burpsuite抓取的一个请求数据包。

请求行由三个标记组成:请求方法、请求URL和HTTP版本,它们用空格分隔。
例如:GET / HTTP/1.1
其中的get是请求方法,HTTP 规划定义了8种可能的请求方法:
GET:检索URL中标识资源的一个简单请求
HEAD:与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST:服务器接收被写入客户端输出流中数据的请求
PUT:服务器保存请求数据作为指定URL新内容的请求
DELETE:服务器删除URL中命令的资源的请求
OPTIONS:关于服务器支持的请求方法信息的请求
TRACE:web服务器反馈HTTP请求和其头标的请求
CONNECT:已文档化,但当前未实现的一个方法,预留做隧道处理
请求头:一些键值对,浏览器与web服务器之间都可以发送,特殊的某种含义
HOST:主机或域名地址
Accept:指浏览器或其他客户可以接受的MIME文件格式,servlet可以根据它判断并返回适当的文件格式
User-Agent:是客户浏览器名称
Host:对应网址URL中的web名称和端口号
Accept-Language:指出浏览器可以接受的语言种类,如en或者en-us,指英语
connection:用来告诉服务器是否可以维持固定的HTTP连接、http是无连接的,HTTP/1.1使用Keep-Alive为默认值,这样当浏览器需要多个文件时(比如一个HTML文件和相关的图形文件),不需要每次都建立连接
Accept-Charset:指出浏览器可以接受的字符编码
Accept-Encoding:指出浏览器可以接受的编码方式。编码方式不同于文件格式,它是为了压缩文件传递速度。浏览器在接收到web响应之后再解码,然后再检查文件格式
Cookie:浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体,他可以记载服务器相关的用户信息,也可以用来实现会话功能
Referer:表明产生请求的网页URL,这个属性可以用来跟踪web请求是从什么网站来的。
空行:请求头与请求体之间用一个空行分开
最后一个请求头标之后是空行,发送回车符和退行,通知服务器以下不再有头标
请求体:要发送的数据(一般post提交时候会用)使用POST传送,例:userName=123&password=123&returnUrl=/
Response返回数据包格式

同样也为四个部分组成:状态行、响应头标、空行、响应数据
其中,状态行:协议版本,数字形式的状态代码和状态描述,各元素之间用空格进行分割
HTTP响应码
1XX:信息,请求收到,继续处理
2XX:成功,行为被成功的接收、理解和采纳
3XX:重定向,为了完成请求,必须进一步执行的动作
4XX:客户端错误
5XX:服务器错误
200:存在文件
403:存在文件夹
3XX:均可能存在
404:不存在文件及文件夹
500:均可能存在
响应头标:包含服务器类型、日期、长度、内容类型等
像请求头标一样,它们指出服务器的功能,标识出响应数据的细节
空行:响应头与响应体之间用空行隔开
最后一个响应头标之后是一个空行,发送回车符和退行,表面服务器一下不再有头标。
响应数据:浏览器会将实体内容中额数据取出来,生成相应的页面
HTML文档和图像等,也就是HTML本身

凌云网络
图文 |丁晓鸣
审核 |孙梦丹




