公众号后台回复“面试”,获取精品学习资料

扫描下方海报了解专栏详情

本文来源:Java建设者
《Java工程师面试突击(第3季)》重磅升级,由原来的70讲增至160讲,内容扩充一倍多,升级部分内容请参见文末
HTTP 和 HTTPS 的区别
超文本传输协议(Hypertext Transfer Protocol),HTTP 是一个在计算机世界里专门在两点之间传输文字、图片、音频、视频等超文本数据的约定和规范

超文本就是不单单只是本文,它还可以传输图片、音频、视频,甚至点击文字或图片能够进行 超链接
的跳转。上面这些概念可以统称为数据,传输就是数据需要经过一系列的物理介质从一个端系统传送到另外一个端系统的过程。通常我们把传输数据包的一方称为 请求方
,把接到二进制数据包的一方称为应答方
。而协议指的就是是网络中(包括互联网)传递、管理信息的一些规范。如同人与人之间相互交流是需要遵循一定的规矩一样,计算机之间的相互通信需要共同遵守一定的规则,这些规则就称为协议,只不过是网络协议。



Hypertext Transfer Protocol Secure,从名称我们可以看出 HTTPS 要比 HTTPS 多了 secure 安全性这个概念,实际上, HTTPS 并不是一个新的应用层协议,它其实就是 HTTP + TLS/SSL 协议组合而成,而安全性的保证正是 TLS/SSL 所做的工作。

最简单的,HTTP 在地址栏上的协议是以 http://
开头,而 HTTPS 在地址栏上的协议是以https://
开头
http://www.cxuanblog.com/
https://www.cxuanblog.com/
HTTP 是未经安全加密的协议,它的传输过程容易被攻击者监听、数据容易被窃取、发送方和接收方容易被伪造;而 HTTPS 是安全的协议,它通过 密钥交换算法 - 签名算法 - 对称加密算法 - 摘要算法 能够解决上面这些问题。

HTTP 的默认端口是 80,而 HTTPS 的默认端口是 443。
HTTP Get 和 Post 区别
get 方法一般用于请求,比如你在浏览器地址栏输入 www.cxuanblog.com
其实就是发送了一个 get 请求,它的主要特征是请求服务器返回资源,而 post 方法一般用于表单
的提交,相当于是把信息提交给服务器,等待服务器作出响应,get 相当于一个是 pull/拉的操作,而 post 相当于是一个 push/推的操作。get 方法是不安全的,因为你在发送请求的过程中,你的请求参数会拼在 URL 后面,从而导致容易被攻击者窃取,对你的信息造成破坏和伪造;
/test/demo_form.asp?name1=value1&name2=value2
POST /test/demo_form.asp HTTP/1.1
Host: w3schools.com
name1=value1&name2=value2
get 请求的 URL 有长度限制,而 post 请求会把参数和值放在消息体中,对数据长度没有要求。 get 请求会被浏览器主动 cache,而 post 不会,除非手动设置。 get 请求在浏览器反复的 回退/前进
操作是无害的,而 post 操作会再次提交表单请求。get 请求在发送过程中会产生一个 TCP 数据包;post 在发送过程中会产生两个 TCP 数据包。对于 get 方式的请求,浏览器会把 http header 和 data 一并发送出去,服务器响应 200(返回数据);而对于 post,浏览器先发送 header,服务器响应 100 continue,浏览器再发送 data,服务器响应 200 ok(返回数据)。
什么是无状态协议,HTTP 是无状态协议吗,怎么解决
无状态协议(Stateless Protocol)就是指浏览器对于事务的处理没有记忆能力。举个例子来说就是比如客户请求获得网页之后关闭浏览器,然后再次启动浏览器,登录该网站,但是服务器并不知道客户关闭了一次浏览器。
小甜饼(Cookie)的机制。它能够让浏览器具有
记忆能力。



JWT 的 Cookie 信息存储在 客户端
,而不是服务端内存中。也就是说,JWT 直接本地进行验证就可以,验证完毕后,这个 Token 就会在 Session 中随请求一起发送到服务器,通过这种方式,可以节省服务器资源,并且 token 可以进行多次验证。JWT 支持跨域认证,Cookies 只能用在 单个节点的域
或者它的子域
中有效。如果它们尝试通过第三个节点访问,就会被禁止。使用 JWT 可以解决这个问题,使用 JWT 能够通过多个节点
进行用户认证,也就是我们常说的跨域认证
。
UDP 和 TCP 的区别
UDP 是什么
User Datagram Protocol,用户数据报协议。它不需要所谓的
握手操作,从而加快了通信速度,允许网络上的其他主机在接收方同意通信之前进行数据传输。
数据报是与分组交换网络关联的传输单元。
UDP 能够支持容忍数据包丢失的带宽密集型应用程序 UDP 具有低延迟的特点 UDP 能够发送大量的数据包 UDP 能够允许 DNS 查找,DNS 是建立在 UDP 之上的应用层协议。
TCP 是什么
Transmission Control Protocol,传输控制协议。它能够帮助你确定计算机连接到 Internet 以及它们之间的数据传输。通过三次握手来建立 TCP 连接,三次握手就是用来启动和确认 TCP 连接的过程。一旦连接建立后,就可以发送数据了,当数据传输完成后,会通过关闭虚拟电路来断开连接。
TCP 能够确保连接的建立和数据包的发送 TCP 支持错误重传机制 TCP 支持拥塞控制,能够在网络拥堵的情况下延迟发送 TCP 能够提供错误校验和,甄别有害的数据包。
TCP 和 UDP 的不同


TCP 三次握手和四次挥手
TCP 三次握手

SYN:它的全称是 Synchronize Sequence Numbers
,同步序列编号。是 TCP/IP 建立连接时使用的握手信号。在客户机和服务器之间建立 TCP 连接时,首先会发送的一个信号。客户端在接受到 SYN 消息时,就会在自己的段内生成一个随机值 X。SYN-ACK:服务器收到 SYN 后,打开客户端连接,发送一个 SYN-ACK 作为答复。确认号设置为比接收到的序列号多一个,即 X + 1,服务器为数据包选择的序列号是另一个随机数 Y。 ACK: Acknowledge character
, 确认字符,表示发来的数据已确认接收无误。最后,客户端将 ACK 发送给服务器。序列号被设置为所接收的确认值即 Y + 1。

小明给小红打电话,接通了后,小明说喂,能听到吗,这就相当于是连接建立。 小红给小明回应,能听到,你能听到我说的话吗,这就相当于是请求响应。 小明听到小红的回应后,好的,这相当于是连接确认。在这之后小明和小红就可以通话/交换信息了。
TCP 四次挥手

首先,客户端应用程序决定要终止连接(这里服务端也可以选择断开连接)。这会使客户端将 FIN 发送到服务器,并进入 FIN_WAIT_1
状态。当客户端处于 FIN_WAIT_1 状态时,它会等待来自服务器的 ACK 响应。然后第二步,当服务器收到 FIN 消息时,服务器会立刻向客户端发送 ACK 确认消息。 当客户端收到服务器发送的 ACK 响应后,客户端就进入 FIN_WAIT_2
状态,然后等待来自服务器的FIN
消息服务器发送 ACK 确认消息后,一段时间(可以进行关闭后)会发送 FIN 消息给客户端,告知客户端可以进行关闭。 当客户端收到从服务端发送的 FIN 消息时,客户端就会由 FIN_WAIT_2 状态变为 TIME_WAIT
状态。处于 TIME_WAIT 状态的客户端允许重新发送 ACK 到服务器为了防止信息丢失。客户端在 TIME_WAIT 状态下花费的时间取决于它的实现,在等待一段时间后,连接关闭,客户端上所有的资源(包括端口号和缓冲区数据)都被释放。
小明对小红说,我所有的东西都说完了,我要挂电话了。 小红说,收到,我这边还有一些东西没说。 经过若干秒后,小红也说完了,小红说,我说完了,现在可以挂断了 小明收到消息后,又等了若干时间后,挂断了电话。
简述 HTTP1.0/1.1/2.0 的区别
HTTP 1.0
HTTP 1.0 仅仅提供了最基本的认证,这时候用户名和密码还未经加密,因此很容易收到窥探。 HTTP 1.0 被设计用来使用短链接,即每次发送数据都会经过 TCP 的三次握手和四次挥手,效率比较低。 HTTP 1.0 只使用 header 中的 If-Modified-Since 和 Expires 作为缓存失效的标准。 HTTP 1.0 不支持断点续传,也就是说,每次都会传送全部的页面和数据。 HTTP 1.0 认为每台计算机只能绑定一个 IP,所以请求消息中的 URL 并没有传递主机名(hostname)。
HTTP 1.1
HTTP 1.1 使用了摘要算法来进行身份验证 HTTP 1.1 默认使用长连接,长连接就是只需一次建立就可以传输多次数据,传输完成后,只需要一次切断连接即可。长连接的连接时长可以通过请求头中的 keep-alive
来设置HTTP 1.1 中新增加了 E-tag,If-Unmodified-Since, If-Match, If-None-Match 等缓存控制标头来控制缓存失效。 HTTP 1.1 支持断点续传,通过使用请求头中的 Range
来实现。HTTP 1.1 使用了虚拟网络,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。
HTTP 2.0
头部压缩
,由于 HTTP 1.1 经常会出现 User-Agent、Cookie、Accept、Server、Range 等字段可能会占用几百甚至几千字节,而 Body 却经常只有几十字节,所以导致头部偏重。HTTP 2.0 使用HPACK
算法进行压缩。二进制格式
,HTTP 2.0 使用了更加靠近 TCP/IP 的二进制格式,而抛弃了 ASCII 码,提升了解析效率强化安全
,由于安全已经成为重中之重,所以 HTTP2.0 一般都跑在 HTTPS 上。多路复用
,即每一个请求都是是用作连接共享。一个请求对应一个id,这样一个连接上可以有多个请求。

请你说一下 HTTP 常见的请求头
通用标头、
实体标头、
请求标头、
响应标头。分别介绍一下
通用标头
Date、
Cache-Control和
ConnectionDate: Wed, 21 Oct 2015 07:28:00 GMT

请求标头和
响应标头中,Cache-Control 的种类比较多,虽然说这是一个通用标头,但是有一些特性是请求标头具有的,有一些是响应标头才有的。主要大类有
可缓存性、
阈值性、
重新验证并重新加载和
其他特性持久性连接,即一次事务完成后不关闭网络连接
Connection: keep-alive
非持久性连接,即一次事务完成后关闭网络连接
Connection: close

实体标头
Content-Length、
Content-Language、
Content-Encoding是实体头。
Content-Length 实体报头指示实体主体的大小,以字节为单位,发送到接收方。 Content-Language 实体报头描述了客户端或者服务端能够接受的语言。 Content-Encoding 这又是一个比较麻烦的属性,这个实体报头用来压缩媒体类型。Content-Encoding 指示对实体应用了何种编码。 常见的内容编码有这几种: gzip、compress、deflate、identity ,这个属性可以应用在请求报文和响应报文中
Accept-Encoding: gzip, deflate //请求头
Content-Encoding: gzip //响应头

请求标头
Host: developer.mozilla.org
Accpet、
Accept-Language、
Accept-Encoding都是属于内容协商的请求标头。
Referer: https://developer.mozilla.org/testpage.html
Last-Modified来确定。
Last-Modified之后更新了服务器资源,那么服务器会响应 200,如果在
Last-Modified之后没有更新过资源,则返回 304。
If-Modified-Since: Mon, 18 Jul 2016 02:36:04 GMT
ETag时,服务器才会以 200 状态发送回请求的资源。对于其他方法,仅当最终现有资源的
ETag与列出的任何值都不匹配时,才会处理请求。
If-None-Match: "c561c68d0ba92bbeb8b0fff2a9199f722e3a621a"

响应标头
Access-Control-Allow-Origin指定一个来源,它告诉浏览器允许该来源进行资源访问。
Server: Apache/2.4.1 (Unix)
X-Frame-Options属于 HTTP 响应首部,用于控制网站内容在其他 Web 网站的 Frame 标签内的显示问题。其主要目的是为了防止点击劫持(clickjacking)攻击。

地址栏输入 URL 发生了什么
首先,你需要在浏览器中的 URL 地址上,输入你想访问的地址,如下

然后,浏览器会根据你输入的 URL 地址,去查找域名是否被本地 DNS 缓存,不同浏览器对 DNS 的设置不同,如果浏览器缓存了你想访问的 URL 地址,那就直接返回 ip。如果没有缓存你的 URL 地址,浏览器就会发起系统调用来查询本机 hosts
文件是否有配置 ip 地址,如果找到,直接返回。如果找不到,就向网络中发起一个 DNS 查询。
首先来看一下 DNS 是啥,互联网中识别主机的方式有两种,通过 主机名
和IP 地址
。我们人喜欢用名字的方式进行记忆,但是通信链路中的路由却喜欢定长、有层次结构的 IP 地址。所以就需要一种能够把主机名到 IP 地址的转换服务,这种服务就是由 DNS 提供的。DNS 的全称是 Domain Name System
域名系统。DNS 是一种由分层的 DNS 服务器实现的分布式数据库。DNS 运行在 UDP 上,使用 53 端口。

本地 DNS 服务器(local DNS server)。
ISP(Internet Service Provider)比如居民区的 ISP 或者一个机构的 ISP 都有一台本地 DNS 服务器。当主机和 ISP 进行连接时,该 ISP 会提供一台主机的 IP 地址,该主机会具有一台或多台其本地 DNS 服务器的 IP地址。
注意:DNS 涉及两种查询方式:一种是 递归查询(Recursive query)
,一种是迭代查询(Iteration query)
。《计算机网络:自顶向下方法》竟然没有给出递归查询和迭代查询的区别,找了一下网上的资料大概明白了下。如果根域名服务器无法告知本地 DNS 服务器下一步需要访问哪个顶级域名服务器,就会使用递归查询; 如果根域名服务器能够告知 DNS 服务器下一步需要访问的顶级域名服务器,就会使用迭代查询。
第三步,浏览器需要和目标服务器建立 TCP 连接,需要经过三次握手的过程,具体的握手过程请参考上面的回答。 在建立连接后,浏览器会向目标服务器发起 HTTP-GET
请求,包括其中的 URL,HTTP 1.1 后默认使用长连接,只需要一次握手即可多次传输数据。如果目标服务器只是一个简单的页面,就会直接返回。但是对于某些大型网站的站点,往往不会直接返回主机名所在的页面,而会直接重定向。返回的状态码就不是 200 ,而是 301,302 以 3 开头的重定向码,浏览器在获取了重定向响应后,在响应报文中 Location 项找到重定向地址,浏览器重新第一步访问即可。 然后浏览器重新发送请求,携带新的 URL,返回状态码 200 OK,表示服务器可以响应请求,返回报文。
HTTPS 的工作原理

密钥交换算法的类型和双方支持的
密码套件而不同。我们以
RSA 非对称加密来讨论这个过程。整个 TLS 通信流程图如下

在进行通信前,首先会进行 HTTP 的三次握手,握手完成后,再进行 TLS 的握手过程 ClientHello:客户端通过向服务器发送 hello
消息来发起握手过程。这个消息中会夹带着客户端支持的TLS 版本号(TLS1.0 、TLS1.2、TLS1.3)
、客户端支持的密码套件、以及一串客户端随机数
。ServerHello:在客户端发送 hello 消息后,服务器会发送一条消息,这条消息包含了服务器的 SSL 证书、服务器选择的密码套件和服务器生成的随机数。 认证(Authentication):客户端的证书颁发机构会认证 SSL 证书,然后发送 Certificate
报文,报文中包含公开密钥证书。最后服务器发送ServerHelloDone
作为hello
请求的响应。第一部分握手阶段结束。加密阶段
:在第一个阶段握手完成后,客户端会发送ClientKeyExchange
作为响应,这个响应中包含了一种称为The premaster secret
的密钥字符串,这个字符串就是使用上面公开密钥证书进行加密的字符串。随后客户端会发送ChangeCipherSpec
,告诉服务端使用私钥解密这个premaster secret
的字符串,然后客户端发送Finished
告诉服务端自己发送完成了。
Session key 其实就是用公钥证书加密的公钥。
实现了安全的非对称加密
:然后,服务器再发送ChangeCipherSpec
和Finished
告诉客户端解密完成,至此实现了 RSA 的非对称加密。
文章参考:
What is a TLS handshake?
Recursive and Iterative DNS Queries
DNS递归查询与迭代查询
TCP三次握手和四次挥手过程
HTTP/1.0 AND 1.1, WHAT ARE THE DIFFERENCES?
TCP Connection Termination
Transmission_Control_Protocol
SYN
TCP 3-Way Handshake (SYN, SYN-ACK,ACK)
HTTP/2 相比 1.0 有哪些重大改进?
TCP vs UDP: What's the Difference?
计算机网络7层模型
HTTP常见面试题
END
《Java工程师面试突击第三季》加餐部分大纲:(注:1-66讲的大纲请扫描文末二维码,在课程详情页获取)



详细的课程内容,大家可以扫描下方二维码了解:

最后修改时间:2020-05-30 08:53:50
文章转载自石杉的架构笔记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。





