本文讲了如何使用HTTP协议——基于该协议进行数据交换——HTTP报文的写法。
目前正在使用的版本均可参照以下(1.1和2),最早的两个版本这里就不考古了。
请求消息由四部分组成:请求行(request line)、请求头部(header)、空行、请求数据。响应消息和请求很像,也是四个部分:状态行、消息报头、空行、响应正文。 | |
| |
| 类似于 GET 请求,服务器只返回响应头,不发送响应内容。
|
| 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。此处即可看出与GET的区别:不仅向服务器请求数据,还提交了数据。
|
| 从客户端向服务器传送的数据取代指定的文档的内容。(只送不取) |
| |
| HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接与非加密的HTTP代理服务器的通信。 |
| |
| |
| 对 PUT 方法的补充,用来对已知资源进行局部更新 。
|
| |
| |
| 浏览器能够进行解码的数据编码方式,比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间。 |
| 浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到。 |
| 授权信息,通常出现在对服务器发送的WWW-Authenticate头的应答中。 |
| |
| |
| |
|
|
| 请求发送者的email地址,由一些特殊的Web客户程序使用,浏览器不会用到它。 |
| |
| 只有当所请求的内容在指定的日期之后又经过修改才返回它,否则返回304“Not Modified”应答。 |
| 指定“no-cache”值表示服务器必须返回一个刷新后的文档,即使它是代理服务器而且已经有了页面的本地拷贝。 |
| 包含一个URL,用户从该URL代表的页面出发访问当前请求的页面。 |
| 浏览器类型,如果Servlet返回的内容与浏览器类型有关则该值非常有用。 |
相应信息的首行为状态行,状态行包括三部分:HTTP协议版本(HTTP-Version)、状态码(Status-Code)、状态码的文本描述(Reason-Phrase),三者之间用空格分隔。文本描述是对状态码信息的补充。
状态码:
状态码
| 状态码的文本描述
| 含义
|
| | |
| | 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议 |
|
| | |
| | |
| | |
| Non-Authoritative Information | 非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本 |
| | 无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档 |
| | 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域 |
| | |
|
| | 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择 |
| | 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替 |
| | 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI |
| | 查看其它地址。与301类似。使用GET和POST请求查看 |
| | 未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源 |
| | |
| | |
| | |
|
| | |
| | |
| | |
| | |
| | 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面 |
| | |
| | |
| Proxy Authentication Required | 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权 |
| | |
| | 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突 |
| | 客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置 |
| | 服务器无法处理客户端发送的不带Content-Length的请求信息 |
| | |
| | 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息 |
| | 请求的URI过长(URI通常为网址),服务器无法处理 |
| | |
| Requested range not satisfiable | |
| | |
|
| | |
| | |
| | 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应 |
| | 由于超载或系统维护,服务器暂时的无法处理客户端的请求,一段时间后可能恢复正常。延时的长度可包含在服务器的Retry-After头信息中 |
| | 充当网关或代理的服务器,未及时从远端服务器获取请求 |
| HTTP Version not supported | 服务器不支持请求的HTTP协议的版本,无法完成处理 |
| |
| 文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE
4、IE
5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader("Accept-Encoding"))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。 |
| 表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入
ByteArrayOutputStream,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。 |
| 用于告知客户端(浏览器),服务器发送给客户端的文件/数据的类型与编码方式,这决定了浏览器以什么形式、编码读取这个文件/数据。 表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType。 |
| 当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。 |
| |
| 文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not
Modified)状态。Last-Modified也可用setDateHeader方法来设置。 |
| 表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。 |
| 表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。 注意这种功能通常是通过设置HTML页面HEAD区的<META
HTTP-EQUIV="Refresh"
CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。
注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META
HTTP-EQUIV="Refresh" ...>。
注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。 |
| 服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。 |
| 设置和页面关联的Cookie。Servlet不应使用response.setHeader("Set-Cookie", ...),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。 |
| 客户应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader("WWW-Authenticate",
"BASIC realm=\"executives\"")。 注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。 |
很遗憾,碍于笔者的学识以及搜集到的资料有限,关于请求方法的具体使用、请求响应头信息字段对应的值、具有代表性概括性的报文实例这三部分,我做不到阐述的尽善尽美,甚至还有些残破,所以索性就不拿出来了,待完善后再将这一话题的内容重发更新。