http协议及httpd特性详解

前言

随着互联网的迅猛发展和网络的普及,各类网站层出不穷,网站也成为企业宣传和实力展现的主要途径之一,说到网站就不得不说一下web服务了,现在比较流行的web服务还是当属Apache即httpd。本文将详解http协议及httpd的特性。

http协议详解

http协议

http: Hyper Text Transfer Protocol 超文本传输协议

传输文本:HTML

html: Hyper Text Mark Language 超文本标记语言

html文档的生成方式

静态:纯html格式文档

动态:编程语言编写的程序可输出html格式的结果

http协议版本

http 0.9: 仅用于传输html文档

http 1.0:引入MIME机制,从而支持多媒体数据;引入keep-alive(持久连接);缓存

http 1.1:更多请求方法,更精细缓存控制;持久连接(persistent)

注意:http协议是无状态的

http事务:一次请求及对应的响应

CGI:Common Gateway Interface 通用网关接口

http协议报文

请求报文

1.jpg

报文详解

请求报文主要由请求行、请求头部和请求数据(实体)组成

①请求行

请求行由请求方法字段、请求资源字段(URL)和协议版本字段组成

http方法:

GET:请求获取一个资源,需要服务器发送
HEAD:跟GET近似,但其不需要服务响应请求的资源,而返回响应首部
POST:基于HTML表单向服务器提交数据,服务器通常需要存储此数据(位置:通常为关系型数据库)
PUT:与GET相反,向服务器发送资源;服务器通常需要存储此资源(位置:通常为文件系统)
DELETE:删除URL指向的资源
OPTIONS:探测服务器端对请求的URL所支持使用的请求方法
TRACE:跟一次请求中间所经过的代理服务器、防火墙或网关等
#注意:方法严格区分大小写

资源名称:URI (Uniform Resource Idnentifier)

URL :描述一个特定服务器上某资源的特定位置

可以是相对路径,也可以绝对路径
例如:http://www.scholar.com/download/index.html 
      分为三部分:
      scheme(方案):http://
      服务器:www.scholar.com      特定服务器上的资源:/download/index.html

协议版本:例如HTTP/1.0, HTTP/1.1

②请求头部

http协议首部:

通用首部

Connection: 定义C/S之间关于请求、响应的有关选项
Connection: keep-alive
Cache-Control: 缓存控制
Via: 显示了报文经过的中间节点

请求首部

Client-IP:客户端IP
Host: 请求的主机
Referer: 指明了请求当前资源原始资源的URL
User-Agent: 用户代理
Accept首部:
Accept: 指明服务器能发送的媒体类型
Accept-Charset: 支持使用的字符集
Accept-Encoding: 支持使用的编码方式
Accept-Language: 支持使用语言
条件式请求:
Expect: 告诉服务器能够发送哪些媒体类型
If-Modified-Since: 是否在指定时间内修改过此资源
If-None-Match:如果提供的实体标记与当前文档的实体标记不符,就获取此文档
跟安全相关请求:
Authorization: 客户端提交给服务器的认证数据,如帐号和密码
Cookie: 客户端发送给服务器身份标识

实体首部

Location: 资源的新位置
Allow: 允许对此资源使用的请求方法
内容相关的首部:
Content-Encoding: 支持编码
Content-Language:支持语言
Content-Length:文本长度
Content-Location:资源所在位置
Content-Type:主体对象类型
Content-Range:在整个资源中此实体表示的字节范围
缓存相关:
ETag: 实体标签
Expires: 过期期限
Last-Modified: 上次修改时间

③实体

实体内包含客户端请求服务器的数据

响应报文

2.jpg

报文详解

响应报文主要由状态行、响应头部和响应数据(实体)组成

①状态行

状态行由协议版本字段、状态码字段和原因短语字段组成

状态码:

1XX:信息性状态码
2XX:成功状态码
     200:OK,客户端请求成功
     201:CREATED,请求已被实现
3XX: 重定向类的状态码
     301: Moved Permanently, 永久重定向
     302: Found, 临时重定向,会在响应报文中使用“Location: 新位置”
     304: Not Modified,条件式请求中使用
4XX:客户端类错误
     403:Forbidden,请求被服务器拒绝
     404: Not Found,服务器无法找到请求的URL
     405: Method Not Allowed,不允许使用此方法请求相应的URL
5XX:服务器类的错误
     500:Internal Server Error, 服务器内部错误
     502:Bad Gateway, 代理服务器从上游服务器收到一条伪响应
     503:Service Unavailable, 服务暂时不可用
     505:HTTP Version Not Supported,服务器不支持

②响应头部

响应首部

Date:消息产生的时间
Age: 响应持续时间
Server: 向客户端说明自己的程序名称和版本
ETage:不透明验证者
Location:URL备用的位置
Content-Length:实体的长度
Content-Tyep:实体的媒体类型
协商首部:
ary: 首部列表,服务器会根据列表中的内容挑一个最适用的版本发送给客户端
Accept-Ranges: 对当前资源来讲,服务器所能够接受的范围类型
跟安全相关:
WWW-Authentication:质询,即要求客户提供帐号和密码
Set-Cookie:服务器端在某客户端第一次请求时发送令牌

③实体

实体内包含客户端请求的数据,根据解析请求报文内的请求数据,将客户端请求的数据打包,通过响应报文发送给客户端,如果请求出现错误,则显示报文内的错误代码及原因。

资源请求过程及服务器结构

一次Web资源请求的具体过程(服务器的角度):

    建立连接
    接收请求
    处理请求
    访问资源
    构建响应
    发送响应
    记录日志

3.png

web服务器的I/O结构:

单进程模型:串行

多进程模型:每个进程响应一个用户请求实现并发的效果

复用的I/O机制:一个进程生成多个线程,每个线程响应一个用户请求

复用的I/O机制:多个线程,每个线程响应多个用户请求;

httpd特性详解

httpd特性

高度模块化:core + modules

DSO: Dynamic Shared Object

MPM:Multipath Processing Module

MPM包含:
prefork: 每个进程响应一个用户请求,预先生成多个空闲进程;
worker: 启动多个进程,每个进程生成多个线程,每个线程响应一个用户请求;
event: 启动多个线程,每个线程响应N个请求;

httpd功能特性

丰富用户认证:基本认证和摘要认证

CGI:原生支持perl CGI

虚拟主机:基于端口、IP、主机名

反向代理:负载均衡

用户站点:用户可在家目录创建站点

路径别名:alias

支持第三方模块

The end

好了,http协议及httpd特性就说到这里了。下文将讲解虚拟主机和基于用户访问控制及SSL实现https等配置,有兴趣可以继续关注呦。以上仅为个人学习整理,如有错漏,大神勿喷~~~

原创文章,作者:书生,如若转载,请注明出处:http://www.178linux.com/3145