http协议及httpd特性详解

前言

随着互联网的迅猛发展和网络的普及,各类网站层出不穷,网站也成为企业宣传和实力展现的主要途径之一,说到网站就不得不说一下web服务了,现在比较流行的web服务还是当属Apache即httpd。本文将详解http协议及httpd的特性。

http协议详解

http协议

http: Hyper Text Transfer Protocol 超文本传输协议

传输文本:HTML

html: Hyper Text Mark Language 超文本标记语言

html文档的生成方式

静态:纯html格式文档

动态:编程语言编写的程序可输出html格式的结果

http协议版本

http 0.9: 仅用于传输html文档

http 1.0:引入MIME机制,从而支持多媒体数据;引入keep-alive(持久连接);缓存

http 1.1:更多请求方法,更精细缓存控制;持久连接(persistent)

注意:http协议是无状态的

http事务:一次请求及对应的响应

CGI:Common Gateway Interface 通用网关接口

http协议报文

请求报文

1.jpg

报文详解

请求报文主要由请求行、请求头部和请求数据(实体)组成

①请求行

请求行由请求方法字段、请求资源字段(URL)和协议版本字段组成

http方法:

GET:请求获取一个资源,需要服务器发送
HEAD:跟GET近似,但其不需要服务响应请求的资源,而返回响应首部
POST:基于HTML表单向服务器提交数据,服务器通常需要存储此数据(位置:通常为关系型数据库)
PUT:与GET相反,向服务器发送资源;服务器通常需要存储此资源(位置:通常为文件系统)
DELETE:删除URL指向的资源
OPTIONS:探测服务器端对请求的URL所支持使用的请求方法
TRACE:跟一次请求中间所经过的代理服务器、防火墙或网关等
#注意:方法严格区分大小写

资源名称:URI (Uniform Resource Idnentifier)

URL :描述一个特定服务器上某资源的特定位置

可以是相对路径,也可以绝对路径
例如:http://www.scholar.com/download/index.html 
      分为三部分:
      scheme(方案):http://
      服务器:www.scholar.com      特定服务器上的资源:/download/index.html

协议版本:例如HTTP/1.0, HTTP/1.1

②请求头部

http协议首部:

通用首部

Connection: 定义C/S之间关于请求、响应的有关选项
Connection: keep-alive
Cache-Control: 缓存控制
Via: 显示了报文经过的中间节点

请求首部

Client-IP:客户端IP
Host: 请求的主机
Referer: 指明了请求当前资源原始资源的URL
User-Agent: 用户代理
Accept首部:
Accept: 指明服务器能发送的媒体类型
Accept-Charset: 支持使用的字符集
Accept-Encoding: 支持使用的编码方式
Accept-Language: 支持使用语言
条件式请求:
Expect: 告诉服务器能够发送哪些媒体类型
If-Modified-Since: 是否在指定时间内修改过此资源
If-None-Match:如果提供的实体标记与当前文档的实体标记不符,就获取此文档
跟安全相关请求:
Authorization: 客户端提交给服务器的认证数据,如帐号和密码
Cookie: 客户端发送给服务器身份标识

实体首部

Location: 资源的新位置
Allow: 允许对此资源使用的请求方法
内容相关的首部:
Content-Encoding: 支持编码
Content-Language:支持语言
Content-Length:文本长度
Content-Location:资源所在位置
Content-Type:主体对象类型
Content-Range:在整个资源中此实体表示的字节范围
缓存相关:
ETag: 实体标签
Expires: 过期期限
Last-Modified: 上次修改时间

③实体

实体内包含客户端请求服务器的数据

响应报文

2.jpg

报文详解

响应报文主要由状态行、响应头部和响应数据(实体)组成

①状态行

状态行由协议版本字段、状态码字段和原因短语字段组成

状态码:

1XX:信息性状态码
2XX:成功状态码
     200:OK,客户端请求成功
     201:CREATED,请求已被实现
3XX: 重定向类的状态码
     301: Moved Permanently, 永久重定向
     302: Found, 临时重定向,会在响应报文中使用“Location: 新位置”
     304: Not Modified,条件式请求中使用
4XX:客户端类错误
     403:Forbidden,请求被服务器拒绝
     404: Not Found,服务器无法找到请求的URL
     405: Method Not Allowed,不允许使用此方法请求相应的URL
5XX:服务器类的错误
     500:Internal Server Error, 服务器内部错误
     502:Bad Gateway, 代理服务器从上游服务器收到一条伪响应
     503:Service Unavailable, 服务暂时不可用
     505:HTTP Version Not Supported,服务器不支持

②响应头部

响应首部

Date:消息产生的时间
Age: 响应持续时间
Server: 向客户端说明自己的程序名称和版本
ETage:不透明验证者
Location:URL备用的位置
Content-Length:实体的长度
Content-Tyep:实体的媒体类型
协商首部:
ary: 首部列表,服务器会根据列表中的内容挑一个最适用的版本发送给客户端
Accept-Ranges: 对当前资源来讲,服务器所能够接受的范围类型
跟安全相关:
WWW-Authentication:质询,即要求客户提供帐号和密码
Set-Cookie:服务器端在某客户端第一次请求时发送令牌

③实体

实体内包含客户端请求的数据,根据解析请求报文内的请求数据,将客户端请求的数据打包,通过响应报文发送给客户端,如果请求出现错误,则显示报文内的错误代码及原因。

资源请求过程及服务器结构

一次Web资源请求的具体过程(服务器的角度):

    建立连接
    接收请求
    处理请求
    访问资源
    构建响应
    发送响应
    记录日志

3.png

web服务器的I/O结构:

单进程模型:串行

多进程模型:每个进程响应一个用户请求实现并发的效果

复用的I/O机制:一个进程生成多个线程,每个线程响应一个用户请求

复用的I/O机制:多个线程,每个线程响应多个用户请求;

httpd特性详解

httpd特性

高度模块化:core + modules

DSO: Dynamic Shared Object

MPM:Multipath Processing Module

MPM包含:
prefork: 每个进程响应一个用户请求,预先生成多个空闲进程;
worker: 启动多个进程,每个进程生成多个线程,每个线程响应一个用户请求;
event: 启动多个线程,每个线程响应N个请求;

httpd功能特性

丰富用户认证:基本认证和摘要认证

CGI:原生支持perl CGI

虚拟主机:基于端口、IP、主机名

反向代理:负载均衡

用户站点:用户可在家目录创建站点

路径别名:alias

支持第三方模块

The end

好了,http协议及httpd特性就说到这里了。下文将讲解虚拟主机和基于用户访问控制及SSL实现https等配置,有兴趣可以继续关注呦。以上仅为个人学习整理,如有错漏,大神勿喷~~~

原创文章,作者:书生,如若转载,请注明出处:http://www.178linux.com/3145

(0)
书生书生
上一篇 2015-04-13
下一篇 2015-04-13

相关推荐

  • 哥是玩程序的

      下面一组有趣的Web示例,这些示例使用Web的一些很“土”控件做出一些很有趣的玩意儿。原来,编程是可以用来玩的,看看这些玩程序的人搞出的这些有意思的玩意,简直是玩得太有意思了。不过,请注意,这些东西只能使用Chrome打开,不然,你看不到相关的效果。 用滚动条做的时间 http://toki-woki.net/p/scroll-clock/,下…

    Linux干货 2015-04-01
  • 马哥教育网络班21期+第10周课程练习

    1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情) POST:加电自检,主板检测系统硬件。 BOOT sequence:依次查找引导设备(装有引导程序) MBR:找到引导设备的主引导扇区引导记录(446k bootloader 64k DPT 2k 结束标志) GRUB: 引导程序的一种,提供一个菜单,允许用户选择要启动系统或不同的内…

    Linux干货 2016-08-15
  • linux上安全软件SElinux

    selinux简介 SELinux(Security-Enhanced Linux) 是美国国家安全局(NSA)对于强制访问控制的 实现,是 Linux历史上最杰出的新安全子系统。NSA是在Linux社区的帮助下开发了一种访问控制体系,在这种访问控制体系的限制下,进程只能访问那些在他的 任务中所需要文件。SELinux 默认安装在 Fedora 和 Red …

    系统运维 2016-09-19
  • Linux 网络管理

    Linux 网络管理 第一篇:计算机网络基础: 一、计算机网络: 1.TCP/IP:协议栈(使用中的模型)     ISO(国际标准化组织):OSI(开放系统互联基本参考模型),学习中的模型。           1)各层之间的相关协议和单位:     互联网…

    Linux干货 2016-09-06
  • 压缩和归档——释放你的磁盘空间

    压缩和解压缩工具 压缩比:文件压缩比就是指文件经过压缩后的文件大小与源文件大小的一个比差,经过压缩工具包可以把文件压缩 压缩的目的:      时间换空间      CPU时间换硬盘的空间 压缩工具: compress/uncompress 以.Z作为文件后缀 gzip/gunz…

    Linux干货 2016-08-18
  • 马哥教育网络班21期第5周课程练习

    1、显示/boot/grub/grub.conf中以至少一个空白字符开头的行; # grep '^[[:space:]]\+' /boot/grub2/grub.cfg 2、显示/etc/rc.d/rc.sysinit文件中以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行; # grep…

    Linux干货 2016-08-05