高效配置Apache,Tomcat的gzip压缩功能

东坡下载 2011年06月04日 22:08:45

      HTTP 压缩可以大大提高浏览网站的速度,它的原理是,在客户端请求网页后,从服务器端将网页文件压缩,再下载到客户端,由客户端的浏览器负责解 压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ,它可以节省40%左右的流量。更为重要的是,它可以对动态生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩,压缩效率惊人

      一对于Tomcat5.0以后的版本是支持对输出内容进行压缩的.使用的是gzip压缩格式

      下 面是tomcat5.5.20 中的$tomcat_home$/conf/server.xml的原内容

      1 < Connector port ="80" maxHttpHeaderSize ="8192"

      2 maxThreads ="150" minSpareThreads ="25" maxSpareThreads ="75"

      3 enableLookups ="false" redirectPort ="8443" acceptCount ="100"

      4 connectionTimeout ="20000" disableUploadTimeout ="true" URIEncoding ="utf-8" />

      从上面的第 8行内容可以看出,要使用gzip压缩功能,你可以在Connector实例中加上如下 属性即可

      1) compression="on" 打开压缩功能

      2) compressionMinSize="2048" 启用压缩的输出内容大小,这里面默认为2KB

      3) noCompressionUserAgents="gozilla, traviata" 对于以下的浏览器,不启用压缩

      4) compressableMimeType="text/html,text/xml"压缩类型

      我 这里的配置内容为:

      2 maxThreads="150" minSpareThreads="25" maxSpareThreads="75"

      3 enableLookups="false" redirectPort="8443" acceptCount="100"

      4 connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="utf-8"

      5 compression="on"

      6 compressionMinSize="2048"

      7 noCompressionUserAgents="gozilla, traviata"

      8 compressableMimeType="text/html,text/xml,text/javascript,text/css,text/plain" />

      tomcat 开启Gzip :

      1.找到Tomcat 目录下的conf下的server.xml,并找到如下信息

      Connector port="8080"

      maxHttpHeaderSize="8192"

      maxThreads="150" minSpareThreads="25" maxSpareThreads="75"

      enableLookups="false" redirectPort="8443" acceptCount="100"

      connectionTimeout="20000" disableUploadTimeout="true"

      将它改成如下的形式(其实在上面代码的下面已经有了,将他们打开而已。):

      maxHttpHeaderSize="8192"

      maxThreads="150" minSpareThreads="25" maxSpareThreads="75"

      enableLookups="false" redirectPort="8443" acceptCount="100"

      connectionTimeout="20000" disableUploadTimeout="true"

      compression="on"

      compressionMinSize="2048"

      noCompressionUserAgents="gozilla, traviata"

      compressableMimeType="text/html,text/xml"

      >

      这样,就能够对html和xml进行压缩了,如果要压缩css 和 js,那么需要将

      compressableMimeType=”text/html,text/xml”加入css和js:

      .........

      compressableMimeType="text/html,text/xml,text/css,text/javascript"

      >

      你甚至可以压缩图片:

      compressableMimeType=”text/html,text/xml”加入css和js:

      .........

      compressableMimeType="text/html,text/xml,text/css,text/javascript,image/gif,image/jpg"

      >

      http://www.gidnetwork.com/tools/gzip-test.php

      一旦启用了这个压缩功能后,我们怎么来测试压缩是否有效呢?首先Tomcat是根据浏览器请求头中的accept-encoding来判断浏览器是否支持压缩功能,如果这个值包含有gzip,就表明浏览器支持gzip压缩内容的浏览,所以我们可以用httpclient来写一个这样的简单测试程序

      检验tomcat是否开启成功

      import org.apache.commons.httpclient.HttpClient;

      import org.apache.commons.httpclient.methods.GetMethod;

      public class HttpTester {

      public static void main(String[] args) throws Exception{

      HttpClient http = new HttpClient();

      GetMethod get = new GetMethod("http://www.dlog.cn/js/prototype.js");

      try{

      get.addRequestHeader("accept-encoding", "gzip,deflate");

      get.addRequestHeader("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Alexa Toolbar; Maxthon 2.0)");

      int er = http.executeMethod(get);

      if(er==200){

      System.out.println(get.getResponseContentLength());

      String html = get.getResponseBodyAsString();

      System.out.println(html);

      System.out.println(html.getBytes().length);

      }

      }finally{

      get.releaseConnection();

      }

      }

      }

      执行这个测试程序,看看它所输出的是什么内容,如果输出的是一些乱码,以及打印内容的长度远小于实际的长度,那么恭喜你,你的配置生效了,你会发现你网站的浏览速度比以前快多了。

      二, 对于Apache而言,有两种情况

      1)针对Apache2.0之前的版本,它原本是不支持 的,不过可以通过添加第三方的module_gzip模块来启用

      2)针对Apache2.0及之后的版本,Apache提供支持, 不过不叫gzip,而叫mod_deflate

      下面就对Apache2.0及之后的版本作一个说明

      1) 去掉#LoadModule headers_module modules/mod_headers.so前面的注释#,

      2) 添加LoadModule deflate_module modules/mod_deflate.so

      3) 在VirtualHost中添加

      1

      2 SetOutputFilter DEFLATE

      3 BrowserMatch ^Mozilla/4 gzip-only-text/html

      4 BrowserMatch ^Mozilla/4\.0[678] no-gzip

      5 BrowserMatch \bMSIE !no-gzip !gzip-only-text/html

      6 SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary

      7 Header append Vary User-Agent env=!dont-vary

      8

      9

      我这里面有一个完整的演示

      1# 加载deflate模块

      2LoadModule headers_module modules/mod_headers.so

      3LoadModule deflate_module modules/mod_deflate.so

      4

      5 DocumentRoot f:/apacheTest

      6

      7 SetOutputFilter DEFLATE

      8 BrowserMatch ^Mozilla/4 gzip-only-text/html

      9 BrowserMatch ^Mozilla/4\.0[678] no-gzip

      10 BrowserMatch \bMSIE !no-gzip !gzip-only-text/html

      11 SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary

      12 Header append Vary User-Agent env=!dont-vary

      13

      14

      关于 JavaScript的gzip静态压缩方法

      传统的JS压缩(删除注释,删除多余空格等)提供的压缩率有时还是不尽不意,幸亏现在的浏览器都支持压缩传输(通过设置http header的Content-Encoding=gzip),可以通过服务器的配置(如apache)为你的js提供压缩传输,或是appfuse中使用的GZipFilter使tomcat也提供这种能力

      现在的问题是这种动态的压缩会导致服务器CPU占用率过高,现在我想到的解决辨法是通过提供静态压缩(就是将js预先通过gzip.exe压缩好)

      一.下面描述在tomcat中的应用

      1.将prototype.js通过gzip.exe压缩保存成prototype.gzjs

      2.设置header,我编写了一个简单的AddHeadersFilter来将所有以gzjs结尾的文件增加设置header Content-Encoding=gzip

      web.xml中的配置

      AddHeaderFilter badqiu.web.filter.AddHeaderFilter headers Content-Encoding=gzip AddHeaderFilter *.gzjs

      测试prototype.js是否正常的代码

      在Apache httpd中可以直接通过在httpd.conf增加AddEncoding x-gzip .gzjs来映射.gzjs文件的header

      二.相关压缩率数据

      1. prototype.js 1.5.0_rc0原始大小56KB,未经任何处理直接使用gzip压缩为12KB,总压缩率79%

      2. 通过js压缩工具压缩过的protytype.js为20KB,使用gzip压缩为10KB,总压缩率为83%

      3. 实际项目中的多个js合并成的文件 439KB,直接通过gzip压缩为85KB,总压缩率81%

      4. 439KB经过js压缩为165KB,再经过gzip压缩为65KB,总压缩率86%

      基本上你都可以忽略js压缩工具的压缩率,直接使用gzip压缩