工作笔记

Nginx实战(二) URL重写

2019-10-10
阅读次数:

“Rewrite主要的功能就是实现URL的重写,Nginx的Rewrite规则采用PCRE Perl兼容正则表达式的语法规则匹配,如果需要Nginx的Rewrite功能,在编译Nginx之前,需要编译安装PCRE库。”

通过Rewrite规则,可以实现规范的URL、根据变量来做URL转向及选择配置。

相关指令

if指令

语法:if(condition){…}

使用环境:server,location

该指令用于检查一个条件是否符合,如果条件符合,则执行大括号内的语句。if指令不支持嵌套,不支持多个条件&&和   处理。

其中,condition中可以包含的判断标识如下

  • ~ 为区分大小写匹配
  • ~* 为不区分大小写匹配
  • !~ 为区分大小写不匹配
  • !~* 为不区分大小写不匹配
  • -f和!-f用来判断是否存在文件
  • -d和!-d用来判断是否存在目录
  • -e和!-e用来判断是否存在文件或目录
  • -x和!-x用来判断文件是否可执行

例如,示例,如果是IE浏览器就进行跳转

if ($http_user_agent ~MSIE){  
  rewrite ^(.*)$ /msie/$1 break;  
}  

$ 匹配输入字符串的结尾位置

return指令

语法:return code 使用环境:server,location,if

该指令用于结束规则的执行并返回状态码给客户端。状态码包括:204(No Content)、400(Bad Request)、402(Payment Required)、403(Forbidden)、404(Not Found)、405(Method Not Allowed)、406(Not Acceptable)、408(Request Timeout)、410(Gone)、411(Length Required)、413(Request Entity Too Large)、416(Requested Range Not Satisfiable)、500(Internal Server Error)、501(Not Implemented)、502(Bad Gateway)、503(Service Unavailable)和504(Gateway Timeout)。

例如,示例,如果访问的URL以 .sh .bash 结尾,返回状态码403

location ~ .*\.(sh|bash)?$  
{  
  return 403;  
}

? 匹配前面的子表达式零次或一次

set指令

语法:set variable value

使用环境:server,location,if

该指令用于定义一个变量,并给变量赋值

rewrite指令

语法:rewrite regex replacement flag

使用环境:server,location,if

该指令根据表达式来重定向URI,或者修改字符串。

flag标记有:

  • last相当于Apache里的[L]标记,表示完成rewrite
  • break终止匹配, 不再匹配后面的规则
  • redirect返回302临时重定向 地址栏会显示跳转后的地址
  • permanent返回301永久重定向 地址栏会显示跳转后的地址

例如,示例,将www重定向到http://

if ($host ~* www\.(.*)){
  set $host_without_www $1;
  rewrite ^(.*)$ http://$host_without_www$1 permanent;
}

^ 匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合

使用案例

域名永久重定向

rewrite ^(.*)$  https://taylorzhou.github.io permanent;

当访问的文件和目录不存在时,重定向到某个html文件

if ( !-e $request_filename ){
  rewrite ^/(.*)$ error.html last;
}

访问目录跳转

将访问/b跳转到/bbs目录上去

rewrite ^/b/?$ /bbs permanent;

目录对换

/123456/xxxx  ====>   /xxxx?id=123456
rewrite ^/(d+)/(.+)/  /$2?id=$1 last;

根据不同的浏览器将得到不同的结果

if ($http_user_agent ~ Firefox) {  
   rewrite ^(.*)$ /firefox/$1 break;  
}  
 
if ($http_user_agent ~ MSIE) {  
   rewrite ^(.*)$ /msie/$1 break;  
}  
 
if ($http_user_agent ~ Chrome) {  
  rewrite ^(.*)$ /chrome/$1 break;  
}

防止盗链

根据Referer信息防止盗链

location ~*\.(gif|jpg|png|swf|flv)${  
  valid_referers none blocked www.cheng.com*.test.com;  
  if ($invalid_referer)  
    return 403;          
}

补充说明:
语法:valid_referers none | blocked | server_names | string …;

  • none 表示无Referer值的情况(表示空的,也就是直接访问,比如直接在浏览器打开一个图片)

  • blocked 表示Referer值被防火墙进行伪装,如:“Referer: XXXXXXX”。

  • server_names Referer来源头部包含当前的server_names(当前域名)

  • arbitrary string 任意字符串,定义服务器名或者可选的URI前缀.主机名可以使用*开头或者结尾,在检测来源头部这个过程中,来源域名中的主机端口将会被忽略掉

  • regular expression 正则表达式,~表示排除https://或http://开头的字符串.

该指令会根据Referer Header头的内容分配一个值为0或1给变量$invalid_referer。如果Referer Header头不符合valid_referers指令设置的有效Referer,变量$invalid_referer 将被设置为1.

禁止访问以/data开头的文件

location ~ ^/data
{
  deny all;
}

禁止访问以.sh,.exe为文件后缀名的文件

location ~ .*\.(sh|exe)?$  
{  
  return 403;  
}

设置某些类型文件的浏览器缓存时间

location ~ .*.(gif|jpg|jpeg|png|bmp)$
{
  expires 30d;
}
 
location ~ .*.(js|css)$
{
  expires 1h;
}

设置过期时间并不记录404错误日志

favicon.ico和robots.txt设置过期时间,为favicon.ico为99天,robots.txt为7天并不记录404错误日志。

location ~(favicon.ico) {
  log_not_found off;
  expires 99d;
  break;
}
 
location ~(robots.txt) {
  log_not_found off;
  expires 7d;
  break;
}

补充说明:
语法:log_not_found on | off
默认值:on
使用环境:location
这个参数指定了是否记录客户端的请求出现404错误的日志,通常用于不存在的robots.txt和favicon.ico文件。

设置过期时间并不记录访问日志

设定某个文件的过期时间;这里为600秒,并不记录访问日志

location ^~ /html/scripts/loadhead_1.js {
  access_log   off;
  root /opt/lampp/htdocs/web;
  expires 600;
break;
}

相似文章

评论