Skip to content

Nginx基本梳理 #60

Open
Open
@TieMuZhen

Description

@TieMuZhen

Nginx是一款轻量级的Web服务器反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。

基本原理

特点:

  • 轻量级,配置方便灵活,无侵入性;
  • 占用内存少,启动快,性能好;
  • 高并发,事件驱动,异步;
  • 热部署,修改配置热生效;

架构模型:

基于 socket 与 Linux epoll (I/O 事件通知机制),实现了 高并发

  • 使用模块化、事件通知、回调函数、计时器、轮询实现非阻塞的异步模式;
  • 磁盘不足的情况,可能会导致阻塞;

Master-worker 进程模式:

  • Nginx 启动时会在内存中常驻一个 Master 主进程,功能:
    • 读取配置文件;
    • 创建、绑定、关闭 socket;
    • 启动、维护、配置 worker 进程;
    • 编译脚本、打开日志;
  • master 进程会开启配置数量的 worker 进程,比如根据 CPU 核数等:
    • 利用 socket 监听连接,不会新开进程或线程,节约了创建与销毁进程的成本;
    • 检查网络、存储,把新连接加入到轮询队列中,异步处理;
    • 能有效利用 cpu 多核,并避免了线程切换和锁等待;

热部署模式:

  • 当我们修改配置热重启后,master 进程会以新的配置新创建 worker 进程,新连接会全部交给新进程处理;
  • 老的 worker 进程会在处理完之前的连接后被kill掉,逐步全替换成新配置的 worker 进程;

常用场景

正向代理

  • 即用户通过访问这层正向代理服务器,再由代理服务器去到原始服务器请求内容后,再返回给用户;
  • 例如我们常使用的 VPN 就是一种常见的正向代理模式。通常我们无法直接访问谷歌服务器,但是通过访问一台国外的服务器,再由这台服务器去请求谷歌返回给用户,用户即可访问谷歌;
  • 特点:
    • 代理服务器属于 客户端层,称之为正向代理;
    • 代理服务器是 为用户服务,对于用户是透明的,用户知道自己访问代理服务器;
    • 对内容服务器来说是 隐藏 的,内容服务器并无法分清访问是来自用户或者代理

反向代理:

  • 用户访问头条的反向代理网关,通过网关的一层处理和调度后,再由网关将访问转发到内部的服务器上,返回内容给用户;
  • 特点:
    • 代理服务器属于 服务端层,因此称为反向代理。通常代理服务器与内部内容服务器会隶属于同一内网或者集群;
    • 代理服务器是 为内容服务器服务 的,对用户是隐藏的,用户不清楚自己访问的具体是哪台内部服务器;
    • 能有效保证内部服务器的 稳定与安全

反向代理的好处:

  • 安全与权限:
    • 用户访问必须通过反向代理服务器,也就是便可以在做这层做统一的请求校验,过滤拦截不合法、危险的请求,从而就能更好的保证服务器的安全与稳定;
  • 负载均衡: 能有效分配流量,最大化集群的稳定性,保证用户的访问质量;

负载均衡:

  • 负载均衡是基于反向代理下实现的一种 流量分配 功能,目的是为了达到服务器资源的充分利用,以及更快的访问响应;
  • 其实很好理解,还是以上面银行的例子来看: 通过门口的取号器,系统就可以根据每个柜台的业务排队情况进行用户的分,使每个柜台都保持在一个比较高效的运作状态,避免出现分配不均的情况
  • 由于用户并不知道内部服务器中的队列情况,而反向代理服务器是清楚的,因此通过 Nginx,便能很简单地实现流量的均衡分配;
  • Nginx 实现: Upstream模块, 这样当用户访问http://xxx 时,流量便会被按照一定的规则分配到upstream中的3台服务器上;
http {
    upstream xxx {
        server 1.1.1.1:3001;
        server 2.2.2.2:3001;
        server 3.3.3.3:3001;
    }
    server {
        listen 8080;
        location / {
            proxy_pass http://xxx;
        }
    }
}
  • 分配策略:
    • 服务器权重(weight): 可以为每台服务器配置访问权重,传入参数weight,例如:
      upstream xxx {
          server 1.1.1.1:3001 weight=1;
          server 2.2.2.2:3001 weight=1;
          server 3.3.3.3:3001 weight=8;
      }
      
    • 时间顺序(默认): 按用户的访问的顺序逐一的分配到正常运行的服务器上;
    • 连接数优先(least_conn): 优先将访问分配到列表中连接数队列最短的服务器上;
    • 响应时间优先(fair): 优先将访问分配到列表中访问响应时间最短的服务器上;
    • ip_hash: 通过 ip_hash 指定,使每个 ip 用户都访问固定的服务器上,有利于用户特异性数据的缓存,例如本地 session 服务等;
    • url_hash: 通过 url_hash 指定,使每个 url 都分配到固定的服务器上,有利于缓存;

Nginx 对于前端的作用:

1. 快速配置静态服务器,当访问localhost:80时,就会默认访问到/Users/files/index.html

server {
	listen 80;                                                         
	server_name localhost;                                               
		
	location / {
		root   /Users/files;
		index  index.html;
	}
}

2. 访问限制: 可以制定一系列的规则进行访问的控制,例如直接通过 ip 限制:

# 屏蔽 192.168.1.1 的访问;
# 允许 192.168.1.2 ~ 10 的访问;
location / {
    deny  192.168.1.1;
    allow 192.168.1.2/10;
    deny  all;
}

3. 解决跨域: 其实跨域是 浏览器的安全策略,这意味着只要不是通过浏览器,就可以绕开跨域的问题。所以只要通过在同域下启动一个 Nginx 服务,转发请求即可;

location ^~/api/ {
    # 重写请求并代理到对应域名下
    rewrite ^/api/(.*)$ /$1 break;
    proxy_pass https://www.cross-target.com/;
}  

4. 图片处理: 通过 ngx_http_image_filter_module 这个模块,可以作为一层图片服务器的代理,在访问的时候 对图片进行特定的操作,例如裁剪,旋转,压缩等

5. 本地代理,绕过白名单限制: 例如我们在接入一些第三方服务时经常会有一些域名白名单的限制,如果我们在本地通过localhost进行开发,便无法完成功能。这里我们可以做一层本地代理,便可以直接通过指定域名访问本地开发环境;

server {
    listen 80;
    server_name www.toutiao.com;

    location / {
        proxy_pass http://localhost:3000;
    }
}

参考文献

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions