Open
Description
Nginx是一款轻量级的Web服务器、反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。
基本原理
特点:
- 轻量级,配置方便灵活,无侵入性;
- 占用内存少,启动快,性能好;
- 高并发,事件驱动,异步;
- 热部署,修改配置热生效;
架构模型:
基于 socket 与 Linux epoll (I/O 事件通知机制),实现了 高并发;
- 使用模块化、事件通知、回调函数、计时器、轮询实现非阻塞的异步模式;
- 磁盘不足的情况,可能会导致阻塞;
Master-worker 进程模式:
- Nginx 启动时会在内存中常驻一个 Master 主进程,功能:
- 读取配置文件;
- 创建、绑定、关闭 socket;
- 启动、维护、配置 worker 进程;
- 编译脚本、打开日志;
- master 进程会开启配置数量的 worker 进程,比如根据 CPU 核数等:
- 利用 socket 监听连接,不会新开进程或线程,节约了创建与销毁进程的成本;
- 检查网络、存储,把新连接加入到轮询队列中,异步处理;
- 能有效利用 cpu 多核,并避免了线程切换和锁等待;
热部署模式:
- 当我们修改配置热重启后,master 进程会以新的配置新创建 worker 进程,新连接会全部交给新进程处理;
- 老的 worker 进程会在处理完之前的连接后被
kill
掉,逐步全替换成新配置的 worker 进程;
常用场景
正向代理
- 即用户通过访问这层正向代理服务器,再由代理服务器去到原始服务器请求内容后,再返回给用户;
- 例如我们常使用的 VPN 就是一种常见的正向代理模式。通常我们无法直接访问谷歌服务器,但是通过访问一台国外的服务器,再由这台服务器去请求谷歌返回给用户,用户即可访问谷歌;
- 特点:
- 代理服务器属于 客户端层,称之为正向代理;
- 代理服务器是 为用户服务,对于用户是透明的,用户知道自己访问代理服务器;
- 对内容服务器来说是 隐藏 的,内容服务器并无法分清访问是来自用户或者代理;
反向代理:
- 用户访问头条的反向代理网关,通过网关的一层处理和调度后,再由网关将访问转发到内部的服务器上,返回内容给用户;
- 特点:
- 代理服务器属于 服务端层,因此称为反向代理。通常代理服务器与内部内容服务器会隶属于同一内网或者集群;
- 代理服务器是 为内容服务器服务 的,对用户是隐藏的,用户不清楚自己访问的具体是哪台内部服务器;
- 能有效保证内部服务器的 稳定与安全;
反向代理的好处:
- 安全与权限:
- 用户访问必须通过反向代理服务器,也就是便可以在做这层做统一的请求校验,过滤拦截不合法、危险的请求,从而就能更好的保证服务器的安全与稳定;
- 负载均衡: 能有效分配流量,最大化集群的稳定性,保证用户的访问质量;
负载均衡:
- 负载均衡是基于反向代理下实现的一种 流量分配 功能,目的是为了达到服务器资源的充分利用,以及更快的访问响应;
- 其实很好理解,还是以上面银行的例子来看: 通过门口的取号器,系统就可以根据每个柜台的业务排队情况进行用户的分,使每个柜台都保持在一个比较高效的运作状态,避免出现分配不均的情况;
- 由于用户并不知道内部服务器中的队列情况,而反向代理服务器是清楚的,因此通过 Nginx,便能很简单地实现流量的均衡分配;
- Nginx 实现:
Upstream
模块, 这样当用户访问http://xxx 时
,流量便会被按照一定的规则分配到upstream
中的3台服务器上;
http {
upstream xxx {
server 1.1.1.1:3001;
server 2.2.2.2:3001;
server 3.3.3.3:3001;
}
server {
listen 8080;
location / {
proxy_pass http://xxx;
}
}
}
- 分配策略:
- 服务器权重(weight): 可以为每台服务器配置访问权重,传入参数
weight
,例如:upstream xxx { server 1.1.1.1:3001 weight=1; server 2.2.2.2:3001 weight=1; server 3.3.3.3:3001 weight=8; }
- 时间顺序(默认): 按用户的访问的顺序逐一的分配到正常运行的服务器上;
- 连接数优先(
least_conn
): 优先将访问分配到列表中连接数队列最短的服务器上; - 响应时间优先(
fair
): 优先将访问分配到列表中访问响应时间最短的服务器上; - ip_hash: 通过 ip_hash 指定,使每个 ip 用户都访问固定的服务器上,有利于用户特异性数据的缓存,例如本地 session 服务等;
- url_hash: 通过 url_hash 指定,使每个 url 都分配到固定的服务器上,有利于缓存;
- 服务器权重(weight): 可以为每台服务器配置访问权重,传入参数
Nginx 对于前端的作用:
1. 快速配置静态服务器,当访问localhost:80
时,就会默认访问到/Users/files/index.html
;
server {
listen 80;
server_name localhost;
location / {
root /Users/files;
index index.html;
}
}
2. 访问限制: 可以制定一系列的规则进行访问的控制,例如直接通过 ip 限制:
# 屏蔽 192.168.1.1 的访问;
# 允许 192.168.1.2 ~ 10 的访问;
location / {
deny 192.168.1.1;
allow 192.168.1.2/10;
deny all;
}
3. 解决跨域: 其实跨域是 浏览器的安全策略,这意味着只要不是通过浏览器,就可以绕开跨域的问题。所以只要通过在同域下启动一个 Nginx 服务,转发请求即可;
location ^~/api/ {
# 重写请求并代理到对应域名下
rewrite ^/api/(.*)$ /$1 break;
proxy_pass https://www.cross-target.com/;
}
4. 图片处理: 通过 ngx_http_image_filter_module 这个模块,可以作为一层图片服务器的代理,在访问的时候 对图片进行特定的操作,例如裁剪,旋转,压缩等;
5. 本地代理,绕过白名单限制: 例如我们在接入一些第三方服务时经常会有一些域名白名单的限制,如果我们在本地通过localhost
进行开发,便无法完成功能。这里我们可以做一层本地代理,便可以直接通过指定域名访问本地开发环境;
server {
listen 80;
server_name www.toutiao.com;
location / {
proxy_pass http://localhost:3000;
}
}