什么是GMP模型，它为什么快？

GMP 模型 是 Go 语言实现高并发的核心，也是它“快”的根本原因。下面将拆解模型本身，再说明为什么这种设计能让 Go 在处理大量并发任务时既高效又轻量。

一、GMP 模型是什么

GMP 是 Goroutine、Machine、Processor 三个组件的缩写：

G (Goroutine)
Go 的“协程”，可以理解为用户态的轻量级线程。
一个 Goroutine 只占 2KB 左右的栈空间（可动态伸缩），创建、销毁、切换的成本远低于操作系统线程（通常线程栈 1~8MB）。
M (Machine)
操作系统线程的抽象，由内核管理。
一个 M 对应一个真实的内核线程，负责执行 Goroutine 的代码。
P (Processor)
处理器，是 G 和 M 之间的“调度器”。
每个 P 维护一个本地的 Goroutine 队列，并持有执行 Go 代码所需的资源（如内存分配缓存等）。
P 的数量通常等于 CPU 核心数（由 GOMAXPROCS 控制）。

核心关系：

一个 M 必须绑定一个 P 才能执行 G。
一个 P 可以绑定多个 M，但同一时刻只能有一个 M 与其绑定并执行 G。
G 被调度到 P 的本地队列或全局队列，M 通过 P 获取 G 并执行。

二、调度流程（如何工作）

初始化
启动时，会创建与 GOMAXPROCS 数量相等的 P，并启动一个初始 M。
创建 Goroutine
go func() 会新建一个 G，优先放入当前 P 的本地队列；若本地队列满，则放入全局队列。
调度循环
每个 M 在绑定 P 后，不断执行以下循环：
- 从当前 P 的本地队列取 G 执行
- 若本地队列空，则尝试从全局队列取
- 若全局队列空，则从其他 P 的本地队列 偷取一半 G（work stealing）
阻塞处理
- 当 G 进行阻塞系统调用（如文件 I/O）：
  M 会与 P 解绑，P 可以寻找或新建一个 M 继续执行其他 G，从而避免 CPU 空闲。
  系统调用返回后，G 会被重新放回队列，对应的 M 会尝试获取一个 P 继续执行。
- 当 G 进行网络 I/O 或 channel 操作：
  这是非阻塞的，Go 的网络轮询器（netpoller）会在事件就绪时重新唤醒 G，不会阻塞 M。
抢占式调度
Go 1.14 后实现了基于信号的抢占式调度，使得长时间运行的 Goroutine 不会“饿死”其他 G。

三、为什么快

1. 轻量级 Goroutine

栈初始仅 2KB（线程通常 1~8MB），可以轻松创建成千上万个 Goroutine。
创建、销毁、切换都在用户态完成，不陷入内核，速度极快（切换成本约几十纳秒，线程切换约 1~2 微秒）。

2. 高效的 M:N 调度

M（内核线程）数量远少于 G，避免了大量内核线程的上下文切换开销。
P 的数量等于 CPU 核心数，保证了 每个核心都能高效运行 G，没有多余的线程竞争 CPU。

3. Work Stealing 均衡负载

当一个 P 空闲时，会从其他忙碌的 P 偷取一半 G，避免某个核心空闲而其他核心过载，最大化 CPU 利用率。

4. 阻塞处理不浪费线程

当 G 因系统调用阻塞时，M 会解绑 P，让 P 带着其他 G 继续运行。阻塞的 M 不会占用 P，也不会导致 CPU 空闲。
网络 I/O 使用 epoll/kqueue 等事件驱动机制，完全非阻塞，不占用线程。

5. 局部性优化

每个 P 有自己的本地队列和内存分配缓存，减少了多线程竞争锁的开销。

四、总结

Go 的 GMP 模型本质上是一个 用户态协程调度器 + 多线程执行器 的完美结合。它把并发任务（G）映射到少量内核线程（M）上执行，并通过 P 进行精细的负载均衡和阻塞处理。这种设计使得 Go 在保留多核并行能力的同时，拥有接近 C 语言的执行效率，又具备类似 Python/Node.js 的高并发编程体验。

快的原因可以归结为三点：

轻量：Goroutine 资源占用极小，创建、切换成本极低。
智能：调度器充分利用多核，并通过 work stealing 和阻塞处理避免资源浪费。
简洁：开发者只需写同步代码，背后是高效的异步调度，无需关心线程管理。

如果你在面试中被问到这个问题，可以按照“模型定义 → 调度流程 → 为什么快”的结构回答，重点突出 用户态调度、work stealing、阻塞处理 这三个亮点，并可以适当提及 GOMAXPROCS 对性能的影响。

一、GMP 模型是什么#

二、调度流程（如何工作）#

三、为什么快#

1. 轻量级 Goroutine#

2. 高效的 M:N 调度#

3. Work Stealing 均衡负载#

4. 阻塞处理不浪费线程#

5. 局部性优化#

四、总结#