Go语言Goroutine调度器GMP模型深度解析

张

张建站

2026/5/13 6:27:08

10分钟阅读

Go语言Goroutine调度器GMP模型深度解析从源码到实战，彻底搞懂Go调度器的工作原理前言很多Go开发者写了几年代码，对Goroutine的理解还停留在"轻量级线程"这个层面。面试被问到GMP模型时，只能说出G是协程、M是线程、P是处理器，但具体怎么调度的？为什么Goroutine比线程轻量？什么时候会发生抢占？网络I/O阻塞时调度器怎么处理？这些问题答不上来，说明对Go调度器的理解还远远不够。本文将从源码层面深入剖析GMP调度模型，结合实际踩坑经验，帮你彻底搞懂Go调度器。一、为什么需要GMP模型1.1 从最朴素的调度说起最简单的协程调度模型是N:1——N个协程绑定到1个OS线程上：协程A → 协程B → 协程C → 协程A → ... ↑ 1个OS线程这个模型的问题很明显：如果协程A调用了阻塞系统调用（比如文件I/O），整个线程被阻塞，其他协程全部卡住。1.2 M:N调度的挑战理想的方案是M:N——M个协程分布在N个OS线程上并行执行：协程A 协程B 协程C 协程D 协程E 协程F ↓ ↓ ↓ ↓ ↓ ↓ 线程1 线程2 线程1 线程3 线程2 线程1但M:N调度面临几个核心问题：线程创建开销大：每个协程都创建一个线程，退化成1:1模型上下文切换成本高：线程切换需要内核态参与，保存/恢复寄存器资源竞争：多个线程同时调度协程，需要加锁保护局部性丢失：协程可能被调度到不同的CPU核心，缓存失效Go的GMP模型就是为了解决这些问题而设计的。1.3 GMP模型的核心思想┌─────────────────────────────────────────────────┐ │ Go Runtime │ │ │ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │ │ G1 │ │ G2 │ │ G3 │ │ G4 │ ... │ │ └──┬───┘ └──┬───┘ └──┬───┘ └──┬───┘ │ │ └─────────┴─────────┴─────────┘ │ │ ↓ │ │ ┌──────────────────────────────────────┐ │ │ │ 全局队列 (Global Queue) │ │ │ └──────────────────┬───────────────────┘ │ │ ↓ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ P0 │ │ P1 │ │ P2 │ │ │ │ 本地队列 │ │ 本地队列 │ │ 本地队列 │ │ │ │ [G5,G6] │ │ [G7,G8] │ │ [G9] │ │ │ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ ↓ ↓ ↓ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ M0 │ │ M1 │ │ M2 │ │ │ │ (OS线程) │ │ (OS线程) │ │ (OS线程) │ │ │ └──────────┘ └──────────┘ └──────────┘ │ └─────────────────────────────────────────────────┘G（Goroutine）：轻量级协程，包含栈、程序计数器、状态等M（Machine）：OS线程，真正执行代码的实体P（Processor）：逻辑处理器，持有本地运行队列，数量等于GOMAXPROCS关键关系：P的数量由GOMAXPROCS决定（默认等于CPU核心数）M的数量可以远大于P（M会按需创建）G必须绑定到P上才能被M执行P同一时刻只能绑定一个M二、GMP三组件详解2.1 G（Goroutine）每个Goroutine在runtime中对应一个g结构体：// runtime/runtime2.gotypegstruct{stack stack// 栈空间 [stack.lo, stack.hi)stackguard0uintptr// 栈溢出检测地址stackguard1uintptr// C栈溢出检测地址_panic*_panic// panic链表_defer*_defer// defer链表m*m// 当前绑定的Msched gobuf// 调度信息（保存/恢复用）atomicstatusuint32// 状态：_Gidle/_Grunnable/_Grunning/_Gsyscall/_Gwaiting/_Gdeadgoidint64// goroutine IDschedlink guintptr// 链表指针（用于本地队列）preemptbool// 抢占标记// ...}typegobufstruct{spuintptr// 栈指针pcuintptr// 程序计数器g guintptr// 关联的gctxt unsafe.Pointer retuintptrlruintptrbpuintptr}Goroutine的初始栈大小：2KB（Go 1.4+），可动态增长到最大1GB。对比OS线程默认栈大小8MB，这就是Goroutine轻量的核心原因之一。// 创建一个goroutine只需要分配2KB栈空间// 创建一个OS线程需要分配8MB栈空间// 也就是说，同样内存可以创建：// 1GB / 2KB = 524,288 个goroutine// 1GB / 8MB = 128 个OS线程2.2 M（Machine）M代表OS线程，结构体定义：typemstruct{g0*g// 特殊的goroutine，用于执行调度代码curg*g// 当前正在运行的goroutinep puintptr// 绑定的Pnextp puintptr// 预绑定的Poldp puintptr// 之前的P（用于handoff）idint64spinningbool// 是否正在寻找workblockedbool// 是否阻塞在系统调用上// ...}M的几个关键特性：M的数量可以远大于P：当M阻塞在系统调用上时，Go会创建新的M来保持P的利用率M的创建有上限：默认最多10000个（可通过debug.SetMaxThreads调整）M0：进程启动时创建的第一个M，负责执行初始化代码和全局调度每个M都有一个特殊的g0：用于执行runtime调度代码，不占用用户goroutine的栈2.3 P（Processor）P是GMP模型的核心调度单元：typepstruct{idint32statusuint32// _Pidle/_Prunning/_Psyscall/_Pgcstop/_Pdeadm muintptr// 绑定的M// 本地运行队列runqheaduint32runqtailuint32runq[256]guintptr// 环形队列，最多256个Grunnext guintptr// 下一个优先执行的G（用于减少调度延迟）// 全局队列缓存gFreestruct{gList nint32}// ...}P的本地队列：固定大小256的环形队列当本地队列满时，会将一半G转移到全局队列本地队列不需要加锁（只有绑定的M能访问），效率极高P的状态流转：_Pidle → _Prunning → _Psyscall → _Prunning → _Pgcstop → _Pdead ↑ ↓ └────── _Pidle ────────┘三、调度流程详解3.1 Goroutine的创建当你写go func()时，runtime会执行newproc()：// runtime/proc.gofuncnewproc(sizint32,fn*funcval){argp:=add(unsafe.Pointer(fn),sys.PtrSize)gp:=getg()pc:=getcallerpc()systemstack(func(){newg:=gfget(gp.m.p)// 从P的空闲G链表获取ifnewg==nil{newg=malg(_StackMin)// 创建新G，分配2KB栈casgstatus(newg,_Gidle,_Grunnable)}// 保存函数参数到G的栈totalSize:=4*sys.RegSize+uintptr(siz)totalSize+=-totalSize15// 对齐sp:=newg.stack.hi-totalSize// ...newg.sched.pc=funcPC(goexit)+sys.PCQuantum newg.sched.sp=sp// 将G放入本地队列或全局队列runqput(gp.m.p.ptr(),newg,true)// 如果有空闲P且没有M在运行，唤醒新的Mifatomic.Load(sched.npidle)!=0atomic.Load(sched.nmspinning)==0{wakep()}})}关键步骤：从P的空闲链表获取G（复用已销毁的G，避免频繁分配）如果没有空闲G，创建新G并分配2KB栈将G放入P的本地队列（runqput）如果有空闲P，唤醒新的M来执行3.2 调度主循环调度器的核心是schedule()函数：// runtime/proc.gofuncschedule(){gp:=getg()// 1. 检查GC标记ifgp.m.preemptoff!=""{// ...}top:varpp*pifsched.gcwaiting!=0{// 等待GC完成stopm()gototop}// 2. 检查是否有GC标记的G需要执行ifgcBlackenEnabled!=0gp.m.curg!=nil

孩子训练总没效果？别再跟风瞎练！北思则定制化方案，不盲目、不重复，进步看得见～

定制化训练方案，不盲目、不重复、更见效：儿童能力提升的精准化路径“孩子训练没效果？可能是方案没‘对准’——定制化训练方案，不盲目、不重复、更见效，每个孩子的成长都需要专属路径。” 很多家长在孩子训练中遇到“别…...

2026/5/13 6:27:04 阅读更多 →

阿里巴巴千问与淘宝全面打通，AI购物全流程闭环落地！

千问与淘宝打通，AI购物全流程闭环落地近日，阿里巴巴宣布千问与淘宝实现全面打通，这标志着AI购物从商品推荐、下单履约到售后服务的全流程闭环正式落地。用户现在既可以在千问App内通过对话完成淘宝商品的挑选、对比及购买，也能在淘…...

2026/5/13 6:11:05 阅读更多 →

艾法斯 IFR2948B 通信综合测试仪 Aeroflex 2948B

艾法斯2945B内部集成了二十余种测量仪表的功能,标准配置有全扫宽频谱分析仪。其内部数字存储示波器支持余辉选择功能，可用于捕捉不稳定的信号。内置扩展插槽,可升级测试模拟蜂窝及集群电话。2945B的重量轻于12公斤，功耗低于100W。无交流供电时&#xff0…...

2026/5/13 6:07:05 阅读更多 →

【四川电影电视学院主办 | AP出版，高录用快见刊，最快刊后1个月内上知网谷歌学术 | 主题不设限，教育、艺术、语言等人文社科主题均可】第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026）

高录用快见刊，会议快见刊，最快刊后1个月内上知网&谷歌学术主题不设限，教育、艺术、语言等人文社科主题均可第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026） 2026 5th International Conference on Science …...

2026/5/11 9:28:07 阅读更多 →

【斯普林格Springer 旗下的Atlantis Press出版社出版 | EI Compendex、Scopus、谷歌学术】第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026）

第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026） The 5th International Conference on Blockchain, Information Technology and Smart Finance 2026年6月19日 -21日，中国-上海大会官网：www.ic-bis.net【论文投…...

2026/5/12 5:45:54 阅读更多 →