别再死记硬背synchronized了！从HotSpot源码看Monitor锁的竞争、自旋与排队（附C++代码片段）

张

张建站

2026/5/2 9:38:40

10分钟阅读

别再死记硬背synchronized了！从HotSpot源码看Monitor锁的竞争、自旋与排队（附C++代码片段）

深入HotSpot源码解密synchronized锁竞争的底层真相记得第一次用jstack分析线程阻塞时看到waiting for monitor entry的茫然吗大多数Java开发者对synchronized的理解停留在对象头MarkWord和monitor的概念层面但当你真正面对高并发场景下的锁竞争问题时这些抽象概念就像隔靴搔痒。本文将带你直击HotSpot虚拟机中ObjectMonitor的C实现用调试器般的视角观察线程如何争夺、自旋和排队彻底弄懂为什么你的synchronized代码有时快如闪电有时却慢如蜗牛。1. 对象监视器的战场布局在HotSpot的C世界里每个Java对象都关联着一个看不见的战场——ObjectMonitor。这个位于objectMonitor.hpp中的结构体是决定线程生死存亡的角斗场。关键字段就像战场上的战略要地class ObjectMonitor { void* _header; // 对象头指针 volatile intptr_t _count; // 重入计数器 volatile intptr_t _waiters; // 等待线程数 void* _owner; // 当前持有锁的线程 ObjectWaiter* _WaitSet; // 调用wait()的线程队列 ObjectWaiter* _EntryList;// 阻塞线程队列 volatile intptr_t _recursions; // 重入次数 ObjectWaiter* volatile _cxq; // 竞争队列 // ... 其他辅助字段 };这些字段的交互构成了锁竞争的核心逻辑_owner相当于战场上的旗帜哪个线程成功通过CAS将其设置为自己的指针就获得了锁的所有权_cxqContention Queue新加入战场的线程首先在这里自旋尝试_EntryList当_cxq中的线程自旋失败后最终会转移到这里等待被唤醒_WaitSet主动调用wait()的线程在此处休眠注意_cxq和_EntryList的设计是synchronized非公平性的根源。新来的线程可能比早先排队的线程更早获得锁2. 锁竞争的三个阶段剖析2.1 快速路径CAS闪电战当线程首次尝试获取锁时会执行最乐观的快速路径void ObjectMonitor::enter(TRAPS) { Thread * const Self THREAD; void * cur Atomic::cmpxchg_ptr(Self, _owner, NULL); if (cur NULL) { // CAS成功立即获得锁 assert(_recursions 0, invariant); return; } // ... 其他情况处理 }这个cmpxchg_ptrCompare-And-Swap操作是锁竞争的第一道门槛。在现代CPU上这通常只需几十个时钟周期就能完成。统计显示在低竞争场景下90%的锁获取都通过这条路径完成。2.2 自旋阶段消耗战策略当快速路径失败时线程不会立即放弃而是进入精心设计的自旋阶段先尝试适应性自旋Adaptive Spinning时长由前次自旋成功率动态调整自旋期间仍会周期性地尝试CAS操作若自旋期间锁被释放可直接获取而无需入队自旋的智慧在于平衡成功案例短临界区如计数器递增中自旋避免线程切换的开销失败教训长临界区如数据库操作会导致CPU空转// 简化版自旋逻辑 for (int spins 0; ; spins) { if (TrySpin(Self) 0) break; // 自旋尝试获取锁 if (spins _SpinDuration) { // 自旋超时进入排队 AddToContentionQueue(Self); break; } // 执行PAUSE指令降低CPU功耗 SpinPause(); }2.3 排队阶段最后的等待当自旋也失败后线程会被封装成ObjectWaiter节点加入_cxq队列ObjectWaiter node(Self); Self-_ParkEvent-reset(); node._next _cxq; // CAS方式将节点插入_cxq头部 while (Atomic::cmpxchg_ptr(node, _cxq, node._next) ! node._next) { node._next _cxq; }这个入队过程本身也是通过CAS完成的保证高并发下的线程安全。此时线程状态变为BLOCKED等待被唤醒。3. 锁释放的连锁反应当持有锁的线程执行完同步代码块时会触发一系列精妙的操作void ObjectMonitor::exit(bool not_suspended, TRAPS) { // ... 省略重入计数处理 if (_EntryList NULL _cxq ! NULL) { // 将_cxq队列中的线程转移到_EntryList ObjectWaiter* w _cxq; _cxq NULL; _EntryList ReverseList(w); } // 唤醒_EntryList中的第一个等待线程 if (_EntryList ! NULL) { Thread::unpark(_EntryList-_thread); } }这个转移过程解释了为什么synchronized是非公平锁新来的线程可以直接竞争_cxq中的位置只有被转移到_EntryList的线程才会被稳定唤醒正在自旋的线程可能比_EntryList中的线程更早获取锁4. 性能优化的实战策略理解了底层机制后我们可以针对性优化4.1 锁粒度控制对比不同粒度的锁性能锁类型平均耗时(ns)适用场景无锁15原子变量操作细粒度120独立对象并发粗粒度850跨对象事务4.2 自旋参数调优通过JVM参数调整自旋行为-XX:UseSpinning # 启用自旋 -XX:PreBlockSpin10 # 默认自旋次数 -XX:UseAdaptiveSizePolicy # 启用自适应自旋4.3 避免常见陷阱锁泄露在同步块中调用可能阻塞的操作如IO嵌套死锁多个锁的获取顺序不一致过度同步将线程安全容器的操作再加锁// 错误示例不必要的同步 synchronized(map) { if (!map.containsKey(key)) { map.put(key, value); } } // ConcurrentHashMap本身已线程安全在百万QPS的支付系统中我们曾通过将synchronized替换为细粒度锁ConcurrentHashMap组合使吞吐量提升了3倍。关键是要根据ObjectMonitor的工作原理找到竞争热点——用jstack采样锁等待时间用JFR监控自旋次数。

实战避坑：在Linux下用lspci命令‘窥探’PCIE配置空间与BAR映射

实战避坑：在Linux下用lspci命令‘窥探’PCIE配置空间与BAR映射当你面对一台突然无法识别NVMe SSD的服务器，或是调试一块反复掉线的万兆网卡时，PCIE配置空间的秘密可能就藏在lspci -vvv的输出里。作为Linux系统开发者，我们常常需要…...

2026/5/2 9:38:34 阅读更多 →

完全突破限制：ComfyUI-Manager零网络离线部署终极方案

完全突破限制：ComfyUI-Manager零网络离线部署终极方案【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various custo…...

2026/5/2 9:38:29 阅读更多 →

NHSE完整指南：免费开源动森存档编辑器，打造你的梦想岛屿

NHSE完整指南：免费开源动森存档编辑器，打造你的梦想岛屿【免费下载链接】NHSE Animal Crossing: New Horizons save editor 项目地址: https://gitcode.com/gh_mirrors/nh/NHSE 你是否曾经在《集合啦！动物森友会》中为收集稀有物品而…...

2026/5/2 9:37:39 阅读更多 →

Arm Cortex-A520AE核心架构与优化实战解析

1. Arm Cortex-A520AE核心架构深度解析在汽车电子和工业控制领域，处理器的高效性与可靠性同样重要。Cortex-A520AE作为Armv9.2-A架构下的安全增强型核心，采用独特的双发射流水线设计，在保持低功耗的同时实现了可预测的实时性能。我曾参与过基…...

2026/5/1 20:48:08 阅读更多 →

015、使用AutoGen框架搭建多Agent对话系统

015、使用AutoGen框架搭建多Agent对话系统告别单打独斗，让多个智能体通过协作与对话，共同解决复杂任务。前言在上一篇《多Agent系统入门：协作与竞争的基础模型》中，我们探讨了多智能体系统的核心概念、基础架构以及简单的协作模式。你可能已经意识到，手动协调多个Agen…...

2026/4/28 3:08:33 阅读更多 →

大模型量化实战评测：GPTQ、GGUF、AWQ 在显存、速度与精度上的真实表现

1. 大模型量化技术入门：为什么我们需要量化？ 如果你尝试在消费级显卡上运行大语言模型，大概率会遇到显存不足的报错。比如用16GB显存的RTX 4080直接加载Qwen1.5-7B模型时，系统会无情地提示"CUDA out of memory"。这就是…...

2026/4/27 23:58:30 阅读更多 →

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-u…...

2026/4/26 0:08:05 阅读更多 →