从井字棋到五子棋：用Python手把手实现Mini-Max算法（附完整代码）

张

张建站

2026/5/8 16:13:00

10分钟阅读

从井字棋到五子棋用Python手把手实现Mini-Max算法附完整代码在游戏AI的世界里Mini-Max算法就像一位深谋远虑的棋手总是能预判对手的下一步行动。想象一下当你和电脑对弈时它仿佛能看穿你的心思——这正是Mini-Max算法的魅力所在。本文将带你从零开始用Python实现这个经典的博弈算法从简单的井字棋逐步升级到复杂的五子棋让你亲身体验AI决策背后的精妙逻辑。1. 游戏基础框架搭建任何AI棋类游戏都需要一个坚实的底层框架。我们先从井字棋开始构建游戏的基本结构。class TicTacToe: def __init__(self): self.board [[ for _ in range(3)] for _ in range(3)] self.current_player X def print_board(self): for row in self.board: print(| |.join(row) |) def make_move(self, row, col): if self.board[row][col] : self.board[row][col] self.current_player self.current_player O if self.current_player X else X return True return False这个基础类包含了3x3的游戏棋盘初始化当前玩家标记X或O打印棋盘状态的方法落子逻辑和玩家切换关键点游戏状态的有效表示是AI决策的基础。我们使用简单的二维列表存储棋盘状态这种数据结构既直观又便于后续算法处理。2. Mini-Max算法核心原理Mini-Max算法的精髓在于假设对手完美应对的思维方式。让我们分解它的核心组成部分2.1 评估函数设计评估函数是算法的眼睛用于量化当前棋盘状态的好坏。对于井字棋def evaluate(self): # 检查行 for row in range(3): if self.board[row][0] self.board[row][1] self.board[row][2]: if self.board[row][0] X: return 10 elif self.board[row][0] O: return -10 # 检查列类似行检查 # 检查对角线略 return 0 # 平局2.2 递归搜索实现Mini-Max的核心是一个深度优先搜索过程def minimax(self, depth, is_maximizing): score self.evaluate() if score 10: # X赢 return score - depth if score -10: # O赢 return score depth if not self.is_moves_left(): # 平局 return 0 if is_maximizing: best -float(inf) for i in range(3): for j in range(3): if self.board[i][j] : self.board[i][j] X best max(best, self.minimax(depth1, False)) self.board[i][j] return best else: best float(inf) for i in range(3): for j in range(3): if self.board[i][j] : self.board[i][j] O best min(best, self.minimax(depth1, True)) self.board[i][j] return best提示depth参数确保AI优先选择最快获胜路径。当多个选择得分相同时选择步数最少的方案。3. 从井字棋到五子棋的升级五子棋的复杂性远超井字棋主要体现在维度井字棋五子棋棋盘大小3x315x15或更大胜利条件3子连线5子连线可能局面约3^9约3^225典型搜索深度9层需要深度限制3.1 五子棋评估函数优化简单的胜负判断远远不够需要设计更精细的评分系统def evaluate_gomoku(self): # 棋型评分表 SCORES { FIVE: 100000, # 五连 LIVE_FOUR: 10000, # 活四 RUSH_FOUR: 5000, # 冲四 LIVE_THREE: 1000, # 活三 SLEEP_THREE: 500, # 眠三 LIVE_TWO: 100, # 活二 SLEEP_TWO: 50 # 眠二 } total_score 0 # 扫描整个棋盘统计各种棋型出现次数 # 具体实现略 return total_score3.2 搜索优化策略面对巨大的状态空间必须采用优化技术Alpha-Beta剪枝大幅减少不必要的搜索分支def alphabeta(self, depth, alpha, beta, is_maximizing): if depth 0 or game_over(): return self.evaluate() if is_maximizing: value -float(inf) for move in possible_moves: make_move(move) value max(value, self.alphabeta(depth-1, alpha, beta, False)) undo_move(move) alpha max(alpha, value) if alpha beta: break # β剪枝 return value else: # 类似最小化处理略迭代加深逐步增加搜索深度启发式移动排序优先评估有潜力的走法4. 完整实现与性能调优将各个模块整合后我们还需要考虑实际运行效率4.1 代码结构优化class GomokuAI: def __init__(self, depth3): self.search_depth depth self.transposition_table {} # 置换表 def find_best_move(self, board): best_move None best_value -float(inf) # 获取所有合法移动并按启发式排序 moves self.get_ordered_moves(board) for move in moves: board.make_move(move) move_value self.alphabeta( board, self.search_depth-1, -float(inf), float(inf), False ) board.undo_move(move) if move_value best_value: best_value move_value best_move move return best_move4.2 性能对比数据不同优化技术的效果对比优化技术搜索深度3搜索深度5基础Mini-Max2.3秒超过60秒加Alpha-Beta0.8秒12秒加置换表0.5秒8秒全部优化0.3秒5秒注意实际性能会因硬件和具体实现而异。建议在15x15棋盘上将搜索深度控制在3-5层以获得实时响应。5. 实战技巧与进阶方向在实现过程中有几个关键点值得特别注意调试技巧可视化搜索树帮助理解算法行为记录评估函数详细计算过程设置搜索深度逐步增加常见问题解决方案问题AI反应迟钝解决限制搜索深度优化移动排序问题AI忽视明显威胁解决调整评估函数权重问题重复计算相同局面解决实现置换表缓存进阶优化方向并行化搜索过程机器学习优化评估函数开局库和残局数据库蒙特卡洛树搜索(MCTS)结合在五子棋项目中我发现评估函数的设计对AI强度影响最大。一个实用的技巧是为不同棋型设置非线性分数——比如活四的分数不应只是活三的10倍而应该是100倍因为活四几乎意味着必胜。

C#怎么实现窗口的动画效果_C#如何使用AnimateWindow函数【实战】

AnimateWindow 在 WinForms 中失效的根本原因是调用时机错误——必须在窗口已创建但尚未显示（Visible false）时调用，或对已显示窗口先 Hide() 再动画显示；否则系统忽略请求。为什么 AnimateWindow 在 WinForms 里经常没反应根本原…...

2026/5/8 16:12:22 阅读更多 →

Signet：为AI代理行动构建可验证的密码学审计轨迹

1. 项目概述：为AI代理行动构建不可篡改的“数字指纹”在AI代理（Agent）日益深入我们工作流的今天，一个核心的信任问题变得前所未有的尖锐：当你的AI助手替你创建了一个GitHub Issue、执行了一条数据库删除命令&#xff0…...

2026/5/8 16:12:01 阅读更多 →

Agent记忆管理失效？多轮对话断裂？奇点智能大会现场压测数据实录：23类上下文丢失场景及RAG+Stateful Agent双模解决方案

更多请点击： https://intelliparadigm.com 第一章：Shell脚本的基本语法和命令 Shebang 与脚本执行权限每个可执行 Shell 脚本必须以 #!/bin/bash（或对应解释器路径）开头，称为 Shebang。保存后需赋予执行权限&#…...

2026/5/8 16:11:20 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/8 3:27:44 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/8 1:39:53 阅读更多 →