别再死记硬背公式了！用Python手写一个感知机，从鸢尾花分类理解AI的‘第一课’

张

张建站

2026/4/24 11:31:18

10分钟阅读

别再死记硬背公式了！用Python手写一个感知机，从鸢尾花分类理解AI的‘第一课’

用Python手写感知机从鸢尾花分类看AI如何学会决策当你第一次听说机器学习时脑海中浮现的是不是一堆复杂的数学公式那些Σ、∇符号和矩阵运算确实容易让人望而生畏。但今天我们要打破这个魔咒——用不到100行Python代码亲手实现一个能自动学习分类规则的感知机模型。你会发现AI的第一课其实就像教小朋友区分苹果和橘子一样直观。1. 感知机半个世纪前的AI基石1960年代Frank Rosenblatt发明的感知机Perceptron开启了模式识别的新纪元。这个看似简单的模型蕴含着机器学习最核心的思想通过错误来学习。想象一下教孩子认猫孩子指着狗说猫错误分类你纠正说这是狗调整参数孩子下次更可能正确识别模型收敛感知机的工作方式与此惊人相似。它由三个关键部分组成class Perceptron: def __init__(self): self.weights None # 决策边界的倾斜程度 self.bias 0 # 决策边界的左右偏移 self.lr 0.1 # 学习率犯错后的调整幅度**权重(weights)**就像我们对不同特征的重视程度。在鸢尾花分类中花瓣长度可能比萼片宽度更重要**偏置(bias)**则相当于判断时的宽松程度——好比老师批改试卷时60分及格和70分及格的区别。2. 数据准备鸢尾花的简化世界我们使用经典的鸢尾花数据集但做两个简化处理只保留setosa和versicolor两个品种二分类问题仅使用萼片长度和宽度两个特征方便可视化from sklearn.datasets import load_iris import numpy as np iris load_iris() X iris.data[:100, :2] # 前100个样本取前两个特征 y np.where(iris.target[:100] 0, 1, -1) # 转换为1/-1标签来看看数据的分布情况特征组合Setosa (标签1)Versicolor (标签-1)萼片长度4.3-5.8 cm4.9-7.0 cm萼片宽度2.3-4.4 cm2.0-3.4 cm提示实际项目中应该对特征进行标准化处理但为了教学直观性我们保留原始尺度3. 核心算法错误驱动的学习过程感知机的训练过程就像蒙眼走迷宫每次碰到墙分类错误就调整前进方向。具体实现如下def fit(self, X, y, epochs100): n_samples, n_features X.shape self.weights np.zeros(n_features) for _ in range(epochs): for idx, x_i in enumerate(X): condition y[idx] * (np.dot(x_i, self.weights) self.bias) if condition 0: # 分类错误 update self.lr * y[idx] self.weights update * x_i self.bias update这段代码中藏着两个精妙之处错误判断条件y * (w·x b) ≤ 0正确分类时w·x b与y同号乘积为正错误分类时两者异号乘积为负参数更新规则w w η * y * xη是学习率b b η * y用几何解释错误样本点在决策边界的错误一侧更新规则将其拉向正确方向。例如正样本被误判为负w η * x使得w·x增大负样本被误判为正w - η * x使得w·x减小4. 可视化看决策边界如何进化让我们用matplotlib观察训练过程中决策边界的变化def plot_decision_boundary(model, X, y, epoch): x1_min, x1_max X[:,0].min()-0.5, X[:,0].max()0.5 x2_min, x2_max X[:,1].min()-0.5, X[:,1].max()0.5 xx1, xx2 np.meshgrid(np.linspace(x1_min,x1_max,100), np.linspace(x2_min,x2_max,100)) Z model.predict(np.c_[xx1.ravel(), xx2.ravel()]) Z Z.reshape(xx1.shape) plt.contourf(xx1, xx2, Z, alpha0.3) plt.scatter(X[:,0], X[:,1], cy, edgecolorsk) plt.title(fEpoch {epoch}) plt.xlabel(Sepal length) plt.ylabel(Sepal width)训练过程中的关键阶段初始状态随机权重决策边界混乱准确率约50%中期调整部分样本正确分类边界开始分离两类样本仍有一些顽固的错误点最终收敛所有训练样本正确分类边界处于两类之间的中庸位置注意如果数据不是线性可分的感知机会在两者间反复震荡无法收敛5. 超越基础现代视角下的感知机虽然原始感知机很简单但它启发了现代深度学习的许多概念激活函数感知机的sign函数是阶跃函数现代神经网络使用sigmoid、ReLU等平滑函数损失函数感知机最小化误分类点到超平面的距离现代方法常用交叉熵、MSE等优化算法感知机使用原始梯度下降现代优化器如Adam、RMSprop更高效用PyTorch实现感知机会发现惊人相似import torch class TorchPerceptron(torch.nn.Module): def __init__(self, input_dim): super().__init__() self.linear torch.nn.Linear(input_dim, 1) def forward(self, x): return torch.sign(self.linear(x)).squeeze()关键区别在于自动计算梯度autograd可以使用GPU加速轻松扩展为多层网络6. 实战建议从玩具到真实项目当你在真实数据上应用感知机时记住这些经验特征工程比算法更重要对非线性数据尝试多项式特征from sklearn.preprocessing import PolynomialFeatures poly PolynomialFeatures(degree2) X_poly poly.fit_transform(X)超参数调优学习率太大导致震荡太小收敛慢用网格搜索找最佳组合from sklearn.model_selection import GridSearchCV param_grid {lr: [0.001, 0.01, 0.1, 1]}评估指标选择准确率对平衡数据集有效不平衡数据用F1-score或AUC-ROC扩展到多分类一对多One-vs-Rest策略多类感知机变种在Kaggle的Titanic数据集上即使简单如感知机经过恰当的特征工程也能达到75%的准确率——这已经比随机猜测的50%好很多了。

从PDF手册到智能客服：我是如何用LangChain和BGE模型快速搭建汽车问答机器人的

从PDF到智能对话：基于LangChain与BGE模型的汽车知识问答系统实战指南当企业积累了大量PDF格式的汽车维修手册、产品说明书等文档时，如何让这些静态文档转化为可交互的智能知识库？传统的关键词搜索已无法满足精准问答需求，而直接使…...

2026/4/24 11:30:19 阅读更多 →

OCR数据集避坑指南：ICDAR/CTW/Total-Text等12个主流数据集怎么选、怎么用、怎么标注？

OCR数据集实战指南：12个主流数据集的选型策略与标注技巧当你准备启动一个OCR项目时，第一个拦路虎往往是数据——该选哪些数据集？如何组合使用？标注格式不统一怎么办？这些问题直接决定了模型训练的效果和效率。市面上…...

2026/4/24 11:27:34 阅读更多 →

从SD到总账：拆解SAP RAR的收入过账逻辑与会计分录（含案例）

SAP RAR收入过账逻辑全解析：从销售订单到总账的财务闭环当企业财务团队第一次看到SAP RAR系统生成的会计分录时，常常会陷入困惑——为什么明明已经开票确认的收入，系统还要通过"发票更正"进行二次调整？那些自动生成的&…...

2026/4/24 11:24:17 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/20 15:14:20 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/23 4:18:42 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/20 13:56:02 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/23 2:47:31 阅读更多 →