1.机器学习就是让机器具备找函式寻找规律的能力。2.不同类型的函式回归函数输出一个数值输入可能是多种能够判断输出结果的指标预测连续数值。分类给定选项类函式输出正确的选项预测离散类型。如何找到函式a.假设函数yy就是模型可带有未知参数b.根据训练数据定义损失L判断模型的好坏实际也是一个函数c.优化(Optimiztion)找最佳的y中的未知参数使得损失最小。MAE均值绝对误差e|y-y|y为预测值y为真实值MSE均方差e(y-y)²y为预测值y为真实值学习率寻找未知参数的最佳值时用到3.模型分为线性模型、非线性模型liner function会具有模型偏差Sigmoid function(w改变斜率、b改变左右位置、c改变上下高度)Rectified Liner UnitRLU4.深度学习由多个神经元组成神经层从而构成深度神经网络的机器学习。神经元 (Neuron)基本计算单元接收输入加权求和通过激活函数输出相当于过滤器。层输入出、隐藏层进行特征提取和变换、输出层。激活函数让网络拟合出复杂的曲线。ReLU、Sigmoid5.常见的网络架构CNN卷积神经网络处理网络状数据。图像RNN循环神经网络处理序列数据具有“记忆”特点。文本GAN生成对抗网络生成内容。6.AI生成术语解释通俗理解特征 (Feature)输入数据的属性比如预测房价特征就是“面积”、“地段”、“房龄”。标签 (Label)想要预测的目标值比如预测房价标签就是具体的“价格”。模型 (Model)经过训练后的算法文件就像学生学完知识后的大脑可以用来做题。训练集/测试集用于训练和验证的数据划分训练集是“课本”测试集是“期末考试题”。损失函数 (Loss)衡量预测值与真实值差距的公式考试扣了多少分分数越低越好。优化器 (Optimizer)用于更新模型参数的算法老师根据错题指导学生如何改进学习方法如 SGD, Adam。梯度下降 (Gradient Descent)寻找损失函数最小值的方法下山的过程一步步往坡度最陡的地方走直到谷底。过拟合 (Overfitting)模型在训练集表现好测试集表现差“死记硬背”课本题都会考试换个题就不会了。欠拟合 (Underfitting)模型在训练集和测试集表现都差“没学懂”课本题都不会。超参数 (Hyperparameter)训练前人工设定的参数如学习率、网络层数类似于“每天学几小时”。7.训练损失8.过拟合表现训练集准确率很高但测试集/验证集准确率很低。本质模型太复杂记住了数据中的“噪声”而不是“规律”。解决方法增加训练数据数据增强没有足够的数据需要对原数据进行变换给模型进行限制减少参数、使用共享参数、去掉不相关或冗余的特征、早停法early stopping、正则化技术Regularization、Dropout。9.欠拟合表现训练集准确率低测试集/验证集准确率很低。本质模型太简单。解决方法增加模型复杂度减少正则化增加新特征增加训练时间epoch注所有的机器学习深度学习系列的博客都来自于B站https://www.bilibili.com/video/BV1TAtwzTE1S?spm_id_from333.788.videopod.sectionsvd_source4106df216615f53c8d3e6469d4c06be8