机器学习深度学习beginning1

张

张建站

2026/4/28 10:49:36

10分钟阅读

1.机器学习就是让机器具备找函式寻找规律的能力。2.不同类型的函式回归函数输出一个数值输入可能是多种能够判断输出结果的指标预测连续数值。分类给定选项类函式输出正确的选项预测离散类型。如何找到函式a.假设函数yy就是模型可带有未知参数b.根据训练数据定义损失L判断模型的好坏实际也是一个函数c.优化(Optimiztion)找最佳的y中的未知参数使得损失最小。MAE均值绝对误差e|y-y|y为预测值y为真实值MSE均方差e(y-y)²y为预测值y为真实值学习率寻找未知参数的最佳值时用到3.模型分为线性模型、非线性模型liner function会具有模型偏差Sigmoid function(w改变斜率、b改变左右位置、c改变上下高度)Rectified Liner UnitRLU4.深度学习由多个神经元组成神经层从而构成深度神经网络的机器学习。神经元 (Neuron)基本计算单元接收输入加权求和通过激活函数输出相当于过滤器。层输入出、隐藏层进行特征提取和变换、输出层。激活函数让网络拟合出复杂的曲线。ReLU、Sigmoid5.常见的网络架构CNN卷积神经网络处理网络状数据。图像RNN循环神经网络处理序列数据具有“记忆”特点。文本GAN生成对抗网络生成内容。6.AI生成术语解释通俗理解特征 (Feature)输入数据的属性比如预测房价特征就是“面积”、“地段”、“房龄”。标签 (Label)想要预测的目标值比如预测房价标签就是具体的“价格”。模型 (Model)经过训练后的算法文件就像学生学完知识后的大脑可以用来做题。训练集/测试集用于训练和验证的数据划分训练集是“课本”测试集是“期末考试题”。损失函数 (Loss)衡量预测值与真实值差距的公式考试扣了多少分分数越低越好。优化器 (Optimizer)用于更新模型参数的算法老师根据错题指导学生如何改进学习方法如 SGD, Adam。梯度下降 (Gradient Descent)寻找损失函数最小值的方法下山的过程一步步往坡度最陡的地方走直到谷底。过拟合 (Overfitting)模型在训练集表现好测试集表现差“死记硬背”课本题都会考试换个题就不会了。欠拟合 (Underfitting)模型在训练集和测试集表现都差“没学懂”课本题都不会。超参数 (Hyperparameter)训练前人工设定的参数如学习率、网络层数类似于“每天学几小时”。7.训练损失8.过拟合表现训练集准确率很高但测试集/验证集准确率很低。本质模型太复杂记住了数据中的“噪声”而不是“规律”。解决方法增加训练数据数据增强没有足够的数据需要对原数据进行变换给模型进行限制减少参数、使用共享参数、去掉不相关或冗余的特征、早停法early stopping、正则化技术Regularization、Dropout。9.欠拟合表现训练集准确率低测试集/验证集准确率很低。本质模型太简单。解决方法增加模型复杂度减少正则化增加新特征增加训练时间epoch注所有的机器学习深度学习系列的博客都来自于B站https://www.bilibili.com/video/BV1TAtwzTE1S?spm_id_from333.788.videopod.sectionsvd_source4106df216615f53c8d3e6469d4c06be8

麒麟系统ky10.aarch64环境下OpenSSH-10.0p1升级实战指南

1. 为什么需要升级OpenSSH？ 在麒麟系统ky10.aarch64环境下，很多用户可能还在使用OpenSSH 8.2p1版本。这个版本虽然稳定，但已经发布多年，存在一些安全隐患和功能限制。OpenSSH 10.0p1带来了多项重要改进： 首先是安全性增…...

2026/4/2 20:29:47 阅读更多 →

Excel模拟运算表隐藏技巧：用它做产品定价和利润敏感性分析，老板直呼内行

Excel商业决策神器：用双变量模拟运算表破解定价与利润敏感度密码当产品经理在季度会议上被问到"价格上调5%对利润的影响"时，手忙脚乱地现场计算？当市场总监需要评估原材料波动对全年盈利的冲击时，还在用计算器逐个场景…...

2026/4/2 20:29:26 阅读更多 →

别再让AI瞎猜了！5个实战案例教你写出让Vibe Coding一次成功的提示词

别再让AI瞎猜了！5个实战案例教你写出让Vibe Coding一次成功的提示词当你在Vibe Coding平台上输入一串提示词，满心期待地按下生成按钮，结果却得到一个与你想象中完全不同的产物——这种经历相信很多开发者都不陌生。为什么AI总是"误解&q…...

2026/4/2 20:21:45 阅读更多 →

Arm Cortex-A520AE核心架构与优化实战解析

1. Arm Cortex-A520AE核心架构深度解析在汽车电子和工业控制领域，处理器的高效性与可靠性同样重要。Cortex-A520AE作为Armv9.2-A架构下的安全增强型核心，采用独特的双发射流水线设计，在保持低功耗的同时实现了可预测的实时性能。我曾参与过基…...

2026/4/28 1:18:38 阅读更多 →

015、使用AutoGen框架搭建多Agent对话系统

015、使用AutoGen框架搭建多Agent对话系统告别单打独斗，让多个智能体通过协作与对话，共同解决复杂任务。前言在上一篇《多Agent系统入门：协作与竞争的基础模型》中，我们探讨了多智能体系统的核心概念、基础架构以及简单的协作模式。你可能已经意识到，手动协调多个Agen…...

2026/4/28 3:08:33 阅读更多 →

大模型量化实战评测：GPTQ、GGUF、AWQ 在显存、速度与精度上的真实表现

1. 大模型量化技术入门：为什么我们需要量化？ 如果你尝试在消费级显卡上运行大语言模型，大概率会遇到显存不足的报错。比如用16GB显存的RTX 4080直接加载Qwen1.5-7B模型时，系统会无情地提示"CUDA out of memory"。这就是…...

2026/4/27 23:58:30 阅读更多 →

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-u…...

2026/4/26 0:08:05 阅读更多 →