minimind模型训练

张

张建站

2026/5/1 20:15:26

10分钟阅读

项目包括供完整的 MiniMind-LLM 结构代码Dense MoE当前主线结构对齐 Qwen3 / Qwen3-MoE 生态。提供 Tokenizer 与分词器训练代码支持 tool_call、tool_response、think 等模板标记。覆盖 Pretrain、SFT、LoRA、RLHF-DPO、RLAIFPPO / GRPO / CISPO、Tool Use、Agentic RL、自适应思考与模型蒸馏等完整训练流程。提供全阶段开源数据覆盖收集、蒸馏、清洗与去重后的高质量数据集。关键训练算法与核心模块均从 0 实现不依赖第三方框架封装。兼容 transformers、trl、peft 等主流框架以及 llama.cpp、vllm、ollama 等常用推理引擎与 Llama-Factory 等训练框架。支持单机单卡与单机多卡DDP、DeepSpeed训练支持 wandb / swanlab 可视化与动态启停训练。支持在 C-Eval、C-MMLU、OpenBookQA 等第三方测评集上进行评测并支持通过 YaRN 实现 RoPE 长文本外推。提供兼容 OpenAI API 协议的极简服务端便于接入 FastGPT、Open-WebUI 等第三方 Chat UI并支持 reasoning_content、tool_calls、open_thinking。提供基于 Streamlit 的极简聊天 WebUI支持思考展示、工具选择与多轮 Tool Call。创建环境conda create –name minimind python3.10conda env listconda activate minimind学术加速source /etc/network_turbo可以安装包单独下载然后上传解压解压缩unzip .zip解压之后进入安装依赖安装依赖中前置知识神经网络是什么function输入是x输出是y拟合函数。attention是什么3b1b的视频看一下完形填空的预测词语。根据前面的信息预测出下一个信息是什么。加权求和。minimind架构图创建一个文件uv init将其依赖粘贴过来然后继续使用uv sync。创建虚拟环境安装依赖重启终端加载环境创建这几个文件

php内核定制内核补丁制作、版本固化管理

最佳方式不是“改完源码就打包”，而是“补丁最小化补丁集管理可重复构建版本指纹固化”。 for shortcuts这样你─6─个月后还能复现今天这版私有─PHP─内核。────────────────────────────────…...

2026/5/1 20:10:23 阅读更多 →

如何用开源方案终结企业IT资产管理的混乱局面？

如何用开源方案终结企业IT资产管理的混乱局面？ 【免费下载链接】snipe-it A free open source IT asset/license management system 项目地址: https://gitcode.com/GitHub_Trending/sn/snipe-it 当你的公司发展到50人规模，IT设备数量突破200台时…...

2026/5/1 20:09:24 阅读更多 →

保姆级教程：用MySQL 8.0的caching_sha2_password插件，彻底搞定ODBC连接的密码问题

MySQL 8.0认证机制深度解析：从caching_sha2_password到ODBC连接实战当你第一次在MySQL 8.0环境中配置ODBC数据源时，那个令人困惑的"Access denied for user ODBClocalhost (using password: NO)"错误提示是否让你停下了脚步？这背后…...

2026/5/1 19:56:09 阅读更多 →

Arm Cortex-A520AE核心架构与优化实战解析

1. Arm Cortex-A520AE核心架构深度解析在汽车电子和工业控制领域，处理器的高效性与可靠性同样重要。Cortex-A520AE作为Armv9.2-A架构下的安全增强型核心，采用独特的双发射流水线设计，在保持低功耗的同时实现了可预测的实时性能。我曾参与过基…...

2026/5/1 20:48:08 阅读更多 →

015、使用AutoGen框架搭建多Agent对话系统

015、使用AutoGen框架搭建多Agent对话系统告别单打独斗，让多个智能体通过协作与对话，共同解决复杂任务。前言在上一篇《多Agent系统入门：协作与竞争的基础模型》中，我们探讨了多智能体系统的核心概念、基础架构以及简单的协作模式。你可能已经意识到，手动协调多个Agen…...

2026/4/28 3:08:33 阅读更多 →

大模型量化实战评测：GPTQ、GGUF、AWQ 在显存、速度与精度上的真实表现

1. 大模型量化技术入门：为什么我们需要量化？ 如果你尝试在消费级显卡上运行大语言模型，大概率会遇到显存不足的报错。比如用16GB显存的RTX 4080直接加载Qwen1.5-7B模型时，系统会无情地提示"CUDA out of memory"。这就是…...

2026/4/27 23:58:30 阅读更多 →

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-u…...

2026/4/26 0:08:05 阅读更多 →