《大模型的结构》

张

张建站

2026/4/29 1:59:20

10分钟阅读

一、大模型整体结构一个大模型其实就是文本 - tokenizer(分词器) - embedding变成向量 - Transformer核心大脑 - 输出二、具体步骤1、文本输入比如输入This Paper is interesting2、分词器tokenizer[“This” , “paper” , “is” , “interest” , “ing”]再变成Token ID每个大模型的Token ID是不一样的[101,2023,20021,…]3、Embedding模型不会直接用数字ID会变成“向量”一小串数字101 - [0.12, -0.98, 0.33, …]可以简单的理解为token - 坐标点语义空间4、Transformer核心大脑这是大模型最重要的部分它让每个词互相理解对方核心机制Self-Attention(自注意力)比如The paper is not good模型会学“good”要注意“not”“paper”和“good”有关系所以每个token都会看其他token**Transformer结构**一个Transformer层大概是Self-Attention - Feed Forward小神经网络 - 重复很多层比如12层/32层/96层GPT-4这种几十到上百层Transformer5、输出不同模型输出不同GPT生成模型输入This paper is 输出interesting**BERT分类模型**输入This paper is interesting 输出accept / reject三、总结成一个流程图文本↓tokenizer↓token IDs↓embedding变向量↓Transformer理解语义↓输出预测 / 生成四、可以这样理解整个模型把它想成一个“超级读书人”1、tokenizer - 切词2、embeding - 理解词的含义3、attention - 看上下文4、多层网络 - 深度思考5、输出 - 给答案五、BERT vs GPTBERTGPT方向双向看前后单向只看前用途分类/理解生成例子accept/reject写review

黑苹果新手福音：OpCore-Simplify图形化工具15分钟搞定EFI配置

黑苹果新手福音：OpCore-Simplify图形化工具15分钟搞定EFI配置【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为黑苹果复杂的OpenCore…...

2026/4/29 1:54:22 阅读更多 →

日常实用娱乐向｜无需下载任何播放器！万能M3U8在线播放神器，追剧看直播永久备用

开篇前言不管是电脑办公闲暇追剧，还是手机随身看各类直播源、高清影视资源，很多优质流媒体资源都是M3U8格式。但用过的朋友都知道，这种格式非常特殊，电脑自带播放器无法直接打开，手机普通视频软件也不支持解析。专门…...

2026/4/29 1:52:21 阅读更多 →

springboot+vue3宠物领养系统原生微信小程序

目录同行可拿货,招校园代理 ,本人源头供货商功能模块分析技术实现要点特色功能建议安全考虑项目技术支持源码获取详细视频演示 ：文章底部获取博主联系方式！同行可合作同行可拿货,招校园代理 ,本人源头供货商功能模块分析后端（SpringBoot&…...

2026/4/29 1:48:37 阅读更多 →

Arm Cortex-A520AE核心架构与优化实战解析

1. Arm Cortex-A520AE核心架构深度解析在汽车电子和工业控制领域，处理器的高效性与可靠性同样重要。Cortex-A520AE作为Armv9.2-A架构下的安全增强型核心，采用独特的双发射流水线设计，在保持低功耗的同时实现了可预测的实时性能。我曾参与过基…...

2026/4/28 1:18:38 阅读更多 →

015、使用AutoGen框架搭建多Agent对话系统

015、使用AutoGen框架搭建多Agent对话系统告别单打独斗，让多个智能体通过协作与对话，共同解决复杂任务。前言在上一篇《多Agent系统入门：协作与竞争的基础模型》中，我们探讨了多智能体系统的核心概念、基础架构以及简单的协作模式。你可能已经意识到，手动协调多个Agen…...

2026/4/28 3:08:33 阅读更多 →

大模型量化实战评测：GPTQ、GGUF、AWQ 在显存、速度与精度上的真实表现

1. 大模型量化技术入门：为什么我们需要量化？ 如果你尝试在消费级显卡上运行大语言模型，大概率会遇到显存不足的报错。比如用16GB显存的RTX 4080直接加载Qwen1.5-7B模型时，系统会无情地提示"CUDA out of memory"。这就是…...

2026/4/27 23:58:30 阅读更多 →

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具

Display Driver Uninstaller终极指南：彻底清理显卡驱动的专业工具【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-u…...

2026/4/26 0:08:05 阅读更多 →