【学习笔记】大模型备案到底要交什么材料

张

张建站

2026/5/22 14:51:08

10分钟阅读

算法备案、大模型备案、登记备案到底要交哪些材料网上说法五花八门到底听谁的我翻了十几份法规、国标和实践指南把需要准备的材料从头到尾理了一遍。结论是备案要交的东西远比你想象的多但也比你以为的有章可循。一、先搞清楚要做的是哪种备案很多人把三件事混在一起算法备案、大模型备案、登记备案。它们不是一个东西。简单说算法备案只要你的产品用了算法推荐个性化推送、排序精选、检索过滤等就需要在互联网信息服务算法备案系统上填报。依据是《互联网信息服务算法推荐管理规定》2022年3月施行。大模型备案如果你自研或微调了大模型并且对外提供服务就需要走完整的大模型备案流程。材料更多、周期更长通常3-6个月。登记备案如果你只是调用已备案大模型的API走登记管理就行材料简单得多。本文重点讲大模型备案要交的材料。这是要求最全、也是最让人头疼的。二、大模型备案的完整流程在说材料之前先过一遍流程会更理解为什么要准备这些材料。企业主动向属地网信办省级发起申请网信办核准后反馈需要提交的材料并选派指导老师企业完成自评估并准备备案所需材料核心环节提交材料给属地网信办评估可能涉及驳回修改属地网信办进行安全性评测大模型接口安全评测提交材料给中央网信办复核材料复核接口安全评测通过后在互联网信息服务算法备案系统网站公示备案完成关键环节是第3步——自评估和材料准备。材料质量直接决定你被驳回几次、整个周期多长。三、核心材料清单一张图看全貌根据《生成式人工智能服务管理暂行办法》、GB/T 45654-2025《网络安全技术生成式人工智能服务安全基本要求》以及实际备案经验你需要准备的材料可以分为五大类算法机制说明——模型架构、算法原理、技术路线训练数据安全报告——语料来源、标注规范、个人信息保护模型安全评估报告——内容安全、拒答能力、公平性安全措施说明——风险防范、内容标识、投诉举报企业资质与制度——安全管理组织、应急预案、合规制度下面逐项拆解。四、逐项拆解每类材料具体要什么4.1 算法机制说明这份材料要回答的核心问题是你的模型是什么、怎么工作的。需要涵盖的内容项目具体要求模型架构Transformer/其他架构参数规模层数、注意力头数等算法类型生成合成类/个性化推送类/排序精选类等训练方法预训练、微调、RLHF/DPO等安全对齐方法技术路线基座模型来源自研/开源二开推理框架服务形式网页/API/嵌入APP面向C端还是B端小贴士这部分建议由算法团队牵头撰写。如果基于开源模型二次开发要写清楚基座模型名称、版本和改动内容。4.2 训练数据安全报告这是材料中工作量最大的部分也是被驳回最多的地方。依据标准《生成式人工智能预训练和优化训练数据安全规范》和《生成式人工智能数据标注安全规范》。核心量化指标必须达标训练数据整体合格率≥96%违法内容占比红线≤5%安全标注数据量A.1类17项违法内容每项≥200条A.2类每项≥100条个人信息知情同意100%合规需要准备的具体材料数据来源合法性证明——每个数据源的授权文件、采集合规说明语料内容安全评估报告——抽样检测方法和结果附抽检记录个人信息保护说明——去标识化方案、同意机制、处理记录知识产权合规说明——版权授权文件、权利人投诉处理机制数据标注规范及执行记录——标注规则文档、人员培训记录、质量抽检记录4.3 模型安全评估报告这份材料回答的是你的模型说出来的话安不安全。依据标准GB/T 45654-2025《网络安全技术生成式人工智能服务安全基本要求》。核心量化指标指标合规阈值评估方法生成内容安全合格率≥90%自动化测试≥500条/风险类别违法内容输出率0%红线自动化测试人工审核正确拒答率≥95%对抗性输入测试误拒率≤5%正常输入测试拒答覆盖面覆盖全部31类风险附录A全覆盖这份报告需要覆盖的内容语料安全评估——语料规模、来源、标注规则、训练服务器信息算法部门牵头模型生成内容安全评估——31类违法不良信息的拒答与输出测试结果算法安全部门协同公平性与透明性评估——歧视性内容检测、模型可解释性说明内容标识能力评估——AIGC显式/隐式标识是否完整、准确、持久4.4 安全措施说明这部分回答的是你做了哪些防护出了问题怎么处理。需要涵盖类别具体要求输入内容监测用户输入的违法内容识别、安全提示、上报机制输出内容管控生成内容审核、关键词拦截、实时过滤内容标识AIGC显式标识水印/标签、隐式标识元数据个人信息保护最小必要原则、用户查询/删除/更正权利保障投诉举报机制便捷入口、处理流程、反馈时限、记录留存应急响应安全事件应急预案、熔断机制、异常行为检测未成年人保护防沉迷、内容过滤、适龄提示注意这部分建议安全和法务部门联合撰写。标识部分参考《人工智能生成合成内容标识方法》强制性国标。4.5 企业资质与安全管理制度最后一类是软性材料但同样重要安全管理组织架构图负责人、安全团队配置安全管理制度体系文件专职安全管理人员证明安全培训记录安全事件应急预案定期安全评估记录如有五、高频疑问速答Q1用开源模型需要备案吗要不要备案不取决于开源还是闭源而是看你是否满足备案条件面向公众提供服务、具有舆论属性或社会动员能力。建议应备尽备避免监管风险。Q2只给企业内部用呢如果企业体量较大或者计划对外发布大模型服务建议还是备案。Q3调用已备案大模型API需要什么不需要做大模型备案但需要做算法备案和登记备案。走登记管理流程材料简单得多。Q4原有APP接入大模型API的智能问答功能要改隐私政策和用户协议吗不需要单独改。只有原生AI应用如文心一言、豆包等需要单独准备。Q5备案周期多长一般3-6个月取决于材料质量和配合效率。六、参考标准速查表做备案时手边常备这几份标准标准名称发布时间性质解决什么问题《生成式人工智能服务管理暂行办法》2023.7部门规章基本法规依据算法备案和安全评估的顶层要求《互联网信息服务算法推荐管理规定》2022.3部门规章算法备案的流程、时限和材料框架GB/T 45654-2025 生成式AI服务安全基本要求2025.4国标模型备案上线的安全底线量化指标来源生成式AI预训练和优化训练数据安全规范2025.4国标训练数据全流程安全要求生成式AI数据标注安全规范2025.4国标数据标注安全基线人工智能生成合成内容标识方法2025.2强制性国标AIGC内容标识要求写在最后大模型备案看起来材料很多但拆开来看就是五件事说清楚你的模型是什么算法机制说明证明你喂的数据是干净的训练数据安全报告证明你的模型说话是安全的模型安全评估报告证明你有防护和兜底措施安全措施说明证明你的企业有安全管理体系企业资质与制度每一步都有对应的标准可以参照关键是要组织好团队、提前准备、按标准对齐。备案不是目的安全才是。但这些材料本身就是一个倒逼过程——在准备的过程中你会发现很多之前没注意到的安全盲点。参考文献1、https://mp.weixin.qq.com/s/4b_w6Tmezgmi5pPjnVZPgQ

Windows Server TLS安全加固：注册表三步禁用Sweet32漏洞

1. 这不是“打补丁”，而是给Windows Server的SSL/TLS协议栈做一次外科手术你有没有遇到过这样的情况：安全扫描工具突然报出一堆红色高危漏洞，CVE-2016-2183（Sweet32）、CVE-2015-2808（Logjam）、C…...

2026/5/22 14:46:10 阅读更多 →

鸿蒙 PC 正在重新定义“软件”

子玥酱 （掘金 / 知乎 / CSDN / 简书同名） 大家好，我是子玥酱，一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂，目前在某国企负责前端软件研发相关工作，主要聚…...

2026/5/22 14:45:34 阅读更多 →

Subfinder 字幕查找器终极指南：5分钟掌握高效自动字幕下载技巧

Subfinder 字幕查找器终极指南：5分钟掌握高效自动字幕下载技巧【免费下载链接】subfinder 字幕查找器项目地址: https://gitcode.com/gh_mirrors/subfi/subfinder Subfinder 是一款功能强大的开源字幕查找工具，能够智能识别视频文件并自动匹配最…...

2026/5/22 14:45:05 阅读更多 →