基于cv_resnet101_face-detection的人脸考勤系统实战：Java后端集成开发

张

张建站

2026/5/8 4:48:50

10分钟阅读

基于cv_resnet101_face-detection的人脸考勤系统实战Java后端集成开发每天早上公司前台都排着长队员工们等着刷卡或按指纹签到。遇到高峰期队伍能排到门外耽误时间不说偶尔还会因为设备故障或忘记带卡导致考勤异常人事部门每个月都要花大量时间核对和修正。这大概是很多企业都有的烦恼。有没有一种方法能让员工“刷脸”进门系统自动、无感地完成打卡后台实时生成报表既提升体验又解放人力这就是人脸识别考勤系统要解决的问题。今天我们就来聊聊如何将一个专业的人脸检测模型——cv_resnet101_face-detection_cvpr22papermogface集成到我们熟悉的Java后端服务里打造一个真正能用起来的企业级考勤系统。我们会用SpringBoot搭建服务用MySQL存数据并重点解决一个核心问题当上下班高峰期成百上千人同时“刷脸”时系统怎么才能扛得住不卡顿、不崩溃整个过程我会尽量用大白话讲清楚即使你对深度学习模型不太熟也能跟着一步步把系统搭起来。1. 为什么选择这个模型先聊聊“地基”在动手敲代码之前我们得先明白手里这个“工具”到底好不好用。cv_resnet101_face-detection这个模型听名字有点复杂但其实我们可以把它理解成一个经过大量“看图训练”的超级眼睛。它的核心任务很简单在一张图片里又快又准地找到人脸在哪里并且用一个框标出来。这对于考勤系统来说就是最基础也是最关键的第一步——先得发现人脸才能进行后续的识别比对。我选择它主要是看中了三点精度够高它是在一个叫“MogFace”的论文基础上构建的专门针对复杂场景比如侧脸、遮挡、光线暗做了优化。这意味着员工戴着口罩、或者走廊灯光不太亮时它依然有很大概率能成功检测到减少了漏打卡的尴尬。速度与精度的平衡基于ResNet101这个经典网络它在保证高精度的同时推理速度也经过优化不是那种慢吞吞的“老学究”。这对于需要实时响应的考勤场景很重要。易于部署这个模型通常以ONNX或类似的标准化格式提供可以相对方便地集成到我们的Java服务中不需要我们从零开始训练省时省力。你可以把它想象成我们系统的“火眼金睛”而我们要做的就是为这双眼睛搭建一个高效运转的“大脑”Java后端和“记忆库”数据库。2. 搭建系统骨架SpringBoot与数据库设计有了强大的“眼睛”接下来我们得为它建造一个身体。我们使用SpringBoot因为它能让我们快速搭建一个稳健的Web服务省去大量繁琐配置。2.1 初始化SpringBoot项目首先我们创建一个基础的SpringBoot项目。你可以用IDE的创建向导或者直接上Spring Initializr网站勾选依赖。核心依赖有这么几个Spring Web用来提供RESTful API接收前端传来的图片。Spring Data JPA方便我们操作数据库用对象的方式和MySQL打交道少写很多SQL。MySQL Driver连接MySQL数据库的桥梁。项目的核心目录结构大概长这样attendance-system/ ├── src/main/java/com/example/attendance/ │ ├── AttendanceApplication.java // 启动类 │ ├── controller/ // 控制器接收请求 │ ├── service/ // 业务逻辑层 │ ├── repository/ // 数据访问层 │ ├── model/ // 数据实体类 │ └── dto/ // 数据传输对象 └── src/main/resources/ ├── application.properties // 配置文件 └── models/ // 存放人脸检测模型文件2.2 设计数据库表考勤系统需要记录什么最基本的就是员工信息和打卡记录。我们先设计两张简单的表1. 员工表 (employee)这张表存放员工的基本信息特别是人脸特征检测到人脸后我们可以提取特征向量用于后续的识别这里我们先预留字段。CREATE TABLE employee ( id bigint NOT NULL AUTO_INCREMENT, employee_id varchar(20) NOT NULL COMMENT 工号, name varchar(50) NOT NULL COMMENT 姓名, department varchar(100) COMMENT 部门, face_feature_vector text COMMENT 人脸特征向量预留用于1:N识别, register_photo_url varchar(500) COMMENT 注册照路径, create_time datetime DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (id), UNIQUE KEY uk_employee_id (employee_id) ) ENGINEInnoDB DEFAULT CHARSETutf8mb4;2. 考勤记录表 (attendance_record)这是核心表记录每一次打卡行为。CREATE TABLE attendance_record ( id bigint NOT NULL AUTO_INCREMENT, employee_id varchar(20) NOT NULL COMMENT 工号, check_time datetime NOT NULL COMMENT 打卡时间, check_type tinyint NOT NULL COMMENT 打卡类型1上班2下班, photo_url varchar(500) COMMENT 打卡抓拍图片路径, device_location varchar(200) COMMENT 打卡设备位置, detection_confidence float COMMENT 人脸检测置信度, create_time datetime DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (id), KEY idx_employee_date (employee_id, check_time) ) ENGINEInnoDB DEFAULT CHARSETutf8mb4;这里有几个关键点photo_url保存刷脸时的照片便于人工复核detection_confidence保存模型检测的置信度低于某个阈值比如0.9的打卡我们可以标记为“可疑”这比简单粗暴的成功/失败更精细。在Java中我们用JPA的Entity注解来创建对应的实体类这里就不展开代码了。3. 核心引擎集成人脸检测模型这是最“硬核”的部分我们要让Java服务能调用那个深度学习模型。模型推理通常用Python更常见但在Java生态里我们可以借助ONNX Runtime这个强大的工具。3.1 引入ONNX Runtime首先在项目的pom.xml里添加ONNX Runtime的依赖。它提供了Java API可以直接加载和运行ONNX格式的模型。dependency groupIdcom.microsoft.onnxruntime/groupId artifactIdonnxruntime/artifactId version1.16.3/version !-- 请使用最新稳定版本 -- /dependency3.2 编写模型服务类我们创建一个FaceDetectionService它的职责就是加载模型并处理图片。Service Slf4j public class FaceDetectionService { private OrtEnvironment environment; private OrtSession session; PostConstruct public void init() throws OrtException { // 1. 初始化ONNX Runtime环境 environment OrtEnvironment.getEnvironment(); OrtSession.SessionOptions sessionOptions new OrtSession.SessionOptions(); // 2. 加载模型文件假设模型文件放在resources/models下 String modelPath getClass().getClassLoader().getResource(models/cv_resnet101_face.onnx).getPath(); session environment.createSession(modelPath, sessionOptions); log.info(人脸检测模型加载成功。); } /** * 执行人脸检测 * param imageBytes 图片的字节数组 * return 检测到的人脸框列表每个框包含x, y, width, height和置信度 */ public ListFaceBoundingBox detect(byte[] imageBytes) { try { // 1. 将字节数组转换为BufferedImage进行预处理 BufferedImage image ImageIO.read(new ByteArrayInputStream(imageBytes)); // 2. 预处理调整尺寸、归一化、转换为CHW格式的float数组等 // 注意这里的预处理步骤必须和模型训练时完全一致 float[] processedData preprocessImage(image); // 3. 创建模型输入Tensor long[] inputShape {1, 3, image.getHeight(), image.getWidth()}; // 示例shape需根据模型调整 OnnxTensor inputTensor OnnxTensor.createTensor(environment, FloatBuffer.wrap(processedData), inputShape); MapString, OnnxTensor inputs Collections.singletonMap(input, inputTensor); // input是模型输入节点名 // 4. 运行推理 OrtSession.Result results session.run(inputs); // 5. 解析输出结果 // 模型输出通常是边界框坐标、置信度等格式需参考模型文档 float[][] boxes (float[][]) results.get(boxes).get().getValue(); float[] scores (float[]) results.get(scores).get().getValue(); // 6. 后处理根据置信度过滤并转换坐标回原图尺寸 ListFaceBoundingBox faceBoxes postProcessResults(boxes, scores, image.getWidth(), image.getHeight()); // 7. 释放资源 inputTensor.close(); results.close(); return faceBoxes; } catch (Exception e) { log.error(人脸检测失败, e); return Collections.emptyList(); } } // 图像预处理和后处理的具体实现这里省略它们高度依赖于具体模型 private float[] preprocessImage(BufferedImage image) { /* ... */ } private ListFaceBoundingBox postProcessResults(float[][] boxes, float[] scores, int imgW, int imgH) { /* ... */ } }这段代码是核心流程的骨架。你需要重点关注预处理 (preprocessImage)必须严格按照模型要求调整图片大小、归一化像素值、转换颜色通道例如BGR转RGB。这一步错了模型就看不懂图片。后处理 (postProcessResults)模型输出的通常是归一化的坐标或一堆候选框你需要根据置信度阈值比如0.7过滤掉质量差的检测结果并把坐标映射回原始图片的尺寸。3.3 构建API接收图片接下来我们创建一个控制器提供一个API接口让前端比如打卡机能把拍到的照片传过来。RestController RequestMapping(/api/attendance) Slf4j public class AttendanceController { Autowired private FaceDetectionService faceDetectionService; Autowired private AttendanceService attendanceService; PostMapping(/check-in) public ResponseEntityMapString, Object checkIn(RequestParam(file) MultipartFile file, RequestParam(deviceId) String deviceId) { MapString, Object result new HashMap(); try { // 1. 基本校验 if (file.isEmpty()) { result.put(success, false); result.put(message, 图片文件不能为空); return ResponseEntity.badRequest().body(result); } // 2. 调用人脸检测服务 ListFaceBoundingBox detectedFaces faceDetectionService.detect(file.getBytes()); if (detectedFaces.isEmpty()) { result.put(success, false); result.put(message, 未检测到人脸); return ResponseEntity.ok().body(result); } if (detectedFaces.size() 1) { result.put(success, false); result.put(message, 检测到多张人脸请单人打卡); return ResponseEntity.ok().body(result); } // 3. 获取检测到的人脸信息这里简化处理实际需要与人脸库比对 FaceBoundingBox face detectedFaces.get(0); // 假设我们通过其他方式如工号输入人脸检测辅助确定了员工身份 // 实际场景中这里应接入人脸识别1:N比对模块 String employeeId determineEmployeeId(face, file.getBytes()); if (employeeId null) { result.put(success, false); result.put(message, 身份验证失败); return ResponseEntity.ok().body(result); } // 4. 生成打卡记录 AttendanceRecord record attendanceService.createRecord(employeeId, CheckType.CHECK_IN, deviceId, face.getConfidence(), file); result.put(success, true); result.put(message, 打卡成功); result.put(data, record); return ResponseEntity.ok().body(result); } catch (Exception e) { log.error(打卡处理异常, e); result.put(success, false); result.put(message, 系统处理异常); return ResponseEntity.internalServerError().body(result); } } // 简化版的身份确定方法真实项目需要复杂的人脸特征比对逻辑 private String determineEmployeeId(FaceBoundingBox face, byte[] imageBytes) { // TODO: 实现人脸特征提取并与数据库中的注册照特征进行比对1:N识别 // 此处为演示返回一个模拟的工号 return EMP10001; } }这个接口做了几件事接收图片、调用模型检测人脸、判断是否单人、生成打卡记录。注意这是一个简化版本真正的身份验证1:N识别需要额外的人脸特征提取和比对模块这可以是同一个模型的后续网络层也可以是另一个专门的识别模型。4. 应对高峰期性能优化与缓存策略想象一下早上9点几百人同时到达公司门口刷脸。如果每个请求都完整走一遍“读图-检测-存数据库”的流程数据库和服务器压力会巨大响应变慢体验变差。我们必须优化。4.1 异步处理与消息队列对于打卡这种场景其实用户不需要立即知道打卡记录是否已经写入数据库他只需要立即知道“人脸检测是否成功”。我们可以把耗时操作保存记录、更新报表放到后台慢慢做。Service public class AttendanceService { Autowired private JdbcTemplate jdbcTemplate; Autowired private KafkaTemplateString, String kafkaTemplate; // 或用RabbitMQ Async // 使用Spring的Async实现异步 public void asyncProcessRecord(String employeeId, CheckType type, float confidence, byte[] image) { // 1. 将图片上传到对象存储如OSS、MinIO获取URL String photoUrl uploadToObjectStorage(image); // 2. 将打卡记录消息发送到消息队列 AttendanceMessage message new AttendanceMessage(employeeId, type, photoUrl, confidence); kafkaTemplate.send(attendance-topic, JSON.toJSONString(message)); // 消费者会从队列取出消息异步写入数据库生成报表 } }这样API接口只负责快速的人脸检测和返回结果把“写数据库”这个重活丢给后台消费者接口响应速度会快很多。4.2 模型推理结果缓存同一个员工在短时间内连续打卡比如网络不好多点了几下或者同一张图片被重复提交我们没必要每次都调用模型。可以缓存检测结果。Service public class FaceDetectionService { // 使用Guava Cache或Caffeine private CacheString, ListFaceBoundingBox detectionCache; public FaceDetectionService() { detectionCache Caffeine.newBuilder() .maximumSize(1000) // 缓存1000条结果 .expireAfterWrite(5, TimeUnit.SECONDS) // 5秒后过期防止缓存旧数据 .build(); } public ListFaceBoundingBox detectWithCache(byte[] imageBytes) { String imageKey DigestUtils.md5DigestAsHex(imageBytes); // 用图片MD5作key return detectionCache.get(imageKey, key - { // 缓存未命中执行实际的模型推理 return detect(imageBytes); }); } }这里用图片的MD5值作为缓存键5秒过期对于防重复提交基本够用又不会占用太多内存。4.3 数据库连接池与索引优化连接池在application.properties中配置HikariCP等高性能连接池参数确保有足够的连接应对并发。spring.datasource.hikari.maximum-pool-size20 spring.datasource.hikari.connection-timeout30000索引如前所述在attendance_record表的(employee_id, check_time)上建立复合索引能极大加速按员工和时间范围查询报表的速度。5. 把一切组装起来从打卡到报表最后我们梳理一下完整的流程看看各个模块是如何协同工作的员工刷脸终端设备摄像头捕获一张照片通过HTTP请求调用我们的/api/attendance/check-in接口。快速检测控制器收到图片立即调用带缓存的FaceDetectionService。模型在百毫秒内完成人脸检测。即时反馈如果检测失败无人脸、多人脸立即返回错误信息给终端屏幕提示。如果检测成功接口立即返回“打卡成功”。异步落库服务层异步将图片上传到云存储并将一条包含所有信息的消息发送到消息队列如Kafka。可靠消费一个独立的消费者服务从队列中取出消息稳稳当当地将打卡记录写入MySQL并可能触发更新当日考勤状态、发送异常通知等后续逻辑。查询报表人事系统通过另一个查询接口从已建立索引的attendance_record表中快速拉取数据生成每日、每月的考勤报表。这样一来我们就把一个前沿的AI模型稳稳地塞进了经典的企业级Java技术栈里构建了一个既能处理高并发又具备AI能力的实用系统。整个项目做下来感觉最深的就是“平衡”二字。既要利用AI模型的高精度又要兼顾Java后端在高并发下的稳定与高效。选择ONNX Runtime作为桥梁用异步和缓存来化解性能瓶颈这些都是工程实践中很实在的招数。当然这里展示的是一个最小可行产品MVP。真要上线还有很多细节要打磨比如如何构建准确的人脸特征库实现1:N识别、如何防止用照片/视频冒充的活体检测、打卡数据的安全与隐私保护、更复杂的排班和异常考勤规则引擎等等。但无论如何这个基于cv_resnet101_face-detection和SpringBoot的骨架已经为我们打下了一个非常扎实的基础。你可以在这个基础上根据自己公司的实际需求一步步添砖加瓦打造一个更智能、更高效的数字化考勤门户。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

NSudo终极指南：5个技巧让你彻底掌握Windows系统权限管理

NSudo终极指南：5个技巧让你彻底掌握Windows系统权限管理【免费下载链接】NSudo [Deprecated, work in progress alternative: https://github.com/M2Team/NanaRun] Series of System Administration Tools 项目地址: https://gitcode.com/gh_mirrors/ns/NSudo …...

2026/4/13 12:52:10 阅读更多 →

从领域驱动到本体论：AI 时代的架构方法论变了焚

从0构建WAV文件：读懂计算机文件的本质虽然接触计算机有一段时间了，但是我的视野一直局限于一个较小的范围之内，往往只能看到于算法竞赛相关的内容，计算机各种文件在我看来十分复杂，认为构建他们并能达到目的是一件困难…...

2026/4/13 12:50:04 阅读更多 →

[OpenGL] 视图矩阵（View）矩阵的数学原理与glm::lookAt实现剖析

1. 视图矩阵的本质：从3D世界到2D屏幕的桥梁第一次接触OpenGL视图矩阵时，我完全被那些数学符号搞晕了。直到有天我在调试一个摄像机漫游程序时，突然意识到视图矩阵其实就是把真实世界的3D场景"拍扁"成手机屏幕上的2D画面的魔法工具…...

2026/4/13 12:49:13 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/8 3:27:44 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/8 1:39:53 阅读更多 →