提高人类活动识别准确性的新方法：空间注意力与遗传算法的结合

张

张建站

2026/5/16 21:35:56

10分钟阅读

前言全网受益百万人零基础学PythonPython从0到100最新最全教程。想做这件事情很久了这次我更新了自己所写过的所有博客汇集成了Python从0到100共一百节课帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识成为学业升学和工作实践的先行者【优惠信息】 • 新专栏订阅前200名享9.9元优惠 • 订阅量破200后价格上涨至19.9元 • 订阅本专栏可免费加入粉丝福利群享受所有问题解答专属福利领取一、前言人类活动识别Human Activity Recognition, HAR是环境计算和情境感知计算领域中一个重要的研究主题。随着智能手机和可穿戴设备的普及HAR在诸如智能监控系统、健康护理、异常行为检测以及人机交互等多个领域变得越来越重要。HAR的目标是通过分析从各种传感器获得的数据来识别个体正在进行的活动。在HAR中有两种主要的方法来从传感器数据中识别活动基于视觉的方法和基于可穿戴传感器的方法。视觉方法通过分析使用摄像头捕获的视频或图像来识别和分类活动但这些方法存在一些局限性如环境光线、摄像机位置、潜在障碍物以及隐私侵犯等问题。而基于可穿戴传感器的方法则更有前景因为这些传感器易于使用、体积小、对被测对象的侵入性小并且安装成本和能耗低。尽管如此从时间序列信号中捕捉时间和频率关系为自动HAR提供了固有的障碍。从传感器读取序列的特征空间中提取时空上下文是当前循环、卷积或混合活动识别模型所面临的挑战。这些模型产生的大型特征映射也影响了整体分类准确性。为了解决这些问题本文提出了一种基于可穿戴传感器数据的HAR混合架构。首先使用连续小波变换Continuous Wavelet Transform, CWT对传感器数据的时间序列进行编码将其转换为多通道图像。然后利用空间注意力辅助的卷积神经网络CNN提取更高维度的特征。为了找到识别人类活动最本质的特征开发了一种新的特征选择Feature Selection, FS方法。首先采用三种基于过滤器的方法互信息Mutual Information, MI、Relief-F和最小冗余最大相关性minimum redundancy maximum relevance, mRMR来评估特征的适应度。然后通过修改版的遗传算法Genetic Algorithm, GA移除排名较低的特征来选择最佳特征集。最后使用K-最近邻K-Nearest Neighbors, KNN分类器对人类活动进行分类。通过在五个知名的公共HAR数据集上的全面实验证明了该模型在分类性能上显著优于现有的最先进模型。同时观察到使用基于GA的特征选择技术在降低特征数量的同时提高了整体识别准确性。二、相关工作在过去的几年中深度学习模型在人类活动识别HAR领域取得了显著的成就研究人员开发了多种基于深度学习的模型这些模型利用卷积神经网络CNN、循环神经网络RNN、长短期记忆网络LSTM等技术来处理时间序列数据。1.深度学习在HAR中的应用CNN模型卷积神经网络在图像识别领域取得了巨大成功研究人员尝试将其应用于时间序列数据的特征提取。例如通过将时间序列数据转换为图像如通过小波变换然后使用CNN进行识别。RNN和LSTM模型RNN特别是LSTM由于其处理序列数据的能力在HAR中被广泛使用。LSTM能够学习数据中的长期依赖关系适用于处理来自可穿戴/惯性传感器的时间序列数据。混合模型结合CNN和RNN或LSTM的方法进一步提高了识别准确性。这些混合模型可以同时提取时间序列的时空特征。2.时间序列数据的图像表示Gramian Angular Field (GAF)和Markov Transition Field (MTF)这些方法通过将时间序列数据转换为图像使得可以使用CNN等图像识别技术进行分类。Recurrence Plots另一种表示时间序列数据的方法是使用递归图这可以帮助捕获数据的动态特征。短时傅里叶变换STFT通过将传感器信号编码为频谱图即短时傅里叶变换的结果可以作为CNN模型的输入。3.特征选择技术包装器方法这类方法使用学习算法如分类器来评估特征子集的质量并选择最佳子集。过滤器方法与包装器方法不同过滤器方法基于统计技术评估特征的重要性不依赖于特定的学习算法。遗传算法GAGA是一种元启发式搜索算法用于解决特征选择等优化问题。GA通过模拟自然选择过程中的交叉、变异和遗传机制来搜索最优解。在这些研究中特征选择被证明是提高HAR系统性能的关键步骤。选择合适的特征不仅可以提高分类的准确性还可以减少计算资源的使用提高系统的实时性。尽管已经有许多方法被提出来提高HAR的准确性但如何有效地从大量可能的特征中选择出最有用的特征仍然是一个挑战。此外如何将深度学习技术与特征选择技术结合起来以进一步提高HAR的性能也是当前研究的热点之一。三、模型提出HAR框架的整体工作流程1.连续小波变换首先作者采用了连续小波变换CWT来将原始的传感器时间序列数据编码成图像。CWT是一种有效的数学工具用于信号处理它可以将时域信号转换为时频域的表示形式。通过选择适当的母小波函数CWT能够生成反映信号局部特性的系数。步骤对每个传感器通道的1D时间序列数据执行CWT生成2D的scalogram。使用不同的尺度参数对原始信号进行CWT以捕获不同频率下的特性。2.惯性传感器到图像编码将传感器数据转换为图像表示后可以利用深度学习模型来提取特征。作者通过CWT将每个传感器样本转换为一个多通道的2D图像其中每个通道对应于传感器的一个轴。步骤对每个传感器样本执行CWT生成多通道的2D图像。根据传感器通道的数量和采样窗口的大小调整CWT的参数。3.特征提取使用空间注意力辅助CNN作者提出了一个基于CNN的特征提取模型该模型包含四个卷积层和空间注意力子网络。空间注意力机制使模型能够关注图像中最具信息性的部分。步骤输入图像通过四个卷积层每层后面跟着一个最大池化层和一个dropout层。在每个卷积层之后使用空间注意力模块来增强特征图。最后将特征图展平并通过一个全连接层生成1024维的特征向量。4.空间注意力模块空间注意力模块通过利用特征之间的空间关系来生成注意力特征图。该模块使用1x1的卷积层来融合通道信息然后通过2D卷积层生成注意力特征图。步骤使用1x1的卷积层来融合特征图的通道。应用2D卷积层来生成空间注意力特征图。使用ReLU激活函数和适当的填充操作来保持空间尺寸。5.特征选择为了减少计算开销并提高分类准确性提出了一种基于遗传算法GA的特征选择方法。该方法首先使用三种过滤器方法MI、Relief-F和mRMR来评估特征的重要性。步骤使用过滤器方法对特征进行评分。根据评分结果使用GA选择最佳特征子集。应用指导性变异策略来提高个体染色体的适应度。四、实验和结果 (Experiments and results)在这一部分作者详细描述了他们所提出的模型在多个公共人类活动识别HAR数据集上的实验设置、性能评估指标、实验结果以及结果的详细分析。1.模型实现实验环境实验在配备AMD Ryzen 7 4800 H处理器、16 GB RAM和NVIDIA GeForce GTX 1660 Ti GPU的笔记本电脑上进行。软件框架使用Keras API和TensorFlow后端构建模型CWT部分使用PyWavelets库。训练细节CNN模型采用Adam优化器进行训练共训练150轮批量大小为32。2.数据集描述作者使用了以下五个公共HAR数据集进行实验UCI-HAR包含6种活动由30名志愿者使用智能手机记录。WISDM包含6种活动通过在福特汉姆大学实验室控制条件下收集的数据。MHEALTH包含12种活动涉及10名不同背景的志愿者。PAMAP2包含12种活动使用3个惯性测量单元IMU记录。HHAR包含6种活动使用智能手机和智能手表记录。下面出了五个数据集的汇总信息。UCI-HAR、WISDM和HHAR数据集包含6个活动但传感器数量不同。MHEALTH和PAMAP2这两个数据集都包含12种活动和更多附加传感器。HHAR包含最多的训练和测试数据而PAMAP2与其他数据集相比包含更多的附加传感器。3.性能评估指标Accuracy准确率正确预测的样本数占总样本数的比例。Precision精确率正确预测为正类的样本数占预测为正类样本总数的比例。Recall召回率正确预测为正类的样本数占实际正类样本总数的比例。F1-ScoreF1分数精确率和召回率的调和平均值。Confusion Matrix混淆矩阵评估分类模型性能的方阵。4.实验结果作者首先展示了不使用特征选择FS的模型性能并与使用FS的模型进行了比较。无FS模型在所有数据集上均取得了较高的准确率但使用FS后准确率进一步提高。有FS模型在UCI-HAR、WISDM、MHEALTH、PAMAP2和HHAR数据集上的准确率分别达到了99.45%、99.38%、99.90%、98.29%和97.72%。5.混淆矩阵分析混淆矩阵显示了模型在不同活动类别上的分类性能。模型有无FS时UCI-HAR的混淆矩阵尽管模型整体性能良好但在某些相似活动类别上仍然存在混淆如站立和坐下、上楼和下楼等。6.超参数影响分析作者还探讨了遗传算法GA的超参数对模型性能的影响包括种群大小发现种群大小为10时模型性能最佳。交叉概率不同的数据集对交叉概率的敏感度不同但一般而言交叉概率在0.6左右时性能较好。迭代次数迭代次数的增加并不总是能提高模型性能适当的迭代次数可以避免过拟合。五、结论通过在多个公共数据集上的实验验证证明了提出的结合CWT、空间注意力辅助CNN和GA特征选择的模型在HAR任务上的有效性和优越性。实验结果表明该模型不仅提高了分类的准确性还通过特征选择减少了计算资源的需求提高了模型的实用性。

从MHC到MCC：PIC32项目迁移实战指南与问题排查

1. 项目概述：从MHC到MCC的迁移之路如果你是一位长期使用Microchip PIC32系列微控制器的嵌入式开发者，那么“MPLAB Harmony配置器（MHC）”这个名字你一定不陌生。它曾经是Harmony框架下图形化配置工具的核心，帮助我们快速…...

2026/5/16 21:32:16 阅读更多 →

终极指南：如何为HarmonyOS设备配置MicroG签名伪造与位置服务

终极指南：如何为HarmonyOS设备配置MicroG签名伪造与位置服务【免费下载链接】GmsCore Free implementation of Play Services 项目地址: https://gitcode.com/GitHub_Trending/gm/GmsCore MicroG作为Google移动服务（GMS）的开源替代实…...

2026/5/16 21:32:13 阅读更多 →

如何快速下载HLS视频流：M3U8下载器的终极指南

如何快速下载HLS视频流：M3U8下载器的终极指南【免费下载链接】m3u8-downloader 一个M3U8 视频下载(M3U8 downloader)工具。跨平台: 提供windows、linux、mac三大平台可执行文件,方便直接使用。项目地址: https://gitcode.com/gh_mirrors/m3u8d/m3u8-downloader…...

2026/5/16 21:31:29 阅读更多 →

【四川电影电视学院主办 | AP出版，高录用快见刊，最快刊后1个月内上知网谷歌学术 | 主题不设限，教育、艺术、语言等人文社科主题均可】第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026）

高录用快见刊，会议快见刊，最快刊后1个月内上知网&谷歌学术主题不设限，教育、艺术、语言等人文社科主题均可第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026） 2026 5th International Conference on Science …...

2026/5/14 4:32:07 阅读更多 →

【斯普林格Springer 旗下的Atlantis Press出版社出版 | EI Compendex、Scopus、谷歌学术】第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026）

第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026） The 5th International Conference on Blockchain, Information Technology and Smart Finance 2026年6月19日 -21日，中国-上海大会官网：www.ic-bis.net【论文投…...

2026/5/14 21:21:27 阅读更多 →