视觉CNN常用基础技术来源：UberNet

张

张建站

2026/5/8 2:15:50

10分钟阅读

UberNet是2017CVPR中的一篇经典论文步入视觉领域这么很多年依旧觉得浮于表面没有真的理解CNN其中的奥妙然后持续性去读一些经典的论文总是会发现很多惊喜。UberNet就是被我挖掘出来的一批经典的论文它的经典之处在于它的思想在10年后的今天已经成为了大家共识性知识。一、UberNet是用来解决同时训练多个任务边缘、分割、法向、目标、人体部件等,UberNet的具体做法从结构开始上图是UberNet的结构第一行是原始图片输入第二行是原始图片resize 1/2后再输入到网络中第三行是原始图片resize 1/4后输入到网络中这三行实现了图像scale每一行的结构的结构都是一样的这个就是UberNet的结构基于vgg16网络C1VGG16的conv1_2, C2conv2_2, C3 conv3_3, C4conv4_3、C5conv5_3, C7 fc7,C1…C6代表浅层特征~深层特征这个是feature scale每层特征上的E1到ETE^1 到E^TE1到ET是T个任务分支每个任务在C1~C6不同特征层都有任务分支因为不同任务需要的特征不同F1到FTF^1到F^TF1到FT是当前图像尺寸上的每个任务在不同特征层上的融合S1到STS^1到S^TS1到ST是不同任务在三种图像尺寸上的融合。二、UberNet的思想只有backbone是共享的多层特征都重要并不是最后一层feature 重要不同任务需要不同层级的feature例如边缘/纹理的浅层特征、具备结构的中层特征、语义的深层特征在现代结构中FPN就是所有层的特征进行融合所以多层特征融合已经成为了默认操作不同任务对feature的需求不同不同任务需要的是backbone的不同部分多尺度输入很重要不仅仅是input pyramid 还有feature pyramid不同分辨率的输入都要进入到网络中

C++STL之string

.auto和范围for auto关键字在早期C/C中auto的含义是：使用auto修饰的变量，是具有自动存储器的局部变量，后来这个不重要了。C11中，标准委员会变废为宝赋予了auto全新的含义即：auto不再是一个存储类型指示符&a…...

2026/5/8 2:12:31 阅读更多 →

如何快速配置MHY扫码登录器：新手完全指南

如何快速配置MHY扫码登录器：新手完全指南【免费下载链接】MHY_Scanner MHY扫码登录器，支持从直播流抢码。项目地址: https://gitcode.com/gh_mirrors/mh/MHY_Scanner 还在为米哈游游戏登录抢码而烦恼吗？MHY_Scanner正是你需要的游戏…...

2026/5/8 2:11:32 阅读更多 →

TinyML与边缘计算：MCU上的机器学习部署实践

1. TinyML与边缘计算的技术融合微控制器（MCU）上的机器学习部署正在重塑物联网设备的智能化边界。传统云端AI方案在工业传感器、可穿戴设备等场景面临三大核心挑战：网络延迟导致的实时性不足、数据隐私传输风险以及电池供电设备的能耗限制。Ti…...

2026/5/8 2:08:28 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/4 6:26:56 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/8 1:39:53 阅读更多 →