LinkNet 笔记
一、背景
目标检测上中 Fast RCNN,YOLO,SSD 致力于实时的目标检测,但分割任务上实时性的相关工作仍未有所进展。
二、网络结构
创新点:每个编码器与解码器相连接,编码器的输入连接到对应解码器的输出上。
- 恢复降采样操作中丢失的空间信息;
- 可以减少解码器的参数,因为解码器是共享从编码器的每一层学习到的参数;

conv 代表卷积,full-conv 代表全卷积,/2代表下采样的步长是2,*2代表上采样的因子是2。 在卷积层之后添加 BN,后加 ReLU。左半部分表示编码,右半部份表示解码。编码块基于 ResNet18。
编码模块

解码模块

网络模块输入输出大小

三、训练策略
- 优化器:RMSProp
- 使用自定义类别权重(a custom class weighing scheme): $\omega_{class}= \frac{1}{\ln\left(c+p_{class}\right)}$
- 学习率:5e-4
- batch_size:10