我们提出了移动视频网络 (MoViNets),这是一系列计算和内存高效的视频网络,可以在流视频上运行以进行在线推理。 3D 卷积神经网络(CNN)在视频识别方面非常准确,但需要大量的计算和内存预算,并且不支持在线推理,这使得它们很难在移动设备上工作。我们提出了一种三步方法来提高计算效率,同时大幅降低 3D CNN 的峰值内存使用量 ...
空间卷积广泛应用于众多深度视频模型中。它从根本上假设时空不变性,即 ...
空间卷积广泛应用于众多深度视频模型中。它从根本上假设时空不变性,即 ...
传统的通道修剪方法通过减少网络通道来有效地修剪具有深度卷积层和某些高效模块(例如流行的反向残差块)的高效 CNN 模型。由于一些归一化层的存在,先前通过减少网络深度的深度剪枝方法不适合剪枝一些高效模型。此外,通过直接删除激活层来微调子网会破坏原始模型权重,阻碍剪枝后的模型实现高性能 ...