Benjam1n的文档

Benjam1n

Benjam1n

个性签名 ...

MoViNets: Mobile Video Networks for Efficient Video Recognition

我们提出了移动视频网络 (MoViNets)，这是一系列计算和内存高效的视频网络，可以在流视频上运行以进行在线推理。 3D 卷积神经网络（CNN）在视频识别方面非常准确，但需要大量的计算和内存预算，并且不支持在线推理，这使得它们很难在移动设备上工作。我们提出了一种三步方法来提高计算效率，同时大幅降低 3D CNN 的峰值内存使用量 ...

0 0 0 0 2024/04/25 arXiv:2103.11511v2 Benjam1n

TAda! Temporally-Adaptive Convolutions for Video Understanding

空间卷积广泛应用于众多深度视频模型中。它从根本上假设时空不变性，即 ...

0 0 0 0 2024/04/24 arXiv:2110.06178v4 Benjam1n

Temporally-Adaptive Models for Efficient Video Understanding

空间卷积广泛应用于众多深度视频模型中。它从根本上假设时空不变性，即 ...

0 0 0 0 2024/04/23 arXiv:2308.05787v1 Benjam1n

UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer

传统的通道修剪方法通过减少网络通道来有效地修剪具有深度卷积层和某些高效模块（例如流行的反向残差块）的高效 CNN 模型。由于一些归一化层的存在，先前通过减少网络深度的深度剪枝方法不适合剪枝一些高效模型。此外，通过直接删除激活层来微调子网会破坏原始模型权重，阻碍剪枝后的模型实现高性能 ...

0 0 0 0 2024/04/17 arXiv:2401.06426v1 Benjam1n

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）