**arXiv Computer Science** @arxiv_cs@qoto.org · 2021-08-24T03:00:11Z

arXiv Computer Science @arxiv_cs@qoto.org

MM-ViT: Multi-Modal Video Transformer for Compressed Video Action Recognition. (arXiv:2108.09322v1 [cs.CV]) http://arxiv.org/abs/2108.09322

Aug 24, 2021, 03:00 · · feed2toot · · ·