arxiv LongVideoBench: A Benchmark for Long-context Interleaved Video-Language Understanding

名称
LongVideoBench: A Benchmark for Long-context Interleaved Video-Language Understanding
首页
https://yiyibooks.cn/arxiv/2407.15754v1/index.html
原始地址
https://arxiv.org/abs/2407.15754
描述
大型多模型模型(LMM)正在处理越来越长,更丰富的输入。尽管取得了进展,但很少有公共基准可以衡量这种发展。为了减轻这一差距,我们介绍了LongVideobench,这是一个提问的基准,它具有视频语言交织的输入长达一个小时的时间 ...