arxiv LOT: A Story-Centric Benchmark for Evaluating Chinese Long Text Understanding and Generation

名称
LOT: A Story-Centric Benchmark for Evaluating Chinese Long Text Understanding and Generation
首页
https://yiyibooks.cn/arxiv/2108.12960v2/index.html
原始地址
https://arxiv.org/abs/2108.12960
描述
标准的多任务基准对于开发可以推广到各种下游任务的预训练模型至关重要。现有的自然语言处理(NLP)基准通常只关注理解或生成短文本。然而,长文本建模需要许多与短文本不同的能力,例如长距离话语和常识关系的建模,以及生成的连贯性和可控性 ...