用于时间序列预测的深度学习传统上在每个数据集一个模型的框架内运行,限制了其利用大型预训练模型改变游戏规则的影响的潜力。通用预测的概念源于对大量时间序列数据集的预训练,设想了一个能够解决各种下游预测任务的大型时间序列模型。然而,构建这样的模型对时间序列数据提出了独特的挑战:i)跨频率学习,ii)为多元时间序列容纳任意数量的变量,以及iii)解决大规模数据固有的不同分布特性 ...
GPT-3 等大型语言模型是优秀的小样本学习器,允许通过自然文本提示来控制它们。最近的研究报告称,基于提示的直接分类消除了微调的需要,但缺乏数据和推理的可扩展性。本文提出了一种新颖的数据增强技术,该技术利用大规模语言模型从真实样本的混合中生成真实的文本样本 ...
自然而富有表现力的人体动作生成是计算机动画的圣杯。由于可能的运动的多样性、人类对运动的感知敏感性以及准确描述运动的难度,这是一项具有挑战性的任务。因此,当前的生成解决方案要么质量低下,要么表达能力有限 ...
大多数现代监督统计/机器学习 (ML) 方法都明确设计用于很好地解决预测问题。实现这一目标并不意味着这些方法会自动提供良好的因果参数估计量。此类参数的示例包括个体回归系数、平均治疗效果、平均提升以及需求或供应弹性 ...
最近的工作提出了一种系统评估“情境语言理解智能体”的方法,即在丰富的语言和非语言环境中运行的智能体,通过在精心构建的交互环境中对其进行测试。最近的其他工作认为,如果设置适当,大型语言模型(LLM)可以被理解为此类代理(的模拟器)。本文探讨了一种联系:是否可以通过将 LLM 置于旨在挑战特定能力的受限游戏环境中来对其进行有意义的评估?作为概念证明,本文研究了五种交互设置,表明当前聊天优化的 LLM ...