近年来,大型语言模型(LLMS)在各种自然语言处理(NLP)任务中表现出了出色的功能。但是,这种令人印象深刻的表现通常是由于参数规模增加的权衡,因此对广泛部署构成了重大挑战。知识蒸馏(KD)通过将知识从大型教师模型转移到较小的学生模型来提供解决方案 ...
随着摩尔的扩展时代的结束,特定应用的硬件加速器似乎是提高计算系统性能和功率效率的一种有吸引力的方式。具有大量硬件加速器以及多个通用CPU的大量异质系统是一个有前途的方向,但是就加速器的加速器和设计粒度的任务计划而言,构成了一些挑战。本文通过开发一个示例异质系统来促进多个应用程序来共享可用的加速器,从而解决了这些挑战 ...
现有的基于及时的方法在不断学习中表现出令人印象深刻的表现,并利用预先培训的大规模模型进行分类任务。但是,由于医疗和自然域之间的概念差距,提示和图像文本 Token 之间的前景 - 背景信息与提示和图像文本 Token 之间的关注之间的紧密耦合在增量医学对象检测任务中面临着重大挑战。 To overcome these challenges, we introduce the \method~fra ...
提升建模是一种快速发展的方法,利用因果推理和机器学习方法直接估计异质治疗效果 ...
近年来,在音频驱动的人类动画方面取得了重大进展。但是,(i)在保持角色一致性的同时,(ii)实现角色和音频之间的精确情感一致性,以及(iii)启用多字符音频驱动的动画。为了应对这些挑战,我们提出了HunyuanVideo-Avatar,这是一种多模式扩散 Transformer (MM-DIT)的模型,能够同时产生动态,情感控制和多个视频对话视频 ...
分析师经常需要在数据分析过程中创建可视化以获取和传达见解。为了减轻创建可视化的负担,之前的研究开发了多种方法,供分析师根据自然语言查询创建可视化。最近的研究证明了大型语言模型在自然语言理解和代码生成任务中的能力... ...
排名模型主要集中于对预测的相对顺序进行建模,同时经常忽略其绝对值准确性的重要性。但是,准确的绝对值对于某些下游任务至关重要,因此需要对原始预测进行校准。为了解决这个问题,现有的校准方法通常采用具有订单保留属性的预定义转换功能来调整原始预测 ...
针对具有多种数据的人形机器人的培训操纵政策可增强其在任务和平台之间的稳健性和概括。但是,仅从机器人演示中学习是劳动密集型的,需要昂贵的远程操作数据收集,这很难扩展。本文研究了更可扩展的数据源,即中心的人类示范,以作为机器人学习的跨体型培训数据 ...