有效的探索对于与环境相互作用的智能系统至关重要,但是现有的语言模型通常在需要战略信息收集的情况下不足。在本文中,我们提出了一种微调方法,它使语言模型能够开发不限于特定环境的一般决策能力。通过培训来自需要各种策略的不同任务的合成互动数据,Paprika教授模型以基于环境反馈在信中的新任务上探索和调整其行为,而无需更新 ...
0 0 0 2025/03/03 arXiv:2502.17543v1 liuweitang
在人类视觉系统中,自上而下的注意力在感知中起着至关重要的作用,其中大脑最初执行整体但粗糙的场景分析以提取显着提示(即首先概述),然后进行更精确的检查以做出更准确的判断(i ...
0 0 0 2025/03/03 arXiv:2502.20087v1 hnu
思维链提示在各种自然语言推理任务中表现出了卓越的性能。然而,它往往在需要比提示中显示的示例更难解决问题的任务上表现不佳。为了克服从易到难的泛化挑战,我们提出了一种新颖的提示策略,即从最少到最多的提示... ...
0 0 2 2025/03/03 arXiv:2205.10625v3 sailingsan
医疗保健是数据挖掘和机器学习中最令人兴奋的边界之一。成功采用电子健康记录(EHRS)在可用于分析的数字临床数据中造成了爆炸,但是由于没有公开可用的基准数据集,因此很难衡量医疗保健研究的机器学习进展。为了解决这个问题,我们使用从重症监护室(MIMIC-III)数据库中得出的数据提出了四个临床预测基准 ...
0 0 0 2025/03/03 arXiv:1703.07771v3 emoji
近年来,针对语义细分的分布外(OOD)检测的研究主要集中在道路场景上,这是一个具有限制语义多样性的领域。在这项工作中,我们挑战了这一限制,并将此任务的领域扩展到一般的自然图像。为此,我们介绍:1 ...
0 0 0 2025/03/03 arXiv:2407.15739v1 w2691455851
提示调整是使用与任务相关的文本标记使预训练的视觉语言模型((VLM)适应下游任务的有效方法。基于coop的代表性工作将可学习的文本标记与类标记相结合,以获得特定的文本知识。然而,特定的文本知识对于未见过的类的泛化能力较差,因为它忘记了具有很强泛化能力的本质的一般文本知识... ...
0 0 0 2025/03/03 arXiv:2303.13283v1 uvk9090
我们提出了hunyuan-dit,一种文本到图像的扩散转换器,可以对英语和中文进行细粒度的理解。为了构建hunyuan-dit,我们仔细设计了 Transformer 结构、文本编码器和位置编码。我们还从头开始构建整个数据管道来更新和评估数据以进行迭代模型优化 ... ...
0 0 2 2025/03/03 arXiv:2405.08748v1 adrianxu
在现代信息检索中,开发越来越有效,准确的算法是近似最近的邻居搜索。解决此问题的主要方法是聚类,其中涉及将数据集划分为不同的组,每个组都以代表性数据点为特征。通过这种方法,检索查询的TOP-K数据点需要根据其代表(路由步骤)识别最相关的群集,然后仅在这些群集中进行最近的邻居搜索,从而大大降低了搜索空间 ...
0 0 0 2025/03/03 arXiv:2412.05921v1 cormus

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)