ChatGPT 的引入使得用于解决下游任务的大型语言模型 (LLM) 的利用率显着增加。在这种背景下,人们越来越关注具有成本效益的培训和部署。 LLM 的低成本培训和部署代表了未来的发展趋势 ...
0 0 0 2024/03/29 arXiv:2401.02038v2 prettyross
学术界和工业界对大型语言模型 (LLM) 的依赖日益增加,因此需要全面了解其对提示的鲁棒性。为了满足这一重要需求,我们引入了 PromptBench,这是一个稳健性基准,旨在衡量 LLM 对对抗性提示的适应能力。这项研究使用了大量的对抗性文本攻击,针对多个级别的提示:字符、单词、句子和语义 ...
0 0 0 2024/03/29 arXiv:2306.04528v4 Wangyanyan0619
基于提示的大型语言模型 (LLM) 在生成自然语言推理步骤或用于多步骤问答 (QA) 的思想链 (CoT) 方面具有惊人的强大功能。然而,当 LLM 无法获得必要的知识或在其参数范围内不是最新的知识时,他们就会陷入困境。虽然使用问题从外部知识源检索相关文本有助于 LLM ,但我们观察到这种一步检索和阅读方法不足以进行多步 QA ...
0 0 0 2024/03/29 arXiv:2212.10509v2 seeker
多元时间序列建模长期以来一直吸引着来自经济、金融和交通等不同领域的研究人员。多元时间序列预测背后的一个基本假设是其变量相互依赖,但仔细观察后,可以公平地说,现有方法未能充分利用变量对之间的潜在空间依赖性。与此同时,近年来,图神经网络(GNN)在处理关系依赖性方面表现出了强大的能力 ...
0 0 0 2024/03/29 arXiv:2005.11650v1 peiy
通过直接访问人类书写的参考作为记忆,检索增强生成在广泛的文本生成任务中取得了很大进展。因为更好的记忆通常会促进更好的生成〜(我们将其定义为原始问题)。传统的记忆检索方法涉及选择与输入表现出最高相似度的记忆 ...
0 0 0 2024/03/29 arXiv:2305.02437v3 Dolerite
最近基于 LiDAR 的 3D 对象检测 (3DOD) 方法显示出有希望的结果,但它们通常不能很好地推广到源(或训练)数据分布之外的目标域。为了减少此类域差距,从而使 3DOD 模型更具通用性,我们引入了一种新颖的无监督域适应 (UDA) 方法,称为 CMDA,该方法 (i) 利用来自图像模态的视觉语义线索(即 ...
0 0 0 2024/03/29 arXiv:2403.03721v2 爱吃鱼的两包盐
有大量关于通过融合各种传感器输入(例如使用深度神经网络的激光雷达点云和相机图像)来感知道路结构的文献。利用神经架构师(例如 Transformer)和鸟瞰图(BEV)表示的最新进展,道路认知准确性不断提高。然而,在没有明确定义的“道路”的情况下,如何识别自动驾驶汽车的“道路”仍然是一个悬而未决的问题 ...
0 0 0 2024/03/29 arXiv:2305.01622v2 dumbbird
这项调查探讨了大型语言模型 (LLM) 和向量数据库 (VecDB) 的协同潜力,这是一个新兴但快速发展的研究领域。随着 LLM 的激增,带来了一系列挑战,包括幻觉、过时的知识、高昂的商业应用成本和内存问题。 VecDB 通过提供一种有效的方法来存储、检索和管理 LLM 操作固有的高维向量表示,成为解决这些问题的引人注目的解决方案 ...
0 0 0 2024/03/29 arXiv:2402.01763v2 云汐瑶