我们研究如何将在互联网规模数据上训练的视觉语言模型直接纳入端到端机器人控制中,以促进泛化并实现紧急语义推理。我们的目标是使单个端到端训练模型能够学习将机器人观察映射到动作,并享受对来自网络的语言和视觉语言数据进行大规模预训练的好处。为此,我们建议在机器人轨迹数据和互联网规模的视觉语言任务(例如视觉问答)上共同微调最先进的视觉语言模型 ...
0 0 0 2024/04/25 arXiv:2307.15818v1 czvzb
本报告调查了生成模型以及联网和自动驾驶汽车 (CAV) 的历史和影响,这两种推动技术和交通进步的突破性力量。通过重点关注生成模型在 CAV 背景下的应用,该研究旨在揭示这种集成如何增强自动驾驶汽车的预测建模、模拟准确性和决策过程。本文讨论了在交通运输中集成生成模型和 CAV 技术的好处和挑战 ...
0 0 0 2024/04/25 arXiv:2403.10559v1 838348914
ChatGPT 和 Bard 等大型语言模型 (LLM) 彻底改变了自然语言的理解和生成。他们拥有深厚的语言理解能力、类人的文本生成能力、情境意识和强大的解决问题的能力,这使得他们在各个领域(例如,人工智能)都具有无价的价值 ...
0 0 0 2024/04/25 arXiv:2312.02003v3 zzyx
大型语言模型 (LLM) 因其在理解和生成类人文本方面的卓越能力而彻底改变了人工智能 (AI) 服务。尤其是 LLM 聊天机器人已得到广泛采用,改变了人机交互。然而,这些 LLM 聊天机器人很容易受到“越狱”攻击,即恶意用户操纵提示来引发不适当或敏感的响应,从而违反服务策略 ...
0 0 0 2024/04/25 arXiv:2307.08715v2 zzyx
大型语言模型 (LLM) 很容易受到越狱攻击,从而导致有害、不道德或有偏见的文本生成。然而,现有的越狱方法的计算成本很高。在本文中,我们提出了从弱到强的越狱攻击,这是一种攻击对齐的 LLM 以产生有害文本的有效方法 ...
0 0 0 2024/04/25 arXiv:2401.17256v2 zzyx
半监督学习已被证明是利用未标记数据来减轻对大型标记数据集的依赖的强大范例。在这项工作中,我们统一了当前半监督学习的主流方法,以产生一种新算法 MixMatch,该算法通过猜测数据增强的未标记示例的低熵标签并使用 MixUp 混合标记和未标记数据来工作。我们表明,MixMatch 在许多数据集和标记数据量中大幅获得了最先进的结果 ...
0 0 0 2024/04/25 arXiv:1905.02249v2 豆芽ya
在教育应用中,知识追踪是指根据学生过去对问题的回答来估计学生随时间变化的概念/技能掌握水平并预测他们未来的表现的问题。大多数现有知识追踪方法的一个关键限制是它们将学生对问题的回答视为二元值,即 ...
0 0 0 2024/04/25 arXiv:2203.03716v4 sadscv
以参数有效的方式微调预训练的大型语言模型因其有效性和效率而被广泛研究。流行的低秩适应方法(LoRA)提供了一种值得注意的方法,假设适应过程本质上是低维的。尽管 LoRA 表现出了值得称赞的性能,但它是通过固定且不可更改的内在等级来实现的,这可能并不总是理想的选择 ...
0 0 0 2024/04/25 arXiv:2311.11696v1 DoubleSails

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)