本文档描述了使用 Lucene Java 框架的 BM25 和 BM25F 实现。这两种模型都因其性能在 TREC 中脱颖而出,并被认为是 IR 社区中最先进的模型。 BM25 适用于“ad-hoc”检索,即不包含字段的文档,而 BM25F 适用于有结构的文档 ...
0 0 0 2024/04/26 arXiv:0911.5046v2 _xxt_
在这项工作中,我们研究了损失 Hessian 在许多分类任务中的演变,以了解损失曲率对训练动态的影响。虽然之前的工作重点关注不同的学习率如何影响训练期间观察到的 Hessian 损失,但我们还分析了模型初始化、架构选择和常见训练启发式(例如梯度裁剪和学习率预热)的影响。我们的结果表明,成功的模型和超参数选择允许早期优化轨迹避免或导航出高曲率区域并进入可容忍更高学习率的平坦区域 ...
0 0 0 2024/04/26 arXiv:2110.04369v1 huwenxing
车辆轨迹预测越来越依赖于数据驱动的解决方案,但它们扩展到不同数据域的能力以及较大数据集大小对其泛化的影响仍有待探索。虽然可以通过使用多个数据集来研究这些问题,但由于存在一些差异,因此具有挑战性 ...
0 0 0 2024/04/26 arXiv:2403.15098v2 jerome.zhou
编队飞行对于空中机器人群在各种应用中具有巨大的潜力。然而,现有方法缺乏在密集环境下实现完全自主的大规模编队飞行的能力。为了弥补这一差距,我们提出了一个完整的编队飞行系统,该系统可以有效地将现实世界的约束融入空中编队导航中 ...
0 0 0 2024/04/26 arXiv:2210.04048v2 qiufeiguye
尽管大型语言模型 (LLM) 在不同的应用程序中具有令人印象深刻的功能,但它们仍然存在可信度问题,例如幻觉和错位。检索增强语言模型(RAG)已被提出来通过基于外部知识来提高世代的可信度,但对其世代风险的理论理解仍有待探索。在本文中,我们回答:1)RAG 是否确实可以降低发电风险,2)如何为 RAG 和普通 LLM 的发电风险提供可证明的保证,3)什么充分条件使 RAG 模型能够降低发电风险 ...
0 0 0 2024/04/26 arXiv:2402.03181v3 云汐瑶
随着大型预训练语言模型 (PLM) 的激增,微调所有模型参数变得越来越低效,特别是在处理需要大量训练和存储成本的大量下游任务时。已经提出了几种旨在实现参数高效微调(PEFT)的方法。其中,低秩适应(LoRA)作为一种原型方法脱颖而出,它将可训练的秩分解矩阵合并到每个目标模块中 ...
0 0 0 2024/04/26 arXiv:2401.11316v1 DoubleSails
角色动画旨在通过驱动信号从静止图像生成角色视频。目前,扩散模型因其强大的生成能力已成为视觉生成研究的主流。然而,图像到视频领域仍然存在挑战,特别是在角色动画中,暂时保持与角色详细信息的一致性仍然是一个艰巨的问题 ...
0 0 0 2024/04/26 arXiv:2311.17117v2 kingsley
我们引入了具有表示的 Hom 关联代数上的相对平均算子的概念。相对平均算子是关联代数上相对平均算子的扭曲概括。我们通过图和 Nijenhuis 算子给出了 Hom 关联代数的相对平均算子的两个特征 ...
0 0 0 2024/04/26 arXiv:2311.08407v1 2301183018

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)