虽然大型语言模型 (LLM) 已表现出卓越的多任务处理能力,但通常需要在下游、特定领域的数据集上对这些模型进行微调,以便与未经微调的模型相比,在测试集上产生卓越的性能。然而,微调对 LLM 泛化能力的综合影响尚不完全清楚。本文深入探讨了原始的、未经修改的 LLM 及其微调变体之间的差异 ...
0 0 0 2024/05/16 arXiv:2403.09162v1 Datow
本文档指定了自动证书管理环境 (ACME) 协议的新挑战,该协议允许使用 TLS 进行域控制验证 ...
0 0 0 2024/05/16 rfc:8737 rfc
无监督跨域图像检索(UCIR)旨在检索跨不同域共享同一类别的图像,而不依赖于标记数据。先前的方法通常将 UCIR 问题分解为两个不同的任务:域内表示学习和跨域特征对齐。然而,这些分离的策略忽视了这些任务之间的潜在协同作用 ...
0 0 0 2024/05/16 arXiv:2402.18411v2 yonghengzhijian
盲脸恢复通常依赖于面部先验,例如面部几何先验或参考先验,来恢复真实且忠实的细节。然而,质量非常低的输入无法提供准确的几何先验,而高质量的参考也无法访问,从而限制了其在现实场景中的适用性。在这项工作中,我们提出了 GFP-GAN,它利用封装在预训练人脸 GAN 中的丰富多样的先验来进行盲脸恢复 ...
0 0 0 2024/05/16 arXiv:2101.04061v2 SOOKIE
PIM 版本 2 消息共享通用的消息标头格式。公共标头定义包含八个保留位。本文档指定了各个消息类型如何使用这些位,并创建一个包含每个消息类型用法的注册表。本文档还通过定义三种新的消息类型来扩展 PIM 类型空间。对于每种新类型,使用先前保留的四个位来形成扩展类型范围 ...
0 0 0 2024/05/16 rfc:8736 rfc
为了设计快速神经网络,许多工作一直致力于减少浮点运算(FLOP)的数量。然而,我们观察到,FLOP 的减少并不一定会导致延迟的类似程度的减少。这主要源于每秒浮点运算 (FLOPS) 效率低下 ...
0 0 0 2024/05/16 arXiv:2303.03667v3 gakki
最近大型模型的突破凸显了数据规模、标签和模式的关键意义。在本文中,我们介绍了 MS MARCO Web 搜索,这是第一个大规模信息丰富的 Web 数据集,具有数百万个真实点击的查询文档标签。该数据集密切模仿现实世界的网络文档和查询分布,为各种下游任务提供丰富的信息,并鼓励各个领域的研究,例如通用端到端神经索引器模型、通用嵌入模型和下一代信息访问具有大型语言模型的系统 ...
0 0 0 2024/05/16 arXiv:2405.07526v1 oscarhscc
服务提供商网络中不断出现提供端到端 (E2E) 性能保证的要求。尽管有多种技术解决方案,但没有一种解决方案可以满足本地 IP 网络的这些要求。尤其需要一种能够覆盖域内和域间场景的通用端到端解决方案 ...
0 0 0 2024/05/16 rfc:8735 rfc

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)