语言模型后训练用于改进行为并解锁各种最新语言模型的新技能,但应用这些技术的开放方法落后于专有技术。底层训练数据和训练后的配方既是难题中最重要的部分,也是透明度最低的部分。为了弥补这一差距,我们推出了 TÜLU 3,这是一系列完全开放的、最先进的训练后模型及其数据、代码和训练方法,可作为现代训练后技术的综合指南 ...
0 0 0 2025/03/10 arXiv:2411.15124v4 lalaxiao
大型语言模型(LLM)已在各种任务中证明了能力。但是,许多LLM在高资源和低资源语言之间表现出很大的性能差异。为了缓解这一挑战,我们提出了一种开源的多语言LLM Fuxitranyu,旨在满足研究社区的需求,以实现平衡且高性能的多语言能力 ...
0 0 0 2025/03/10 arXiv:2408.06273v3 revive
人工神经网络在解决特定刚性任务的分类问题方面蓬勃发展,通过从不同的训练阶段通过广义学习行为获取知识。由此产生的网络类似于知识的静态实体,并努力扩展这些知识而不针对原始任务导致灾难性遗忘。持续的学习将这种范式转移到可以在不同任务上不断积累知识的网络,而无需从头开始重新训练 ...
0 0 0 2025/03/10 arXiv:1909.08383v3 Serendipity
大型语言模型 (LLM) 的采样输出质量可能表现出相当大的变化。从采样集中重新排序并选择最佳生成是获得生成质量大幅提升的一种流行方法。在本文中,我们提出了一种对 LLM 世代重新排名的新方法 ...
0 0 0 2025/03/10 arXiv:2307.06857v3 来自古代的熊
阻塞性睡眠呼吸暂停综合征(OSA)是最常见的与睡眠有关的呼吸障碍。这是由于睡眠期间的上呼吸道阻力增加引起的,这决定了气流部分或完全中断的发作。 OSA的检测和治疗在中风患者中尤为重要,因为严重的OSA的存在与较高的死亡率,神经功能障碍较差,康复后的功能效果较差以及不受控制的高血压可能性更高 ...
0 0 0 2025/03/10 arXiv:2302.05179v1 cr9294
大型语言模型(llm)作为解决自然语言(nl)相关任务的少样本推理器变得越来越有吸引力。然而,llm的输入,llm是否真正理解这些数据的全面研究... ...
0 0 0 2025/03/10 arXiv:2305.13062v5 云汐瑶
在面对新数据时,人工代理人递增其能力的能力是人工智能的一个开放挑战。在这种情况下,面临的主要挑战是灾难性遗忘,即 ...
0 0 0 2025/03/10 arXiv:2011.01844v4 Serendipity
大型视觉模型(LVLM)容易受到对象幻觉的影响,在这个问题中,其生成的文本包含不存在的对象,从而极大地限制了它们的可靠性和实用性。当前的方法通常依赖于模型的 Token 可能性或其他内部信息,在其他数据集上调整指令或合并复杂的外部工具。我们首先对句子级LVLM幻觉进行经验分析,发现与图像的剪辑相似性是与 Token 可能性相比的更强,更强大的幻觉指标 ...
0 0 0 2025/03/10 arXiv:2402.15300v2 Rainbow

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)