Remixa的文档

Remixa

个性签名 ...

A Survey of Multimodal Large Language Model from A Data-centric Perspective

人类通过视觉、嗅觉、听觉、触觉等多种感官来感知世界。同样，多模态大语言模型 (MLLM) 通过集成和处理来自文本、视觉、音频、视频和 3D 环境等多种模态的数据，增强了传统大语言模型的功能。数据在这些模型的开发和完善中发挥着关键作用 ...

0 0 0 0 2024/06/03 arXiv:2405.16640v1 Remixa

DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining

（lm）（lm）的性能... ...

0 1 0 0 2025/03/01 arXiv:2305.10429v4 Remixa

Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive

直接偏好优化 (DPO) 可以有效显着提高大型语言模型 (LLM) 在推理、摘要和对齐等下游任务上的性能。使用成对的首选和不首选数据，DPO 对选择一个响应而不是另一个响应的相对概率进行建模。在这项工作中，我们首先从理论上证明，只要首选类别和不首选类别之间的相对概率增加，标准 DPO 损失就可以导致模型的首选示例可能性减少 ...

0 2 1 6 2024/02/26 arXiv:2402.13228v1 Remixa

A Survey of Multimodal Large Language Model from A Data-centric Perspective

DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining

Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）