15966829631的文档

LoRA-Based Continual Learning with Constraints on Critical Parameter Changes

基于洛拉的持续学习代表了在下游持续学习任务中利用预训练的模型的有希望的途径。最近的研究表明，正交的洛拉调整有效地减轻了遗忘。但是，这项工作揭示了在正交Lora调整下的工作，在学习后任务后，任务的关键参数仍会显着变化 ...

0 0 0 0 2025/07/30 arXiv:2504.13407v1 15966829631

PeriodicLoRA: Breaking the Low-Rank Bottleneck in LoRA Optimization

监督微调是将大型语言模型（LLMS）调整到下游任务的最常见方法，但是完整的微调LLMS需要大量的计算资源。最近，由于其成本效益，已广泛研究了参数有效的微调（PEFT）方法。洛拉（Lora）是使用最广泛的方法之一，假设优化过程本质上是低维的 ...

0 0 0 0 2025/07/29 arXiv:2402.16141v1 15966829631

AutoRank: MCDA Based Rank Personalization for LoRA-Enabled Distributed Learning

随着数据量的迅速扩展，分布式机器学习对于解决现代AI系统不断增长的计算需求至关重要。但是，分布式环境中的培训模型在参与者持有偏斜的，非独立的分布（非IID）数据方面具有挑战性。低级适应（LORA）通过个性化低级更新，而不是优化整个模型，启用LORA的分布式学习最大程度地减少了计算和最大化个性化的个性化，从而为该问题提供了有希望的解决方案 ...

0 0 0 0 2025/07/29 arXiv:2412.15553v1 15966829631

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

低秩适应，也称为 LoRA，通过将原始矩阵重新参数化为两个低秩矩阵的乘积，已成为参数高效微调基础模型的重要方法。尽管效率很高，但与完全微调相比，LoRA 的性能通常较差。在本文中，我们提出 LoRA-Pro 来弥补这一性能差距 ...

0 0 0 0 2025/07/29 arXiv:2407.18242v3 15966829631

Modification and Generated-Text Detection: Achieving Dual Detection Capabilities for the Outputs of LLM by Watermark

大型语言模型（LLM）的发展引起了人们对潜在滥用的关注。一种实用的解决方案是在文本中嵌入水印，从而通过水印提取允许所有权验证。现有方法主要集中于防御修改攻击，通常忽略其他欺骗攻击 ...

0 0 0 0 2025/07/28 arXiv:2502.08332v2 15966829631

Multi-LoRA Composition for Image Generation

低秩适应 (LoRA) 广泛应用于文本到图像模型，用于准确再现特定元素，例如生成图像中的不同字符或独特样式。尽管如此，现有方法在有效组合多个 LoRA 方面面临着挑战，特别是随着要集成的 LoRA 数量的增长，从而阻碍了复杂图像的创建。在本文中，我们从以解码为中心的角度研究多 LoRA 组合 ...

0 0 0 0 2025/07/25 arXiv:2402.16843v2 15966829631

A Survey on Patent Analysis: From NLP to Multimodal AI

验证的语言模型（PLM）和大型语言模型（LLM）的最新进展证明了各种领域的变革能力。专利分析和创新领域不是一个例外，在该领域中，自然语言处理（NLP）技术在专利周期中提供了简化和增强重要任务的机会，例如专利分类和专利检索。这不仅加快了专利研究人员和申请人的效率，而且为技术创新和发现开辟了新的途径 ...

0 0 0 0 2025/07/24 arXiv:2404.08668v3 15966829631

CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning

程序合成或代码生成旨在生成满足问题规范的程序。使用大规模预处理的语言模型（LMS）的最新方法显示出令人鼓舞的结果，但它们有一些关键局限性。特别是，他们经常遵循标准监督的微调程序，仅从对自然语言问题描述和基础真相计划对培训代码生成模型 ...

0 0 0 0 2025/07/23 arXiv:2207.01780v3 15966829631

Agent Laboratory: Using LLM Agents as Research Assistants

从历史上看，科学发现一直是一个漫长而昂贵的过程，从最初的概念到最终结果需要大量时间和资源。为了加速科学发现，降低研究成本并提高研究质量，我们介绍了代理实验室，这是一个能够完成整个研究过程的基于自主LLM的框架。该框架接受了人类提供的研究思想，并通过三个阶段进行了进展 - 验证，实验和报告写作，以产生全面的研究成果，包括代码存储库和研究报告，同时使用户能够在每个阶段提供反馈和指导 ...

0 0 0 0 2025/07/22 arXiv:2501.04227v2 15966829631

Adapting While Learning: Grounding LLMs for Scientific Problems with Intelligent Tool Usage Adaptation

大型语言模型（LLMS）表现出在解决科学问题方面有希望的能力，但经常遭受幻觉问题。在将LLM与工具集成可以减轻此问题的同时，对工具使用情况进行微调的模型对它们过高，并产生不必要的成本。在选择解决方案之前人类专家如何评估问题复杂性的启发下，我们提出了一种新颖的两部分微调方法，在学习时适应（AWL） ...

0 0 0 0 2025/07/22 arXiv:2411.00412v4 15966829631