检索增强的一代(RAG)越来越多地显示了其在扩展大型语言模型(LLMS')能力之外的力量之外的力量。现有作品表明,破布可以帮助完成软件开发任务,例如代码生成,代码更新和测试生成。然而,使用抹布将LLM适应快速发展或较少常见的API库的有效性仍然未知 ...

0 0 0 0 2025/03/31 arXiv:2503.15231v1 15966829631

人工智能 (AI) 在医疗保健领域,特别是在疾病诊断和治疗计划方面,展现了巨大的潜力。医学大视觉语言模型 (Med-LVLM) 的最新进展为交互式诊断工具开辟了新的可能性。然而,这些模型经常遭受事实幻觉,这可能导致错误的诊断 ...

0 0 0 0 2025/03/31 arXiv:2410.13085v2 15966829631

在大型语言模型(LLMS)的一代中,检索型生成一代(RAG)的出现缓解了过时和幻觉的问题,但它仍然揭示了许多局限性。当通用LLM充当抹布发电机时,它通常会遭受响应信息不足,响应鲁棒性和引文质量的影响。过去的方法可以解决这些限制,要么通过合并除了产生响应之外的其他步骤,要么通过监督的微调(SFT)优化发电机,但仍无法完全与破布需求保持一致 ...

0 1 0 0 2025/03/31 arXiv:2412.14510v1 15966829631

人工智能(AI)技术,尤其是大型语言模型(LLMS),已经开始在研究人员和软件开发人员生成源代码中广受欢迎。但是,LLM已被证明可以生成具有质量问题的代码,还产生了版权/许可侵权。因此,检测人类还是AI是否撰写的源代码是必要的 ...

0 0 0 0 2025/03/31 arXiv:2411.04299v1 15966829631

大型语言模型(LLM)表现出非常熟练的生成代码。但是,滥用LLM生成的(合成)代码在教育和工业环境中引起了人们的关注,强调了对合成代码探测器的迫切需求。由于编程语言的独特语法结构以及存在许多“低渗透性” Token ,现有的检测合成内容的方法主要是为一般文本而设计的,并与代码斗争 ...

0 0 0 0 2025/03/31 arXiv:2405.16133v3 15966829631

在本文中,我们提出了\ textbf {unicode},这是一种多模式大语言模型(MLLMS)领域内的一种新方法,该方法学习了一个统一的代码簿,以有效地将视觉,文本和潜在类型的信号添加。这项创新解决了现有MLLM中的一个关键限制:它们对仅文本代码簿的依赖,这限制了MLLM在多模式上下文中生成图像和文本的能力。为此,我们提出了一种语言驱动的迭代训练范式,再加上一个中文预训练的任务,我们称其为``图像减压'',使我们的模型能够解释压缩的视觉数据并产生高质量的HTTP URL URL URL URL URL URL URL统一的代码书,以扩展视觉指导性的指导性指导性调谐到非上线性的任务 ...

0 0 0 0 2025/03/28 arXiv:2403.09072v1 15966829631

保护文本和代码等文本的知识产权(IP)越来越重要,尤其是随着复杂的攻击的可能性,例如通过大语言模型(LLM)释义,甚至是在受版权保护的文本上对LLM的未经授权培训以侵犯此类IP。但是,现有的文本水印方法在此类攻击方面不够强大,也不适用于数百万用户进行实际实施。在本文中,我们提出了瀑布,这是第一个适用于多种文本类型的可靠和可扩展文本标记的无训练框架(e ...

0 0 0 0 2025/03/28 arXiv:2407.04411v2 15966829631

源代码的预训练的生成语言模型(例如PLBART,CODET5,SPT-CODE)在过去几年中对多个任务(包括代码生成和翻译)产生了强大的结果 ...

0 0 0 0 2025/03/28 arXiv:2206.07585v2 15966829631

源代码作者归因是在软件取证,错误修复和软件质量分析等应用程序中经常遇到的重要问题。最近的研究表明,当前的源代码作者归因方法可以通过利用对抗性示例和编码样式操纵的攻击者损害。这要求解决代码作者归因问题的强大解决方案 ...

0 0 0 0 2025/03/28 arXiv:2202.06043v1 15966829631

开源社区的扩展和大型语言模型的兴起引起了人们对源代码分布的道德和安全问题,例如对版权法规的不当行为,无适当许可的发行或出于恶意目的滥用代码。因此,跟踪源代码的所有权很重要,其中水印是一项主要技术。但是,源代码水印与自然语言截然不同,需要更严格,更复杂的规则,以确保可读性以及源代码的功能 ...

0 0 0 0 2025/03/28 arXiv:2309.00860v2 15966829631

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)