近年来,人们对将C代码转换为生锈,从而受益于生锈的记忆和线程安全保证。 C2RUST是一个基于规则的系统,可以自动将C代码转换为功能相同的RUST,但是它产生的锈蚀代码是非异常的,即 ...

0 0 0 0 2025/04/16 arXiv:2501.14257v1 15966829631

维护和扩展软件系统在很大程度上取决于有效的代码重构,但是此过程仍然是劳动密集型的,要求开发人员仔细分析现有代码库并防止引入新的缺陷。尽管最近的进步利用了大型语言模型(LLMS)来自动化重构任务,但当前解决方案在范围和缺乏机制方面受到限制,无法保证代码汇编和成功的测试执行。在这项工作中,我们介绍了Mantra,这是一个基于LLM代理的综合框架,可自动化方法级重构 ...

0 0 0 0 2025/04/16 arXiv:2503.14340v2 15966829631

确保大语模型(LLM)生成的代码的鲁棒性对于现实世界的可靠性至关重要。但是,现有评估主要集中在正确性上,通常会忽略关键的鲁棒性问题,例如丢失输入验证和错误处理不足。在本文中,我们介绍了有关LLM生成代码鲁棒性的首次实证研究 ...

0 0 0 0 2025/04/16 arXiv:2503.20197v2 15966829631

广泛应用的大语言模型(LLM)可以产生类似人类的内容,从而引起人们对LLM滥用的担忧。因此,重要的是要构建强大的AI生成的文本(AIGT)检测器。当前工作仅考虑文档级AIGT检测,因此,在本文中,我们首先通过合成包含使用LLMS抛光的文档的数据集来引入句子级检测挑战,也就是说,文档包含人类编写的句子和LLMS修改的句子 ...

0 0 0 0 2025/04/16 arXiv:2310.08903v2 15966829631

语言建模的最新进展显着改善了深神经模型的生成能力:2019年OpenAI释放了GPT-2,这是一种预先训练的语言模型,可以自主生成连贯的,非平底和类似人类的文本样本。从那时起,已经开发了更强大的文本生成模型。对手可以利用这些巨大的生成能力来增强社交机器人,这些社交机器人将有能力写出合理的深击信息,希望污染公众的辩论 ...

0 0 0 0 2025/04/16 arXiv:2008.00036v2 15966829631

最近的问题生成显示了将问题答案(QA)系统定制到新领域的令人印象深刻的结果。这些方法规定了从新领域手动注释的培训数据的需求,而是生成用于培训的综合问题 - 答案对。但是,现有的问题生成方法依赖于大量合成生成的数据集和昂贵的计算资源,当文本语料库的大小有限时,这些技术使这些技术广泛无法访问 ...

0 0 0 0 2025/04/15 arXiv:2108.13854v1 15966829631

尽管已证明检索功能增强的生成(RAG)可以增强大语言模型(LLM)输出的事实,但LLMS仍然患有幻觉,产生不正确或无关紧要的信息。一种常见的检测策略涉及促使LLM再次评估其反应是否基于检索的证据,但这种方法是昂贵的。另外,可以在推理时间使用轻巧的自然推理(NLI)模型以进行有效接地验证 ...

0 0 0 0 2025/04/15 arXiv:2410.03461v2 15966829631

常规的无监督域适应性(UDA)假定训练数据是从单个域中采样的。这忽略了从多个来源收集培训数据的更实际的方案,需要多源域的适应性。我们为解决这个问题做出了三个主要贡献 ...

0 0 0 0 2025/04/14 arXiv:1812.01754v4 15966829631

代码的等效表示(ers)是文本表示,可以保留与代码本身相同的语义,例如自然语言注释和伪代码 ...

0 0 0 0 2025/04/14 arXiv:2410.03351v1 15966829631

最近,已经提出了基于深度学习的测试案例生成方法来自动化单位测试用例的生成。在这项研究中,我们利用基于 Transformer 的代码模型在项目级别的域适应(DA)的帮助下生成单元测试。具体来说,我们使用Codet5,这是一种在源代码数据上训练的相对较小的语言模型,并将其在测试生成任务上进行微调 ...

0 0 0 0 2025/04/14 arXiv:2308.08033v3 15966829631

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)