中国拼写校正(CSC)任务着重于检测和纠正句子中的拼写错误。当前的研究主要探讨了两种方法:传统的多模式预训练模型和大型语言模型(LLMS)。但是,LLMS在CSC中面临限制,尤其是过度校正,使其在此任务中均优美 ...
概率的逻辑规则学习在逻辑规则挖掘和知识图完成中表现出很大的实力。它学习逻辑规则,通过在知识图中的现有边缘进行推理来预测缺失边缘。但是,以前的努力在很大程度上仅限于建模类似链的喇叭子句,例如$ r_1(x,z)\ land r_2(z,y)\ rightarrow h(x,y)$ ...
在本文中,我们全面研究了现代大型语言模型(LLM)的潜在滥用,以产生可信的错误信息及其随后对信息密集型应用程序的影响,尤其是开放域问题答案(ODQA)系统。我们建立了一个威胁模型,并模拟潜在的滥用情景,无论是无意的还是故意的),以评估LLM可以在多大程度上用于产生错误信息。我们的研究表明,LLM可以充当有效的错误信息发生器,从而导致ODQA系统的性能显着降解 ...
视觉模型(VLM)在自然场景中具有先进的推理,但是它们在医学成像中的作用仍然没有被逐渐倍增。医学推理任务需要强大的图像分析和正式的答案,这是由于医疗图像的复杂性而提出的挑战。透明度和可信度对于临床采用和法规依从性至关重要 ...
大型语言模型(llm)可以捕获对现实世界任务有用的丰富概念表示。然而,llm擅长基于文本的推理,但健康应用程序要求模型以数字数据为基础(例如,数据)... ...
对表格数据中行的概率分布进行建模并生成逼真的合成数据是一项非平凡的任务。表格数据通常包含离散和连续列的混合物。连续列可能具有多种模式,而离散列有时会失衡,使建模变得困难 ...
机器生成的文本(MGT)检测对于调节和归因于在线文本至关重要。尽管现有的MGT检测器达到了强大的性能,但它们仍然容易受到简单的扰动和对抗性攻击的影响。为了制定针对恶意扰动的有效辩护,我们从威胁建模的角度查看了MGT检测,也就是说,从对手的角度分析模型的脆弱性并探索有效的缓解 ...
使用问答(QA)对来训练和评估大型语言模型(LLM)引起了相当大的关注。然而,很少有可用的 QA 数据集是基于科学文献中的知识。在这里,我们通过提出自动生成科学问题答案(SciQAG)来弥补这一差距,这是一个自动生成和评估来自已发表的科学文献的科学问答对的框架 ...