跨模态融合来自不同模态的互补信息有效地提高了目标检测性能,使其对于更广泛的应用更加有用和强大。现有的融合策略通过精心设计的神经网络模块组合不同类型的图像或合并不同的主干特征。然而,这些方法忽略了模态差异影响跨模态融合性能,因为具有不同相机焦距、位置和角度的不同模态很难融合 ... ...
现有的半监督医学分割共同学习框架已经意识到,模型性能可以通过低质量伪标签引起的模型识别中的偏差来降低。由于其伪标签集成策略的平均性质,他们无法探索来自不同来源的伪标签的可靠性。在本文中,我们提出了一个相互的证据深度学习(MEDL)框架,该框架从两个角度的半监督学习中为伪标记生成提供了潜在可行的解决方案 ...
对象计数已从特定于类的模型(仅计数已知类别)发展为概括为看不见类别的类别模型。下一个挑战是转介表达计数(REC),其中的目标是基于细粒属性和上下文差异对象进行计数。现有方法与区分属于同一类别但对应于不同的参考表达式相对应的视觉上相似对象而努力 ...
我们提出桥梁,这是一种强大的顺序体系结构,用于在跨DB语义解析中自然语言问题与关系数据库之间建模依赖性。桥梁表示标记的序列中的问题和DB架构,其中一个字段的子集被问题中提到的单元格值增强。杂种序列由BERT用最小的后续层编码,文本DB上下文化是通过BERT中的微调深度注意来实现的 ...
这项研究调查了时间序列分类模型对对抗性攻击的脆弱性,重点是这些模型如何处理在这种情况下本地信息与全球信息。通过利用归一化自动相关函数(NACF),进行了对神经网络倾向的探索。证明正则化技术,尤其是那些采用快速傅立叶变换(FFT)方法和靶向扰动频率成分的技术显着提高了攻击的有效性 ...
最近文本到sql的最佳尝试之一是预训练语言模型。由于sql查询的结构属性,seq2seq 模型负责解析两个模式项(即 ... ...
检索增强的生成系统依赖于有效的文档检索功能。根据设计,在多跳检索方案中,传统的稀疏或密集的检索员面临挑战。在本文中,我们提出了齿轮,该齿轮通过两个关键的创新来提高抹布性能:(i)图形扩展,它增强了任何常规的基本猎犬,例如BM25,以及(ii)结合图形扩展的代理框架 ...
近年来,大型语言模型(LLMS)面临着越来越多的需求,以选择性地删除敏感信息,保护隐私并遵守通过未学习,通过机器学习来遵守版权法规。虽然评估学习效率至关重要,但现有基准的规模和全面性有限,通常仅包含几百个测试案例。我们确定了生成整体审核数据集的两个关键挑战:确保审核充足性并处理忘记和保留数据集之间的知识冗余 ...