最近,围绕少样本命名实体识别 (NER) 主题涌现了大量文献,但很少公开专门关注实际且具有挑战性的任务的基准数据。当前的方法收集现有的监督 NER 数据集,并将它们重新组织到少样本设置以进行实证研究。这些策略通常旨在通过很少的示例来识别粗粒度的实体类型,而在实践中,大多数看不见的实体类型都是细粒度的 ...
0 0 0 2024/04/26 arXiv:2105.07464v6 leizhengtao520
知识图谱 (KG) 在推进各种人工智能应用方面发挥着关键作用,语义网络社区对多模态维度的探索开启了新的创新途径。在本次调查中,我们仔细回顾了 300 多篇文章,重点关注两个主要方面的知识图谱感知研究:知识图谱驱动的多模态(KG4MM)学习,其中知识图谱支持多模态任务,以及多模态知识图谱(MM4KG) ,它将 KG 研究扩展到 MMKG 领域。我们首先定义 KG 和 MMKG,然后探讨它们的构建进度 ...
0 0 0 2024/04/26 arXiv:2402.05391v4 xodara
尽管神经网络作为预测模型在各个领域取得了巨大成功,但它们对分布外 (OOD) 数据的预测可能过于自信。为了适用于自动驾驶汽车等安全关键型应用,神经网络必须准确估计其认知或模型不确定性,从而实现一定程度的系统自我意识。认知不确定性量化技术通常需要训练期间的 OOD 数据或推理期间的多个神经网络前向传递 ...
0 0 0 2024/04/26 arXiv:2211.08701v1 布朗瓶
虽然在开发轨迹预测方法方面已经进行了大量的工作,并且已经提出了各种数据集来对这项任务进行基准测试,但迄今为止,对于这些方法在数据集上的通用性和可转移性的研究还很少。在本文中,我们观察了两种最新最先进的轨迹预测方法在四个不同数据集(Argoverse、NuScenes、Interaction、Shifts)中的性能。通过这种分析,可以深入了解最新轨迹预测模型的通用性,并分析哪个数据集更能代表真实驾驶 ...
0 0 0 2024/04/26 arXiv:2205.07310v2 布朗瓶
尽管时间变量很重要,但它在 NLP 和语言模型文献中基本上被忽视了。在本文中,我们提出了 TimeLM,这是一组专门研究历时 Twitter 数据的语言模型。我们表明,持续学习策略有助于增强基于 Twitter 的语言模型处理未来和未分发推文的能力,同时使其与标准化和更单一的基准相比具有竞争力 ...
0 0 0 2024/04/26 arXiv:2202.03829v2 deralnhund
两个有界线性算子 $A$ 和 $B$ 相对于范数 $\|\cdot\|$ 平行,如果 $\|A+\mu B\| = \|A\| + \|B\|$ 对于一些标量 $\mu$ 和 $|\mu| = 1 美元。获得双射线性映射的表征,将并行有界线性算子发送到相对于 Ky-Fan $k$-范数的并行有界线性算子 ...
0 0 0 2024/04/26 arXiv:2309.14357v1 still52
由于这些视觉数据中存在大量的局部冗余和复杂的全局依赖性,从图像和视频中学习判别性表示是一项具有挑战性的任务。卷积神经网络(CNN)和视觉变换器(ViT)是过去几年的两个主要框架。尽管 CNN 可以通过小邻域内的卷积有效地减少局部冗余,但有限的感受野使其难以捕获全局依赖性 ...
0 0 0 2024/04/26 arXiv:2201.09450v3 taotao1993
本文档描述了使用 Lucene Java 框架的 BM25 和 BM25F 实现。这两种模型都因其性能在 TREC 中脱颖而出,并被认为是 IR 社区中最先进的模型。 BM25 适用于“ad-hoc”检索,即不包含字段的文档,而 BM25F 适用于有结构的文档 ...
0 0 0 2024/04/26 arXiv:0911.5046v2 _xxt_

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)