声源定位(SSL)使用多通道音频数据确定声源的位置。它通常用于改善语音增强和分离。提取空间特征对于SSL至关重要,尤其是在具有挑战性的声学环境中 ...
事件参数提取(EAE)是从非结构化文本中提取结构化信息的关键,但是由于现实世界中的文档级别的EAE的复杂性,它仍然具有挑战性。我们提出了一种新颖的定义启发式驱动提示(DHP)方法,以增强文档级EAE中大语言模型(LLM)的性能。我们的方法集成了参数提取相关的定义和启发式规则,以指导提取过程,降低错误传播并提高任务准确性 ...
大型语言模型(LLM)正在发展为自主决策者,引起了人们对高风险风险的担忧,特别是在化学,生物学,放射学和核(CBRN)领域中。基于这样的见解,即这种风险可以源于代理商的有益,无害和诚实(HHH)目标之间的权衡,我们建立了一个新颖的三阶段评估框架,该框架经过精心构建,以有效地自然地暴露了这种风险。我们对12个高级LLM进行了14,400次代理模拟,并进行了广泛的实验和分析 ...
扩散模型的最新进展具有显着高级的文本到图像的生成,但是仅凭全球文本提示仍然不足以实现对图像中各个实体的细粒度控制。为了解决这一限制,我们提出了Eligen,这是实体级别受控图像生成的新型框架。首先,我们提出了区域关注,这是扩散 Transformer 的机制,不需要其他参数,无缝整合实体提示和任意形状的空间掩码 ...
我们将因果扩散作为扩散模型的自回旋(AR)对应物。这是一个下一步的预测框架,对离散和连续模式都很友好,并且与现有的下一步预测模型(如Llama和GPT)兼容。尽管最近的工作试图将扩散与AR模型相结合,但我们表明,将顺序分解引入扩散模型可以大大提高其性能,并在AR和扩散生成模式之间实现平稳的过渡 ...
多代理路径查找(MAPF)是物流和仓库管理的关键组成部分,它重点是在已知环境中为机器人团队计划无碰撞路径。最近的工作引入了一种新型的MAPF方法LNS2,该方法通过依靠快速但质量较低的优先规划(PP)算法来修复一组不可行的途径。同时,最近有一个基于多代理增强学习(MARL)的MAPF算法的推动,这些算法在此类PP算法上表现出改善的合作,尽管不可避免地保持较慢 ...
这篇评论探讨了常识性推理和意图检测的最新进展,这是自然语言理解的两个关键挑战。我们分析了来自ACL,EMNLP和Chi(2020-2025)的28篇论文,并通过方法和应用组织。在零局学习,文化适应,结构化评估和交互式环境中审查常识性推理 ...
大型语言模型(LLMS)在将有关关系数据库转换为SQL查询的自然语言问题方面表现出了令人印象深刻的能力。尽管最近有所改进,但小型LLM仍在努力处理涉及多个表和复杂SQL模式(ZSL学习(ZSL)设置的复杂SQL模式)的问题。受监督的微调(SFT)部分弥补了预验证的模型中的知识缺陷,但在处理涉及多跳上推理的查询时却差不多 ...