在医疗保健和金融等高风险领域中,有效的决策不仅需要准确的结果,而且需要透明且可解释的推理。但是,当前的语言模型通常缺乏此类任务所需的结构化审议,而是以断开的事后方式产生决策和理由。为了解决这个问题,我们提出了决策流,这是一个新颖的决策建模框架,它指导模型来推理动作,属性和约束的结构化表示 ...
最近,随着越来越多的人对其心理健康表示关注,对心理咨询的需求已大大增加。这次激增加快了通过使用大型语言模型(LLM)作为辅导员来提高咨询的可及性的努力。为了确保客户隐私,培训开源LLM面临着一个关键挑战:缺乏现实的咨询数据集 ...
自主代理在自动化复杂的多步骤决策任务方面表现出了巨大的潜力。然而,即使是最先进的视觉语言模型(VLM),例如 GPT-4o,仍然达不到人类水平的性能,特别是在复杂的网络环境和长期规划任务中。为了解决这些限制,我们提出了反射蒙特卡罗树搜索 (R-MCTS) 和探索性学习,为代理应用程序构建类似 o1 的模型 ...
我们介绍 W.A.L. ...
但是,生成大语言模型(LLM)的最新进展非常出色,但是,这些模型产生的文本质量通常揭示出持续的问题。评估这些模型产生的文本质量,尤其是在开放式文本中,一直持续提出重大挑战。在解决这一问题时,最近的工作探索了使用LLM作为评估者的可能性 ...
使用大型语言模型(LLMS)提供动力的代理商的社会,在解决问题的自动化问题中取得了重大进展。在金融中,努力主要集中在单独的系统上处理特定任务或独立收集数据的多代理框架。但是,多代理系统复制现实世界贸易公司的协作动态的潜力仍然没有得到充实 ...
通过可区分的搜索索引普及,生成检索的新兴范式将经典信息检索问题重新汇总为序列到序列建模任务,放弃外部索引并在单个 Transformer 中编码整个文档语料库。尽管已经提出了许多不同的方法来提高生成检索的有效性,但仅根据规模为100K的文档语料库进行了评估。我们对各种语料库量表的生成检索技术进行了首次实证研究,最终以8个语料库的形式扩展到整个MS MARCO通道排名任务 ...
修改音频信号的音高和时间是基本音频编辑操作,并在语音操纵,视听同步以及唱歌语音编辑和综合中进行了应用。到目前为止,使用数字信号处理(DSP)的俯仰转换和时间拉伸方法因其速度和相对较高的质量而受到深度学习方法的青睐。但是,即使是基于DSP的现有方法,用于俯仰转换和时间拉伸的方法会引起降低音频质量的人工制品 ...