xx的文档

xx 南京

生命的统一性和多样性

STAR: A Schema-Guided Dialog Dataset for Transfer Learning

我们提出了 STAR，一个模式引导的面向任务的对话数据集，由 13 个领域的 5,820 个面向任务的对话的 127,833 个话语和知识库查询组成，专门用于促进面向任务的对话中的任务和域迁移学习。此外，我们提出了一种可扩展的众包范例来收集与 STAR 质量相同的任意大数据集。此外，我们引入了新颖的模式引导对话模型，该模型使用任务的显式描述来从已知任务概括为未知任务 ...

0 0 0 0 2024/05/20 arXiv:2010.11853v1 xx

MultiWOZ 2.2 : A Dialogue Dataset with Additional Annotation Corrections and State Tracking Baselines

MultiWOZ 是一个著名的面向任务的对话数据集，包含跨越 8 个领域的 10,000 多个带注释的对话。它被广泛用作对话状态跟踪的基准。然而，最近的工作报告了对话状态注释中存在大量噪音 ...

0 0 0 0 2024/05/19 arXiv:2007.12720v1 xx

SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented Dialogue Agents

近年来，面向任务的对话（TOD）模型取得了重大进展。然而，之前的研究主要集中在注释者编写的数据集上，这导致了学术研究与现实世界口语对话场景之间的差距。虽然提出了几个小规模口语 TOD 数据集来解决 ASR 错误等鲁棒性问题，但它们忽略了口语对话中的独特挑战 ...

0 0 1 13 2024/05/14 arXiv:2305.13040v5 xx

Speech-based Slot Filling using Large Language Models

最近，大型语言模型（LLM）的进步在各种语言任务中表现出了前所未有的能力。本文通过上下文学习和特定于任务的微调，研究了 LLM 在带有噪声 ASR 转录的槽位填充中的潜在应用。提出了专用的提示设计和微调方法，以提高 LLM 在用嘈杂的 ASR 转录进行槽填充时的鲁棒性 ...

0 0 1 27 2024/05/09 arXiv:2311.07418v1 xx

Revisit Input Perturbation Problems for LLMs: A Unified Robustness Evaluation Framework for Noisy Slot Filling Task

随着大型语言模型（LLM）能力的不断增强，这些高性能模型在广泛的自然语言处理（NLP）任务上取得了最先进的结果。然而，当应用于现实世界的噪声数据时，模型在常用基准数据集上的性能通常无法准确反映其可靠性和鲁棒性。为了应对这些挑战，我们提出了一个基于槽填充任务的统一鲁棒性评估框架，以系统地评估 LLM 在不同输入扰动场景下的对话理解能力 ...

0 1 1 5 2024/05/08 arXiv:2310.06504v1 xx

Generative Active Learning for the Search of Small-molecule Protein Binders

尽管近年来机器学习在科学发现方面取得了重大进展，但真正从头设计具有感兴趣特性的小分子仍然是一个重大挑战。我们介绍 LambdaZero，一种用于搜索可合成分子的生成主动学习方法。在深度强化学习的支持下，LambdaZero 学会搜索广阔的分子空间，以发现具有所需特性的候选分子 ...

0 0 0 0 2024/05/07 arXiv:2405.01616v1 xx

Dialog-to-Actions: Building Task-Oriented Dialogue System via Action-Level Generation

基于端到端生成的方法已被研究并应用于面向任务的对话系统。然而，在工业场景中，现有方法面临可控性瓶颈（例如 ...

0 0 1 10 2024/04/25 arXiv:2304.00884v1 xx

Learn Your Reference Model for Real Good Alignment

对齐问题的复杂性源于现有方法不稳定。研究人员不断发明各种技巧来解决这个缺点。例如，在语言模型对齐的基本人类反馈强化学习 (RLHF) 技术中，除了奖励最大化之外，可训练策略和 SFT 策略之间的 Kullback-Leibler 差异也被最小化 ...

0 0 0 0 2024/04/17 arXiv:2404.09656v1 xx

Wu's Method can Boost Symbolic AI to Rival Silver Medalists and AlphaGeometry to Outperform Gold Medalists at IMO Geometry

证明几何定理是结合直觉和逻辑技能的视觉推理的标志。因此，奥林匹克级别几何问题的自动定理证明被认为是人类级别自动推理的一个重要里程碑。 AlphaGeometry 的推出标志着一项重大突破，这是一种用 1 亿个合成样本训练的神经符号模型 ...

0 0 0 0 2024/04/11 arXiv:2404.06405v1 xx

When Does Label Smoothing Help?

通过使用软目标（硬目标的加权指令和标签上的分配），通常可以显着提高多类神经网络的泛化和学习速度。以这种方式平滑标签可以防止网络过度自信，并且标签平滑已被用于许多最先进的模型中，包括图像分类、语言翻译和语音识别。尽管标签平滑被广泛使用，但人们对此仍然知之甚少... ...

0 0 0 0 2024/12/15 arXiv:1906.02629v3 xx