传统的对话状态跟踪(DST)问题旨在跟踪用户对话中的用户偏好和意图。尽管足以支持狭窄域应用程序的以任务为导向的对话系统,但大语模型的出现(LLM)的聊天系统已经在开放域中引入了许多现实世界中的复杂性。这些复杂性以上下文相互作用的复杂性增加的形式表现出来,扩展的对话会议包含各种主题,以及更频繁的上下文转移 ...
0 0 0 2025/09/12 arXiv:2309.08827v1 allez
我们提出图像界,一种学习跨六个不同方式的关节嵌入的方法 - 图像,文本,音频,深度,热和IMU数据。我们表明,配对数据的所有组合对于训练这种联合嵌入并不是必需的,并且只有图像对数据足以将模态绑定在一起。 ImageBind可以通过使用与图像的自然配对来利用最近的大型视觉语言模型,并将其零击功能扩展到新的模式 ...
0 0 0 2025/09/12 arXiv:2305.05665v2 chenlei
大型语言模型(LLM)需要高质量的指导数据才能有效对齐,尤其是在专家策划数据集生产昂贵的代码生成任务中。我们提出了遗传教学,这是一种可扩展的算法,用于使用进化原理综合大规模,高质量的编码指令。从一小部分种子说明开始,遗传学结构通过利用讲师-LLM的生成,代码合成的编码器-LLM以及自动质量评估的法官-LLM来产生多样化且具有挑战性的指示代码对 ...
0 0 0 2025/09/12 arXiv:2407.21077v3 lianzhepku
如今,强大的大型语言模型(LLM)(例如Chatgpt)已经在各种任务中展示了革命性的力量。因此,随着LLMS变得更加先进和普遍,机器生成的文本(MGT)的检测变得越来越重要。这些模型具有生成类似人类的语言的能力,使识别文本是由人类还是机器撰写的具有挑战性 ...
0 0 0 2025/09/12 arXiv:2303.14822v3 15966829631
在临床实践中,医学图像分析通常需要对资源约束的移动设备有效执行。但是,由于天然和医疗领域之间的显着信息密度差距,现有用于自然图像的移动模型在医疗任务上进行了优化。在开发轻巧,通用和高性能网络时,将计算效率与特定于医学成像的体系结构优势相结合仍然是一个挑战 ...
0 0 0 2025/09/12 arXiv:2508.01064v1 mixiu
这项工作涉及推荐系统中的基本障碍:无法跨域中概括而无需进行广泛的再培训。传统的基于ID的方法完全在寒冷和跨域场景中失败,新用户或项目缺乏足够的交互历史。受基础模型的跨域成功的启发,我们开发了一个基础模型,用于实现真正的零击功能的顺序建议 ...
0 0 0 2025/09/12 arXiv:2506.06270v2 Zophe
医疗图像分割,特别是在多域情景中,需要精确保存各种表示形式的解剖结构。尽管深度学习已经提高了这一领域,但现有模型通常会在准确的边界表示,器官形态的变异性以及在下采样过程中的信息丢失,从而限制其准确性和鲁棒性。为了应对这些挑战,我们提出了上下文增强网络(CENET),这是一个具有两个关键创新的新颖分割框架 ...
0 0 0 2025/09/12 arXiv:2505.18423v1 mixiu
现代搜索系统在促进信息获取方面起着至关重要的作用。传统的搜索引擎通常依靠级联的体系结构,在该体系结构中,通过召回,预先排名和排名阶段检索结果。设计和维护多个模块的复杂性使得难以实现整体性能提高 ...
0 0 0 2025/09/12 arXiv:2509.06887v2 Zophe

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)