在临床实践中,医学图像分析通常需要对资源约束的移动设备有效执行。但是,由于天然和医疗领域之间的显着信息密度差距,现有用于自然图像的移动模型在医疗任务上进行了优化。在开发轻巧,通用和高性能网络时,将计算效率与特定于医学成像的体系结构优势相结合仍然是一个挑战 ...
0 0 0 2025/09/12 arXiv:2508.01064v1 mixiu
这项工作涉及推荐系统中的基本障碍:无法跨域中概括而无需进行广泛的再培训。传统的基于ID的方法完全在寒冷和跨域场景中失败,新用户或项目缺乏足够的交互历史。受基础模型的跨域成功的启发,我们开发了一个基础模型,用于实现真正的零击功能的顺序建议 ...
0 0 0 2025/09/12 arXiv:2506.06270v2 Zophe
医疗图像分割,特别是在多域情景中,需要精确保存各种表示形式的解剖结构。尽管深度学习已经提高了这一领域,但现有模型通常会在准确的边界表示,器官形态的变异性以及在下采样过程中的信息丢失,从而限制其准确性和鲁棒性。为了应对这些挑战,我们提出了上下文增强网络(CENET),这是一个具有两个关键创新的新颖分割框架 ...
0 0 0 2025/09/12 arXiv:2505.18423v1 mixiu
现代搜索系统在促进信息获取方面起着至关重要的作用。传统的搜索引擎通常依靠级联的体系结构,在该体系结构中,通过召回,预先排名和排名阶段检索结果。设计和维护多个模块的复杂性使得难以实现整体性能提高 ...
0 0 0 2025/09/12 arXiv:2509.06887v2 Zophe
随着推理时间缩放对于增强的推理能力至关重要,构建有效推断的模型变得越来越重要。我们介绍了Nemotron-H,这是一个由8B和56B/47B混合Mamba转换器模型的家族,旨在降低给定精度水平的推理成本。为了实现这一目标,我们用执行恒定计算并需要每个生成的 Token 的恒定内存来替换常见 Transformer 模型体系结构中的大多数自我发项层 ...
0 0 0 2025/09/12 arXiv:2504.03624v4 lianzhepku
通用音频编解码器学习跨音频类型的纠缠表示形式,而某些特定的编解码器提供了脱钩的表示,但仅限于语音。但是,现实世界的音频通常包含语音和背景声音混合,而下游任务需要选择性访问这些组件。因此,我们将音频编解码器重新考虑为通用的分离表示学习者,以在不同的音频任务中启用可控制的功能选择 ...
0 0 0 2025/09/12 arXiv:2509.09201v1 melo_0925
大型语言模型(LLMS)供电现代AI应用程序,但是对不受信任的服务器进行处理敏感数据引起了隐私问题。同态加密(HE)可以对加密数据进行计算以进行安全推断。但是,神经文本生成需要诸如Argmax和采样等解码方法,这些方法是非多项式的,因此在加密下计算昂贵,从而产生了重要的性能瓶颈 ...
0 0 0 2025/09/12 arXiv:2509.08383v1 joye
通常使用仅在非缺陷样本上训练的异常检测(AD)框架进行工业产品检查。尽管在生产过程中可能会收集有缺陷的样品,但是利用它们通常需要像素级注释,从而限制可伸缩性。为了解决这个问题,我们提出了AdClick,这是一种用于工业异常检测的交互式图像分割(IIS)算法 ...
0 0 0 2025/09/12 arXiv:2509.05034v1 lzx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)