3d 点云的语义、实例和全景分割已通过不同设计的特定任务模型得到解决。因此,所有分割任务的相似性以及它们之间的隐含关系没有得到有效利用。本文提出了一个统一、简单且有效的模型,共同解决所有这些任务... ...
0 1 1 2025/02/10 arXiv:2311.14405v1 qszhou
尽管最近取得了巨大进展,但生成的视频模型仍然很难捕获现实世界的运动,动态和物理。我们表明,这种局限性是由常规像素重建物镜产生的,该物镜以牺牲运动相干性为代价偏向于外观保真度。为了解决这个问题,我们介绍了Videojam,这是一个新颖的框架,通过鼓励模型学习联合外观运动表示,该框架在视频发电机之前灌输了有效的动作 ...
0 0 0 2025/02/10 arXiv:2502.02492v1 陆三七
建立大型视力语言模型的长期文化能力对于视频理解,高分辨率图像理解,多模式代理和推理至关重要。我们介绍了Long-Vita,这是一个简单而有效的大型多模式模型,用于长篇小说视觉语言理解任务。它擅长在4K帧或1M Token 上同时处理和分析图像,视频和文本的方式,同时在短篇文本多模式任务上提供高级性能 ...
0 0 0 2025/02/10 arXiv:2502.05177v1 Curry123
大脑是寻找灵感来开发更有效的神经网络的理想场所。我们的突触和神经元的内部工作能够瞥见深度学习的未来外观。本文是一个教程和观点,展示了如何应用深度学习,梯度下降,反向传播和神经科学的几十年研究中学到的经验教训,以在生物学上具有尖峰神经神经网络 ...
0 0 0 2025/02/10 arXiv:2109.12894v6 打笨蛋
图形神经网络(GNN)是该HTTP URL上的机器学习的强大工具,结合了节点特征信息与图形结构,通过沿输入图的边缘递归传递神经消息。但是,结合图结构和特征信息会导致复杂的模型,并且解释GNNS做出的预测仍未解决。在这里,我们提出了Gnnexplainer,这是第一种通用模型无关的方法,用于为任何基于GNN的机器学习任务的任何基于GNN的模型提供可解释的解释 ...
0 0 0 2025/02/10 arXiv:1903.03894v4 QingXiang
个性化建议是一类重要的深入学习应用程序类,可为大量的互联网服务提供动力,并消耗大量的数据中心资源。随着生产级推荐系统的规模不断增长,优化其在​​异质数据中心中的服务性能和效率很重要,并且可以转化为基础架构的节省。在本文中,我们提出了Hercules,这是一个针对个性化推荐推理服务的优化框架,该框架针对各种行业代表性模型和云规模的异质系统 ...
0 0 0 2025/02/10 arXiv:2203.07424v1 大东专属
大型语言模型(LLM),例如ChatGpt和GPT-4,在各种生成任务中都表现出了令人印象深刻的功能。但是,访问和利用长期记忆的局限性通常会阻碍它们的性能,从而导致特定的漏洞和偏见,尤其是在长期互动期间。本文介绍了ChatLogic,这是一个专门针对LLM推理任务的创新框架,可以通过集成逻辑编程来增强多步扣除推理任务中LLM的性能 ...
0 0 0 2025/02/10 arXiv:2407.10162v1 attention2
用户兴趣在一天的过程中表现出一种动态模式,例如,用户通常在8 a处有利于软音乐 ...
0 0 0 2025/02/10 arXiv:2501.15817v1 hzlyiyibooks

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)