我们提出了一种用于实时交互式流体模拟的神经物理系统。基于物理的传统方法虽然准确,但在计算中却遭受了延迟问题的限制。最近的机器学习方法降低了计算成本,同时保持了忠诚度;然而,大多数人仍然无法满足实时使用的延迟约束,并且缺乏对交互式应用程序的支持 ...
部分微分方程(PDE)是建模物理系统的基础,但是解决它们仍然是一个复杂的挑战。传统的数值求解器依靠专家知识来实施,并且在计算上很昂贵,而基于神经网络的求解器则需要大型培训数据集,并且通常缺乏可解释性。在这项工作中,我们将PDE求解作为代码生成任务,并引入Codepde,这是使用大语言模型(LLMS)生成PDE求解器的第一个推理框架 ...
大型语言模型(LLM)在代码生成方面取得了令人印象深刻的性能。但是,对于复杂的编程任务,在一个GO中生成正确的解决方案变得具有挑战性,因此一些先前的作品已经设计了程序维修方法来提高代码生成性能。在这项工作中,我们提出了自我欺骗,它教授了一个大型语言模型,可以通过几次示范进行调试其预测程序 ...
专家(MOE)的混合物由于推理效率的提高,对分布式培训的适应性和模块化而获得了(自我监督学习的突出性)。先前的研究表明,MOE可以通过扩大网络的参数计数而在减少休眠神经元的同时,可以显着提高深度强化学习(DRL)的性能,从而增强了模型的学习能力和处理非平稳性的能力。在这项工作中,我们更多地了解了Moes处理非平稳性并通过多任务培训“放大”非平稳性的MOE的能力,并提供了进一步的证据,表明MOE提高了学习能力 ...
随着模型大小的增加,深度神经网络在增强学习(RL)中的使用通常会遭受性能降解。尽管专家的软混合物(SoftMoes)最近显示出有望减轻此问题的在线RL,但其有效性背后的原因在很大程度上是未知的。在这项工作中,我们提供了深入的分析,以确定推动这种绩效增长的关键因素 ...
解决部分微分方程的机器学习方法需要在功能空间之间学习映射。尽管卷积或图神经网络被限制在离散功能上,但神经操作员为直接映射功能提供了有希望的里程碑。尽管结果令人印象深刻,他们仍然在域几何形状方面面临挑战,并且通常依靠某种形式的离散化 ...
面部识别系统容易受到物理和数字攻击的影响,带来了严重的安全风险。传统方法通常由于其独特的特征而分别对这两种攻击类型进行处理。因此,当被攻击合并时,几乎所有方法都无法处理 ...
最近开发的 Transformer 网络通过在图像中利用自我发挥(SA)来实现图像DeNo的令人印象深刻的性能。但是,现有方法主要使用相对较小的窗口来计算SA,因为IT的二次复杂性限制了模型对长期图像信息进行建模的能力。在本文中,我们提出了空间频率注意网络(SFANET),以增强网络利用远程依赖性的能力 ...
模型蒸馏是一种有效且广泛使用的技术,可以将知识从教师转移到学生网络。典型的应用程序是从强大的大型网络或合奏转移到小型网络,这更适合低内存或快速执行要求。在本文中,我们提出了一种深入的相互学习(DML)策略,其中,一个学生合作地学习了静态的预定老师和学生之间的转移,而是在整个培训过程中互相教学 ...
模拟围绕任意形状的流体流是解决各种工程问题的关键。但是,在复杂几何形状上模拟流体物理学在数值上仍然具有挑战性和计算资源密集型,尤其是在使用常规的PDE求解器时。机器学习方法为创建快速和适应性的PDE求解器提供了有吸引力的机会 ...