叙事可视化将数据转化为引人入胜的故事,从而使广泛的受众可以访问复杂的信息。基础模型具有其高级功能,例如自然语言处理,内容产生和多模式集成,具有丰富叙事可视化的巨大潜力。最近,已经引入了基于不同方面的基础模型来制作叙事可视化的技术集合 ...
理解和复制现实世界是人工通用智能(AGI)研究的关键挑战。为了实现这一目标,许多现有的方法,例如世界模型,旨在捕获有关物理世界的基本原则,从而实现更准确的模拟和有意义的互动。但是,当前方法通常将不同的方式视为不同的模态,包括2D(图像),视频,3D和4D表示,作为独立域,忽略了它们的相互依赖性 ...
背景:脆弱的依赖关系是当今开源软件生态系统中的已知问题,因为OSS库是高度互连的,并且开发人员并不总是更新其依赖关系。目的:在本文中,我们旨在提出一种精确的方法,该方法将基于代码的补丁分析与从非常代码存储库中提取的构建,测试,更新日期和小组的信息相结合,因此可以满足工业实践的正确分配开发和审计资源的需求。方法:了解拟议方法论的工业影响,我们考虑了SAP在其自己的软件中使用的200个最受欢迎的OSS ...
大型语言模型(LLMS)在包括数学,物理和化学在内的一系列科学任务中表现出了令人印象深刻的能力。尽管取得了成功,但LLM在处理复杂的统计任务中的有效性仍然有系统地探索。为了弥合这一差距,我们介绍了STATQA,这是一种用于统计分析任务的新基准 ...
JavaScript的受欢迎程度已导致通过NPM软件包注册表提供的大型第三方软件包生态系统。 NPM的开放性质提高了其增长,提供了超过800,000个免费和可重复使用的软件包。不幸的是,这种开放性的性质也会引起安全风险,这是通过在数百万计算机上违反或攻击软件的单个软件包的最新事件所证明的 ...
安全性和成本是开发自动驾驶技术的两个重要问题。从学术研究到自动驾驶车辆的商业应用,需要足够的模拟和现实世界测试。通常,在模拟环境中进行了大量测试,然后将学习的驾驶知识转移到现实世界中,因此如何适应模拟中学习的驱动知识成为现实成为一个关键问题 ...
多模式大型语言模型(MLLM)在需要跨域知识的各种下游任务中表现出了巨大的潜力。能够处理视频(称为视频mllms)的MLLM对视频语言理解引起了广泛的兴趣。但是,视频,尤其是长视频,包含比图像更多的视觉 Token ,这使得它们难以处理LLM ...
我们介绍了KodCode,这是一个合成数据集,该数据集可解决跨不同困难和域中培训大语言模型进行编码的高质量,可验证的培训数据的持续挑战。现有的以代码为中心的资源通常无法确保覆盖范围的广度(例如 ...