序列到序列(SEQ2SEQ)具有关注的模型在涉及生成自然语言句子(例如机器翻译,图像字幕和语音识别)等任务上表现出色。通常以语言模型的形式利用未标记的数据来进一步提高性能。在这项工作中,我们提出了冷融合方法,该方法在培训过程中利用了预训练的语言模型,并显示了其对语音识别任务的有效性 ...
我们证明,AI模型可以通过在CT扫描中使用合成肿瘤来准确地分割肝肿瘤,而无需手动注释。我们的合成肿瘤具有两个有趣的优势:(i)形状和质地的现实,即使是医学专业人员也可能将其与实际肿瘤混淆; (ii)对训练AI模型有效,可以进行肝肿瘤分割,类似于对实际肿瘤训练的模型类似 - 这是令人兴奋的,因为迄今为止,没有现有的工作仅使用合成肿瘤,但与真实肿瘤的性能相似甚至接近性能。该结果还意味着,将来可以大大减 ...
在这项研究中,我们介绍了有关ESPNET:端到端语音处理工具包的最新发展,该工具包主要涉及最近提出的称为Conformer,卷积增强 Transformer 的体系结构。本文显示了各种端到端语音处理应用程序的结果,例如自动语音识别(ASR),语音翻译(ST),语音分离(SS)和文本到语音(TTS)。我们的实验揭示了通过对不同任务的构象体获得的各种培训技巧和显着的绩效好处 ...
尽管在传统的自主驾驶系统中探索了个性化,但尽管它的突出性越来越大,但在端到端的自主驾驶(E2EAD)中仍在很大程度上被忽略。这一差距至关重要,因为用户一致的行为对于自动驾驶汽车的信任,舒适和广泛采用至关重要。一个核心挑战是缺乏带有多种且细粒度的驾驶偏好注释的大型现实世界数据集,从而阻碍了个性化E2EAD模型的开发和评估 ...
传统上,公司以预定的折现率向客户群提供了优惠券。但是,机器学习的进步和丰富的客户数据的可用性现在使平台可以为个人提供实时定制优惠券。在这项研究中,我们与领先的购物平台Meituan合作开发了一种实时的端到端优惠券分配系统,该系统在刺激需求方面快速有效,同时面对来自多元化客户群的不确定流量时遵守营销预算 ...
设计有效的关键字点(KWS)系统,该系统在资源受限的边缘设备上提供出色的性能长期以来一直引起人们的关注。现有的KWS搜索算法通常遵循帧同步方法,尽管大多数框架都是关键字 - iRrelevant,但在每个帧中反复做出搜索决策。在本文中,我们提出了TDT-KWS,该TDT-kws利用 Token 和持续传感器(TDT)来执行KWS任务 ...
大多数3D对象发电机都专注于美学质量,通常会忽略应用程序中必要的物理约束。这样的约束之一是3D对象应该是自支持的,即 ...
这项调查解决了大型语言模型(llm)中真实性的关键问题。随着llm在不同领域找到应用,llm产生与既定事实不一致的内容的可能性... ...