在原始分层表中嵌入视觉表示可以减轻由于用户注意力划分而产生的额外认知负荷。创建的分层表格可视化可以帮助用户理解和探索具有多级属性的复杂数据。然而,由于有许多可用于转换分层表和选择嵌入子集的选项,分层表可视化的设计空间变得巨大,并且构建过程变得繁琐,阻碍了用户有效地构建具有许多数据洞察力的分层表可视化 ...
我们构想了涉及人工智能技术的未来设计工作流程。借鉴活动和通信理论,我们试图分离出大型人工智能模型与过去技术相比可以提供设计的新价值。我们得出了三个可供性——动态基础、建设性谈判和可持续动机——总结了自然语言支持的基础模型的潜在品质,如果明确设计,可以支持设计过程 ...
数据可视化是探索和交流各个领域见解的强大工具。为了自动化数据集的可视化选择,提出了一项称为可视化推荐的任务。为此目的开发了各种基于机器学习的方法,但它们通常需要大量数据集-可视化对的语料库进行训练,并且对其结果缺乏自然的解释 ...
自动生成数据可视化以响应人类对数据集的表达需要对数据表达进行深入的语义理解,包括对数据属性、可视化任务和必要的数据准备步骤的隐式和显式引用。用于数据可视化的自然语言接口(NLI)已经探索了推断此类信息的方法,但由于人类语音固有的不确定性,挑战仍然存在。大型语言模型 (LLM) 的最新进展提供了解决这些挑战的途径,但它们提取相关语义信息的能力仍有待探索 ...
自然语言是数据可视化(例如条形图和折线图)的强大补充通信方式。为了促进使用自然语言进行基于图表的推理,最近引入了各种下游任务,例如图表问答、图表摘要和图表事实检查。这些任务提出了独特的挑战,要求视觉语言推理以及对图表数据表、视觉编码和自然语言提示的细致理解 ...
新兴的多模态大语言模型(MLLM)在图表问答(CQA)方面展现出巨大的潜力。最近的努力主要集中在扩大训练数据集(即 ...
语言模型 (LM) 的最新发展已显示出其在 NLP 任务中的有效性,特别是在知识密集型任务中。然而,其参数内知识存储和内存访问的底层机制仍然难以捉摸。在本文中,我们研究了生成式 LM(例如 ...
故事前提简洁地定义了故事的主要思想、基础和轨迹。它充当自动故事生成的初始触发器。现有的故事前提来源受到缺乏多样性、质量参差不齐和成本高昂的限制,使其难以扩展 ...
监督微调(SFT)是大型语言模型(LLM)的关键一步,使它们能够与人类指令保持一致并增强其在下游任务中的能力。大幅增加指令数据是使模型与更广泛的下游任务保持一致或显着提高其在特定任务上的性能的直接解决方案。然而,我们发现指令数据的大规模增加可能会损害之前存储在 LLM 中的世界知识 ...
中间推理或行动步骤已成功改进大型语言模型(LLM),以处理各种下游自然语言处理(NLP)任务。当应用LLM进行代码生成时,最近的工作主要集中在指导模型思维导图中间自然语言推理步骤,如思考链(CoT)提示,然后用自然语言或其他格式化中间步骤输出代码。然而,这样的输出不适合代码翻译或生成任务,因为标准CoT与具有不同的逻辑结构和表达形式的代码.. ...