【斯坦福博士论文】在语言模型融合多模态知识，225页pdf - 专知VIP

会员服务 ·

33

语言模型 · 多模态知识 · 博士论文 ·

2024 年 4 月 10 日

【斯坦福博士论文】在语言模型融合多模态知识，225页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

语言模型，如GPT-4，具有生成对用户查询的文本响应的能力。它们被用于各种任务，包括问答、翻译、摘要和个人助理等。然而，为了创建更多功能的人工智能助手，这些模型需要处理更多样化和复杂的任务，涉及领域或视觉知识，如回答医疗问题以及解释或生成图像。这种需求促使了开发能够访问并利用文本之外的多样化知识源的模型，如数据库和图像。在本论文中，我们旨在开发能够利用多模态知识的语言模型，包括文本、知识图谱和图像，以解决各种用户查询。文本提供广泛且富有语境的知识，知识图谱通常提供结构化的领域知识，而图像则促进各种视觉应用。本论文共有五章。第一章介绍语言模型如何有效地从文本数据中学习知识的方法。具体来说，我们在一系列相关文档上训练语言模型，鼓励它们学习和推理具有长期依赖性的知识。这种方法在复杂的长上下文和多步推理任务上表现出强大的性能。在第二章中，我们介绍了使语言模型能够利用知识图谱信息的方法。具体来说，我们开发了一种新的模型架构，结合了语言模型和图神经网络，以及一个融合文本和知识图谱表征的训练目标。这种方法在涉及领域知识的任务上表现出强大的性能，如医疗问题回答。在第三章中，为了使语言模型能够在文本信息旁使用和生成视觉内容，我们设计了能够编码、检索和解码文本和图像交织序列的统一多模态模型。该模型采用检索器来获取文本或视觉知识，并将其整合到一个多模态变换器中，该变换器使用标记表示同时编码和解码文本和图像。最后，在第四和第五章中，我们展示了将文本、结构化和视觉知识融合技术应用于解决实际医疗任务的情况，包括临床试验结果预测和多模态医疗问题回答。总之，本论文构建了能够理解和生成多模态内容的模型，涵盖了文本、知识图谱和图像。

成为VIP会员查看完整内容

49

相关内容

语言模型

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

专知会员服务

46+阅读 · 2024年5月4日

【博士论文】神经语言模型的参数效率，199页pdf

【博士论文】神经语言模型的参数效率，199页pdf

专知会员服务

32+阅读 · 2024年3月13日

【纽约大学博士论文】在大型语言模型时代的自然语言处理评估，152页pdf

【纽约大学博士论文】在大型语言模型时代的自然语言处理评估，152页pdf

专知会员服务

43+阅读 · 2023年12月30日

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

专知会员服务

77+阅读 · 2023年10月23日

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

55+阅读 · 2023年10月10日

【斯坦福大学博士论文】生成式模型在现实世界应用中的进展，222页pdf

【斯坦福大学博士论文】生成式模型在现实世界应用中的进展，222页pdf

专知会员服务

74+阅读 · 2023年10月6日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

45+阅读 · 2023年9月7日

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

专知会员服务

52+阅读 · 2023年7月13日

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

专知会员服务

46+阅读 · 2023年3月14日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

32+阅读 · 2023年3月1日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

35+阅读 · 2020年8月29日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

共现潜在语义向量空间模型及其语义核的构建与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

214+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

多模态知识

相关VIP内容

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

专知会员服务

46+阅读 · 2024年5月4日

【博士论文】神经语言模型的参数效率，199页pdf

【博士论文】神经语言模型的参数效率，199页pdf

专知会员服务

32+阅读 · 2024年3月13日

【纽约大学博士论文】在大型语言模型时代的自然语言处理评估，152页pdf

【纽约大学博士论文】在大型语言模型时代的自然语言处理评估，152页pdf

专知会员服务

43+阅读 · 2023年12月30日

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

专知会员服务

77+阅读 · 2023年10月23日

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

55+阅读 · 2023年10月10日

【斯坦福大学博士论文】生成式模型在现实世界应用中的进展，222页pdf

【斯坦福大学博士论文】生成式模型在现实世界应用中的进展，222页pdf

专知会员服务

74+阅读 · 2023年10月6日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

45+阅读 · 2023年9月7日

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

专知会员服务

52+阅读 · 2023年7月13日

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

专知会员服务

46+阅读 · 2023年3月14日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

32+阅读 · 2023年3月1日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

35+阅读 · 2020年8月29日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

共现潜在语义向量空间模型及其语义核的构建与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

214+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员