多模态信息抽取,Multi-modal Information Extraction from Text, Semi-structured, and Tabular Data on the Web

Organizers: Xin Luna Dong, Hannaneh Hajishirzi, Colin Lockard and Prashant Shiralkar

万维网以多种形式包含大量的文本信息:非结构化文本、基于模板的半结构化网页(以键-值对和列表的形式呈现数据)和表格。从这些资源中提取信息并将其转换为结构化形式的方法一直是自然语言处理(NLP)、数据挖掘和数据库社区研究的目标。虽然这些研究人员已经很大程度上根据数据的模态将web数据的提取分离到不同的问题中,但他们也面临着类似的问题,比如使用有限的标记数据进行学习,定义(或避免定义)本体,利用先验知识,以及针对web规模的缩放解决方案。在本教程中,我们将从整体的角度来看待信息抽取,探索挑战中的共性,以及为解决这些不同形式的文本而开发的解决方案。

地址:

https://sites.google.com/view/acl-2020-multi-modal-ie

成为VIP会员查看完整内容
0
85

相关内容

在当今的信息和计算社会中,复杂系统常常被建模为与异质结构关系、非结构化属性/内容、时间上下文或它们的组合相关联的多模态网络。多模态网络中丰富的信息要求在进行特征工程时既要有一个领域的理解,又要有一个大的探索性搜索空间,以建立针对不同目的的定制化智能解决方案。因此,在多模态网络中,通过表示学习自动发现特征已成为许多应用的必要。在本教程中,我们系统地回顾了多模态网络表示学习的领域,包括一系列最近的方法和应用。这些方法将分别从无监督、半监督和监督学习的角度进行分类和介绍,并分别给出相应的实际应用。最后,我们总结了本教程并进行了公开讨论。本教程的作者是这一领域活跃且富有成效的研究人员。

https://chuxuzhang.github.io/KDD20_Tutorial.html

  • Part 1: Introduction and Overview 导论与概述 (Nitesh Chawla) (1:00-1:10pm) [slide] [video]
  • Part 2: Supervised Methods and Applications 监督方法与应用 2-1: User and behavior modeling (Meng Jiang) (1:10-1- :50pm) [slide] [video] 2-2: Cybersecurity and health intelligence (Yanfang Ye) (1:50-2:20pm) [slide] [video] 2-3: Relation learning (Chuxu Zhang) (2:20-2:35pm) [slide] [video] Coffee Break (2:35-3:00pm)
  • Part 3: Semi-supervised Methods and Applications 半监督方法与应用 3-1: Attributed network embedding (Xiangliang Zhang) (3:00-3:25pm) [slide] [video] 3-2: Graph alignment (Xiangliang Zhang) (3:25-3:40pm) [slide] [video]
  • Part 4: Unsupervised Methods and Applications 无监督方法与应用 4-1: Heterogeneous graph representation learning (Chuxu Zhang) (3:40-4:00pm) [slide] [video] 4-2: Graph neural network for dynamic graph and unsupervised anomaly detection (Meng Jiang) (4:00-4:20pm) [slide] [video] Part 5: Conclusions (Chuxu Zhang) (4:20-5:00pm) [slide] [video] 结论
成为VIP会员查看完整内容
0
95

理想情况下,我们希望将两个几何对象插入到一个函数中,然后通过函数来说明它们之间的相似性。这将允许我们回答关于下游应用程序中几何数据的不同层次上的各种问题。然而,对于高级任务,如计算样式相似度或三维形状之间的顶点到顶点映射,直接在原始几何数据上进行这些操作是困难的,因为更抽象的任务需要更结构化的聚合信息。实现这种相似性函数的一种方法是首先计算这些数据到嵌入空间的映射,从而对不同几何元素之间的有意义的关系进行编码,例如在风格上,更相似的形状嵌入得更紧密。通过利用这个嵌入空间,我们可以计算并输出相似度度量。然而,手工构建保存这些属性的映射是很困难的,因为为越来越抽象的任务制定显式规则或模型变得越来越具有挑战性。因此,我们使用了由人类提供的与任务相关的元信息的几何数据集合。这允许我们通过使用神经网络灵活地制定地图计算,而不用对映射图本身的形式做太多假设。为了从广泛可用的机器学习技术中获益,我们必须首先考虑如何选择合适的几何数据表示作为各种学习模型的输入。具体来说,根据数据源的可用性和任务的特定需求,我们从图像、点云和三角形网格计算嵌入。一旦我们找到了对输入进行编码的合适方法,我们就会探索不同的方法来塑造学习到的中间域(嵌入),这超越了直接的基于分类分布的交叉熵最小化方法。

https://sites.google.com/view/geometry-learning-foundation/schedule#h.p_am99P6ELk_gL

成为VIP会员查看完整内容
0
23

【导读】2020 年 2 月 7 日-2 月 12 日,AAAI 2020 于美国纽约举办。迁移学习近年来受到了非常大的关注,今年AAAI也有很多相关论文,这场Tutorial全面回顾可迁移表示学习方法的最新发展,重点介绍文本、多关系和多媒体数据的可迁移表示学习方法。除了介绍域内嵌入学习方法外,还讨论各种半监督、弱监督、多视图和自监督学习技术来连接多个域特定的嵌入表示,是一个非常全面的迁移表示学习总结,讲者最后也介绍了其未来发展趋势,值得研究者关注和收藏。

迁移表示学习最新进展

Recent Advances in Transferable Representation Learning

Tutorial 目标

本教程针对有兴趣将深度学习技术应用于跨域决策任务的AI研究人员和从业人员。这些任务包括涉及多语言和跨语言自然语言处理,特定领域知识以及不同数据模式的任务。本教程将为听众提供以下方面的整体观点:(i)针对未标记的文本,多关系和多媒体数据的多种表示学习方法;(ii)在有限的监督下跨多种表示对齐和迁移知识的技术;以及(iii)在自然语言理解,知识库和计算生物学中使用这些技术的大量AI应用程序。我们将通过概述该领域未来的研究方向来结束本教程。观众不需要有特定的背景知识。

概述

许多人工智能任务需要跨域决策。例如,许多NLP任务涉及跨多种语言的预测,其中可以将不同的语言视为不同的域;在人工智能辅助的生物医学研究中,药物副作用的预测常常与蛋白质和有机体相互作用的建模并行进行。为了支持机器学习模型来解决这种跨域任务,必须提取不同域中数据组件的特征和关系,并在统一的表示方案中捕获它们之间的关联。为了满足这一需求,表示学习的最新进展往往涉及到将不同域的未标记数据映射到共享嵌入空间。这样,跨域的知识迁移可以通过向量搭配或变换来实现。这种可迁移的表现形式在涉及跨域决策的一系列人工智能应用中取得了成功。然而,这一领域的前沿研究面临两大挑战。一是在学习资源很少的情况下如何有效地从特定领域中提取特性。另一个是在最少的监督下精确地对齐和传递知识,因为连接不同域的对齐信息常常是不充分和有噪声的。

在本教程中,我们将全面回顾可迁移表示学习方法的最新发展,重点介绍文本、多关系和多媒体数据的可迁移表示学习方法。除了介绍域内嵌入学习方法外,我们还将讨论各种半监督、弱监督、多视图和自监督学习技术来连接多个域特定的嵌入表示。我们还将比较域内嵌入算法和跨域对齐算法的改进和联合学习过程。此外,我们将讨论如何利用获得的可迁移表征来解决低资源和无标签的学习任务。参会者将了解本主题的最新趋势和挑战,了解代表性工具和学习资源以获取即用型模型,以及相关的模型和技术如何有益于现实世界AI应用程序。

讲者介绍

Muhao Chen目前是美国宾夕法尼亚大学研究生院博士后。他于2019年在加州大学洛杉矶分校获得了计算机科学博士学位。Muhao从事过机器学习和NLP方面的各种课题。他最近的研究也将相关技术应用于计算生物学。更多信息请访问http://muhaochen.github.io。

Kai-Wei Chang是加州大学洛杉矶分校计算机科学系的助理教授。他的研究兴趣包括为大型复杂数据设计鲁棒的机器学习方法,以及为社会公益应用程序构建语言处理模型。其他信息请访问http://kwchang.net。

Dan Roth是宾夕法尼亚大学CIS的Eduardo D. Glandt Distinguished Professor,也是AAAS、ACM、AAAI和ACL的Fellow。Roth因在自然语言理解建模、机器学习和推理方面的重大概念和理论进展而被认可。更多信息可以参考:http://www.cis.upenn.edu/˜danroth /.

成为VIP会员查看完整内容
0
89
小贴士
相关VIP内容
专知会员服务
95+阅读 · 2020年8月26日
专知会员服务
23+阅读 · 2020年7月24日
专知会员服务
55+阅读 · 2020年7月12日
专知会员服务
131+阅读 · 2020年5月22日
专知会员服务
28+阅读 · 2020年5月1日
专知会员服务
13+阅读 · 2020年4月20日
因果图,Causal Graphs,52页ppt
专知会员服务
152+阅读 · 2020年4月19日
知识图谱本体结构构建论文合集
专知会员服务
60+阅读 · 2019年10月9日
相关论文
Wentao Xu,Shun Zheng,Liang He,Bin Shao,Jian Yin,Tie-Yan Liu
7+阅读 · 2020年5月2日
Liang Chen,Jintang Li,Jiaying Peng,Tao Xie,Zengxu Cao,Kun Xu,Xiangnan He,Zibin Zheng
33+阅读 · 2020年3月10日
Aidan Hogan,Eva Blomqvist,Michael Cochez,Claudia d'Amato,Gerard de Melo,Claudio Gutierrez,José Emilio Labra Gayo,Sabrina Kirrane,Sebastian Neumaier,Axel Polleres,Roberto Navigli,Axel-Cyrille Ngonga Ngomo,Sabbir M. Rashid,Anisa Rula,Lukas Schmelzeisen,Juan Sequeda,Steffen Staab,Antoine Zimmermann
79+阅读 · 2020年3月4日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
Jianhong Zhang,Manli Zhang,Zhiwu Lu,Tao Xiang,Jirong Wen
60+阅读 · 2020年2月28日
End-to-End Open-Domain Question Answering with BERTserini
Wei Yang,Yuqing Xie,Aileen Lin,Xingyu Li,Luchen Tan,Kun Xiong,Ming Li,Jimmy Lin
3+阅读 · 2019年9月18日
Jingqing Zhang,Piyawat Lertvittayakumjorn,Yike Guo
6+阅读 · 2019年3月29日
Jindou Wu,Yunlun Yang,Chao Deng,Hongyi Tang,Bingning Wang,Haoze Sun,Ting Yao,Qi Zhang
6+阅读 · 2019年3月28日
Seyed Mehran Kazemi,David Poole
7+阅读 · 2018年2月13日
Armand Joulin,Edouard Grave,Piotr Bojanowski,Maximilian Nickel,Tomas Mikolov
3+阅读 · 2017年10月30日
Yike Liu,Abhilash Dighe,Tara Safavi,Danai Koutra
4+阅读 · 2017年4月12日
Top