【CIKM2018】从大数据到大信息和大知识教程(附PPT下载)

CIKM创办于1992年,是由美国计算机协会针对信息检索、知识管理以及数据库主办的全球顶尖学术会议。CIKM每年汇聚了最前沿的科研人员,探讨先进知识及信息系统面临的发展困惑及挑战,通过高质量、已实践的理论研究成果,确定未来的研究方向。


CIKM十分重视工业界的运用,除了CIKM Cup这样的面向实战的国际数据挖掘竞赛外, 还有很多的面向工业界的Tutorial、Workshop。今天给大家带来《从大数据到大信息和大知识:以地球观察数据为例



大数据和人工智能热潮之后,越来越多的专家开始思考未来的技术走向,中科院自动化所胡包钢,董未名,黄飞跃等人指出人工智能未来发展方向的“基于大数据+大知识的建模方法”。他们指出然而深度学习方法的局限性也是显而易见的。其中最为缺失的是关于知识的显式应用与更新。目前的深度学习方法没有应用演绎推理方式实现智能。  而”大知识”是一种以多学科为基础的、多领域为应用的、多种表达方式的一类知识库。  未来类人智能机器在利用已有知识与数据方面均会超过人类平均(AverageHuman-being)水平。其次,它也预示大数据利用下成功发展的深度学习模型必将依赖大知识利用方面取得突破性发展。而对于知识模型方法则需要采取大数据利用下的学习方式实现知识库的“自动/半自动”更新与扩展(这远不同于早期专家系统)。

 

参考文献:胡包钢,董未名,黄飞跃,基于大数据+大知识的建模方法 ——人工智能未来之路的探索,自动化学报通讯


摘要


一些特别重要的开放且免费的大型地理空间数据的丰富来源是各国的地球观测计划,如美国的Landsat计划和欧盟的哥白尼计划。地球观测数据是大数据的一个范例,从中提取的信息和知识也是如此。地球观测数据(卫星图像和现场数据)和所提取的信息和知识可用于许多对金融和环境产生影响的应用,比如应急管理,气候变化,农业和安全等领域。到目前为止,这种潜力尚未完全实现,因为地球观测数据和从中提取的信息“隐藏”在美国宇航局、欧洲航天局和国家航天机构操作的各种档案中。因此,想要开发应用程序的用户需要搜索这些档案,发现所需的数据和信息并将其集成到他的应用程序中。


在本教程中,作者将展示如何通过以RDF的形式发布数据来“打破这些孤岛”, 使现代搜索引擎能够发现它们,将其与其他相关数据连接起来,并使其在Web上免费可用,从而方便地开发地理空间应用程序。提供了一个完整的数据科学流程,该流程以各种格式的地球观测数据集开始,可以在ESA和NASA等空间机构的档案中免费获得,最后部署了一个交互式视觉应用程序,该应用程序使用地球观测数据和其他使用链接数据技术的抵押数据(例如,开放政府数据,封闭企业数据,模型数据等)。本教程将深入介绍在过去8年中,在5个欧洲项目的背景下,演示者开发的相关地球观测数据的技术,系统和应用。其他研究人员的相关工作也将深入讨论。最后,还将讨论该领域未来研究的开放性问题和方向。


教程概述


这是一个为期半天的教程,简要概述如下:


第1部分:简介。卫星图像。欧盟的哥白尼计划。哥白尼数据作为大数据的范例。


第2部分:卫星数据的数据库技术。在本教程的这一部分中,我们将介绍最新的数组DBMS:MonetDB / SciQL,paradigm4 / SciDB和rasdaman。我们将集中研究这些系统处理遥感数据的能力和现有应用。


第3部分:卫星图像的知识发现。在本教程的这一部分中,我们将介绍遥感文献,该文献研究模式识别和机器学习技术,以便从卫星图像中提取知识(例如,土地覆盖类)。PPT将展示这一部分


第4部分:地理空间和时间数据的RDF和SPARQL扩展。在本教程的这一部分中,我们将首先讨论RDF地理空间和时间扩展的数据模型和查询语言,重点关注数据模型stRDF和我们小组开发的查询语言stSPARQL,开放地理空间联盟(OGC)标准GeoSPARQL和RDF的扩展,用于表示不完整信息RDFi。 这些RDF的时空扩展可以使用本教程第3部分中介绍的技术以及其他附带数据(例如,某个国家的行政区划、OpenStreetMap数据等)对从卫星图像中提取的知识进行编码。


第5部分:时空RDF存储。在本教程的这一部分中,我们将介绍Strabon、Ontop-spatial和它们的竞争对手系统(Parliament、uSeekM、GraphDB、AllegroGraph、Virtuoso、Stardog和Oracle Spatial和Graph 12c),以及最近使用benchmark geographic对它们进行的功能和性能比较。我们还将讨论开放问题,比如如何将这些系统扩展到大数据,以及如何在关联数据范式中表示和查询栅格数据。


第6部分:互连地理空间和时间RDF数据。在本教程的这一部分中,我们将讨论有关地理空间实体解析的工作以及与Silk和Radon等系统发现地理空间关系的最新工作。


第7部分:搜索,浏览,探索和可视化遥感数据和链接的时空数据。在本教程的这一部分中,我们将首先讨论从卫星图像档案中进行基于内容的检索的遥感技术。我们还将展示我们的工具Sextant,用于可视化链接的时空数据,以及它在Copernicus App Lab项目的环境应用中的使用。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“CIKM2018BD” 就可以获取 最新PPT下载链接~ 



附PPT全文:



参考链接:

https://www.cikm2018.units.it/tutorial5.html

http://kr.di.uoa.gr/#cikm2018-tutorial


-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员