NoSQL 全称是 Not Only SQL,是一种不同于关系型数据库的数据库管理系统设计方式。

VIP内容

讲座题目

你是我的邻居吗?给邻居的计算问题带来秩序:Are You My Neighbor? Bringing Order to Neighbor Computing Problems

讲座简介

寻找近邻是近年来备受关注的一个重要课题,在市场篮分析、抄袭与异常检测、广告、社区检测、基于配体的虚拟筛选等领域有着广泛的应用。随着数据的收集越来越容易,寻找近邻已成为一个重要的研究课题分析管道中的潜在瓶颈。考虑到今天的大量数据集,执行成对比较不再可行。任务的高计算复杂度导致研究人员开发近似的方法,发现许多但不是所有的最近邻居。然而,对于某些类型的数据,通过仔细划分或过滤搜索空间,以避免最不必要的比较,找到了有效的精确解。 近年来,我们在有效识别适当邻居方面取得了一些基本进展,特别是在非传统数据(如图形或文档集合)方面。在本教程中,我们将深入介绍最近的查找(最近)邻居的方法,重点介绍在设计这些算法时所做选择背后的直觉,以及这些方法在实际应用中的实用性。我们的教程旨在提供“邻居计算”问题的统一视图,从数字数据到图形数据,从分类数据到顺序数据,以及相关的应用场景。对于每种类型的数据,我们将回顾当前用于识别邻居的最新方法,并讨论如何使用邻居搜索方法来解决重要问题。

讲座嘉宾

David C.Anastasiu是圣何塞州立大学计算机工程系的助理教授。他的研究兴趣广泛地落在机器学习、数据挖掘、计算基因组学和高性能计算的交叉点上。他的大部分工作都集中在分析稀疏数据的可伸缩和高效方法上。他开发了用于识别近邻的串行和并行方法、用于搜索相关生化化合物的方法、用于描述用户行为随时间变化的方法以及用于个性化和协作性地呈现Web搜索结果的方法。由于Anastasiu教授在数据科学领域的算法工作,他在2016年IEEE数据科学和高级分析国际会议(DSAA'2016)上获得了竞争性下一代数据科学家(NGDS)奖。他的工作已经发表在许多顶级会议和期刊上,并在最著名的IEEE和ACM数据科学相关会议的项目委员会中任职。他的研究由NSF、Intel实验室、Flex、Infoblox和NVIDIA公司资助。本教程将结合他自己的研究,介绍有效的近邻搜索方法以及在交通分析和计算基因组学中的应用

成为VIP会员查看完整内容
0+
0+
更多VIP内容

最新论文

This paper presents PALPATINE, the first in-memory application-level cache for Distributed Key-Value (DKV) data stores, capable of prefetching data that is likely to be accessed in an immediate future. To predict data accesses, PALPATINE continuously captures frequent access patterns to the back store by means of data mining techniques. With these patterns, PALPATINE builds a stochastic graph of accessed items, and makes prefetching decisions based on it. Experimental evaluation indicates that PALPATINE can improve the latency of a specific DKV store by more that an order of magnitude.

0+
0+
下载
预览
更多最新论文
Top