NoSQL 全称是 Not Only SQL,是一种不同于关系型数据库的数据库管理系统设计方式。

VIP内容

讲座题目

你是我的邻居吗?给邻居的计算问题带来秩序:Are You My Neighbor? Bringing Order to Neighbor Computing Problems

讲座简介

寻找近邻是近年来备受关注的一个重要课题,在市场篮分析、抄袭与异常检测、广告、社区检测、基于配体的虚拟筛选等领域有着广泛的应用。随着数据的收集越来越容易,寻找近邻已成为一个重要的研究课题分析管道中的潜在瓶颈。考虑到今天的大量数据集,执行成对比较不再可行。任务的高计算复杂度导致研究人员开发近似的方法,发现许多但不是所有的最近邻居。然而,对于某些类型的数据,通过仔细划分或过滤搜索空间,以避免最不必要的比较,找到了有效的精确解。 近年来,我们在有效识别适当邻居方面取得了一些基本进展,特别是在非传统数据(如图形或文档集合)方面。在本教程中,我们将深入介绍最近的查找(最近)邻居的方法,重点介绍在设计这些算法时所做选择背后的直觉,以及这些方法在实际应用中的实用性。我们的教程旨在提供“邻居计算”问题的统一视图,从数字数据到图形数据,从分类数据到顺序数据,以及相关的应用场景。对于每种类型的数据,我们将回顾当前用于识别邻居的最新方法,并讨论如何使用邻居搜索方法来解决重要问题。

讲座嘉宾

David C.Anastasiu是圣何塞州立大学计算机工程系的助理教授。他的研究兴趣广泛地落在机器学习、数据挖掘、计算基因组学和高性能计算的交叉点上。他的大部分工作都集中在分析稀疏数据的可伸缩和高效方法上。他开发了用于识别近邻的串行和并行方法、用于搜索相关生化化合物的方法、用于描述用户行为随时间变化的方法以及用于个性化和协作性地呈现Web搜索结果的方法。由于Anastasiu教授在数据科学领域的算法工作,他在2016年IEEE数据科学和高级分析国际会议(DSAA'2016)上获得了竞争性下一代数据科学家(NGDS)奖。他的工作已经发表在许多顶级会议和期刊上,并在最著名的IEEE和ACM数据科学相关会议的项目委员会中任职。他的研究由NSF、Intel实验室、Flex、Infoblox和NVIDIA公司资助。本教程将结合他自己的研究,介绍有效的近邻搜索方法以及在交通分析和计算基因组学中的应用

成为VIP会员查看完整内容
0
1

最新论文

Since very few contributions to the development of an unified memory orchestration framework for efficient management of both host and remote idle memory have been made, we present Valet, an efficient approach to orchestration of host and remote shared memory for improving performance of memory intensive workloads. The paper makes three original contributions. First, we redesign the data flow in the critical path by introducing a host-coordinated memory pool that works as a local cache to reduce the latency in the critical path of the host and remote memory orchestration. Second, Valet utilizes unused local memory across containers by managing local memory via Valet host-coordinated memory pool, which allows containers to dynamically expand and shrink their memory allocations according to the workload demands. Third, Valet provides an efficient remote memory reclaiming technique on remote peers, based on two optimizations: (1) an activity-based victim selection scheme to allow the least-active-chunk of data to be selected for serving the eviction requests and (2) a migration protocol to move the least-active-chunk of data to less-memory-pressured remote node. As a result, Valet can effectively reduce the performance impact and migration overhead on local nodes. Our extensive experiments on both NoSQL systems and Machine Learning (ML) workloads show that Valet outperforms existing representative remote paging systems with up to 226X throughput improvement and up to 98% latency decrease over conventional OS swap facility for big data and ML workloads, and by up to 5.5X throughput improvement and up to 78.4% latency decrease over the state-of-the-art remote paging systems. Valet is open sourced at https://github.com/git-disl/Valet.

0
0
下载
预览
Top