The discovery of community structures in social networks has gained significant attention since it is a fundamental problem in understanding the networks' topology and functions. However, most social network data are collected from partially observable networks with both missing nodes and edges. In this paper, we address a new problem of detecting overlapping community structures in the context of such an incomplete network, where communities in the network are allowed to overlap since nodes belong to multiple communities at once. To solve this problem, we introduce KroMFac, a new framework that conducts community detection via regularized nonnegative matrix factorization (NMF) based on the Kronecker graph model. Specifically, from an inferred Kronecker generative parameter matrix, we first estimate the missing part of the network. As our major contribution to the proposed framework, to improve community detection accuracy, we then characterize and select influential nodes (which tend to have high degrees) by ranking, and add them to the existing graph. Finally, we uncover the community structures by solving the regularized NMF-aided optimization problem in terms of maximizing the likelihood of the underlying graph. Furthermore, adopting normalized mutual information (NMI), we empirically show superiority of our KroMFac approach over two baseline schemes by using both synthetic and real-world networks.


翻译:社会网络中社区结构的发现引起了人们的极大注意,因为社会网络中发现社区结构是理解网络地形和功能的一个根本问题。然而,大多数社会网络数据都是从缺少节点和边缘的可部分观测网络中收集的。在本文件中,我们处理在这样一个不完整的网络中发现重叠社区结构的新问题,因为节点同时属于多个社区,因此网络中的社区可以重叠。为了解决这个问题,我们引入了KroMFac,这是一个新的框架,根据Kronecker图形模型,通过常规化的非负矩阵化因素化(NMF)进行社区检测。具体地说,从一个推断的Kronecker基因参数矩阵中,我们首先估计网络缺失的部分。作为我们对拟议框架的主要贡献,为了提高社区检测准确性,我们然后通过排名来描述和选择有影响力的节点(这些节点往往具有很高的度),然后将其添加到现有的图表中。最后,我们通过解决正规化的NMF的辅助优化优化问题,在最大程度上超越基本图的可能性来发现社区结构。此外,我们采用标准化的相互信息(NMIMI),我们通过合成世界的合成网络的实际优势,通过两个基本基线方案。

0
下载
关闭预览

相关内容

在网络中发现社区(称为社区检测/发现)是网络科学中的一个基本问题,在过去的几十年中引起了很多关注。 近年来,随着对大数据的大量研究,另一个相关但又不同的问题(称为社区搜索)旨在寻找包含查询节点的最有可能的社区,这已引起了学术界和工业界的广泛关注,它是社区检测问题的依赖查询的变体。
【图与几何深度学习】Graph and geometric deep learning,49页ppt
专知会员服务
64+阅读 · 2020年9月24日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
30+阅读 · 2020年4月15日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
19篇ICML2019论文摘录选读!
专知
28+阅读 · 2019年4月28日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
人工智能 | UAI 2019等国际会议信息4条
Call4Papers
6+阅读 · 2019年1月14日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【论文】图上的表示学习综述
机器学习研究会
12+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Deep Clustering based Fair Outlier Detection
Arxiv
0+阅读 · 2021年6月9日
Arxiv
8+阅读 · 2018年4月12日
Arxiv
4+阅读 · 2018年2月19日
VIP会员
相关资讯
19篇ICML2019论文摘录选读!
专知
28+阅读 · 2019年4月28日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
人工智能 | UAI 2019等国际会议信息4条
Call4Papers
6+阅读 · 2019年1月14日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【论文】图上的表示学习综述
机器学习研究会
12+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员