In this paper, we present a linear-time approximation scheme for $k$-means clustering of \emph{incomplete} data points in $d$-dimensional Euclidean space. An \emph{incomplete} data point with $\Delta>0$ unspecified entries is represented as an axis-parallel affine subspaces of dimension $\Delta$. The distance between two incomplete data points is defined as the Euclidean distance between two closest points in the axis-parallel affine subspaces corresponding to the data points. We present an algorithm for $k$-means clustering of axis-parallel affine subspaces of dimension $\Delta$ that yields an $(1+\epsilon)$-approximate solution in $O(nd)$ time. The constants hidden behind $O(\cdot)$ depend only on $\Delta, \epsilon$ and $k$. This improves the $O(n^2 d)$-time algorithm by Eiben et al.[SODA'21] by a factor of $n$.


翻译:在本文中,我们为 emph{infrepty} 数据点组合提供了一种直线时间近似方案, 单位为 emme- euclidean 空间。 以 $\ Delta> 0 美元表示的 emph{infript} 数据点组合值为 $k$ 的线性时间近似方案。 以 $= Delta > 0 美元表示的未指明的条目数据点为 。 两个不完整的数据点之间的距离被定义为 轴- 平方圆子空间中两个最接近点之间与数据点相对的 ELLuclide 距离 。 我们为 以 $\ =2 d 美元表示的轴- parallele 亚空间中值组合值为 $\ Delta$ 的算出 $(1 ⁇ epelon) $- papposi 溶度为 $(n) $. S'n a asben a.

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
fastlane 入门使用
CocoaChina
4+阅读 · 2019年4月23日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
14+阅读 · 2019年4月13日
t-SNE:最好的降维方法之一
人工智能前沿讲习班
25+阅读 · 2019年2月24日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
Arxiv
0+阅读 · 2021年8月25日
VIP会员
相关VIP内容
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
fastlane 入门使用
CocoaChina
4+阅读 · 2019年4月23日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
14+阅读 · 2019年4月13日
t-SNE:最好的降维方法之一
人工智能前沿讲习班
25+阅读 · 2019年2月24日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
Top
微信扫码咨询专知VIP会员