We study extensions of the classic \emph{Line Cover} problem, which asks whether a set of $n$ points in the plane can be covered using $k$ lines. Line Cover is known to be NP-hard, and we focus on two natural generalizations. The first is \textbf{Line Clustering}, where the goal is to find $k$ lines minimizing the sum of squared distances from the input points to their nearest line. The second is \textbf{Hyperplane Cover}, which asks whether $n$ points in $\mathbb{R}^d$ can be covered by $k$ hyperplanes. We also study the more general \textbf{Projective Clustering} problem, which unifies both settings and has applications in machine learning, data analysis, and computational geometry. In this problem, one seeks $k$ affine subspaces of dimension $r$ that minimize the sum of squared distances from the given points in $\mathbb{R}^d$ to the nearest subspace. Our results reveal notable differences in the parameterized complexity of these problems. While Line Cover is fixed-parameter tractable when parameterized by $k$, we show that Line Clustering is W[1]-hard with respect to $k$ and does not admit an algorithm with running time $n^{o(k)}$ unless the Exponential Time Hypothesis fails. Hyperplane Cover is NP-hard even for $d=2$, and prior work of Langerman and Morin [Discrete & Computational Geometry, 2005] showed that it is fixed-parameter tractable when parameterized by both $k$ and $d$. We complement this by proving that Hyperplane Cover is W[2]-hard when parameterized by $k$ alone. Finally, we present an algorithm for Projective Clustering running in $n^{O(dk(r+1))}$ time. This bound matches our lower bound for Line Clustering and generalizes the classic algorithm for $k$-Means Clustering ($r=0$) by Inaba, Katoh, and Imai [SoCG 1994].


翻译:我们研究经典\emph{直线覆盖}问题的扩展,该问题询问平面上的$n$个点是否能够被$k$条直线覆盖。已知直线覆盖问题是NP困难的,我们重点关注两个自然推广。第一个是\textbf{直线聚类},其目标是找到$k$条直线,最小化输入点到其最近直线的距离平方和。第二个是\textbf{超平面覆盖},询问$\mathbb{R}^d$中的$n$个点是否能够被$k$个超平面覆盖。我们还研究了更一般的\textbf{投影聚类}问题,该问题统一了上述两种设定,并在机器学习、数据分析和计算几何中有应用。在此问题中,需要寻找$k$个维度为$r$的仿射子空间,以最小化$\mathbb{R}^d$中给定点到最近子空间的距离平方和。我们的结果揭示了这些问题在参数化复杂度方面的显著差异。虽然直线覆盖在参数$k$下是固定参数可处理的,但我们证明直线聚类对于参数$k$是W[1]困难的,并且除非指数时间假设不成立,否则不存在运行时间为$n^{o(k)}$的算法。超平面覆盖即使在$d=2$时也是NP困难的,Langerman和Morin的先前工作[Discrete & Computational Geometry, 2005]表明其在参数$k$和$d$共同作用下是固定参数可处理的。我们通过证明超平面覆盖在仅参数$k$下是W[2]困难的来补充这一结论。最后,我们提出了一种用于投影聚类的算法,其运行时间为$n^{O(dk(r+1))}$。该界限与我们针对直线聚类的下界相匹配,并推广了Inaba、Katoh和Imai [SoCG 1994]针对$k$均值聚类($r=0$)的经典算法。

0
下载
关闭预览

相关内容

【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
20+阅读 · 2021年11月7日
专知会员服务
20+阅读 · 2021年9月12日
专知会员服务
82+阅读 · 2021年5月10日
专知会员服务
42+阅读 · 2021年4月2日
专知会员服务
29+阅读 · 2020年10月2日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
20+阅读 · 2021年11月7日
专知会员服务
20+阅读 · 2021年9月12日
专知会员服务
82+阅读 · 2021年5月10日
专知会员服务
42+阅读 · 2021年4月2日
专知会员服务
29+阅读 · 2020年10月2日
相关资讯
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
【NeurIPS2019】图变换网络:Graph Transformer Network
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员