We introduce a divergence measure between data distributions based on operators in reproducing kernel Hilbert spaces defined by infinitely divisible kernels. The empirical estimator of the divergence is computed using the eigenvalues of positive definite matrices that are obtained by evaluating the kernel over pairs of samples. The new measure shares similar properties to Jensen-Shannon divergence. Convergence of the proposed estimators follows from concentration results based on the difference between the ordered spectrum of the Gram matrices and the integral operators associated with the population quantities. The proposed measure of divergence avoids the estimation of the probability distribution underlying the data. Numerical experiments involving comparing distributions and applications to sampling unbalanced data for classification show that the proposed divergence can achieve state of the art results.


翻译:我们采用了基于复制内核Hilbert空间的操作者的数据分布差异的测量方法,这些操作者以无限分散的内核为定义的内核空间进行复制。这种差异的实证估测标准是使用通过对样品的对等内核进行评估而获得的正确定矩阵的精度值来计算的。新测量方法与Jensen-Shannon差异具有相似的特性。提议的估算方法的趋同根据基于Gram矩阵定序频谱和与人口数量相关的整体操作者之间差异的浓度结果得出的。拟议的差异计量方法避免了对数据背后的概率分布的估算。涉及比较分布和应用对不平衡数据取样以进行分类的数值实验表明,拟议的差异可以达到艺术结果的状态。

0
下载
关闭预览

相关内容

专知会员服务
45+阅读 · 2020年12月18日
专知会员服务
54+阅读 · 2020年9月7日
【新书】Python编程基础,669页pdf
专知会员服务
197+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
0+阅读 · 2022年2月22日
VIP会员
相关VIP内容
专知会员服务
45+阅读 · 2020年12月18日
专知会员服务
54+阅读 · 2020年9月7日
【新书】Python编程基础,669页pdf
专知会员服务
197+阅读 · 2019年10月10日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员