This work is motivated by the study of local protein structure, which is defined by two variable dihedral angles that take values from probability distributions on the flat torus. Our goal is to provide the space $\mathcal{P}(\mathbb{R}^2/\mathbb{Z}^2)$ with a metric that quantifies local structural modifications due to changes in the protein sequence, and to define associated two-sample goodness-of-fit testing approaches. Due to its adaptability to the space geometry, we focus on the Wasserstein distance as a metric between distributions. We extend existing results of the theory of Optimal Transport to the $d$-dimensional flat torus $\mathbb{T}^d=\mathbb{R}^d/\mathbb{Z}^d$, in particular a Central Limit Theorem. Moreover, we assess different techniques for two-sample goodness-of-fit testing for the two-dimensional case, based on the Wasserstein distance. We provide an implentation of these approaches in R. Their performance is illustrated by numerical experiments on synthetic data and protein structure data.


翻译:这项工作的动因是当地蛋白结构研究,该研究由两个不同角度界定,其值取自平面的概率分布。我们的目标是为空间提供 $mathbb{R ⁇ 2/mathbb ⁇ 2}P}(\\mathb{R\\\\\mathb ⁇ 2}),该标准可以量化因蛋白序列变化而导致的地方结构变化,并界定相关的两样优美测试方法。由于它适应空间几何学,我们侧重于瓦西斯坦距离,作为分布之间的一个度量度。我们将最佳运输理论的现有结果推广到美元-维平面的 $\\mathb{T ⁇ d ⁇ mathb{R ⁇ d/\\mathbb ⁇ d ⁇ d$, 特别是一个中央限值理论。此外,我们根据瓦西斯坦距离,我们评估了两维测试的两种模美性测试方法的不同技术。我们在R中提供了这些方法的精度。通过合成数据和蛋白结构的数值实验来说明其性。

0
下载
关闭预览

相关内容

专知会员服务
41+阅读 · 2021年4月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
专知会员服务
52+阅读 · 2020年9月7日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Science 一周论文导读 | 2018 年 11 月 16 日
科研圈
7+阅读 · 2018年11月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年9月30日
Arxiv
5+阅读 · 2019年6月5日
VIP会员
Top
微信扫码咨询专知VIP会员