In a regression setting with response vector $\mathbf{y} \in \mathbb{R}^n$ and given regressors $\mathbf{x}_1,\ldots,\mathbf{x}_p \in \mathbb{R}^n$, a typical question is to what extent $\mathbf{y}$ is related to these regressors, specifically, how well can $\mathbf{y}$ be approximated by a linear combination of them. Classical methods for this question are based on statistical models for the conditional distribution of $\mathbf{y}$, given the regressors $\mathbf{x}_j$. In the present paper it is shown that various p-values resulting from this model-based approach have also a purely data-analytic, model-free interpretation. This finding is derived in a rather general context. In addition, we introduce equivalence regions, a reinterpretation of confidence regions in the model-free context.
翻译:在使用响应矢量 $mathbf{y} 的回归设置中, 典型的问题是, $\ mathbb{R ⁇ n$ 和给给的回归者 $\ mathbf{x{x}1\ldots,\ mathb{x}p\ in\ mathb{R ⁇ n$, 典型的问题是, 美元在多大程度上与这些回归者有关, 具体来说, $\ mathbf{y} 如何能被它们的线性组合相近。 这个问题的典型方法基于有条件分配$\ mathbf{x}$ 的统计模型模型。 鉴于递增者 $\ mathbf{x}} {\\\ j$ 。 本文显示, 以模型为基础的方法所产生的各种 p价值 也具有纯数据分析性、 模型解释。 这一发现是在相当笼统的背景下产生的。 此外, 我们引入等值区域, 在无模型背景下重新解释信任区 。