正态性-统计

正态性(normality),指描述数据分布是否符合正态分布特征的统计属性。通过偏度、峰度和正态概率图等方法进行检验。适用于多种统计分析,确保模型假设的有效性。提供数据分布形态的评估依据,确保后续分析的可靠性。

标准化残差-统计

标准化残差(standardized residual),指残差除以其标准差所得到的值。

交叉验证-统计

交叉验证(cross validation),指一种评估模型泛化能力的统计方法。将数据集分为训练集和验证集,多次重复训练与验证过程,计算平均性能指标。常见形式包括 k 折、留一法等。有效防止过拟合,广泛应用于机器学习、数据挖掘等领域,为模型选择与参数调优提供可靠依据。 ...

留一法交叉验证-统计

留一法交叉验证(leave-one-out cross validation),指一种模型验证的方法,每次从包含n 个样本的数据集中留出1 个样本作为测试集,其余 n-1 个样本作为训练集,重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性,但因需训练n 次模型,计算成本较高,适用于小样本场景。 ...

外部验证-统计

外部验证(external validation),指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现,客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较,结果更具说服力,但需要额外收集数据。 ...

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...

尺度皮尔逊卡方-统计

尺度皮尔逊卡方(scaled Pearson chi-square),指由数学家卡尔·皮尔逊提出,基于标准误校正的卡方统计量,反映模型的拟合离散度。

尺度偏移量-统计

尺度偏移量(scaled deviance),指基于标准误校正的残差偏移量,反映模型的拟合离散度。

布雷斯洛检验-统计

布雷斯洛检验(Breslow test),又称“Breslow 检验”,指一种单因素方法,用于不同组生存曲线的比较,对近期差异敏感。

重心距离法-统计

重心距离法(centroid neighbor),指以两个聚类的各自的重心之间的距离来进行聚类的方法。

树状图-统计

树状图(tree diagram),表示集群(包括单个样本)间内在联系与差异的一种结构图,其中“分枝”表示较小集群,“根”表示较大集群。用于指导在聚类过程中相似性水平的选取。

k 均值聚类-统计

k 均值聚类(k-means clustering),指一种聚类的方法,首先指定需要划分类的个数,然后按照某种原则选择原始数据中根据预先指定分类个数的样本作为初始凝聚点;基于样本间距离,对除初始凝聚点外的所有样本进行逐个归类,将每个样本归入离初始凝聚点最近的那个类中,该类新的凝聚点更新为该类的均值。重复上述过程,直至所 ...

泛化性-统计

泛化性(generalizability),指机器学习模型在面对未见过的数据时的性能表现。

指数族分布-统计

指数族分布(exponential family of distributions),指一类重要的概率分布集合,概率密度函数可表示为指数形式,具有统一的数学结构,通过自然参数、充分统计量和规范化函数描述,包括正态分布、泊松分布、二项分布等。广泛应用于广义线性模型、统计力学等领域。具有共轭先验、充分统计量等良好性质,便于理论分析与计算 ...

累积逻辑斯谛回归模型-统计

累积逻辑斯谛回归模型(cumulative logistic regression model),又称“累积logistic 回归模型”,指因变量服从多项逻辑分布,且具有符合自然规律的多个有序类别的一类回归模型,对不同分类类别拟合的模型系数有平行斜率的假定。

发病率比值-统计

发病率比值(incident rate ratio),指不同组别发生某疾病概率的比值。

无进展生存时间-统计

无进展生存时间(progression-free survival),又称“无进展生存期”,指从观察起点(如随机化分组)到研究事件(如疾病)进展或终点事件发生(如因病死亡)所经历的时间,包含了疾病恶化期的概念,可用于评估一些治疗的临床效益。 ...

交叉设计的方差分析-统计

交叉设计的方差分析(analysis of variance for crossover design),指用于分析交叉试验数据的统计方法。在该设计中,受试者按特定顺序接受不同处理,通过比较阶段、处理和个体差异的变异,评估处理效应及残留效应。其优势在于控制个体变异,提高检验效能,广泛应用于医学、心理学等领域的干预研究,但需满足无携带效应和 ...

有活力期望寿命-统计

有活力期望寿命(active life expectancy, ALE),指基于日常生活能力量表评分测算的人群期望寿命。

中间距离法-统计

中间距离法(intermediate neighbor),指以两类中所有样本点之间距离的平均值来进行聚类的方法。
12345678910... 46下一页