系统聚类图-统计

系统聚类图(hierarchy diagram),指一种以树状形式,呈现所有样本之间的相似性和聚类结构的图,图的纵轴表示聚类的相似性度量,横轴表示样本。

无限总体-统计

无限总体(infinite population),是研究对象的数量不受限制,或在时间、空间、人群范围上无限制,难以准确计数全部单位的总体,通常用 于理论分析或假设场景。

抽样误差-统计

抽样误差(sampling error),指由于个体之间存在变异导致的样本统计量与总体参数之间的差异,随样本量增大而减小,反映样本代表性的不确定性。

强影响点-统计

强影响点(influential point),指回归分析中对模型参数估计或预测结果具有显著影响的观测点,其存在可能大幅改变回归线的斜率、截距或拟合优度。这类点通常兼具高杠杆值(自变量 X极端)和异常残差(因变量Y 偏离预测)特征,可通过库克距离、DFFITS 或 DFBETAS 等指标量化其影响程度。 ...

序列相关-统计

序列相关(serial correlation),指时间序列中不同时间点之间的观测值的相关性。

格莱泽检验-统计

格莱泽检验(Glejser's test),又称“Glejser 检验”,指一种用于检验回归模型中异方差性(heteroscedasticity)的统计方法,使用残差与自变量做回归,以判断误差项的方差是否与自变量存在相关性。

怀特检验-统计

怀特检验(White's test),又称“White 检验”,指通过对模型残差的平方与自变量进行回归来检验异方差是否存在及检测自变量是否能够显著地解释残差方差变化的统计检验方法。

对数单位变换-统计

对数单位变换(logit transformation),又称“logit 变换”,指一种常用的数据转换方法,将一个取值范围在 0 到 1 之间的概率值,通过逻辑函数转换为取值范围为负无穷大到正无穷大的实数值。

泊松回归-统计

泊松回归(Poisson regression),又称“Poisson 回归”,指因变量服从泊松离散分布的一种回归模型,可用来分析计数资料的离散分布规律。

起始事件-统计

起始事件(initial event),指在研究中,某个感兴趣的研究事件的开始,例如某健康事件的发病时间,第一次确诊时间,或接受正规治疗的时间等。

删失数据-统计

删失数据(censored data),指由于研究终止、失访或事件未发生,在观察期内未能获得研究对象事件发生时间的数据。分为右删失、左删失和区间删失,需采用特殊统计方法处理,如卡普兰-迈耶(Kaplan-Meier)估计。

类平均法-统计

类平均法(average linkage),指以两个聚类各自的中心点(同一类中所有样本点的均值)之间的距离来进行聚类的方法。

快速聚类-统计

快速聚类(quick cluster),指采用近似计算、降维、采样、初始化优化等策略使得在更短时间内完成聚类分析的一类聚类算法。

方差膨胀因子-统计

方差膨胀因子(variance inflation factor, VIF),指评估回归模型中多重共线性的指标,通过计算某个自变量可被其他自变量解释的程度,量化多重共线性对回归系数估计的影响。

安德鲁-普雷吉邦统计量-统计

安德鲁-普雷吉邦统计量(Andrew-Pregibon statistic),又称“Andrew-Pregibon 统计量”,指用于识别对回归模型结果产生较大影响的观测值,通过检测剔除某个观测值后对模型参数估计的影响来评估该观测值对模型结果的影响程度。

方差加权模型-统计

方差加权模型(variance-weighted model),指通过对观测数据进行方差加权,以提高模型预测精度和稳健性的统计方法。分配较高权重给方差较小的观测值,减少噪声对模型的影响。常用于加权最小二乘法和组合预测,适用于异方差性或数据质量不一致的情境,增强模型对不确定性和异常值的抵抗力。 ...

列线图-统计

列线图(nomogram),将多个预测因素整合为一个可视化图形的工具,通常由多条带有刻度的线条组成,可用于直观地展示各因素对结果的影响程度,并通过简单计算预测特定事件发生的概率或风险。

留出法-统计

留出法(holdout method),指一种简单的模型评估方法。将数据集随机分为互斥的两部分,大部分用于训练模型,小部分用于测试模型性能。通常训练集占70-80%,测试集占 20-30%。实现简单,计算成本低,但评估结果可能受数据划分影响较大。 ...

生存时间-统计

生存时间(survival time),又称“失效时间(failure time)”,广义指从规定的观察起点到某一特定终点事件出现的时间长度,狭义指研究对象在死亡前所经历的时间。

疾病进展时间-统计

疾病进展时间(time-to-progression),指研究对象从观察起点(如随机化分组)至终点事件(如疾病)进展恶化所经历的时间,该时间只包含了该研究事件的恶化期。
12345678910... 46下一页