k 均值聚类(k-means clustering),指一种聚类的方法,首先指定需要划分类的个数,然后按照某种原则选择原始数据中根据预先指定分类个数的样本作为初始凝聚点;基于样本间距离,对除初始凝聚点外的所有样本进行逐个归类,将每个样本归入离初始凝聚点最近的那个类中,该类新的凝聚点更新为该类的均值。重复上述过程,直至所 ...
指数族分布(exponential family of distributions),指一类重要的概率分布集合,概率密度函数可表示为指数形式,具有统一的数学结构,通过自然参数、充分统计量和规范化函数描述,包括正态分布、泊松分布、二项分布等。广泛应用于广义线性模型、统计力学等领域。具有共轭先验、充分统计量等良好性质,便于理论分析与计算 ...
交叉设计的方差分析(analysis of variance for crossover design),指用于分析交叉试验数据的统计方法。在该设计中,受试者按特定顺序接受不同处理,通过比较阶段、处理和个体差异的变异,评估处理效应及残留效应。其优势在于控制个体变异,提高检验效能,广泛应用于医学、心理学等领域的干预研究,但需满足无携带效应和 ...