多变量和主成分分析

多变量数据的统计

   在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。在数据处理时,如果只有一个反应变量但有多个解释变量,有时也称为多变量数据。

   数据分析时,主要用到以下方法:

  • 标准相关分析

  • 方差分析 - ANOVA

  • 回归分析

  • 逻辑回归分析(二类评定回归分析,Logit模型)

  • 判别分析 - Discriminant Analysis

  • 线性判别分析 Linear Structure Relation, LISREL

  • 因子分析(主成分分析)- Factor Analysis

  • 聚类分析 - Cluster Analysis

  • 联合分析

  • 多维标度(多维尺度)

  • 离散选择法


多变量数据-主成分分析


反应量的surface plot


主成分分析

       主成分分析(Principal Component Analysis,PCA)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。


PCA分析


PCA分析碎石图


PCA分析3D散点图