典型相关
典型相关 : 设要作典型相关分析的一组指标(变量)有p个:X1,X2,…,Xp;另一组指标(变量)有q个:Y1,Y2,…,Yq。并设p≤q。据n个已知两组p+q个指标值的样品寻找典型相关(包括典型变量对和相应的典型相关系数)一般用标准化的指标。每对典型变量包含2个典型变量,分别是p个Xi′和q个Yi′的线性组合,理论上可求p对(若q≤p则为q对)典型变量:
Uj和Vj称第j对典型变量。(ai′)(j)和(bi′)(j)为第j对典型变量的Xi′和Yi′的系数(标准化系数),可称为Xi′和Yi′的权。Uj和Vj的相关系数叫做典型相关系数,其样本典型相关系数用rj表示,称第j(个)典型相关系数,有:1≥r1≥r2≥…≥rp>0。也可得出用原p个Xi和q个Yi表示的典型变量对:
每个Uj、Vj的均数为0、方差为1。若p个Xi和q个Yi联合服从多元正态分布,则可由样本典型相关系数rj(j= 1,2,…,p)推断总体典型相关系数ρj(j=1,2,…,p)是否等于0,为此作总体典型相关系数的假设检验,即样本典型相关系数的显著性检验。理论上可取样本典型相关系数显著的前面k(k≤p)对典型变量。其含义是:提取两组指标之间的相关信息按从多到少,依次为(U1,V1),(U2,V2),…,(Uk,Vk),这已把两组指标之间所存在的全部相关信息予以分解并提取出来了。若(U1,V1)的r1不显著,则推断ρ1=0,即两组指标彼此独立,不能取典型变量对。在实际应用中究竟取样本典型相关系数显著的前面几对典型变量,还要结合各典型变量对的实际解释而定。典型变量UJ主要被|(bj′)(j)|大的1个或几个原X组指标所解释;典型变量Vj主要被|(bj′)(j)|大的1个或几个原Y组指标所解释。往往在实际应用时,只取第一对典型变量。这是由于两组指标所包含的主要相关信息,用第一典型相关系数常可足以表达,对第一对典型变量容易给于实际解释,而对余下的典型变量对给于实际解释往往要困难得多。