二值回归判别法
二值回归判别法 : 计量资料的两类判别方法。据训练样本资料(n1个第一类样品和n2个第二类样品的m个判别指标的观测数据)拟合回归判别方程,训练样品的应变量据所属二个类别取二个值,即应变量为指示变量Yg(g=1,2)。一般令Y1=n2/(n1+n2),Y2=-n1/(n1+n2),这可使得训练样本的Y=0,计算简单。用拟合多元线性回归方程的最小二乘法求回归系数bi(i=1,2,…,m)(不必求常数项),得二值回归判别方程为:
Z=b1X1+b2X2+…+bmXm
两类分界值一般用两个样本Z均数的平均,即c=(1+2)/2。判别新样品所属类别时,把该新样品观测得的判别指标X1,X2,…,Xm的值代入回归判别方程,算得Z值,Z≥c判别属第一类,Z<c判别属第二类。Z相当于m个判别指标Xi加权的综合判别指标,回归判别系数bi为判别指标Xi的权,反映Xi对判别分类作用的方向和大小。bi>0,Xi增加,Z增加,表示大的Xi值倾向于是第一类;bi<0,Xi减小,Z增加,表示小的Xi值倾向于是第一类。Xi变化1个单位,Z变化bi个单位。二值回归判别方程对两类判别效果的检验,用多元线性回归方程的方差分析(F检验)。如果需要,还可用变量选择(最优子集回归法或逐步回归法)来拟合最优或较理想的二值回归判别方程。二值回归判别不但在理论上把两类判别分析和回归分析相互沟通,还在实际应用上使两类判别分析可利用回归分析程序上计算机运算。