多元线性回归分析
多元线性回归分析 : 作出以自变量(原因因素)估计应变量(结果因素)的多元线性回归方程。应变量和自变量都是定量指标,如果原因因素中有少数定性指标和(或)等级指标要转换成定量指标。设自变量为X1,X2,…,Xm,应变量为Y,则样本的多元线性回归方程的一般形式为:
=a+b1Z1+b2Z2+…+bpZp
Zj(j=1,2,…,p)是X1,X2,…,Xm的任意函数,函数中包含Xi的个数为1~m。线性是指总体回归方程对参数(α,β1,β2,…,βp)是线性的,因此样本回归方程对总体参数的估计(a,b1,b2,…,bp)也是线性的。多元线性回归方程中最简单的是多元1阶线性回归方程。=a+b1X1+b2X2+…+bmXm
通常指的多元线性回归方程为多元1阶线性回归方程。为各Xi取值处Y总体均数的估计值,a为常数项,bi为应变量对自变量Xi(i=1,2,…,m)的偏回归系数。多元线性回归方程当m=2时,为3维空间坐标上的一个平面,当m>2时,则想象为m+1维空间坐标上的一个超平面。多元1阶线性回归方程是多元线性回归的最基本形式,可用以解决所有一般多元线性回归问题,只要令Zj=Xi即可。由n个样品的m个自变量和1个应变量的观测数据拟合多元线性回归方程采用最小二乘法。拟合多元回归方程(包括线性和非线性)的用途是由自变量解释(可称为解释变量)和预报(可称为预报变量)应变量,这在医学科研中有广泛的用途,主要有:①确定每个自变量和应变量的数量关系。②由于引入一些自变量能缩减应变量的变差,因此能比较精密地估计不同Xi值的Y的正常值范围。③由较易测得的各Xi来推算较难测得的Y。如根据人的身高、体重等指标来推算体表面积。④由已发生的各Xi来预测将发生的Y。如小孩成人后的身高预报、恶性肿瘤患者的存活期预报、高血压患者治疗后的血压值预报。⑤由已知的各Xi来回顾推断不知的过去的Y。如法医鉴定受害者的死亡时间。