广告招募

JTG 3441—2024公路工程无机结合料稳定材料试验规程—附录B 一元线性回归分析

2025年12月15日 08:54:07      来源:沧州泰鼎恒业试验仪器有限公司 >> 进入该公司展台      阅读量:0

分享:

附录B    一元线性回归分析

  

1 一元线性回归方程

假设两个变量x与y之间线性相关,现由试验获得x和y 的一组样本数据(xi,yi),它们之间的线性关系如下:

yi=a+bxi+εi             (i=1,2,……,n,n>2)                   (B-1)

式中,ab为待定的估计量;εi为独立、等权的正态偶然误差N(0,σ²); xi为普通自变量,如有随机性,则归入 εi之中。


为求得a b,用线性最小二乘法,即令

   19.6.png   (B-2)

其正则方程组为:

         19.7.png

          

 19.8.png  (B-3)

正则方程组可改写为:

 19.9.png

 

求得

 19.10.png                          (B-4)


由此获得方程

                                                     19.11.png     (B-5)    

称为上述样本(xi,yi) 的一元线性回归方程,b称为回归系数。在笛卡尔座标系中,上式表示的是一条通过重心(19.12.png) 的回归直线。b>0, 表明y x 有线性增大的趋势;b<0,表明y x有线性减小的趋势。

2 线性回归效果检验

对任意一组样本数据,形式上都可按最小二乘法拟合出一条回归直线。显然,线性拟合的效果会有显著与不显著之分。以下,介绍用方差分析的方法来检验它。

测量值y,y,…,yn,之间的差异,是有两个方面的原因引起的:一是自变量x 取值的不同;二是测量误差等其他因素的影响。为了对(xi,yi)线性回归的效果进行检验,必须将上述两原因造成的结果分解出来。如图B-1所示,将变量y n 个测值yi 与其平均值19.13.png的偏离(yi-19.13.png)  分解为由变量x 的不同取值引起的回归偏离(19.33.png) 和由测量误差等其他因素造成的剩余偏离(19.14.png)。并进一步用n个取值的偏离平方和来描述它们,分别记ΣΣΣ


 19.15.png

B-1  一元线性回归直线方差分析

 

      19.16.png     (B-6)

                        

叫总偏离平方和。因为

19.17.png 

可以证明,以上交叉项为零。

因此有

Σ=Σ+Σ

这样就把总偏离平方和Σ,分解为回归平方和Σ及剩余平方和Σ两部分。回归平方和Σ反映了在y 总的偏离中因x y 的线性关系而引起y 变化的大小。剩余平方和Σ反映了在y 总的偏离中除了x y 线性影响之外的其他因素而引起y 变化的大小。 这些其他因素包括测量误差x y不能用直线关系描述的因素以及其他未加控制的因素等。由式(B-2) 可知,回归分析的要求就是应使剩余平方和最小。即Σ愈小,回归效果愈好。

由式(B-4)与式(B-5),可将Σ写成

19.png(B-7)

Σ=Σ-Σ                        (B-8)    

由回归平方和及剩余平方和的意义可知,一个线性回归方程是否显著,取决于ΣΣ的大小。若Σ愈大而Σ小,则说明y与x 线性关系愈密切。回归方程显著的验,通常采用F 检验法。这里,需要构造统计量

19.18.png       (B-9)

式中,v为回归平方和的自由度;v为剩余平方和的自由度。在假定剩余偏离εi从独立、等权正态随机误差分布的前提下,F是服从F(vv)分布的。

自由度是指独立观测值的个数。因Σn个观测值yi受平均值19.13.png的约束,这就等于有一个测值不是独立的,即失去一个自由度,余下自由度v=n-1 中只有b立变化的,即自由度v=1。因此,自由度v=v-v=n-2

将自由度代回式(B-9)有

 

19.19.png    (B-10)

在给定显著性水平a下,查F分布的临界值Fa(1,n-2)  将计算值F Fa(1,n-2)

比较,若

F>Fa(1,n-2) 则认为该回归;反之,则不显著。

通常认为在a=0.01水平上显著,即

 

F>F0.01(1,n-2)

是回归高度显著;

α=0.05水平上显著,即

F0.05(1,n-2)≤F≤F0.01(1,n-2)

是回归显著;

α=0.10水平上显著,即

F0.10(1,n-2)≤F≤F0.05(1,n-2)

是在0.1水平上显著。 (B-10)的分母

 19.20.png

为剩余方差,于是得剩余标准差

19.21.png(B-11)

它的意义是表征除了x y线性关系之外其他因素影响y值偏离得大小。

线性回归效果的检验,可归纳为如下方差分析表,根据该表按照如下步骤进行检验:


(1)依序计算统计量:

Σ= lyy

Σ= blxy

Σ= Σ-Σ

 

B-1   方差分析表

 

偏离

平方和

自由度

标准偏差

统计量F

置信限Fa(1,n-2)

a=0.0

α=0.05

α=0.1

回归

Σ= blxy

1

19.26.png

剩余

Σ= Σ

 

n-2

19.23.png

总和

Σ= lyy

n-1



显著否

显著否

显著否

(2)按一定显著水平α和自由度n-2  F 分布表,得到Fa(1,n-2)    的数值,比较计量FFa(1,n-2)的大小,作出判断结论。

3  回归预测区间

在某个非试验点x=x0处,按回归方程y=a+bx 求得回归值19.27.png,需要预报19.27.png。偏离实际值y0有多大。这是要解决一个回归预测的精度问题。

这里,为讨论方便,仍假设测量值y及回归值19.28.png 均服从正态分布。可构造一个服从t 分布的统计量

                     19.29.png             (B-12)

在给定的置信水平p下,有如下的预测区间

                                19.30.png      (B-13)

式中

                                        19.31.png     (B-14)

λ可查t 分布临界值获得。

(B-13) (B-14) 表明,用回归方程预测的偏差△除与pnS 有关外,还与观测x  有关。当x 靠近x, △小;当x 远离x 时,△就大。特别当x  x 附近,n 又足够大时,可简 化得y 的预测区间

                         19.32.png       (B-15)

λ可查t 分布临界值获得。

 

版权与免责声明:
1.凡本网注明"来源:全球供应商网"的所有作品,版权均属于全球供应商网,转载请必须注明全球供应商网。违反者本网将追究相关法律责任。
2.企业发布的公司新闻、技术文章、资料下载等内容,如涉及侵权、违规遭投诉的,一律由发布企业自行承担责任,本网有权删除内容并追溯责任。
3.本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。 4.如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。