求助!用EXCEL做回归分析,不明白'F'和'Significance F'什么意思.


于 2004-03-20 09:40, cossin 写:

significant F 等于 P-value of F.

如果 选 95% 置信度. 那末, P-value (of F) 小于 5%(=0.05) 则否定null hypothesis( all coefficiencies are zero).



[ 编辑者 cossin 于日期 20Mar04 ]



这刚好也是我想问的问题呢.这么说,我如果解释了F就不需要再解释P VALUE咯?

还想问一下,T值有什么作用呢?

一般进行回归分析,哪几个要素是分析的重点呢?

1)T-ratio=coefficient/standard error,一般来说如果你计算得到的T-ratio的绝对值小于1.96,那么你就不能reject the null hypothesis。反之,reject null,说明你的得到的coefficient是significant的。



2)关于F-test。R不是residual而是restriction的数量,简单的说假设你的null hypothesis: a1=a2=a3=0,那么R=3。

另外,我猜你的degree of freedom应该不会那么小吧。d.f.=(number of observation)-(number of coefficient)。 看你回归几个变量k,那么number of coefficient就是k+1。这是因为intercept也要计算在内。




于 2004-03-20 20:46, michaelmas 写:

1)T-ratio=coefficient/standard error,一般来说如果你计算得到的T-ratio的绝对值小于1.96,那么你就不能reject the null hypothesis。反之,reject null,说明你的得到的coefficient是significant的。



2)关于F-test。R不是residual而是restriction的数量,简单的说假设你的null hypothesis: a1=a2=a3=0,那么R=3。

另外,我猜你的degree of freedom应该不会那么小吧。d.f.=(number of observation)-(number of coefficient)。 看你回归几个变量k,那么number of coefficient就是k+1。这是因为intercept也要计算在内。







那我是弄反了,我的number of observation=83, variables有4个,那我number of coefficient应该是5, d.f.=78. 那应该是F(4,78),是吗?

这样看来,从F 和F significance都说明要accept null hypothesis. 不过我的T statistics里4个variables,有3个variables的绝对值小于1.96,有一个是2.2224.这样又可以reject null hypothesis,怎么办?


于 2004-03-20 21:16, sesameoil 写:



于 2004-03-20 20:46, michaelmas 写:

1)T-ratio=coefficient/standard error,一般来说如果你计算得到的T-ratio的绝对值小于1.96,那么你就不能reject the null hypothesis。反之,reject null,说明你的得到的coefficient是significant的。



2)关于F-test。R不是residual而是restriction的数量,简单的说假设你的null hypothesis: a1=a2=a3=0,那么R=3。

另外,我猜你的degree of freedom应该不会那么小吧。d.f.=(number of observation)-(number of coefficient)。 看你回归几个变量k,那么number of coefficient就是k+1。这是因为intercept也要计算在内。









那我是弄反了,我的number of observation=83, variables有4个,那我number of coefficient应该是5, d.f.=78. 那应该是F(4,78),是吗?



这样看来,从F 和F significance都说明要accept null hypothesis. 不过我的T statistics里4个variables,有3个variables的绝对值小于1.96,有一个是2.2224.这样又可以reject null hypothesis,怎么办?



因为我不太了解你现在整个model的情况,F-test说起来比较麻烦,先说说T-ratio吧。

你得到的T-ratio只有一个是绝对值大于1.96,说明就只有这一个是significant的。不知道你现在在T-ratio后又没有P-value。P-value is the largest significant level at which we fail to reject the null。也就是说,选择5%,如果p-value大于0.05也不能说明coefficient是significant的。

如果你要用F-test,应该有至少两个equation,一个是restricted, 一个是unrestricted,分别计算residual sum of square,RRSS 和 URSS。然后观察restricted equation比unrestricted 少了几个variables,少了几个R就等于几(say,少了r个)。你现在的d.f.是78,那么总的来说,你应该用你计算出来的F-test的数值与F(r,78)进行比较。

建议你使用Eviews,跟Excel兼容,可以把xls文件读到Eviews里。回归出来的数据也比较规范。挺不错的。



试试这个链接吧,Eviews3.1,够用了。

http://medstatstar.myetang.com/log2000.htm


于 2004-03-20 21:40, michaelmas 写:

建议你使用Eviews,跟Excel兼容,可以把xls文件读到Eviews里。回归出来的数据也比较规范。挺不错的。



试试这个链接吧,Eviews3.1,够用了。

http://medstatstar.myetang.com/log2000.htm



谢谢,那我试试看.我T后面有P value, 除了var 3的P VALUE小于0.05外,其他3个variables的P VALUE都大于0.05


于 2004-03-20 21:40, michaelmas 写:

建议你使用Eviews,跟Excel兼容,可以把xls文件读到Eviews里。回归出来的数据也比较规范。挺不错的。



试试这个链接吧,Eviews3.1,够用了。

http://medstatstar.myetang.com/log2000.htm


你介绍的这个网页怎么用呢?好象都没链接…我找找其他地方有没下载好了

又重新把大家的意见消化了一次,我把我的方程先简单介绍一下:

我假设有4个变量会影响Y值,所以方程为

Y=B0+B1X1+B2X2+B3X3+B4X4

number of observation是83.



EXCEL算出F值为2.1205,我按照(RRSS-URSS)/R/URSS/d.f. 手算了一下,得出一样的答案.那我现在在书里查表,应该查什么呢?是不是F(0.05,4,78)?



如过不是,restricted equation和unrestricted equation有什么不同?

前者如果是所有系数为零,那方程仅仅为Y=B0;

后者至少一个不为零,那方程应该是怎样?还是我原来设的那样吗?



晕…




于 2004-03-21 03:04, sesameoil 写:

又重新把大家的意见消化了一次,我把我的方程先简单介绍一下:

我假设有4个变量会影响Y值,所以方程为

Y=B0+B1X1+B2X2+B3X3+B4X4

number of observation是83.



EXCEL算出F值为2.1205,我按照(RRSS-URSS)/R/URSS/d.f. 手算了一下,得出一样的答案.那我现在在书里查表,应该查什么呢?是不是F(0.05,4,78)?



如过不是,restricted equation和unrestricted equation有什么不同?

前者如果是所有系数为零,那方程仅仅为Y=B0;

后者至少一个不为零,那方程应该是怎样?还是我原来设的那样吗?



晕…





如果你把原方程变为y=b0,那么你的null hypothesis就是joint H0: b1=b2=b3=b4=0。不知道你的这样做的intuition是什么。但是如果是这种情况的话,应该查表F(4,78),然后比较。

同样的,如果你想test joint hypothesis H0: b1=b2=b3=b4=0,y=b0就是restricted equation (可以从上面的等式得到Residual sum of squares,就是RRSS),原等式就是unrestricted(从这里得到的residual sum of squares就是URSS)。然后按原来那个F-test的公式计算。

我觉得你如果不是相作joint hypothesis,不用F-test。T-statistics就可以了。


于 2004-03-21 05:49, michaelmas 写:



于 2004-03-21 03:04, sesameoil 写:

又重新把大家的意见消化了一次,我把我的方程先简单介绍一下:

我假设有4个变量会影响Y值,所以方程为

Y=B0+B1X1+B2X2+B3X3+B4X4

number of observation是83.



EXCEL算出F值为2.1205,我按照(RRSS-URSS)/R/URSS/d.f. 手算了一下,得出一样的答案.那我现在在书里查表,应该查什么呢?是不是F(0.05,4,78)?



如过不是,restricted equation和unrestricted equation有什么不同?

前者如果是所有系数为零,那方程仅仅为Y=B0;

后者至少一个不为零,那方程应该是怎样?还是我原来设的那样吗?



晕…







如果你把原方程变为y=b0,那么你的null hypothesis就是joint H0: b1=b2=b3=b4=0。不知道你的这样做的intuition是什么。但是如果是这种情况的话,应该查表F(4,78),然后比较。



同样的,如果你想test joint hypothesis H0: b1=b2=b3=b4=0,y=b0就是restricted equation (可以从上面的等式得到Residual sum of squares,就是RRSS),原等式就是unrestricted(从这里得到的residual sum of squares就是URSS)。然后按原来那个F-test的公式计算。



我觉得你如果不是相作joint hypothesis,不用F-test。T-statistics就可以了。



啊?是这样的吗?F是用来一个一个分析的吗?那岂不是可以有4个restricted equations?

[/quote]



啊?是这样的吗?F是用来一个一个分析的吗?那岂不是可以有4个restricted equations?

[/quote]



用F关键是看你的null hypothesis是不是joint hypothesis。你要是只想test单个的coefficient那么就用T-test吧。

好!多谢指教!!