무한대 - 세번째

Population 2008년 09월 23일 22시

고민 좀 했는지 모르겠다.
아무튼...

05

모형 ②와 ④는 (추정된 회귀계수는 다르지만) 결과적으로 같다.

모형 ①은 독립변수간에 상관계수가 높다. 즉 다중공선성 발생이 의심된다.
그리고 그리 탐탁치 않은 모형이다.
차수를 증가시키면 결정계수 또한 커지나 모형이 얘기하고자하는 핵심이 사라진다.
(모수 절약의 원칙이 괜히 있는게 아니다.)

어쨌든...

06

그래프만 봤을 때, 모형은 ①과 ③이 좀더 원자료에 근접한 것으로 보인다.
(결정계수가 이미 이를 알려줬다.)

그런데 만약 주어진 독립변수의 범위를 벗어난다면 종속변수의 추정치는 어떻게 될까?

07

모형 모두 결정계수가 0.9를 훨씬 상회하지만, 주어진 독립변수의 범위를 벗어난 경우에는
모형 마다 방향이 서로 다른, 한마디로 지 갈 길을 서로 가고 있다.

그리고 회귀분석 결과를 이용할 때, 나부터도 지나치는 경향이 있는데...
추정된 결과의 신뢰(?)는 주어진 독립변수의 범위 내에 한정한다. 
이는 주어진 독립변수의 범위를 벗어난 종속변수의 추정시
신뢰구간의 폭이 더욱 넓어지기 때문이다.

이를 모형 ①에 대해서만 살펴보면 추정치의 신뢰구간은 아래 처럼 나타나게 된다.

08

이렇듯 미지의 값을 추정할 때, 모형 및 사용되는 독립변수의 범위에 대해서도
고민 많이 해야한다.

트랙백 주소 :: http://instatistics.officetutor.org/trackback/1070

댓글을 달아 주세요