고객센터









customer center. 월~금 : 09:00~17:00, 상담가능시간 : 09~17시 (토요일,일요일,공휴일은 휴무입니다)

입금계좌안내. 우리은행, 예금주(에스에스에이씨스탯), 계좌번호(000-00-00000)


요청하신후 문자메세지를 보내
주시면 좀더 빨리 처리됩니다.
(010-3920-3596)

home 고객센터 > BLOG

공지사항. 우리회사의 새로운 정보와 다양한 소식을 전해 드립니다.

조회수 239
제목 최량 부분집합 회귀 분석 - 통계량 해석(R-sq)
등록일 2018-02-27
 


 
 
R2값은 모형에 의해 설명되는 반응 내 변동의 백분율이다.
이 값은 1-오차 제곱합(모형에 의해 설명되지 않는 변동) 대 총 제곱합(모형 내 총 변동)의 비율이다.

모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 R2값을 사용한다. 
R2값이 클수록 모형이 데이터를 더 잘 적합시키며 R2값은 항상 0%에서 100% 사이값이다.
적합선 그림을 사용하여 여러 R2값을 그래픽으로 표시할 수 있다.
 
 



위 그림은 반응에 있는 변동의 85.5%를 설명하는 단순 회귀 모형을 나타낸다.
 
 



또한, 위 그림은 반응에 있는 변동의 22.6%를 설명하는 모형을 나타낸다.
모형에서 설명하는 변동이 많을수록 데이터 점이 적합 회귀선에 더 가깝다.
이론적으로 모형이 변동의 100%를 설명할 수 있는 경우 적합치는 항상 관측치와 같으며
모든 데이터 점이 적합 회귀선에 가깝게 된다. 그러나 R2값이 100%이더라도 모형이 반드시
새 관측치를 잘 예측하는 것은 아니다.
 
 


 

R2값을 해석하는 경우 다음과 같은 문제를 고려하자.
 
   • 모형에 예측 변수를 추가하면 R2은 항상 증가한다. 예를 들어, 최량 예측 변수가 5개인 모형은
     최량 예측 변수가 4개인 모형보다 항상 R2값이 크다. 따라서 R2값은 같은 크기의 모형을
     비교할 때 가장 유용하다.
   • 작은 표본은 반응과 예측 변수 간 관계의 강도에 대한 정확한 추정치를 제공하지 않는다.
     더 정확한 R2값이 필요하면 더 큰 표본을 사용해야 한다(일반적으로 40 이상).
   • R2값은 모형이 데이터를 얼마나 잘 적합시키는 지에 대한 하나의 측도에 지나지 않는다.
     모형의 R2값이 높더라도 해당 모형이 모형 가정을 충족하는지 확인하려면 잔차 그림을 확인해야 한다.