고객센터









customer center. 월~금 : 09:00~17:00, 상담가능시간 : 09~17시 (토요일,일요일,공휴일은 휴무입니다)

입금계좌안내. 우리은행, 예금주(에스에스에이씨스탯), 계좌번호(000-00-00000)


요청하신후 문자메세지를 보내
주시면 좀더 빨리 처리됩니다.
(010-3920-3596)

home 고객센터 > BLOG

공지사항. 우리회사의 새로운 정보와 다양한 소식을 전해 드립니다.

조회수 6130
제목 상관계수(ρ)를 구할때 나타나는 p-value의 의미
등록일 2015-09-15

 


 

공차분석을 하다보면, 종속관계에 있는 두 인자의 공분산값을 구하는 과정에서
종속관계에 있는 두 변수의 상관관계를 구하다 보면 피어슨 상관계수(ρ)을 구할 때
p-value값이 표현되는 것을 통계 프로그램에서 만날 수 있다.

 

Correlations: Verbal, Math

Pearson correlation of Verbal and Math = 0.275
P-Value = 0.000


이 경우, 상관계수(ρ)와 p-value는 각각 어떻게 해석해야 되는지 알아보자.

기본적으로 상관관계(Correlation) 분석에 대한 가설을 먼저 생각해보자,
귀무가설(H0): ρ=0 (두 data간에는 상관관계가 없다),
대립가설(Ha) : ρ≠0 (두 data간에는 상관관계가 없지 않다) , 여기서 ρ은 모상관계수.

 

이 가설검정에 대한 확률적 분석 결과가 p-value이다
즉, p-value<0.05이면, H0 채택실패, p-value≥0.05이면 Ha 채택실패라고 결론 지을 수 있다.

피어슨 상관계수는 표본의 갯수에 영향을 받기 때문에 표본의 크기에 따른
상관계수의 크고 작음을 판단해 주는 척도가 바로 p-value이다.

 

 


 

같은 크기의 표본자료를 가지고 있을 때는 표본상관계수(r)가 클수록
유의확률(p-value)은 작아져서 더 유의하다(r≠0)라는 결론을 내릴 수 있다.
그러나 p-value는 표본의 크기가 크다면 작은 상관계수라도 더 유의하다는 결론을
내릴 수 있게 한다. 즉, 관측한 자료값이 많을수록 상관계수 값은 더 믿을 수 있다는 의미이다. 

 

예를 들어 p값이 0.01 이하로 나왔는데, r= 0.95과 r= 0.35는 어떤 차이가 있는지 비교 해보면,
r=0.95와 r=0.35값을 구한 표본의 갯수가 같다고 하면,
당연히 r=0.95인 것이 더 상관관계가 강하다는 것을 의미한다.


그러나  r=0.95인 표본의 갯수가 r=0.35인 표본의 갯수보다 작으면,
표본의 갯수가 작은 쪽의 결과를 믿을 수가 없게 된다. 
그렇기 때문에 표본의 갯수를 고려한 상관계수(r)의 크고 작음을 중재해 주는 척도가 필요한데
p값이 바로 이 역할을 한다.