고객센터









customer center. 월~금 : 09:00~17:00, 상담가능시간 : 09~17시 (토요일,일요일,공휴일은 휴무입니다)

입금계좌안내. 우리은행, 예금주(에스에스에이씨스탯), 계좌번호(000-00-00000)


요청하신후 문자메세지를 보내
주시면 좀더 빨리 처리됩니다.
(010-3920-3596)

home 고객센터 > BLOG

공지사항. 우리회사의 새로운 정보와 다양한 소식을 전해 드립니다.

조회수 216
제목 일반사람이 혼동하도록 설계된 10 가지 통계 용어
등록일 2021-06-01

 


 

 

다음은 통계 분석에서 일상적으로 사용되는 10 가지 일반적인 단어이다.
데이터 분석을 연습하고 다른 사람들과 결과를 공유하는 사람들은
이 단어가 통계적으로 의미하는 것과 다른 모든 사람에게 의미하는 것의 차이점을 염두에 두어야 한다.

 

 

1. Significant(유의성)


대부분의 사람들이 어떤 것이 "중요하다"고 말할 때 그것은 중요하고

주의를 기울일 가치가 있음을 의미한다.
그러나 통계적으로 유의성은 우리가 관찰하는 것이 단순히 우연한 결과가 아니라는 확률을 나타낸다.
통계적으로는 실질적인 수준에서 중요한 결과가 종종 전혀 중요하지 않다는 것을 알고 있다.
실용적 유의성과 통계적 유의성의 차이는 사람들이 간과하기 쉽다.

 

 

2. Normal(정규)


일반적으로 어떤 것이“정상”이라고 말하는 사람들은 그것이 평범하거나 평범하다는 것을 의미한다.
예를 들어 36.5℃의 체온을 "정상"이라고 부를 수 있다.
 

 


 


더욱이, 무언가가 "정상"이 아닐 때 종종 부정적인 의미를 내포한다.
"내 차의 엔진에서 소음이 들리는 것은 정상이 아니다."
그러나 통계적으로는 데이터가 익숙한 종 모양의 곡선을 따를 때“정상(정규분포)”이며
정상(정규분포)이 아닌 데이터에는 아무런 문제가 없다.
초보자는 "비정규 데이터"를 "불량 데이터"로 판단하기 쉽다.

 

 

3. Regression(회귀)


일상적인 사용에서 "회귀"는 수축 또는 뒤로 이동을 의미한다.
훈련중인 개가 몇번 말을 잘듣다가 어느날 말을 잘 듣지 않으면 그의 행동이

퇴보했다(regressed)고 말할 수 있다. 연어의 회귀라는 말도 사용된다.
 

 


 


통계적 분석중이 아니라면 "회귀"가 입력 변수를 기반으로 출력 변수를 예측하는 것을

의미한다고 즉시 생각하지 않을 것이다.

 

 

4. Average(평균)


통계에서 산술 "평균"은 관측치의 합계를 관측치 개수로 나눈 값이다.
대부분의 사람들이 "평균"이라는 단어를 듣고 말할 때, 그들은 수학적 가치에 대해
생각하는 것이 아니라 정성적인 판단을 내리는 것이다.
이는 무언가가 "그저 그렇다", "정상이다"또는 "공평하다" 등을 의미한다.

 

 

5. Error(오류)


"오류"는 통계적으로는 추정 정밀도의 척도이다.
다른 모든 사람에게 오류는 실수일 뿐이다.

 

 

6. Bias(바이어스)


통계에서 "바이어스"은 기준값과 비교하여 특정 도구 또는 게이지로 측정한 값의 정확도를 나타낸다.
 

 


 

 

그러나 일상적인 사용에서 바이어스는 사람의 세계관에 영향을 미치는 선입견과 편견을 의미한다.

 

 

7. Residual(잔차)


통계적으로 분석중이 아닌 대부분의 사람들에게 "잔차"는 관찰된 값과 적합치의 차이가 아니라
남은 것을 나타내는 멋진 단어일 뿐이다.

 

 

8. Power(검출력)


일반적으로 우리는 영향력과 통제의 관점에서“파워”에 대해 이야기한다.
영향으로 간주 될 수도 있다. 이러한 의미를 염두에 두고 통계 테스트가 강력할 수 있지만
영향력이 없다는 사실은 이미 알고 있지 않는 한 모순적인 것처럼 보인다.

 


 

 

통계적인 Power(검출력)는 그것이 진정으로 존재할 때 중요한 효과를 찾을 확률을 의미한다.

 

 

9. Interaction(교호작용)


사람들은 이 단어를 사용하여 다른 사람과의 의사 소통에 대해 이야기한다.
통계적으로는 한 요인의 효과가 다른 요인에 상호 의존한다는 것을 의미한다.

 

 

10. Confidence (신뢰도)


통계에서 신뢰구간은 모집단 매개 변수(모수)의 실제 값을 보유할 가능성이 높은 표본에서
파생된 값의 범위이다. 신뢰 수준은 모집단을 여러 번 샘플링한 경우 얻을 수 있는
모집단 모수를 포함하는 신뢰 구간의 백분율이다.

 

 


 

 

통계에서의 기술적 의미 외에 "자신감"이라는 단어는 의도하지 않은 의미를 생성하여

감정적 책임까지 전달한다.
너무나 자주 사람들은 통계적 신뢰를 연구자들이 그들의 결과를 정말로 믿는다는 의미로 해석한다.

 

이 10 가지 용어는 통계 세계에서 발견되는 가장 혼란스러운 이중 항목 중 일부에 불과하다.

"sample(샘플)", "assumptions(가정)", "stability(안정성)", "capability(능력)",
"success(성공)", "failure(실패)", "risk(위험)", "representative(대표)"및 "uncertainty(불확실성)"과 같은
다른 용어는 모두 통계를 사용하지 않는 세계에서는 서로 다른 의미를 가질 수 있다.

 


Eston Martz 글