고객센터









customer center. 월~금 : 09:00~17:00, 상담가능시간 : 09~17시 (토요일,일요일,공휴일은 휴무입니다)

입금계좌안내. 우리은행, 예금주(에스에스에이씨스탯), 계좌번호(000-00-00000)


요청하신후 문자메세지를 보내
주시면 좀더 빨리 처리됩니다.
(010-3920-3596)

home 고객센터 > BLOG

공지사항. 우리회사의 새로운 정보와 다양한 소식을 전해 드립니다.

조회수 140
제목 Data 이상값 처리지침
등록일 2023-06-29
 

 이상값은 데이터에서 발견된 비정상적인 값이다.
이제, 발견한 이상값을 어떻게 처리할지 결정을 내려야 한다.
 
 




 이상값 처리지침
 
이상값은 통계분석을 왜곡하고, 가정을 위반할 수 있다. 
발생할 수 있는 문제를 감안할 때 제거하는 것이 최선이다. 
그렇지만, 이상값을 제거하는 것은 특정한 이유가 있을 때만 적합하다.
 


1)데이터 입력 및 측정 오류


분명한 이상값, 눈에 띌 뿐만 아니라 불가능한 값은 제거하거나, 정확한 결정을 위해 재측정  
이상값이 오류라고 판단되면, 가능한 경우 값을 수정,(오타 수정, 재측정 등으로)
수정이 불가능하면, 데이터 포인트를 삭제한다
 
 


 

 


2)샘플링 문제 이상값은 제거


여러가지 방법으로 이러한 일이 발생할 수 있다.
비정상적인 이벤트, 특성발생, 정전, 기계 설정오류 등, 분석중 비정상적
일이 발생하면 제품에 영향을 미칠 수 있다.  
 
 


 
비정상조건에서 제조된 제품은, 정상공정에서 생산된 제품대상 모집단으로 반영하지 않는다.
이러한 요소를 합리적으로 제거할 수 있다.  모집단에 적합하지 않은 이유/원인 밝혀야한다.
 
 
3)자연적 변화의 이상값은?


일부 비정상적인 값은, 실제 이상값이 아니라 프로세스의 일반적인 부분일 수 있다. 
사람의 키가 정규분포를 따르는 것처럼, 키의 차이는 문제를 나타내는 것이 아니라, 자연스러운 과정의 일부일 뿐이다.  
 
 




제조공정에도 동일한 아이디어 적용된다.
비정상적인 제품이 공정의 자연스러운 부분인지, 아니면 기계의 결함을 나타내는지 확인해야 한다.