고객센터









customer center. 월~금 : 09:00~17:00, 상담가능시간 : 09~17시 (토요일,일요일,공휴일은 휴무입니다)

입금계좌안내. 우리은행, 예금주(에스에스에이씨스탯), 계좌번호(000-00-00000)


요청하신후 문자메세지를 보내
주시면 좀더 빨리 처리됩니다.
(010-3920-3596)

home 고객센터 > BLOG

공지사항. 우리회사의 새로운 정보와 다양한 소식을 전해 드립니다.

조회수 106
제목 완전 또는 준완전 분리란 무엇인가? (2)
등록일 2021-10-01

 


 

 

준완전 분리는 로지스틱/프로빗 회귀 분석에서 준완전 분리는 결과 변수가
예측 변수 또는 예측 변수 조합을 어느 정도 분리할 때 발생한다.

 

 


 

 

결과 변수 Y는 X1이 3인 경우를 제외하고 예측 변수 X1을 꽤 잘 분리한다.
즉, X1 <3(Y = 0) 또는 X1 >3(Y=1)일 때 X1은 Y를 완벽하게 예측한다.
불확실성이 있는 경우 X1 = 3인 경우에만. 예상 확률의 관점에서
우리는 Prob(Y=1 | X1<3) = 0 및 Prob(Y=1 | X1>3) = 1을 가지고 있으며
Prob(Y = 1 | X1 = 3을 제외하고는 추정할 것이 없다.


위의 데이터를 사용하여 X1과 X2에 Y의 로지스틱 또는 프로빗 회귀 모델을
맞추려고 하면 어떻게 될까?
 

 


 


X1에 대한 최대우능도 추정치가 존재하지 않는 것으로 나타난다.
이 예에서는 X1에 대한 매개변수가 클수록 우도값이 커진다.
실제로 15 이상의 값은 큰 차이를 만들지 않으며 모두 기본적으로 예측 확률 1에 해당한다.

 

 


 


준완전 분리인 경우 가장 쉬운 전략은 "아무것도 하지 않음" 전략이다.
이는 다른 예측 변수에 대한 최대 우도가 여전히 유효하기 때문이다.
단점은 실제로 결과 변수를 효과적으로 예측하는 변수 X에 대한 합리적인 추정치를
얻지 못한다는 것이다. 이 전략은 완전한 분리 상황에서는 잘 작동하지 않는다.

 

또 다른 간단한 전략은 모델에 X를 포함하지 않는 것이다.
문제는 이것이 모델의 다른 예측 변수에 대해 편향된 추정치를 초래한다는 것이다.
따라서 이것은 권장되는 전략이 아니다.

 

 


 

 

X가 범주형 변수이고 그렇게 하는 것이 실질적인 의미가 있는 경우
X의 일부 범주를 축소할 수 있다.

Exact method는 데이터 세트가 작고 모델이 크지 않을 때 좋은 전략이 된다.

 

다섯 번째 로지스틱 회귀는 또 다른 좋은 전략이다.
페널리제이션 가능성 추정 방법을 사용하고, 1차 편향 보정은 로지스틱 회귀에 대한
분리 문제에 대한 이상적인 솔루션으로 간주된다.

베이지안 방법은 예측 변수 va의 모수 추정값에 대한 추가 정보가 있을 때 사용할 수 있다.