오즈와 오즈비, 왜 사용하지?

로지스틱 회귀분석등 범주형 데이터를 이용한 분석에서 오즈(odds)와 오즈비(odds ratio)라는 용어를 자주 접하게 된다. 어려운 계념이 아니지만 조금 혼란스러워하는 부분이 있어 간단하게 정리를 해본다.
먼저, 오즈는 p/(1-p)로써 실패할 확률대비 성공확률로 (또는 실패 횟수대비 성공횟수) 계산이 된다.   즉 실패대비 성공의 비율을 말한다.
오즈비는 두 방법, 즉 방법 1과 방법 2의 각 오즈의 비율로 계산된다. {p1/(1-p1)} / {p2/(1-p2)}
이렇게 계산된 오즈비로 성공은 실패대비 방법 1이 몇배 더 효과적인가를 알 수 있다.
그런데 왜 이런 조금은 복잡해(?) 보이는 오즈비를 사용하는가?
그 이유는 예를 들어 방법 1과 방법 2를 적용할때 일반적으로 모집단 크기를 알 수 없고, 단지 표본의 크기를 선택하여 성공과 실패 횟수를 얻을 수 있기때문에 통계처리시 많이 이용하게 된다.  

댓글

이 블로그의 인기 게시물

맥에서 여러 버전의 R을 사용하기

Raspberry PI에 R을 설치하여 빅데이터 분석