HOME 정보광장 Q&A

Q&A
문의사항 있으시면 언제든지 문의하세요.

제목 [답변] 데이터 핸들링
작성자 와이즈관리자
조회수 192 등록일 2022/02/14
국민건강영양조사 자료를 이용하여 복합표본설계 선형회귀분석을 하려고 하고 있습니다.

복합표본설계를 할 때 통계 돌리려는 원하는 집단을 부-모집단 (subg) 설정해서 해야하는 것으로 알고 있습니다.

예를 들어 19세 이상 성인 간접흡연자 중 염증수치와 혈압과의 관계를 보려고 합니다.
여기서 대상은 19세 이상 성인 간접흡연자 이기에 이 것을 부-모 집단으로 설정하려고 하는데요, 섷정을 0. 19세 이상 성인 & 간접흡연자 / 1. 그 외 로 설정하려고 합니다.

이 때 아래와 같이 설문조사가 되어 있어

'(성인) 직장실내 간접흡연 노출 여부' 변수 이름 BS8_2
1. 예
2. 아니오
8. 직장에 다니지 않음(일을 하지 않음)
9. 모름, 무응답

조건 설정을 age>=19 & BS8_2=1 로 하면 19세 이상 성인 & 간접흡연자 그룹으로 설정할 수 있을 듯 합니다.

제가 궁금한 점은 이 때 '(성인) 직장실내 간접흡연 노출 여부' 변수에 대해 데이터 핸들링이 필요할지 입니다.

만약 필요하다고 하면
8. 직장에 다니지 않음(일을 하지 않음)
9. 모름, 무응답
항목에 대해
결측치, 9. => 시스템 결측치 로 변경하고
8. 항목은 마찬가지로 시스템 결측치로 넣어야할지 간접흡연자 아님으로 넣어야할지를 모르겠습니다.

==================== 답 변 ====================

안녕하세요

와이즈인컴퍼니 입니다.

해당 내용은 연구자판단이 개입되어야하는 문제 같습니다.

그래도 일반적인 경우, 8번, 9번 보기항목은 명확하게 간접흡연 노출에 대해 예/아니오로 구분되지 못하는 내용이라 분석에 제외하고 진행할 것 같습니다.

감사합니다.

와이즈인컴퍼니 드림.

[다운로드 파일]



이전글 데이터 핸들링
다음글 나이 데이터 처리방법