제목 | 데이터 핸들링 | ||
---|---|---|---|
작성자 | 2021311896 | ||
조회수 | 227 | 등록일 | 2022/02/10 |
국민건강영양조사 자료를 이용하여 복합표본설계 선형회귀분석을 하려고 하고 있습니다. 복합표본설계를 할 때 통계 돌리려는 원하는 집단을 부-모집단 (subg) 설정해서 해야하는 것으로 알고 있습니다. 예를 들어 19세 이상 성인 간접흡연자 중 염증수치와 혈압과의 관계를 보려고 합니다. 여기서 대상은 19세 이상 성인 간접흡연자 이기에 이 것을 부-모 집단으로 설정하려고 하는데요, 섷정을 0. 19세 이상 성인 & 간접흡연자 / 1. 그 외 로 설정하려고 합니다. 이 때 아래와 같이 설문조사가 되어 있어 '(성인) 직장실내 간접흡연 노출 여부' 변수 이름 BS8_2 1. 예 2. 아니오 8. 직장에 다니지 않음(일을 하지 않음) 9. 모름, 무응답 조건 설정을 age>=19 & BS8_2=1 로 하면 19세 이상 성인 & 간접흡연자 그룹으로 설정할 수 있을 듯 합니다. 제가 궁금한 점은 이 때 '(성인) 직장실내 간접흡연 노출 여부' 변수에 대해 데이터 핸들링이 필요할지 입니다. 만약 필요하다고 하면 8. 직장에 다니지 않음(일을 하지 않음) 9. 모름, 무응답 항목에 대해 결측치, 9. => 시스템 결측치 로 변경하고 8. 항목은 마찬가지로 시스템 결측치로 넣어야할지 간접흡연자 아님으로 넣어야할지를 모르겠습니다. |