제목 | [답변] 데이터 핸들링 | ||
---|---|---|---|
작성자 | 와이즈관리자 | ||
조회수 | 192 | 등록일 | 2022/02/14 |
국민건강영양조사 자료를 이용하여 복합표본설계 선형회귀분석을 하려고 하고 있습니다. 복합표본설계를 할 때 통계 돌리려는 원하는 집단을 부-모집단 (subg) 설정해서 해야하는 것으로 알고 있습니다. 예를 들어 19세 이상 성인 간접흡연자 중 염증수치와 혈압과의 관계를 보려고 합니다. 여기서 대상은 19세 이상 성인 간접흡연자 이기에 이 것을 부-모 집단으로 설정하려고 하는데요, 섷정을 0. 19세 이상 성인 & 간접흡연자 / 1. 그 외 로 설정하려고 합니다. 이 때 아래와 같이 설문조사가 되어 있어 '(성인) 직장실내 간접흡연 노출 여부' 변수 이름 BS8_2 1. 예 2. 아니오 8. 직장에 다니지 않음(일을 하지 않음) 9. 모름, 무응답 조건 설정을 age>=19 & BS8_2=1 로 하면 19세 이상 성인 & 간접흡연자 그룹으로 설정할 수 있을 듯 합니다. 제가 궁금한 점은 이 때 '(성인) 직장실내 간접흡연 노출 여부' 변수에 대해 데이터 핸들링이 필요할지 입니다. 만약 필요하다고 하면 8. 직장에 다니지 않음(일을 하지 않음) 9. 모름, 무응답 항목에 대해 결측치, 9. => 시스템 결측치 로 변경하고 8. 항목은 마찬가지로 시스템 결측치로 넣어야할지 간접흡연자 아님으로 넣어야할지를 모르겠습니다. ==================== 답 변 ==================== 안녕하세요 와이즈인컴퍼니 입니다. 해당 내용은 연구자판단이 개입되어야하는 문제 같습니다. 그래도 일반적인 경우, 8번, 9번 보기항목은 명확하게 간접흡연 노출에 대해 예/아니오로 구분되지 못하는 내용이라 분석에 제외하고 진행할 것 같습니다. 감사합니다. 와이즈인컴퍼니 드림. |