지난주 금요일 의뢰한 설문이 완료가 되었다.
주말에 학교와 모임이 있어서 통 들여다보지도 못하다가 오늘에서야 분석을 시작하였다.
구글 설문 38부와 설문 업체 250부의 응답 데이터를 합쳐 288부로 시작한다.
구글 설문의 일부는 네이버 블로그를 통해서 연구에 참여해 주신 데이터이다.
이 포스트를 통해 다시 한번 감사드립니다.

1. 설문 데이터 코딩
설문 응답지는 응답자의 답변이 표시된 경우도 있고, 분석 도구에 활용하기 어려운 형식의 데이터들이 들어있기 때문에 분석프로그램에서 사용할 수 있는 데이터로 변환해 줘야 한다. 컴퓨터가 읽을 수 있는 데이터로 변환해야 한다는 뜻인데...
대표적으로 성별 '남/여' 라면 '1, 2'의 코드 형식으로 바꾸는 작업이다.
2. 데이터 합치기
여러 채널을 통해 응답 데이터를 구했다면 이것을 통합하여 하나의 형식으로 맞추는 작업이 필요하다. 애초에 통합하기 쉽도록 7점의 리커트(Likert) 심리 척도로 맞춰놨기 때문에 이건 일도 아니다. 그냥 몇 번 엑셀가지고 합치면 된다.
3. CSV 변환
프로그램이 가끔 변수에 한글이 들어간 경우 정확히 인식이 안되는 경우가 있기 때문에 CSV 파일은 텍스트 에디터로 한번 열어서 ANSI 타입으로 변경한 후에 저장하면 한글도 잘 보인다.
이때 내가 쓰는 프로그램은 'Notepad++'이다. 무료에다가 기능도 막강하다.
4. SmartPLS에 데이터 불러오기
데이터 분석을 위한 프로그램은 SmartPLS를 사용한다. SPSS를 사용할 수 있지만, 사회과학에서는 문제의 요인(Factor)들의 인과관계(causality)에 대해 연구하는 구조 방정식 모델링(Sturctural Equation Modeling) 방식이 많이 쓰이고 있다. SmartPLS는 데이터의 정규성을 전제로 하지 않아 비모수 통계방식으로 데이터 간의 상관관계를 파악한다.
5. Prototype 모형 분석
최초에 연구의 설계와 변수 간의 관계성을 모형으로 정의하고 연구를 시작한다. 데이터도 그에 맞춰 선행연구에서 참고하여 질문지를 작성한다. 구조식이 복잡하지 않으면 대부분 결과가 잘 나올 것이지만, 구조식이 복잡하다면 주요 변수의 요인 관계가 망가질 수도 있기 때문에 모형의 수정이 필요할 수도 있다. 모형을 아무리 수정해도 안된다면, 최후에는 데이터에 기반한 모형 설계를 해야 할 수 있다. 마지막 심폐 소생이다.
6. PLS Algorithm
데이터 변환과 모형 설계과 완료되었다면 측정 모형(Measurment model)을 검증한다. 주요 검증 단계는 개념의 외부 적재량(Outer loading)과 신뢰성 분석(Reliability Analysis), 판별 타당성(Discriminant validity)을 검정한다.
외부 적재량은 측정하려는 개념이 설문 항목에 얼마큼 잘 반영이 되었는지를 보고자 함이며, 이후에 개념 변수를 설명하는 측정항목들이 개념을 얼마나 집중적으로 잘 설명하는지를 신뢰성 분석을 통해 검정한다. 그리고 여러 변수들이 있다면 이 변수들이 서로 확실히 개념적으로 차이가 있는지를 판별한다.
측정 항목(설문지)이 여러 변수에 걸쳐서 적재량이 별로 차이가 안 나게 비슷하게 높게 나왔다면 다중공선성(Multicollinearity)을 의심해 봐야 한다. 다중공선성은 VIF(Variance Inflation Factor) 지수로 확인할 수 있으며, 이를 통해 상관성이 높은 변수들이 있는지 확인할 수 있다. 상관성이 높다면 하나로 합치거나, 하나를 제거해 줘야 한다.
7. Bootstrapping
측정 모형이 적합하다면, 구조 모형(Structural model)을 검증한다. SmartPLS에서는 부트스트래핑(Bootstrapping) 방식을 통해 가장 적합한 결과를 추론한다. 부트스트래핑은 기반 데이터에서 샘플링 방식을 통해 여러 데이터 셋을 생성하며 이러한 랜덤 데이터 셋을 통해서 여러 번의 반복 분석을 통해 가장 적합한 결과를 도출해낸다. 반복 횟수는 보통 500~1,000를 통해 초기 분석을 진행하고, 실제는 5,000~10,000회의 부트스트래핑을 수행한다. 보통은 테스트 시에는 1,000회 실제 검정 시에는 5,000회 정도면 충분하다. 변수가 많으면 컴퓨터 계산이 많아지므로 속도가 좋은 컴퓨터가 유리하다. 이 단계는 변수 간의 인과성을 검정하는 단계이다. 영향을 주는 변수와 영향을 받는 변수 간의 상관관계를 검정한다.
'타이탄의 도구들' 카테고리의 다른 글
1박 2일 군산 CC 라운딩 여행(feat. 맛집 포함) (0) | 2022.10.30 |
---|---|
갑자기 생각난 반미 '비에뜨반미 건대점' (0) | 2022.10.28 |
클레버 타키온 차량용 고오속~ 충전기 84W(feat. 갤폴드Z3) (0) | 2022.10.27 |
한경희 프리미엄 전기 모기채 HMK-20T(feat. 소신 발언) (0) | 2022.10.27 |
여행은 피곤을 즐기는 시간... (0) | 2022.10.24 |