사회복지조사론
Research Method for Social Welfare
이 수 천
(서울기독대학교 M.A., Ph.D.)
10강 자료분석과 표편집
ü 자료분석의 준비
ü 통계방법과 척도
ü 표 편집
ü (추리통계의 이해?)
자료분석의 준비
1. 코드북 작성
● 설문조사가 끝나면 코딩 작업을 하게 된다.
● 코딩(coding)이란, 설문지에 응답한 내용을 통계 프로그램으로 처리할 수 있도록 수치화하는 것을 의미한다.
(예. 남자는 ‘1’로 입력, 여자는 ‘2’로 입력하는 것)
● 코드북은 설문지에 응답한 결과들을 숫자로 바꾸어 입력할 수 있도록 안내해주는 지침서이다.
● 코드북의 유용성 : 입력오류를 줄일 수 있으며, 분석할 때 분석방향에 대한 힌트를 얻을 수 있다. 특히, 통계를 처음 다루는 사람은 반드시 작성할 필요가 있다.
● 코드북은 역문항이나 하위변수에 대한 표시 등 비교적 상세하게 작성할 필요가 있다. 이렇게 해야 데이터 변환 시 참고할 수 있기 때문이다.
● 코드북 작성의 실예
설문지
코드북
2. 입력과 환산하기
(1) 입력하기 전 작업
● SPSS는 ‘데이터보기’(Data View)와 ‘변수보기’(Variable View)로 구성되어 있다. 데이터보기 창은 데이터를 입력하는 곳이고, 변수보기 창은 변수에 대한 정의 및 변수값을 지정하는 곳이다.
● 먼저 변수보기(Variable View)로 가서 코드북의 변수명과 같은 이름으로 변수명(Name)을 지정해 주어야 한다.
● 각 변수에 대해 변수유형(Type)을 지정해 주어야 한다. 일반적으로 변수유형은 숫자형으로 한다. 결국 입력하는 것은 숫자이기 때문이다. 이름 등 문자로 입력할 경우는 문자형으로 지정해야 한다.
● 변수설명(Label)을 기록한다. 변수에 대한 설명을 구체적으로 기록해 넣는다.
● 변수값(Value)을 지정한다. 코드북의 입력값과 동일하게 지정해야 한다.
● 결측(Missing), 열(Column), 척도(Measure)를 지정한다.
(2) 입력하기
● 데이터보기(Data View)로 가서 설문지에 체크되어 있는 대로 입력한다.
●(설문지와 코드북과 동일해야 하며, 다를 경우 코드북에 그 다름에 대해서 간결하면서도 정확하게 설명되어야 한다.)
● 시간이 걸리더라도 ‘정확하게’ 입력하는 것이 중요하다.
잘못 입력되면 통계 결과를 신뢰할 수 없게 된다.
‘단무지’를 생각하며 입력한다. (왕도는 없다! 나중에 생김 ^^ )
● 입력할 때 일련번호를 설문지에도 적어둔다. 후에 데이터 오류 수정 시 확인을 하려면 반드시 필요하다.
(3) 입력 후 작업
● 눈으로 데이터의 이상이 없는가를 살펴본다.
● 빈도분석을 통하여 데이터의 이상치를 통하여 잘못 입력된 부분을 찾아 수정한다.
● 역코딩을 한다. 역코딩은 같은 변수로 변환을 사용하여 하는 것이 편리하다.
● 변수합산을 한다.
척도를 사용한 경우, 하위척도 별로 또는 연구설계에 따라 측정값들을 합산하여야 할 부분을 합산한다. 합산은 ‘변수계산’을 활용하여 하며, 합산할 결과는 새로운 변수로 만들어 진다.
● 변수 합산을 하는 방법도 여러 가지인데 일반적으로 합산(Sum)과 평균(Mean)을 활용한다. ‘합산’을 활용할 경우 응답값의 범위를 보기에 좋은 면이 있다. ‘평균’을 활용할 경우 응답값이 설문한 것과 비교할 때 어느 정도인지를 보기에 편리한 점이 있다.
통계방법과 척도
● 분석방법의 결정
° 독립변수와 종속변수의 관계와 이 둘이 어떤 척도로 측정되어 있는지에 따라 달라진다.
° 설문과 연구 목적에 따라 가정 적절한 통계방법이 이루어져야 한다.
° ANOVA난 χ2가 선형회귀분석만 못한 것이 아니다. ANOVA의 경우 2차함수와 같은 곡선의 성질이 있기 때문에 두 함수의 선형(liner)으로 이루어지는 회귀분석과 분석의 방법이 다른 것이다.
기술통계
1. 빈도분석
● 모든 변수의 첫 번째 분석에 사용되는 가장 기초적인 분석이다.
● 척도와 상관없이 사용되나 등간, 비율척도는 가급적 기술통계분석을 사용하는 것이 좋다.
● 연령, 급여 등 분포가 넓은 변수를 구역으로 설정할 경우, 즉 연령대, 급여대로 리코딩할 경우 빈도분석을 할 수 있다.
● 퍼센트(%)와 빈도로 값을 제시한다.
● SPSS에서 분석→기술통계량→빈도분석으로 따라가며 분석하면 된다.
● 주로 명목척도, 서열척도로 된 변수에 사용된다.
2. 기술통계분석
● 연령, 키, 월평균 급여와 같이 수치로 된 변수의 일반적 특징을 살필 때 사용한다.
● 평균과 표준편차로 제시한다.
● 5점 척도나 리커트 척도는 등간척도로 가정하고 사용 가능하다.
● SPSS에서 분석→기술통계량→기술통계분석으로 따라가며 분석하면 된다.
● 등간척도, 비율척도로 된 변수에 사용된다.
(1) 빈도분석, (2)기술통계분석
● 성별은 빈도분석을, 거주기간은 빈도분석과 기술통계분석을 함께 나타내고 있다.
● 빈도의 경우, %는 유효퍼센트를 기준으로 한다.
● [해설의 예]조사대상자는 남자 113명(48.9%), 여자 118명(51.1%)로 비슷한 분포를 보이고 있다. 조사대상자의 그룹홈거주기간은 1-3년이 69명(29.9%)으로 가장 많았으며, 이어 1년 미만 61명(26.4%), 5-10년 56(24.2%), 3-5년 34명(14.7%), 10년 이상 11명(4.8) 순으로 나타났다. 거주기간의 평균은 43.5개월 나타났다.
3. 교차분석
● 2개 이상의 범주형 변수들의 관련 정도를 알아보고자 하는 경우에 사용한다.
● 연령대별 정당 선호도, 학년별 과목 선호도 등
● χ2값의 유의확률을 통하여 통계적인 의미를 검증한다.
● SPSS에서 분석→기술통계량→교차분석으로 따라가며 분석하면 된다.
● 명목척도, 서열척도로 된 변수에 사용된다.
(3) 교차분석
● 성별에 따른 학력분포에 대한 교차분석을 나타낸다.
● [해설의 예]남자의 경우 대학교 이상의 학력자(48.1%)가 절반에 가까웠으며, 다음으로 고등학교 학력자(40.4%)로 뒤를 이었다. 여자의 경우 고등학교 학력자(45.7%)가 가장 많았으며 뒤를 이어 대학교 이상 학력자(37.4%)로 나타났다. 남자의 경우 대학교 이상의 학력이, 여자의 경우 고등학교 학력이 상대적으로 높게 나타났으며 이러한 차이는 통계적으로 유의미하였다(χ2=14.13, df=2, p<.01).
평균비교
4. 티검증(t-test)
(1) 독립표본 t-test
● 평균을 이용하여 분석하는 것이다. 따라서 종속변수는 평균값을 가질 수 있는 변수이어야 한다. 즉, 등간척도 이상이어야 한다. (단, 리커트 척도는 등간척도로 간주하고 분석할 수 있다.)
● 2개의 집단을 서로 비교하는 것이다. 따라서 독립변수는 2개의 범주를 나타내는 척도가 사용되어야 한다. 대표적인 예를 성별에 따라서 분석하는 경우이다.
● t값과 유의확률을 통하여 통계적 의미를 검증한다.
● SPSS에서 분석→평균비교→독립표본t-test를 따라가며 분석하면 된다.
(2) 대응표본 t-test
● 집단은 하나인데 시점을 달리하여 검증할 때 사용한다.
● 즉, 시점 상 상이한 두 시점을 각각 집단으로 상정하는 것이다.
● 사전사후 검증할 때 많이 사용된다.
● SPSS에서 분석→평균비교→대응표본t-test를 따라가며 분석하면 된다.
5. 분산분석(ANOVA:Analysis of Variance)
● 평균을 이용하여 분석하는데 집단이 세 개 이상일 경우에 사용한다.
● F값과 유의확률을 통하여 통계적 의미를 검증한다.
● SPSS에서 분석→평균비교→일원배치분산분석을 따라가며 분석하면 된다.
● t-test와 ANOVA는 종속변수가 평균을 구할 수 있는 등간척도 이상이어야 한다.
● t-test의 경우는 두 집단 사이의 평균 비교이기 때문에 사후검증이 필요없으나, ANOVA는 세 집단 이상의 평균비교이기 때문에 사후검증을 필요로 한다.
(4)티검증, (5) 분산분석
● [해설의 예]낙관성은 성별에 따라 집단간 차이가 나타났다(t=2.158, n=207, p<.05). 남자가 여자보다 낙관성이 더 높았다. 낙관성은 성적에 따라 집단간 차이가 나타났다(F=6.559, n=207, p<.001). 이때 사후검증(Turkey)한 결과 ....
상관분석
6. 상관관계분석
(1) 상관관계분석
● 변수 간 서로 상관의 정도를 보는 경우에 사용한다.
● 변수 간 인과관계가 없어도 볼 수 있어 폭넓게 사용할 수 있다.
● 등간척도 이상인 경우 Pearson을, 서열척도가 하나라도 포함되어 있으면 Spearman이나 Kendall's tau-b를 활용한다.
● r값과 유의확률을 통하여 통계적인 의미를 검증한다.
● SPSS에서 분석→상관분석→이변량 상관계수로 따라가며 분석하면 된다.
● 독립변수, 종속변수 모두 서열척도 이상이어야 한다.
(6) 상관관계분석
● 수치는 피어슨 상관계수이다.
● [해설의 예]각 변인의 상관관계를 알아본 바 거주기간과 나이, 친구지지와 성적, 친구지지와 거주기간, 가족지지와 거주기간, 가족지지와 친구지지, 교사지지와 성적, 교사지지와 친구지지, 교사지지와 가족지지 변인간 서로 상관관계가 있는 것을 알 수 있으며, 이 경우 모두 양의 상관관계로 나타났다.
회귀분석
7. 회귀분석
● 변수 간의 인과관계를 보는 경우 사용한다.
● F값과 유의도를 통하여 회귀식의 적정성을 보며,
R2값을 통하여 설명력을 보며,
t값과 유의도를 통하여 영향요인을 본다.
B값과 β값이 따로 제시된다.
● SPSS에서 분석→회귀분석→선형회귀분석을 따라가며 분석한다.
● 독립변수, 종속변수 모두 등간척도 이상이어야 한다.
(7) 회귀분석
● [해설의 예]남자의 경우 회귀식은 유의미한 것으로 나타났다(F=6.06, R2=.28, p<.001). 이때 자아존중감에 영향을 미치는 요인은 친구지지로 나타났다. ...
신뢰도분석
8. 신뢰도분석
● 하나의 척도(지수)에 포함되어 있는 하위 변수(개념)간의
내적 일관성이 있는지를 분석하고자 할 때 사용한다.
● Chronbach's α값으로 판단을 한다.
● SPSS에서 분석→신뢰도분석을 따라가면 분석한다.
● 독립변수와 종속변수의 구분은 없으며,
등간척도 이상이어야 한다.
(8) 신뢰도분석
● [해설의 예]본 연구에서 자아존중감의 신뢰도는 Chronbach α값이 .81로 나와 신뢰도는 문제가 없는 것으로 나타났다. ....
- 수고하셨습니다 -