본문 바로가기

사회복지수업/명지자_사회복지조사론

10강 자료분석과 표편집

사회복지조사론
Research Method for Social Welfare

이 수 천

(서울기독대학교 M.A., Ph.D.)

 

10강 자료분석과 표편집

 

ü     자료분석의 준비

ü     통계방법과 척도

ü     표 편집

ü     (추리통계의 이해?)

 

자료분석의 준비

1. 코드북 작성

● 설문조사가 끝나면 코딩 작업을 하게 된다.

코딩(coding)이란, 설문지에 응답한 내용을 통계 프로그램으로 처리할 수 있도록 수치화하는 것을 의미한다.

    (. 남자는 ‘1로 입력, 여자는 ‘2로 입력하는 것)

코드북은 설문지에 응답한 결과들을 숫자로 바꾸어 입력할 수 있도록 안내해주는 지침서이다.

코드북의 유용성 : 입력오류를 줄일 수 있으며, 분석할 때 분석방향에 대한 힌트를 얻을 수 있다. 특히, 통계를 처음 다루는 사람은 반드시 작성할 필요가 있다.

코드북은 역문항이나 하위변수에 대한 표시 등 비교적 상세하게 작성할 필요가 있다. 이렇게 해야 데이터 변환 시 참고할 수 있기 때문이다.

 

● 코드북 작성의 실예

설문지

 

코드북

 

 

2. 입력과 환산하기

 

(1) 입력하기 전 작업

  SPSS‘데이터보기’(Data View)‘변수보기’(Variable View)로 구성되어 있다. 데이터보기 창은 데이터를 입력하는 곳이고, 변수보기 창은 변수에 대한 정의 및 변수값을 지정하는 곳이다.

먼저 변수보기(Variable View)로 가서 코드북의 변수명과 같은 이름으로 변수명(Name)을 지정해 주어야 한다.

각 변수에 대해 변수유형(Type)을 지정해 주어야 한다. 일반적으로 변수유형은 숫자형으로 한다. 결국 입력하는 것은 숫자이기 때문이다. 이름 등 문자로 입력할 경우는 문자형으로 지정해야 한다.

변수설명(Label)을 기록한다. 변수에 대한 설명을 구체적으로 기록해 넣는다.

변수값(Value)을 지정한다. 코드북의 입력값과 동일하게 지정해야 한다.

결측(Missing), (Column), 척도(Measure)를 지정한다.

 

(2) 입력하기

데이터보기(Data View)로 가서 설문지에 체크되어 있는 대로 입력한다.

(설문지와 코드북과 동일해야 하며, 다를 경우 코드북에 그 다름에 대해서 간결하면서도 정확하게 설명되어야 한다.)

시간이 걸리더라도 ‘정확하게’ 입력하는 것이 중요하다.

    잘못 입력되면 통계 결과를 신뢰할 수 없게 된다.

     단무지를 생각하며 입력한다. (왕도는 없다! 나중에 생김 ^^ )

입력할 때 일련번호를 설문지에도 적어둔다. 후에 데이터 오류 수정 시 확인을 하려면 반드시 필요하다.

 

(3) 입력 후 작업

● 눈으로 데이터의 이상이 없는가를 살펴본다.

빈도분석을 통하여 데이터의 이상치를 통하여 잘못 입력된 부분을 찾아 수정한다.

역코딩을 한다. 역코딩은 같은 변수로 변환을 사용하여 하는 것이 편리하다.

변수합산을 한다.

    척도를 사용한 경우, 하위척도 별로 또는 연구설계에 따라 측정값들을 합산하여야 할 부분을 합산한다. 합산은 ‘변수계산’을 활용하여 하며, 합산할 결과는 새로운 변수로 만들어 진다.

변수 합산을 하는 방법도 여러 가지인데 일반적으로 합산(Sum)과 평균(Mean)을 활용한다. 합산을 활용할 경우 응답값의 범위를 보기에 좋은 면이 있다. 평균을 활용할 경우 응답값이 설문한 것과 비교할 때 어느 정도인지를 보기에 편리한 점이 있다.

 

통계방법과 척도

 

● 분석방법의 결정

° 독립변수와 종속변수의 관계와 이 둘이 어떤 척도로 측정되어 있는지에 따라 달라진다.

° 설문과 연구 목적에 따라 가정 적절한 통계방법이 이루어져야 한다.

° ANOVAχ2가 선형회귀분석만 못한 것이 아니다. ANOVA의 경우 2차함수와 같은 곡선의 성질이 있기 때문에 두 함수의 선형(liner)으로 이루어지는 회귀분석과 분석의 방법이 다른 것이다.

 

기술통계

1.    빈도분석

● 모든 변수의 첫 번째 분석에 사용되는 가장 기초적인 분석이다.

척도와 상관없이 사용되나 등간, 비율척도는 가급적 기술통계분석을 사용하는 것이 좋다.

연령, 급여 등 분포가 넓은 변수를 구역으로 설정할 경우, 즉 연령대, 급여대로 리코딩할 경우 빈도분석을 할 수 있다.

퍼센트(%)와 빈도로 값을 제시한다.

SPSS에서 분석→기술통계량→빈도분석으로 따라가며 분석하면 된다.

주로 명목척도, 서열척도로 된 변수에 사용된다.

 

2. 기술통계분석

● 연령, , 월평균 급여와 같이 수치로 된 변수의 일반적 특징을 살필 때 사용한다.

평균과 표준편차로 제시한다.

5점 척도나 리커트 척도는 등간척도로 가정하고 사용 가능하다.

SPSS에서 분석→기술통계량→기술통계분석으로 따라가며 분석하면 된다.

등간척도, 비율척도로 된 변수에 사용된다.

 

 

(1) 빈도분석, (2)기술통계분석

 

● 성별은 빈도분석을, 거주기간은 빈도분석과 기술통계분석을 함께 나타내고 있다.

빈도의 경우, %는 유효퍼센트를 기준으로 한다.

[해설의 예]조사대상자는 남자 113(48.9%), 여자 118(51.1%)로 비슷한 분포를 보이고 있다. 조사대상자의 그룹홈거주기간은 1-3년이 69(29.9%)으로 가장 많았으며, 이어 1년 미만 61(26.4%), 5-1056(24.2%), 3-534(14.7%), 10년 이상 11(4.8) 순으로 나타났다. 거주기간의 평균은 43.5개월 나타났다.

 

3. 교차분석

2개 이상의 범주형 변수들의 관련 정도를 알아보고자 하는 경우에 사용한다.

연령대별 정당 선호도, 학년별 과목 선호도 등

χ2값의 유의확률을 통하여 통계적인 의미를 검증한다.

SPSS에서 분석→기술통계량→교차분석으로 따라가며 분석하면 된다.

명목척도, 서열척도로 된 변수에 사용된다.

 

 

(3) 교차분석

 

● 성별에 따른 학력분포에 대한 교차분석을 나타낸다.

[해설의 예]남자의 경우 대학교 이상의 학력자(48.1%)가 절반에 가까웠으며, 다음으로 고등학교 학력자(40.4%)로 뒤를 이었다. 여자의 경우 고등학교 학력자(45.7%)가 가장 많았으며 뒤를 이어 대학교 이상 학력자(37.4%)로 나타났다. 남자의 경우 대학교 이상의 학력이, 여자의 경우 고등학교 학력이 상대적으로 높게 나타났으며 이러한 차이는 통계적으로 유의미하였다(χ2=14.13, df=2, p<.01).

 

평균비교

4. 티검증(t-test)

 

(1) 독립표본 t-test

● 평균을 이용하여 분석하는 것이다. 따라서 종속변수는 평균값을 가질 수 있는 변수이어야 한다. , 등간척도 이상이어야 한다. (, 리커트 척도는 등간척도로 간주하고 분석할 수 있다.)

2개의 집단을 서로 비교하는 것이다. 따라서 독립변수는 2개의 범주를 나타내는 척도가 사용되어야 한다. 대표적인 예를 성별에 따라서 분석하는 경우이다.

t값과 유의확률을 통하여 통계적 의미를 검증한다.

SPSS에서 분석→평균비교→독립표본t-test를 따라가며 분석하면 된다.

 

 

(2) 대응표본 t-test

집단은 하나인데 시점을 달리하여 검증할 때 사용한다.

, 시점 상 상이한 두 시점을 각각 집단으로 상정하는 것이다.

사전사후 검증할 때 많이 사용된다.

SPSS에서 분석→평균비교→대응표본t-test를 따라가며 분석하면 된다.

 

5. 분산분석(ANOVA:Analysis of Variance)

평균을 이용하여 분석하는데 집단이 세 개 이상일 경우에 사용한다.

F값과 유의확률을 통하여 통계적 의미를 검증한다.

SPSS에서 분석→평균비교→일원배치분산분석을 따라가며 분석하면 된다.

t-testANOVA는 종속변수가 평균을 구할 수 있는 등간척도 이상이어야 한다.

 

t-test의 경우는 두 집단 사이의 평균 비교이기 때문에 사후검증이 필요없으나, ANOVA는 세 집단 이상의 평균비교이기 때문에 사후검증을 필요로 한다.

 

 

(4)티검증, (5) 분산분석

[해설의 예]낙관성은 성별에 따라 집단간 차이가 나타났다(t=2.158, n=207, p<.05). 남자가 여자보다 낙관성이 더 높았다. 낙관성은 성적에 따라 집단간 차이가 나타났다(F=6.559, n=207, p<.001). 이때 사후검증(Turkey)한 결과 ....

 

 

상관분석

6. 상관관계분석

 

(1) 상관관계분석

● 변수 간 서로 상관의 정도를 보는 경우에 사용한다.

변수 간 인과관계가 없어도 볼 수 있어 폭넓게 사용할 수 있다.

등간척도 이상인 경우 Pearson, 서열척도가 하나라도 포함되어 있으면 Spearman이나 Kendall's tau-b를 활용한다.

r값과 유의확률을 통하여 통계적인 의미를 검증한다.

SPSS에서 분석→상관분석→이변량 상관계수로 따라가며 분석하면 된다.

독립변수, 종속변수 모두 서열척도 이상이어야 한다.

 

(6) 상관관계분석

● 수치는 피어슨 상관계수이다.

[해설의 예]각 변인의 상관관계를 알아본 바 거주기간과 나이, 친구지지와 성적, 친구지지와 거주기간, 가족지지와 거주기간, 가족지지와 친구지지, 교사지지와 성적, 교사지지와 친구지지, 교사지지와 가족지지 변인간 서로 상관관계가 있는 것을 알 수 있으며, 이 경우 모두 양의 상관관계로 나타났다.

 

회귀분석

7. 회귀분석

● 변수 간의 인과관계를 보는 경우 사용한다.

F값과 유의도를 통하여 회귀식의 적정성을 보며,

    R2값을 통하여 설명력을 보며,

    t값과 유의도를 통하여 영향요인을 본다.

    B값과 β값이 따로 제시된다.

SPSS에서 분석→회귀분석→선형회귀분석을 따라가며 분석한다.

독립변수, 종속변수 모두 등간척도 이상이어야 한다.

 

(7) 회귀분석

[해설의 예]남자의 경우 회귀식은 유의미한 것으로 나타났다(F=6.06, R2=.28, p<.001). 이때 자아존중감에 영향을 미치는 요인은 친구지지로 나타났다. ...

 

 

신뢰도분석

8. 신뢰도분석

 

● 하나의 척도(지수)에 포함되어 있는 하위 변수(개념)간의

    내적 일관성이 있는지를 분석하고자 할 때 사용한다.

Chronbach's α값으로 판단을 한다.

SPSS에서 분석→신뢰도분석을 따라가면 분석한다.

독립변수와 종속변수의 구분은 없으며,

    등간척도 이상이어야 한다.

 

(8) 신뢰도분석

[해설의 예]본 연구에서 자아존중감의 신뢰도는 Chronbach α값이 .81로 나와 신뢰도는 문제가 없는 것으로 나타났다. ....

 

- 수고하셨습니다 -

'사회복지수업 > 명지자_사회복지조사론' 카테고리의 다른 글

12강 욕구조사  (0) 2013.05.31
11강 추리통계이해 보고서작성  (0) 2013.05.21
9강 사회조사의 실행  (0) 2013.05.09
7강 표본의 추출  (0) 2013.05.01
6강 측정도구만들기  (0) 2013.04.19