사회복지조사론
Research Method for Social Welfare
이 수 천
(서울기독대학교 M.A., Ph.D.)
7강 표본의 추출
ü 표본에 대한 기초이해
ü 확률표집과 비확률표집
ü 사회복지 분야별 표집방법
표본추출의 기초
1. 표본추출의 기초
• 전수조사와 표본조사
● 전수조사는 조사대상이 되는 모집단(母集團)을 모두 조사하는 조사이다.
● 표본조사는 모집단에서 비의도적(확률표집) 또는 의도적(비확률표집)으로 일부 사례를 선택하여 이들만을 대상으로 조사를 실시하는 것이다.
● 일반적인 조사에서는 전수조사보다 표본조사를 많이 사용하게 된다.
● 특수 대상을 제외하고는 표본조사가 전수조사보다 더 유리한 이유....
° 첫째, 경제적이다.
모집단이 클 경우 조사에 들어가는 비용이 늘어난다.
그런데 모집단의 크기가 적은 경우는 전수조사나 표본조사나 큰 차이가 나지 않는다.
° 둘째, 신속성이다.
모집단이 클 경우 일정 표본만 조사할 경우 조사 시간이 단축된다. 시간을 단축하는 것의 중요성은 응답오차를 줄일 수 있다는 것이다. 조사 기간이 길어지면 조사하는 동안 변화하는 것들이 있을 수 있다.
° 셋째, 신뢰성 높은 조사가 가능하다.
표집오차는 통계적으로 확인할 수 있기 때문에 신뢰구간을 통하여 보완하게 된다. 비표집오차는 조사 시간이 짧을수록 최소화할 수 있다. 또한 반복조사의 경우 전수조사는 이미 앞선 조사의 영향을 받는다.
° 넷째, 전수조사가 불가능한 경우가 현실적으로 많다.
모집단이 너무 많거나 유동인구가 많은 경우 등은 표본조사를 할 수밖에 없다.
또한 파괴적인 조사에서는 전수조사를 하는 것은 불가능에 가깝다.
● 표본조사의 장점에도 불구하고 한계점도 분명히 있다.
° 첫째, 표본의 수는 일정한 크기 이상이어야 한다.
° 둘째, 모집단을 반영하기 위하여는 확률표집을 하여야 한다.
° 셋째, 표본으로 선택한 응답자가 회피하거나 응답자를 찾지 못했을 경우에도 문제가 된다.
(2) 표본의 적합성
● 표본이 많으면 좋다?
→ 연구자의 편견이 가미된 표본이라면 아무리 많아도 대표성 있는 자료가 되지 못한다.
→ 모집단에 가장 가까운 특성을 대표할 수 있는 표본이 선정되어야 한다.
→ 오차를 최소화하기 위한 조사대상자의 선정방식이 필요하게 된다.
● 표본의 적합성
° 첫째, 표본 선정을 확률에 근거하여 무작위로 선정할 때 편견이나 임의선정으로 인하 오류를 최소화할 수 있다.
° 둘째, 표본의 수(또는 크기 sample size)가 현실적으로나 이론적으로나 중요하게 대두된다. 최적화된 표본 수는 표본신뢰도에 의하여 결정된다.
● 동일확률 선택모형(EPSM: Equal Probability Selection Model) : 충분한 수의 무작위 확률표집의 표본들이 정규분포 곡선의 모양을 가지게 되며, 이로 인해 모집단의 값을 보다 정확하게 추정할 확률이 높아진다.
(3) 표본추출과 관련된 용어들
① 모집단과 모수 population & parameter
° 모집단(母集團) : 연구하고자 하는 대상 전체를 의미한다. 대부분 모집단은 이론상으로 규정되는 경우가 많다(=개념화 과정과 비슷. 예. ‘한국인의 의식조사’에서 ‘한국인’은?)
° 모수(母數) : 모집단이 가지고 있는 어떤 성질의 값을 모수라고 한다. 모수는 통상 무작위로 표집된 표본의 값을 통하여 추정하게 되는데, 표본조사는 대부분 모수를 추정하고자 하기 때문이다.
② 연구모집단 또는 조사모집단
study population or survey population
° 연구(조사)모집단은 모집단에 대한 영역이나 범주를 구체적으로 정해, 실제로 조사대상자를 표집할 때 기준이 되는 모집단이다.
° 모집단과 연구(조사)모집단은 같을 수도 있고 다를 수도 있다.
③ 요소와 표집단위 element & sampling unit
° 요소 :
사회조사의 분석 대상이 가지고 있는 자료를 수집하는 최소의 단위로 분석의 기반이 된다. 요소는 개인이나 가족일수도, 소집단이나 조직이 될 수도 있다.
° 표집단위 :
표본추출을 통하여 표집되는 최소의 단위이다.
④ 표집틀 sampling frame
° 표집틀은 표본을 추출하는데 사용되는 표집단위의 실제 목록을 의미한다.
2. 적절한 표본의 수
(1) 표본신뢰도의 이해
● 여기서 신뢰도는 앞서 다룬 측정의 신뢰도와 다른 표본의 신뢰도를 의미한다.
● 허용오차 범위 내에서 95% 믿을 수 있다는 의미이다.
● 허용오차는 표집에 의하여 발생하는 표집오차를 의미한다. 곧, 표집된 대상으로부터 얻어진 표본값은 모집단을 반영하는 데 있어서 ±.03 즉, 3%의 오차만을 갖는다는 것이다
(2) 적절한 표본의 수
● 통상적으로 허용오차가 5%이하이면 일반화에 문제가 되지 않기 때문에, 이 한도 내에서 최대한의 표본을 선택하는 것이 바람직하다.
● 통상 지역사회복지관의 일반주민조사는 최소 350명 이상으로 하는 것이 좋다.
(3) 표본수 결정시 유의사항
● 표본의 신뢰도는 표본수에 의하여 결정된다. 표본수가 충분하지 못하면 모집단의 특성을 반영하기가 어렵다.
● 표본수를 구하기 이전에 유의해야 할 것
° 첫째, 사회복지 분야에서의 표본수의 적합성은 경우에 따라 매우 달라진다. 특정분야의 사람들은 일반집단의 불특정한 성격과는 구별되는 명확성이 있다. 따라서 표본수가 동일하더라도 모집단의 특성을 반영하는 데는 일반시민을 대상으로 하는 표본 신뢰도보다 특수대상의 표본 신뢰도가 더 신뢰할 만한다.
° 둘째, 재가복지 대상자, 기관 이용자, 시설 내 생활자 등의 경우 모집단과 조사대상자가 동일한 전수조사방식을 취하는 것이 일반적이다. 단, 일반화가 목적이 아니라는 전제하에서 말이다.
확률표집과 비확률표집
• 확률표집
● 확률표집은 조사대상자를 선택하는 데 있어 확률이론에 근거하여 선택하는 방법이다.
● 임의적인 선택이 아니다.
따라서 무작위표집이라고 한다.
● 표본의 대표성을 확보해주고,
표집오차의 추정을 가능하게 해 주므로,
표본의 신뢰도를 구할 수 있게 된다.
• 단순무작위표집 simple random sampling
● 확률이론에 근거하여 모든 구성원이 선택될 확률을 동등하게 가지고 있는 상태에서 어떤 의도가 배제되고 우연에 의하여 표본을 결정하는 것이다.
● 한 사례를 표집하는 것이 다른 사례를 표집하는 것에 미치는 영향이 없어야 한다.
● 모집단의 각 구성원에 중복됨 없이 고유 일련번호 부여
→난수표나 제비뽑기 등으로 선출
● 제비뽑기, 복권 추첨시 화살 쏘는 것 등
● 모집단이 대단위일 경우 현실적으로 적용하기가 어렵다.
→ 집락표집, 층화표집 등을 활용한다.
● 난수표 사용법
① 표본수를 결정하고, 표본에 일련번호를 부여한다.
② 모집단의 크기에 따라 표집될 일련번호의 자리수를 결정한다.
③ 난수표의 행과 열을 무작위로 선택한다.
④ 선택된 행과 열에서부터 상하좌우 중 한 방향을 선택한 후 선택된 방향으로 이동하면서 해당 자리수 만큼 수에 따라 번호를 선택한다.
⑤ 반복되는 숫자나 모집단의 범위를 넘어가는 수가 있으면 버리면서 표본수가 채워질 때까지 계속 번호를 선택해 나간다.
(2) 계통적 표집 systemic sampling
● 무작위표집의 번거로움을 최소화하고, 장점을 살리기 위하여 제안되었다.
● 전체 사례에 무작위표집과 같이 번호를 부여하고, 하나의 번호를 무작위로 표집한다.
● 다음으로 미리 정한 일정한 간격에 따라 조사대상자를 반복적으로 표집해 가는 것이다.
● 한 번의 무작위표집만 수행하면 다음 조사대상자를 선택하는 기준이 결정되므로 무작위표집보다 더 편리하다.
● 특정 순서에 의하여 배열되어 있는 경우는 사용할 수 없다.
(3) 층화표집 stratified sampling
● 표본과 모집단의 동질성을 학보하고 표본의 대표성을 높이는 데 유리하다.
● 모집단이 어떤 동질성을 가질 경우 표집오차가 줄어든다. 이 원칙을 이용하여 모집단을 어떤 성질을 이용해 동일집단군으로 하위집단을 구분해 나가는 것이다.
● 하위집단으로 나누는 기준은 성별, 교육수준, 동일한 질병, 이용 프로그램 등 모집단이 특성에 따라 다르게 적용된다. 단, 반드시 다른 집단과는 구별될 수 있어야 한다.
● 표본의 동질성을 확보하여 표집오차를 줄일 수 있으나, 특정 의미를 가진 표본수가 지나치게 많거나 적을 때는 유의해야 한다.
① 비례층화표집
° 모집단의 각 층화된 집단에 대하여 집단의 수(크기)와 상관없이 동일한 비율로 조사대상자를 표집하는 방법이다.
° 모집단 자체의 특성을 그대로 인정하는 조사나,
° 층화된 각 집단이 비슷한 경우 사용하는 것이 좋다.
② 비비례층화표집
° 층화된 집단의 규모보다는 표집된 표본의 수에 더 관심을 가진다.
° 층화된 집단별로 표본의 수간 차이가 상대적으로 적게 나도록 의도적으로 적은 집단은 표본수를 늘리고, 큰 규모의 집단은 표본수를 줄이는 방식으로 대상자를 선택한다.
° 의견이 골고루 반영되는 특징이 있다.
(4) 집락표집 cluster sampling
● 모집단을 집락이라는 많은 수의 집단으로 구분하고, 그 집락 중 표집대상의 집락을 무작위로 추출하고, 표집된 집락에서만 표본을 표집하는 방법이다.
● 단계표집(stage sampling)과 동의어로 사용되며, 지역표집도 집락표집의 일종이다.
● 집락간 이질성이 전제되어 있기 때문에 표본의 대표성은 다소 낮다고 할 수 있다.
2. 비확률표집
● 모집단이 불분명하거나, 시간적·환경적 제한에 의하여 선택되는 경우가 많다.
(1) 편의표집 또는 우연표집 convenience / accidental sampling
● 연구자의 상황에서 손쉽게 선정이 가능한 대상을 임의로 표집하는 방법이다.
● 대표성을 추정할 방법이 없으며, 외적 타당도의 유지가 힘들기 때문에 일반화나 모집단을 추정할 것을 전제로 한 연구에서는 사용하지 않는다.
● 사례연구나 모집단의 특성상 확률표집이 어려운 대상을 선택할 때 많이 사용한다.
● 시간표집 / 공간표집 / 이용자표집
(2) 판단(목적)표집 또는 유의표집 purpose / judgemental sampling
● 연구자의 연구의도에 적합한 대상을 표집하는 것이다.
● 연구자의 의도가 들어가기 때문에 일반화는 힘들지만, 연구목적을 명확하게 할 수 있다.
● 통상 탐색적 조사나 조사도구의 타당성을 검증하는 사전조사에서 많이 사용한다.
(3) 할당표집 quote sampling
● 표집대상자의 인구사회학적 특성이나 기타 기준을 정하고, 각 기준별로 얼마의 표준을 조사할 것인지 미리 정한다.(이를 ‘할당’이라 한다.)
● 할당이 끝나면 조사를 수행하되, 할당량이 채워진 조사대상자는 조사를 멈추고, 채워지지 않는 조사대상자는 계속 조사한다.
(4) 눈덩이표집 또는 연쇄소개표집
snowball / chain referral sampling
● 우선 소수의 대상자를 조사한 후, 그들로부터 연구대상으로 적합한 대상자에 대한 정보를 수집해가면서 조사하는 방법이다.
● 모집단을 잘 모르거나 연구대상자에 대한 사전정보가 거의 없어 새로 발굴해야 하는 경우에 많이 사용한다.
사회복지 분야별 표집방법
• 욕구조사
● 욕구조사는 주로 종합사회복지관, 노인복지관, 장애인복지관, 청소년수련관 등에서 실시하게 된다.
→욕구조사의 대상자들을 어떻게 표집하는 것이 지역사회의 욕구를 대변하는 것인가를 고민하게 된다.
● 지역특성과 기관이용자의 특성을 고려하여 표집하여야 한다.
(1) 일반지역의 표집
● 아파트가 아닌 다가구나 단독주택 등 주거지역이 중심이 되는 곳
① 사회복지관을 이용하는 이용자층은 대체로 지속적으로 그 기관을 이용하고, 아동, 노인, 장애인에 있어서는 재이용률이 비교적 높은 특성이 있다. 신규참여는 보통 10-30% 이내인 것이 일반적이다.
→ 이용자를 제외한 지역주민을 대상으로 조사할 경우 정확한 욕구추산이 어렵다.
⇒ 이용자와 비이용자로 층화하여 층화표집을 할 필요가 있다.
② 표집하기 이전에 조사하고자 하는 대상 지역주민의 지역별 분포를 유념할 필요가 있다.
° 일반거주지역과 아파트거주지역의 주민이 비슷하면 1:1의 비율로 결정하면 된다.(층화)
° 비율이 다르면 그 비율에 따라 비례층화표집을 한다.
° 이파트지역의 이용자가 매우 적은 비율이라면 비비례층화표집을 적용하는 것도 무방하다.
③ 이용자와 비이용자, 비이용자는 다시 아파트와 일반주거지역으로 층화되었다면, 이 층화된 계층별로 다시 확률표집방법을 적용해야 한다.
° 이 경우 이용자는 층화표집을,
° 비이용자 중 아파트지역은 단순 무작위 또는 계통적 표집을,
° 일반거주지역은 집락표집을 이용하는 게 효과적이다.
(2) 아파트 지역의 표집
● 임대아파트가 있는 지역은 일반아파트도 있기 때문에 이 둘을 층화할 필요가 있다.
● 물론 이용자와 비이용자도 층화 이후에, 비이용자를 대상으로 하는 것이라는 점을 기억해야 한다.
● 아파트의 경우 단지, 동, 층, 호의 개념이 분명하기 때문에 이들 숫자에 따라 계통적 표집을 사용하면 편리하다.
(3) 장애인/노인의 표집
● 장애인과 노인에 대한 욕구조사는 층화가 필요한 경우가 많다.
● 사회복지분야에서 장애인과 노인을 층화하는 데 중요한 기준은 역시 경제적 여건이다.
→국민기초생활보장 수급권자와 비수급권자로 구분해서 조사하는 것이 좋을 것이다.
● 수급권자의 경우 많은 수가 아니기 때문에 통상 전수조사를 하거나, 2-3명 단위의 계통적 표집을 활용하는 것이 좋다.
● 비수급권자의 경우 지역별로 집락표집을 이용하여 선택하는 것이 좋은 방법이다.
(4) 청소년의 표집
● 청소년의 경우 방학기간 중에 조사하는 건 어렵고 학기 중이라면 비교적 쉬울 수 있다.
● 성별, 학교별로 층화하는 게 좋다.
● 학교별 층화는 다시 중학교와 고등학교로 층화하고, 고등학교의 경우는 인문계, 실업계, 특목고로 층화할 필요가 있다.
● 학교 선택은 지역사회의 학교가 많을 경우 층화에 해당하는 학교를 무작위로 선정할 수 있다.
● 학교 내에서는 각 학년별로, 가을학기의 경우 1, 2학년을 대상으로 조사하는 것이 좋다.
● 각 학년별로 조사대상이 되는 반을 무작위로 선정하여, 그 반을 전수조사하는 것이 좋다. (계통적 표집이나 단순무작위표집은 이용할 수는 있으나 쉽지 않다.)
(5) 재가복지 대상자의 표집
● 일반적으로 전수조사를 하는 것이 좋다.
● 통상 100-200명 안팎이기 때문에 전수조사가 어렵지 않다.
● 전수조사를 할 경우 사례관리와 연결하여 중요한 자료로 활용될 수도 있기 때문이다.
2. 이용자 만족도 조사
(1) 단위프로그램 만족도 조사의 경우
● 통상적으로 프로그램 참여자가 많지않기 때문에 전수조사가 좋다.
● 바자회와 같은 행사성 프로그램의 경우는 참여자는 많지만 핵심적인 참여자라 볼 수 없기 때문에 설문조사 보다는 보드를 이용한 만족 정도와 간략한 평가를 스티커 등으로 표시하게 하는 게 좋다.
(2) 기관 이용자 만족도 조사의 경우
● 상황에 따라 전수조사 또는 층화방식을 이용하는 게 좋다.
● 프로그램 만족도 조사의 경우 사회교육이든 자격증교실이든 담당자(강사 등)이 조사원이 될 경우 암시나 안면의 배려에 의한 왜곡이 나타날 수 있다. 반드시 외부인력이 조사를 담당하도록 하는 것이 좋다.
3. 지역사회 실태조사
● 일반적인 지역사회조사라면, 즉 일반지역주민을 대상으로 하는 지역사회문제에 대한 실태조사와 같은 것이라면 전형적인 집락표집을 이용하는 것이 좋다.
● 지역사회문제 관련자, 전문가, 여론주도층을 별도로 한다면, 이들의 명단을 확보한 후 전수조사를 할 것인지 표집을 할 것인지 확정한다.
● 이 경우, 직업이나 분야에 따라 계층별로 층화한 후 무작위 표집이나 계통적 표집을 이용하여 선택하면 된다.
- 수고하셨습니다 -