빠지기 쉬운 통계의 함정

빠지기 쉬운 통계의 함정

입력 2009-06-20 00:00
업데이트 2009-06-20 00:48
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

【 벌거벗은 통계 】

‘당신은 대통령 탄핵에 찬성하는가.’ 와 ‘대통령은 상원조사위원회에 출두해야 하는가?’ 는 똑같은 의미였다. 그러나 이 중 ‘워터게이트 사건’의 당사자 닉슨 전 대통령을 불명예 퇴진시킨 질문은 후자였다.

미국의 여론조사 기관인 갤럽이 미국인들에게 첫 번째 질문을 던지자, 대부분의 국민들이 반대했다. ‘면죄부’를 받은 듯 닉슨 대통령은 이 설문조사 결과를 수개월 동안 기자들 코앞에서 깃발처럼 흔들었다.

그러나 처음 질문에는 결정적인 하자가 있었다. 대부분의 미국 국민이 ‘탄핵(Impeachment)’이란 단어를 몰랐다는 것. 그래서 갤럽은 질문을 바꿔 다시 여론조사를 했다. 그 뜻은 첫 번째 질문과 완전히 똑같았지만 왠지 처벌수위가 완화된 느낌이었다. 대다수의 국민들은 찬성했고, 미국 의회는 탄핵 절차에 들어갔다. 두 번째 질문이 닉슨 대통령의 자발적 사임을 이끌어 낸 역사적인 질문이었다.

●데이터 분식·데이터 성형수술 등 통계의 이면

이미지 확대
여론조사에서 이처럼 질문지의 내용을 살짝 손만봐도 결과에 엄청난 차이가 있다는 것을 보여주는 책이 바로 독일 도르트문트 공대 통계학과 교수 발터 크래머가 쓴 ‘벌거벗은 통계’(염정용 옮김, 이순 펴냄)다. 이 책은 여론조사뿐만 아니라 각종 숫자와 데이터를 가지고 만들어진 통계가 어떻게 사람들을 현혹시키고, 잘못된 행동을 이끄는지를 적나라하게 보여준다. 적나라하다는 표현이 너무 미약하게 느껴질 정도다. 크래머 교수는 미국의 저명한 통계학자 대럴 후프가 쓴 ‘통계로 거짓말하는 방법(1954년)’을 읽고 여기서 영감을 받아 1991년 이 책을 완성했다. 그 뒤로 일약 지식인들의 통계 교양서로 자리잡으면서 이 책은 ‘아마존 통계경영학 부문 스테디 셀러’로 독자의 사랑을 받고 있다.

사실 통계는 믿을 수 없다는 것이 현대인의 상식이다. 영국 수상을 지낸 벤저민 디즈레일리가 오죽하면 “거짓말은 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계”라고 말했을까. 그러나 이 새빨간 거짓말보다 더한 거짓말인 통계가 경제뿐 아니라 정치, 사회, 문화 등 온갖 곳에서 널리 사용되고 있다. 통계를 믿을 수 없다고 평소 신념으로 가지고 있던 독자라도 신문에 실린 주식폭등 그래프를 보고 쌈짓돈을 만지작거리고, 유권자들은 사표(死票)방지 심리 때문에 여론조사에서 당선권으로 나타난 정당후보에게 투표를 하게 된다. ‘1인당 국민소득이 2만달러’라는 산술평균값에 현혹돼 주위의 가난한 사람들을 놓치게 된다.

통계는 복잡한 계산이나 숫자들을 피해 빠르고 쉽게 본질에 접근하기 위해 고안된 학문인데 통계 때문에 헷갈리고 조작의 피해를 당한다면 억울하지 않겠는가. 게다가 통계를 활용하는 정부나 기업, 광고주들은 분식회계와 맞먹는 수준으로 ‘데이터 분식’행위를 하고, ‘데이터 성형수술’도 서슴지 않기 때문에 ‘실체적 진실’에 접근할 수 있는 길은 좁고도 험하다. 특히 좌파, 우파, 중도파 모두 선의의 목적을 위해 통계가 조작될 수 있다는 식으로 생각하는 것도 인식의 걸림돌이다.

이럴 때 15장으로 구성된 ‘벌거벗은 통계’가 길이요, 생명줄이 되는 것이다. 몇가지 사례를 보여주겠다.

성경에서 아담은 930살, 그의 아들 셋은 912살까지 살았다고 써 있다. 믿을 수 있을까. 저자는 이것이 ‘정교한 수치가 진실’이라는 환상 때문에 또한 ‘두루뭉술하면 성의없다고 느낄 것’이라는 우려가 겹쳐져 나타난 숫자라고 설명한다. 심지어 영국의 신학자는 천지창조의 시점을 ‘기원전 4004년 10월21일 일요일 오전 9시’라고 정밀하게 계산해냈는데, 요즘 이것을 진실이라고 믿는 사람이 있을까. 레슨1. 너무 구체적이고 정교한 숫자는 믿지 말라.

농부 1명이 소 40마리를 가지고 있고, 농부 9명은 소 ‘0마리’를 가지고 있다면 농부들은 몇마리의 소를 가지고 있는가. 통계에서 나타나는 최빈값은 ‘0마리’이고 중간값도 ‘0마리’인데, 산술평균은 4마리나 된다. 산술평균 4마리는 흔히 인용되는 숫자인데, 이것은 의미있는 실체적 진실인가? 아니다. 산술평균은 심각한 불평등을 은폐시키는 도구로 악용될 수 있다. 1인당 국민소득의 규모로 전세계 국가를 줄세우기 하는 ‘국민 총생산의 신화’도 평균값의 함정에 해당한다. 레슨 2. 산술적 평균, 평균값의 함정에 빠져서는 안 된다.

●가파른 그래프에 현혹되지 말아라

표본조사가 잘못될 경우 통계 자체가 완전히 틀릴 수 있다. 1936년 미국 대통령 선거에서 ‘리터러리 다이제스트’는 1000만명, 갤럽은 단지 5만명의 표본으로 조사해 다이제스트는 공화당 후보가, 갤럽은 민주당 후보가 당선될 것을 예측했다. 결과는 갤럽의 승리였고, ‘뉴딜’로 유명한 루스벨트가 대통령이 됐다. 다이제스트의 표본은 일반인들이 아니라, 정기구독자들로, 자동차, 사교클럽 소속들이었다.

그래프를 볼 때 가파른 화살표나 등락만 살펴보지 말고, 가로축과 세로축의 단위를 살펴볼 필요가 있다. 그래프의 세로축이 ‘0’부터 시작된 것인지 아니면 뚝 잘라내서 가파른 기울기를 의도적으로 만들어낸 것인지를 살펴봐야 한다. 가로축도 마찬가지다. 가로축이 좁을수록 그래프는 가파르게 된다. 특히 주식시장에서 가파른 그래프란 주식가격의 폭등이나 폭락을 의미하는데, 투자자들을 정신적 공황상태로 몰아가는 나쁜 그래프가 된다.

마지막으로 영국 여성은 평생동안 2.9명의 남자와 섹스를 하는 반면 영국 남성은 여성파트너가 11명이나 된다. 이런 결과는 왜 나올까. 여성은 성문제와 관련해 내숭을 떨고 남자들은 자신의 남성성을 강조하기 때문이다. 양쪽 모두 축소했거나 부풀렸을 가능성이 있다. 책은 300페이지가 채 안 된다. 1만 1000원.

문소영기자 symun@seoul.co.kr
2009-06-20 17면
많이 본 뉴스
종부세 완화, 당신의 생각은?
정치권을 중심으로 종합부동산세 완화와 관련한 논쟁이 뜨겁습니다. 1가구 1주택·실거주자에 대한 종부세를 폐지해야 한다는 의견도 있습니다. 종부세 완화에 대한 당신의 생각은?
완화해야 한다
완화할 필요가 없다
모르겠다
광고삭제
위로