【 벌거벗은 통계 】
‘당신은 대통령 탄핵에 찬성하는가.’ 와 ‘대통령은 상원조사위원회에 출두해야 하는가?’ 는 똑같은 의미였다. 그러나 이 중 ‘워터게이트 사건’의 당사자 닉슨 전 대통령을 불명예 퇴진시킨 질문은 후자였다.미국의 여론조사 기관인 갤럽이 미국인들에게 첫 번째 질문을 던지자, 대부분의 국민들이 반대했다. ‘면죄부’를 받은 듯 닉슨 대통령은 이 설문조사 결과를 수개월 동안 기자들 코앞에서 깃발처럼 흔들었다.
그러나 처음 질문에는 결정적인 하자가 있었다. 대부분의 미국 국민이 ‘탄핵(Impeachment)’이란 단어를 몰랐다는 것. 그래서 갤럽은 질문을 바꿔 다시 여론조사를 했다. 그 뜻은 첫 번째 질문과 완전히 똑같았지만 왠지 처벌수위가 완화된 느낌이었다. 대다수의 국민들은 찬성했고, 미국 의회는 탄핵 절차에 들어갔다. 두 번째 질문이 닉슨 대통령의 자발적 사임을 이끌어 낸 역사적인 질문이었다.
●데이터 분식·데이터 성형수술 등 통계의 이면
![](https://img.seoul.co.kr/img/upload/2009/06/19/SSI_20090619173416.jpg)
![](https://img.seoul.co.kr//img/upload/2009/06/19/SSI_20090619173416.jpg)
사실 통계는 믿을 수 없다는 것이 현대인의 상식이다. 영국 수상을 지낸 벤저민 디즈레일리가 오죽하면 “거짓말은 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계”라고 말했을까. 그러나 이 새빨간 거짓말보다 더한 거짓말인 통계가 경제뿐 아니라 정치, 사회, 문화 등 온갖 곳에서 널리 사용되고 있다. 통계를 믿을 수 없다고 평소 신념으로 가지고 있던 독자라도 신문에 실린 주식폭등 그래프를 보고 쌈짓돈을 만지작거리고, 유권자들은 사표(死票)방지 심리 때문에 여론조사에서 당선권으로 나타난 정당후보에게 투표를 하게 된다. ‘1인당 국민소득이 2만달러’라는 산술평균값에 현혹돼 주위의 가난한 사람들을 놓치게 된다.
통계는 복잡한 계산이나 숫자들을 피해 빠르고 쉽게 본질에 접근하기 위해 고안된 학문인데 통계 때문에 헷갈리고 조작의 피해를 당한다면 억울하지 않겠는가. 게다가 통계를 활용하는 정부나 기업, 광고주들은 분식회계와 맞먹는 수준으로 ‘데이터 분식’행위를 하고, ‘데이터 성형수술’도 서슴지 않기 때문에 ‘실체적 진실’에 접근할 수 있는 길은 좁고도 험하다. 특히 좌파, 우파, 중도파 모두 선의의 목적을 위해 통계가 조작될 수 있다는 식으로 생각하는 것도 인식의 걸림돌이다.
이럴 때 15장으로 구성된 ‘벌거벗은 통계’가 길이요, 생명줄이 되는 것이다. 몇가지 사례를 보여주겠다.
성경에서 아담은 930살, 그의 아들 셋은 912살까지 살았다고 써 있다. 믿을 수 있을까. 저자는 이것이 ‘정교한 수치가 진실’이라는 환상 때문에 또한 ‘두루뭉술하면 성의없다고 느낄 것’이라는 우려가 겹쳐져 나타난 숫자라고 설명한다. 심지어 영국의 신학자는 천지창조의 시점을 ‘기원전 4004년 10월21일 일요일 오전 9시’라고 정밀하게 계산해냈는데, 요즘 이것을 진실이라고 믿는 사람이 있을까. 레슨1. 너무 구체적이고 정교한 숫자는 믿지 말라.
농부 1명이 소 40마리를 가지고 있고, 농부 9명은 소 ‘0마리’를 가지고 있다면 농부들은 몇마리의 소를 가지고 있는가. 통계에서 나타나는 최빈값은 ‘0마리’이고 중간값도 ‘0마리’인데, 산술평균은 4마리나 된다. 산술평균 4마리는 흔히 인용되는 숫자인데, 이것은 의미있는 실체적 진실인가? 아니다. 산술평균은 심각한 불평등을 은폐시키는 도구로 악용될 수 있다. 1인당 국민소득의 규모로 전세계 국가를 줄세우기 하는 ‘국민 총생산의 신화’도 평균값의 함정에 해당한다. 레슨 2. 산술적 평균, 평균값의 함정에 빠져서는 안 된다.
●가파른 그래프에 현혹되지 말아라
표본조사가 잘못될 경우 통계 자체가 완전히 틀릴 수 있다. 1936년 미국 대통령 선거에서 ‘리터러리 다이제스트’는 1000만명, 갤럽은 단지 5만명의 표본으로 조사해 다이제스트는 공화당 후보가, 갤럽은 민주당 후보가 당선될 것을 예측했다. 결과는 갤럽의 승리였고, ‘뉴딜’로 유명한 루스벨트가 대통령이 됐다. 다이제스트의 표본은 일반인들이 아니라, 정기구독자들로, 자동차, 사교클럽 소속들이었다.
그래프를 볼 때 가파른 화살표나 등락만 살펴보지 말고, 가로축과 세로축의 단위를 살펴볼 필요가 있다. 그래프의 세로축이 ‘0’부터 시작된 것인지 아니면 뚝 잘라내서 가파른 기울기를 의도적으로 만들어낸 것인지를 살펴봐야 한다. 가로축도 마찬가지다. 가로축이 좁을수록 그래프는 가파르게 된다. 특히 주식시장에서 가파른 그래프란 주식가격의 폭등이나 폭락을 의미하는데, 투자자들을 정신적 공황상태로 몰아가는 나쁜 그래프가 된다.
마지막으로 영국 여성은 평생동안 2.9명의 남자와 섹스를 하는 반면 영국 남성은 여성파트너가 11명이나 된다. 이런 결과는 왜 나올까. 여성은 성문제와 관련해 내숭을 떨고 남자들은 자신의 남성성을 강조하기 때문이다. 양쪽 모두 축소했거나 부풀렸을 가능성이 있다. 책은 300페이지가 채 안 된다. 1만 1000원.
문소영기자 symun@seoul.co.kr
2009-06-20 17면