이란에서는 최근 실시된 선거에서 정부 차원의 조직적인 부정이 있었다는 것을 항의하는 시위가 연일 벌어지고 있다. 워싱톤 포스트지는 최근 기사에서 이란 정부가 발표한 후보별 지역별 득표수를 분석한 결과, 이 숫자들이 정부에 의해서 조작된 것이 틀림없다고 지적했다. 그 내용을 요약하면 다음과 같다.
-
이란 정부는 4명 후보의 29개 지역별 득표수를 발표했는데 그 숫자는 모두 116개 (4*29) 이다. 이들 116개 숫자들의 끝자리 숫자를 보면 특이하게 ’7′이 많고 (17% ) ’5′가 적다 (4%). 공정하게 치뤄진 다른 나라의 선거 득표수를 보면 이들 숫자는 random의 형태를 보여서 ’0′에서 ’9′까지의 숫자가 골고루 (각각 평균 10% 정도) 나타난다. 하지만 이들 숫자를 사람이 머릿속에서 그냥 멋대로 만들어 냈을 경우에는 특정 숫자가 많이 나타난다. 이번 이란 정부가 발표한 득표수 처럼 특정 숫자가 17% 이상 나타나거나 4% 보다 적게 나타날 가능성은 통계적으로 4% 이하이다.
-
사람이 임의로 두자리 숫자를 만들어내는 경우에는 ’64′나 ’17′보다는 서로 인접한 ’23′이나 ’56′, ’89′ 등이 더 자주 만들어진다. 일반적으로 공정하게 치뤄진 선거 득표수의 끝자리와 두번째 자리(예를 들면, 득표수 14,579 에서 ’7′과 ’9′)에서 서로 인접한 숫자가 발생할 가능성은 30% 정도이다. 하지만 이란 정부가 이번에 발표한 후보별 지역별 득표수를 보면 마지막 끝자리 숫자와 끝에서 두번째 자리 숫자가 인접한 경우가 38%다. 30%와 38%가 별로 큰 차이가 아닌 것 같지만 통계적으로 이런 차이가 발생할 가능성은 4.2% 이하이다.
이란 정부가 발표한 지역별 후보별 득표수를 분석한 결과, 위 두 가지 특이한 사항이 발견되었는데, 이 두 가지를 복합적으로 고려하면 이번 이런 정부가 발표한 선거 결과가 누군가에 의해 만들어지지 않았을 (선거가 공정했을) 가능성은 0.5%에 불과하다.
많은 숫자들을 사람이 그냥 그럴듯하게 만들어내는 것은 쉬운 일이 아니다. 조사하면 다 나오게 되어 있다. 부정선거 의혹이 있었던 우리나라 과거 선거결과를 분석해보면 어떤 결과가 나올지 궁금해진다. 정부나 기업이 발표하는 통계자료들은?









기표용지 자체를 조작한 의혹이 있었던 부시-고어 미국 대선은 이런 통계자료를 바탕으로 조사할 순 없었겠지요?