예전에는 수박을 삼각형으로 조그맣게 잘라서 삼각형 부분이 잘 익었는가를 보고 구매 여부를 결정했다. 이때 요령 있는 수박 장수들은 아직 덜 익어서 맛이 없는 수박에서도 잘 익은 부분만을 골라서 보여주었다.

과일 상자에 든 과일을 살 때도 비슷하다. 과일 상자에서 맨 윗줄의 잘 익은 과일을 보고 샀으나 실망하는 경우가 가끔 있다. 상자의 밑의 부분에 안 좋은 과일을 깔아서 파는 비양심적인 과일 상인들이 있기 때문이다.

과일가게의 성공에 관한 책 ‘총각네 야채가게’를 보면 다음과 같은 구절이 있다. “과일을 사면 박스 밑바닥에는 썩고 상한 과일들이 깔려 있기도 했다. 팔지도 못하고 바로 갖다 버려야 할 때도 있었다. 그래서 이영석은 과일 박스를 뒤집어서 바닥에 있는 과일의 상태를 살폈다.”

■ 손님이 없는 점심에만

우리는 많은 경우에 일부만을 보고 유추하여 전체를 판단해야 한다. 수박을 반으로 쪼개어서 전체를 보는 것이 때로는 불가능하고 어렵기 때문이다. 여기에 필요한 기본가정은 일부와 전체가 동일하다는 것이다. 수박이 내부적으로 동일하지 않다면, 우리는 덜 익은 수박을 살 수 있다.

많은 경우, 우리가 관심이 있는 대상은 내부적으로 동일하지 않다.

동일하지 않는 대상들에 대해서 일부인 표본(Sample)만으로 전체를 파악해야 한다면, 표본을 선정하는 방법이 적절한 것인지에 대해 관심을 가져야 한다. 표본을 선정할 때 제일 좋은 방법은 ‘눈 감고’ 뽑는 것이다(‘눈 감고’를 통계학에서는 ‘임의로’ 또는 ‘랜덤하게(random)’라고 표현한다.).

눈을 감는다고 해서 꼭 공평한 것은 아닐 수 있다. 영화 〈친구〉에서 공사 수주를 위해 당첨 공을 ‘눈감고’ 뽑는 공사 입찰 장면을 상기해 보자. 추첨자의 눈은 감겨 있었지만, 손은 냉장고에서 얼린 차가운 ‘자신의 회사의’ 공을 찾아낼 수 있었다. 위의 과일 장수처럼 결과에 이해관계가 얽혀 있는 사람은 내부정보 또는 전문지식을 활용하여 표본을 자신에게 유리하게 선정함으로써 유리한 조사결과를 만들 수 있다.

예전에 어느 식당의 고객의 소리(VOCㆍ Voice of Customers) 조사과정에 참여한 적이 있다. 이 식당은 주차장이 협소하여 손님이 많은 주말 저녁에는 주차 관련 불만이 많으리라 짐작하였다.

그런데, 식당 이용 만족도 결과에서는 주중과 주말 간에 만족도가 별 차이가 없었다. 사실을 조사해 보니 주말에는 손님이 적은 점심시간에만 설문조사를 실시하고 있었다. 즉, 손님이 특히 많은 주말 저녁에는 만족도 조사를 실시하지 않고, 결과적으로 점심시간만이 주말을 대표하고 있었다.

담당자 개인 입장에서는 고객 만족도가 높은 시간에 설문조사를 하여 ‘좋은’ 만족도를 수집하는 것이 여러모로 유리하다.

그러나 이렇게 조사한다면 복잡한 주말 저녁 시간대에 대해서는 적절한 정보를 얻을 수 없게 되고, 결국 원래의 조사 목적인 서비스 품질 유지와 개선에는 도움이 되지 않는 정보만을 관리하는 헛수고를 하는 셈이 된다. 전체를 대표하지 못하는 표본은 정보를 왜곡하게 된다. 못 믿는 통계는 이럴 때 발생하게 된다.

■ 최제호/

서울대 자연과학대학 계산통계학과 졸업

서울대 자연과학대학 계산통계학과 통계학 석사 및 박사

<통계의 미학> 저자, (현) (주)디포커스 상무

<저작권자 ⓒ 한국아이닷컴, 무단전재 및 재배포 금지>


최제호