2024.04.16 (화)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

[송죽단상]빅데이터 시대에 통계로 무장하자

 

 

 

 

 

정확성과 신뢰성을 담보한 통계적 정보는 객관적인 판단을 주는 기준이 되며 정책적인 결정과 방향을 수립하는데 매우 중요한 정보적 자원이다. 그렇기 때문에 통계는 현재의 상황을 판단할 수 있는 정보를 제공할 수 있으며 미래를 예측할 수 있는 유용한 도구가 된다. 특히 총합적, 통합적, 유기적인 연계성을 가지고 인과관계를 기반으로 통계를 활용할 경우에 더욱 강력한 무기가 될 수 있다.

개인·기업·사회·국가의 중요한 의사결정이나 정책을 결정하고자 할 경우 정확성, 신뢰성, 시의 적절성을 기반으로 통계를 적용하고 있으며 정책의 집행과 평가에서도 통계가 적절하게 이용되어야 한다. 특히 4차산업 혁명 시대의 데이터가 실시간으로 과다하게 생성되는 상황에서 데이터의 추출과 분석, 해석, 판단, 결정의 과정인 통계적 기법의 적용이 매우 중요한 업무이며 기능이 되고 있다.

통계는 기술통계와 추측통계로 구분된다. 먼저 기술통계는 수집한 데이터를 요약·묘사하는 것을 말하며 추측 통계는 수집한 데이터를 바탕으로 추론 예측하는 통계기법을 말한다. 기술통계의 도구에는 비율, 평균과 편차, 4분 위수 등이 있다.

가장 익숙한 용어가 평균일 것이다. 우리는 재학 시 반평균으로 반의 등수 경험이 있을 것이다. 반평균은 반 학생전체의 중간값을 나타내어 상대적 반의 순위를 비교할 할 수 있지만 반 학생들의 성적 분포를 알려주지 못한다. 그래서 평균이 주는 정보를 보완하기 위해 집단의 분포를 나타내는 편차를 동시에 활용하곤 한다. 편차는 중간 값으로 부터 떨어진 정도를 나타내는 수치로 집단의 분포가 넓을수록 편차 값이 커지며 가까울수록 편차는 작아지고 분포는 좁아지게 된다.

이렇듯 각종 통계적 도구가 주는 정보를 활용하여 단일 지표가 주는 정보를 활용하기 보다는 유기적으로 연계하여 융합정보, 종합정보로 생산하여 분석하고 해석할 필요가 있다.

또한 추측통계는 대통령 선거의 예측, 경제성장에 대한 예측 등 모르는 것을 예측하고자 할 때 사용된다. 추측통계는 회귀분석, 검정, 추정과 같은 기법을 활용한다. 2012년 미국의 통계학자 Nate Silver는 미국 대선을 앞두고 오바마 대통령의 재선 승리를 예측했다. 놀라운 점은 그가 내놓은 예측이 실제 선거 득표 결과와 0.6%p 밖에 차이가 나지 않았다는 사실이다. 이러한 것이 가능했던 것은 추측 통계 분석 도구인 회귀분석 때문이었다.

앞에서 언급한 바대로 기술통계를 적절하게 활용하여 현재의 상황에 대한 객관적인 정보를 획득하고 미래를 예측하고 추정하기 위해 확률기반의 추측통계를 적용하면 현재 상황의 진단과 미래에 대한 추정으로 적절한 계획과 의사결정, 정책 등에 활용할 수 있다는 것이다.

그러나 통계는 제대로 사용하면 유용하지만, 이를 잘못 사용하면 사회적으로 커다란 재앙이 될 수 있다. 즉 해당 분야의 실상을 제대로 반영하지 못하는 부실한 통계를 근거로 대책들이 계획된 경우, 예측을 위한 통계 자료가 없거나 부족한 경우, 기존의 통계를 다른 의도를 가지고 오용 및 남용하여 통계가 적용된다면 그로 인한 폐해는 기업의 경우 고객에게 돌아가고 국가적으로는 모든 국민 전체에게 돌아갈 것이다. 그래서 통계를 알고 정확하고 적절하게 적용하여 활용해야 한다. 현재 통계청을 비롯한 국가, 기업, 학교 등 많은 조직에서 주기적으로 통계 정보를 생산하고 있다. 이를 기반으로 우리는 현재 상황 정보를 알고 계획과 정책을 결정하는데 활용하고 있다.

스웨덴 수학자 Andrejs Dunkels는 “통계로 거짓말하기는 쉬워도, 통계 없이 진실을 말하기는 어렵다”라고 말하였다. 통계의 중요성을 말하고 있음을 알 수 있다.

빅데이터 시대에는 데이터를 수집하고 가공하여 활용하는 위한 통계적 기술이 사회를 지배하게 될 것이고 통계로 무장한 인재가 사회의 핵심 인재로 부상할 것이다. 통계 역량을 강화하기 위해 지금부터 노력하자!

 









COVER STORY