[의학통계를 시작하기전에 고려할 점들]

자료는 모았는데 통계를 몰라서 정리하지 못하였다는 변명을 종종 듣게 된다. 단순한 자료 입력이 아니라 연구를 위하여 자료를 모은다는 것은 어떠한 통계적 평가를 전제로 하는 것이다. 자료를 모으기 전에 최소한 자기 자료를 분석하기 위한 최소한의 통계적 기법에 대해서는 이해가 필요하다.

연구를 시작하는 단계에서부터 그 연구의 방법과 목적을 명확하게 설정하고 글로 기술하는 것이 좋다. 즉 자세한 연구 계획서를 작성한 후 연구를 시작해야 한다. 연구 계획서에는 당연히 통계적 분석에 대한 방안이 포함되어 있어야 한다. 이 과정을 통하여 분석이 용이한 방향으로 연구를 디자인하게 되고 결과를 정확하게 통계처리 할 수 있다.

의학도가 통계의 모든 것을 완벽히 이해할 수는 없는 노릇이다. 몇가지 기본적이고 중요한 개념을 확실하게 파악하도록 노력하는 것이 좋다. 적어도 변수의 분류, 모수적 방법과 비모수적 방법의 차이, 교란변수, censoring의 개념 정도는 확실하게 이해하도록 하자. 그렇더라도 결국에는 전문가의 도움을 필요로 하게 되는 경우가 많다. 이 경우 연구의 초기단계에서부터 자문을 받아 연구를 디자인하는 것이 유리하다. 통계에 대하여 어느 정도 아는 연구자들은 상당히 복잡한 연구도 통계전문가의 도움 없이 스스로 통계 package를 돌려서 자료분석을 마치는 수가 있다. 전문가들이 분석에 참여한 연구에서도 나중에 통계학적인 오류가 발견되는 수가 매우 많은데, 하물며 비전문가가 통계책과 program manual을 보면서 시행한 통계를 누가 믿을 수 있겠는가. 자신에게 필요한 통계기법에 대한 이해는 많으면 많을수록 좋다. 그러나 아주 기본적인 수준을 넘어서는 통계기법은 반드시 통계전문가에게 의뢰하는 것이 좋다.

간혹, 통계자문 없이 시작한 연구에서 나중에 통계전문가의 도움을 받아야 하는 경우가 있다. 이런 경우에는통계전문가의 자문을 얻기 전에 연구자 스스로 기술통계나 간단한 분석통계를 시행해 보는 것이 좋다. 보다 자세하고 전문적인 분석만을 요구해야 하며 [전부 알아서 해주십시요]식의 태도로는 훌륭한 결과를 얻기 어렵다. SPSS나 SAS같은 통계 package는 생각보다 비싸다. 간단한 통계는 Excel spreadsheet에서 제공하는 data analysis 기능을 이용하고 이 수준을 넘어서는 것은 전문가에게 의뢰하는 것도 좋은 방법이다. 즉 SPSS나 SAS를 몰라도 문제는 없는 것이다.

그림: Excel 2003의 통계 분석 화면

그림: GraphPad Prism 4 통계 분석 화면

SAS, SPSS와 같은 통계 package가 나온 후부터 통계처리 그 자체에는 거의 시간이 소요되지 않는다. 90%의 시간은 변수를 설정하고 데이타를 정리하는데 사용되므로 처음부터 통계에 적합하게 데이타를 입력하는 것이 매우 중요하다. 특히 다음의 몇가지 사항은 반드시 지키도록 하자.

발표한 자료는 항상 완벽한 화일로 만들어서 보관해 두기 바란다. 연구를 지속하거나 다른 사람의 연구와 비교할 때에 필요며 다른 연구자가 데이타를 요구하는 수도 있다. 최소한 10년은 보관하는 것을 원칙으로 하면 좋다.

[Home]