통계학의 이해와 활용

고길곤
524p
Rate
이번 2판에서는 통계 결과를 정확히 해석할 수 있는 설명과 사례를 많이 추가하였다. 유의확률(p-value)을 해석할 때 주의점들이나, 동등성 검정을 통해 귀무가설이 타당한지를 검정하는 내용을 다룬 것은 통계적 가설검정에 대한 독자들의 이해를 높이기 위한 것이다. 또한, 다양한 통계해석의 오류 문제를 소개하면서 통계학이 실생활에서 잘못 활용되고 있는 사례들을 제시하고자 하였다.

Author/Translator

Description

제2판 서문 초판을 출간한 후 벌써 3년이 흘렀다. 기초 통계학이 급격히 바뀌는 것이 아니므로 굳이 2판을 준비할 필요가 있을까 생각도 했었다. 하지만 2판을 준비하게 된 가장 큰 이유는 통계학을 거짓말이라고 주장하는 사람이나, 인공지능 현상을 과장하면서 통계학을 지나치게 신뢰하는 사람이 늘고 있기 때문이다. 이번 2판에서는 통계 결과를 정확히 해석할 수 있는 설명과 사례를 많이 추가하였다. 유의확률(p-value)을 해석할 때 주의점들이나, 동등성 검정을 통해 귀무가설이 타당한지를 검정하는 내용을 다룬 것은 통계적 가설검정에 대한 독자들의 이해를 높이기 위한 것이다. 또한, 다양한 통계해석의 오류 문제를 소개하면서 통계학이 실생활에서 잘못 활용되고 있는 사례들을 제시하고자 하였다. 초판이 출간되고 나서 SAS 프로그램을 구할 수 없어 책에서 소개된 코드들을 분석하기 어렵다는 의견이 많았다. SAS 프로그램을 구매하기 어려운 독자들은 SAS University Edition이 2014년부터 무료로 제공되고 있고 SPSS 프로그램과 같이 메뉴식 작업도 가능하므로 이를 내려받아 활용하기를 권한다. 또한, SPSS 프로그램 사용자를 위해 『SPSS를 이용한 통계학의 이해와 활용』(문우사)을 출간하였으므로 이를 참고하여 공부하면 된다. R 프로그램 사용자들을 위해서는 교과서에서 사용한 분석을 수행할 수 있는 코드를 마련해 놓아, 독자들이 요청하면 제공할 예정이다. 이 책은 다양한 통계기법을 공부하고자 하는 학생들의 기초를 튼튼히 하기 위해 구상되었다. 초판에서 약속한 것처럼 저자는 자료처리 및 시각화, 범주형 자료분석, 다수준 및 패널 자료분석 책의 원고를 계속 쓰고 있다. 얼마 전에 출간한 『효율성 분석 이론』(문우사) 작업으로 인해 이 책들의 출간이 다소 늦어지고 있지만, 조속히 책을 출간하여 학생들이 기초부터 중급 통계학을 체계적으로 이해하는 데 조금이라도 이바지했으면 하는 바람이다. 2판에서는 초판에 있던 오탈자를 교정하였다. 저자의 수업을 들으며 오탈자를 찾아주고 여러 의견을 제시해준 서울대학교 행정대학원 학생들이 없었으면 불가능한 일이었다. 수강생들에게 감사의 말을 전하고 싶다. 2판 교정에는 초판 교정에서 고생하였던 조수연 박사가 다시 한 번 수고를 해주었다. 또한, 김대중 박사과정생은 R 코드를 준비해주었으며, 서울대학교 행정대학원 신가영 박사과정생도 개정을 위해 고생했다. 이들 모두에게 감사의 뜻을 표한다. 2판 개정 작업을 위해 고생해주신 문우사 김영훈 사장님과 김병성 과장님을 비롯한 문우사 직원분들에게도 감사의 말씀을 전하고자 한다. 저자가 책을 쓸 때마다 가장 크게 느끼는 것은 넓은 학문 세계를 이해하는 즐거움과 고통이다. 이 책의 부족함은 저자의 부지런함으로 메꾸어가고자 한다. 이 책에 대한 의견과 질문은 kilkon@gmail.com으로 보내주시면 성실히 답변드릴 것이다. 2017년 2월 서울대학교 관악 연구실에서 고길곤 적다 제1판 서문 통계학 책을 쓰겠다는 생각을 이야기했을 때 많은 지인들이 반신반의(半信半疑)했던 것으로 기억한다. 돌이켜 보면 학문의 수준이 일천한 저자가 통계학 개론서를 쓴다는 것은 무모한 일이었다. 그러나 무모한 일은 저질러졌고 두려운 마음을 가지고 이 졸고를 세상 밖으로 내보내게 되었다. 이 책은 크게 세 가지 관점에서 저술되었다. 첫째, 학생들이 통계논리를 체계적으로 이해해야 한다는 생각이다. 최근 프로그램 언어 사용에 익숙하지 않거나 수학을 싫어하는 학생이 많아지면서 통계학 개론서들이 직관적인 설명과 통계프로그램의 출력물 해석에 초점을 맞추고 있는 실정이다. 그 결과 우리나라 대학생들의 통계이론 이해수준이 점차 낮아져 기초 통계이론과 중급통계 이론 간의 간격이 너무 커지기 시작했다. 안타깝게도 각종 고급통계분석 기법을 논문에 사용하면서도 확률변수가 무엇인지조차 이해를 못하는 학생들이 나오고 있다. 저자는 통계학의 기본 논리를 충실히 소개하여 향후 학생들이 중급 이상의 통계학을 이해하는 데 도움이 될 수 있도록 이 책을 준비하였다. 그 결과 많은 분들의 만류에도 불구하고 부담스러운 수식을 이 책에 포함하게 되었다. 하지만 수식의 의미를 충실히 이해하려고 노력한다면 통계이론을 명확히 이해하는 데 큰 도움이 될 것으로 저자는 믿는다. 둘째, 이 책은 통계학이 자료의 요약과 정리, 그리고 변수와 변수간의 관계 분석을 위한 수단이라는 관점에서 통계논리를 서술하였다. 자료의 요약과 정리는 PART I에서, 기술통계분석과 모집단 특성치에 대한 추정과 가설검정은 PART II에서 주로 논의되었다. 마지막으로 PART III에서는 간단한 두 변수 간의 관계를 설명하는 범주형 변수 분석, 상관분석, 분산분석을 다룬 후 여러 변수의 관계를 종합적으로 분석할 수 있는 회귀분석에 대한 설명을 제시하였다. 변수 간의 관계 분석에서 핵심 쟁점이 되는 것은 인과관계 분석이다. 특히 PART III에서는 원인과 결과 간의 상관관계뿐 아니라 제3의 변수의 영향을 통제한 후 인과관계를 설명하기 위한 통계분석 방법을 함께 다루었다. 셋째, 통계프로그램 활용 능력의 증진이다. 통계이론에 대한 기초가 충분히 갖추어지면 통계프로그램을 이용한 자료 분석은 어렵지 않다. 저자는 SAS가 기초부터 고급통계를 공부하는 학생들에게 적절한 프로그램이라고 생각하고 있다. 학생들이 이론들을 프로그램을 이용하여 검증할 수 있도록 책에 나온 각종 분석과 그림을 그리기 위해 사용한 SAS코드를 제공하였다. 독자들은 이 책에서 사용한 프로그램 예제들을 활용하여 SAS 프로그램의 기초를 다질 수 있을 것이다. 한편 SPSS를 사용하는 독자들을 위한 별도의 통계프로그램 설명서를 곧 출간한 예정이다. 본서의 학부 및 대학원 석사 수준에서 한 학기동안 강의할 수 있도록 14장으로 구성하였다. 하지만 일부는 학부 학생이 이해하기 쉽지 않은 내용을 담고 있다. 학부생 수준을 넘는 내용의 경우에는 각주에 이를 명기하였다. 본서가 나오기까지는 여러분들의 도움이 컸다. 주말에도 학교에 나가 일을 해야 되는 남편과 아빠를 이해해 준 아내 강금화, 딸 희경, 그리고 아들 석찬이 없었다면 이 책이 나오는 것은 불가능했다. 부족하나마 이 책으로 감사의 마음을 전하고자 한다. 또한 부족한 제자에게 계량분석의 세계를 가르쳐주시고 격려해주신 서울대 행정대학원 노화준, 김병섭, 최종원, 김동욱, 김준기 교수님을 비롯한 여러 은사님들께 깊이 감사를 드린다. KDI에 근무하면서 연구자의 자세를 배울 수 있게 해 주신 KDI의 김재형 박사님과, 서울 시립대의 박현 교수님께도 감사의 뜻을 표하고자 한다. 또한 박사과정에서 항상 지적인 자극을 주시며 격려해주시던 John Mendeloff 교수님과 Louise Comfort 교수님에게도 감사의 뜻을 전하고자 한다. 이 밖에도 많은 선후배 교수님들의 도움이 없었으면 이 책이 나오기는 어려웠을 것이다. 본서의 교정에 큰 도움을 주신 분들께도 감사의 뜻을 표하고자 한다. 먼저 본서를 처음부터 끝까지 읽고 총평을 해준 연세대학교 의학통계학과의 송기준 교수에게 깊은 감사를 드린다. 한국행정연구원의 김성근 박사 역시 본서에 대한 유익한 논평을 해주었다. 서울대 행정대학원 박사과정 조수연, 탁현우, 김대중 학생은 바쁜 와중에도 헌신적으로 원고 교정을 도와주었다. 이들의 도움이 없었다면 이 책의 출간에는 더 많은 시간이 걸렸을 것이다. 또한 원고 오탈자 수정에 큰 도움을 준 연구실의 강세진, 이보라, 김지윤, 이주현, 허민녕, 김현오 학생에게도 감사의 뜻을 표하고자 한다. 수업을 들으며 질문과 제안을 해준 서울대학교 행정대학원 학생들에게도 깊은 고마움을 표하고 싶다. 마지막으로 출판을 흔쾌히 동의해주신 문우사의 김영훈 사장님과 세심한 부분까지 살펴봐주신 김병성 과장님, 그리고 원고의 조판·편집·교정을 맡아주신 우일미디어 직원들에게도 감사의 뜻을 전하고 싶다. 여러