‘통계에 꼭 필요한 수학’만 골라
쉽고 빠르게 설명해주는 신개념 수학책
이 책은 중고등학교 때 배웠던 수학 중에서 통계를 이해하고 활용하는 데 꼭 필요한 수학 내용만을 추려서 이론뿐만 아니라 계산 방법까지 자세히 설명하고 있다. 독자는 이 책을 통해서 그동안 배웠던 나눗셈의 개념, 시그마, 적분, 극한 등을 왜 학교에서 강조하며 배웠는지, 그에 대한 답을 찾을 수 있다. 그것은 바로 방대한 데이터를 모아 인간의 행동 뒤에 숨은 법칙을 찾아내 최고의 비즈니스 결정을 내리도록 도와주는 최강의 학문인 통계 기법이 몇 천 년 이상 동안 수학자들이 축적해온 이 모든 수학적 배경과 계산을 통해 나왔기 때문이다.
빅데이터 열풍과 함께 그 중요성이 더욱 강조된 통계의 이해와 활용 능력은 사회・자연 과학 연구자들뿐 아니라 모든 비즈니스맨도 필수적으로 갖춰야 하는 기본 자질이 되었다. 그러나 아직까지 많은 사람이 통계를 어려워하고, 통계 기법의 기본이 되는 수학을 잘 몰라서 자신 있게 통계를 활용하지 못하고 있다. 이 말은 뒤집어 이야기하면 수학만 알면 통계가 어렵지 않다는 의미가 된다.
통계의 기본 개념인 유의수준, 상관계수, 표준편차, 기댓값, 확률변수, 산포도, 대푯값, 데이터의 분포 상태, 이항분포 등이 어떤 수학적 의미를 갖고 있는지, 통계를 제대로 이해하고 활용하기 위한 첫걸음이 무엇인지 알고 싶은 사람이라면 이 책이 큰 도움이 될 것이다.
출간 의의 및 특징
이 책은 일본 경제・경영 부문 베스트셀러 1위에 오른《빅데이터를 지배하는 통계의 힘》의 인기와 함께 ‘통계 수학책’에 대한 요구에 의하여 기획되었다. 《통계가 빨라지는 수학력》의 저자 나가노 히로유키는 한국에서도 독자에게 극찬을 받은《수학력》의 작가이자 수학을 잘 가르치기로 유명한 도쿄 대학교 출신의 인기 강사로서, 수많은 직장인이 통계에 필요한 수학을 배우기 위해 그가 운영하는 나가노수학학원에 줄을 선다고 한다.
책을 펼치면 수학 공식만 쭉 나열되어 있는 듯 보여서 처음엔 어렵게 느껴지지만 다년 간의 강의 경험을 토대로 다양한 예제와 친근한 일러스트를 동원해 하나하나 쉽고 친절하게 짚어주어 직접 현장에서 생생하게 강의를 듣는 듯 완전히 몰두하게 된다. 또 어려운 개념이나 추가 설명이 필요할 때는 통계를 전공한 센슈 대학교의 오카다 겐스케 교수가 일러스트와 함께 등장해 보충 설명을 해주고 다시 방향을 잘 찾도록 길잡이 역할도 해준다.
이 책만의 가장 큰 장점은 각 장마다 앞쪽에 수학 설명을 한 다음에는 이것들이 통계에서 어떻게 응용되고 활용되는지 하나하나 연결해주었다는 점이다. 수학 따로, 통계 따로가 아니라 둘의 연관성을 알기 쉽게 설명해 ‘통계 초보자에게 꼭 필요한 수학개념’을 익힐 수 있는 책으로 완성되었다.
또한 수학은 책을 그냥 읽어서는 자신이 진짜 이해했는지 알 수 없는 법이기에, 각 장의 수학 설명이 끝날 때마다 직접 독자가 연필을 들고 문제를 풀어볼 수 있도록 연습문제까지 실었다.
내용 소개
1장 데이터 정리를 위한 기본 수학은 정규교육을 받은 일반적인 사회인이라면 누구나 알고 있을 아주 간단한 개념에서부터 시작된다. 그렇지만 쉽다고 절대 만만히 볼 수 없는 것이 평균, 나눗셈의 의미와 비율, 그래프 등의 기본 개념을 정확히 알아두지 않으면 통계에서 헷갈리기 쉽기 때문이다. 이들은 통계에서는 데이터와 변량, 히스토그램, 대푯값에 사용되어 설득력 있는 프레젠테이션 자료를 만들 수 있게 하거나 변형된 외부 자료에 속지 않도록 도와준다.
2장 데이터 분석을 위한 기본 수학에서는 제곱근과 다항식의 계산 등을 통해 통계에 꼭 필요한 분산, 표준편차, 편찻값이 어떤 과정을 통해 구해지며 기본 식 안에 든 개념은 무엇인지 자세히 설명한다. 정규분포에서 모든 데이터의 약 70%(68.26%)가 표준편차 1개 분 안에 들어간다는 것의 의미를 수학적으로, 통계적으로 정확히 파악할 수 있다.
3장 상관관계를 알기 위한 수학에서부터는 수식이 조금 많아진다. 1차・2차함수와 그래프, 판별식, 부등식을 공부하고 산포도뿐 아니라 상관계수의 이론적 배경과 직관적 이해도를 높인다.
4장 흩어져 있는 데이터 분석을 위한 수학은 이 책의 하이라이트 부분에 해당한다. 경우의 수, 확률, 시그마 계산을 통해 확률변수와 확률분포, 기댓값, 이항분포 등을 알아본다.
5장 연속 데이터 분석을 위한 수학에서는 드디어 극한, 네이피어수와 적분 등이 나온다. 이를 통해 정규분포가 어떻게 계산되었는지, 왜 세상의 많은 일이 데이터를 계속 쌓아나가면 정규분포를 이루게 되는지 알게 된다. 또 추론통계의 맛보기로 추정과 검정 방법을 예제를 통해 설명한다.
난이도와 연관성에 따라 각 장을 구성했는데 현대 젊은이들이 반드시 배워야 할 통계는 3장까지 모두 정리했고, 4장부터 5장은 심화단계로서, 이산형 데이터의 확률분포와 연속형 데이터의 확률밀도함수 등을 이해할 수 있도록 구성하였다. 즉 수집한 데이터에서 필요한 정보를 읽어내는 기술통계를 총괄하고 부분적인 데이터로 전체를 예측하는 추론통계의 시작 단계까지 안내자 역할을 하고 있는 것이다.