출판사 제공 책 소개
출판사 제공 책 소개
우리 모두를 위한 데이터 과학을 꿈꾸며 이 책은 '우리 모두를 위한 데이터 과학'을 이야기한다. 필자가 전달하고자 하는 주된 메시지는 우리 주변에 이미 데이터를 수집하고 분석할 수 있는 다양한 수단이 존재하며, 데이터를 활용하여 삶과 업무를 개선하는 일은 결코 복잡하지 않다는 것이다. 이 책은 초보적인 수준의 통계와 컴퓨터 지식을 갖춘 보통 사람이 데이터 과학을 시작할 수 있는 방법을 제시하고, 이런방법을 개인의 삶과 업무에 활용하는 다양한 사례를 소개한다. 비전문가도 책을 읽고 나서 활용할 수 있도록 엑셀을 사용한다. 따라서 이 책을 읽고 나면 개인 데이터, 생활 데이터 같은 스몰 데이터에 데이터 과학을 접목하여 분명 여러분도 자신의 문제를 해결할 수 있을 것이다. ★ 이 책이 말하는 데이터 과학이란? 흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 '이게 데이터 과학이야?'라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다. ★ 삶과 업무를 바꾸는 데이터 과학의 가능성 필자는 미국의 대학원에서 데이터 과학의 첨단을 대표하는 분야인 정보 검색을 전공하여 박사학위를 받고, 현재 미국 마이크로소프트 온라인 서비스 부문에서 데이터 과학자로 근무하고 있다. 이는 매일 수많은 종류의 데이터를 접하고, 이를 바탕으로 다양한 분석을 수행하는 일이다. 이런 경험은 앞에서 언급한 데이터 혁명의 위력과 파급효과를 그 최전선에서 느낄 수 있게 해주었다. 특히 필자가 담당하는 업무는 미국 검색 트래픽의 30%를 담당하는 빙(Bing.com) 서비스의 품질 측정 및 개선을 위한 데이터 셋과 지표를 만드는 일이다. 검색엔진 개발의 모든 프로세스는 정량적인 지표에 따라 계획, 실행 및 평가되기 때문에 이는 조직의 방향을 결정하는 일이라고 할 수 있다. 또한 업무의 일부로 사내에서 데이터 수집 및 분석에 대한 교육을 진행하면서 데이터를 업무에 제대로 활용하기 위해서는 많은 노하우가 필요하다는 사실을 깨달았다. 보통 데이터라고 하면 일에만 적용하는 것으로 생각하기 쉽다. 그렇지만 필자는 업무 이외의 영역에서도 데이터를 활용하는 방법을 항상 고민해왔다. 대학을 다닐 때부터 '내가 행복하다고 느끼는 시간의 양을 최대화하는 것'이 인생의 목표 중 하나라고 여겨왔던 필자는 개인의 행복도를 측정하고 개선할 수 있는 방법을 찾기 위해 약 10년간 다양한 방법을 개발하였다. 그리고 최근에는 생산성, 건강, 인간관계 등 삶의 다른 영역에서도 비슷한 접근을 시도하고 있다. 미국에는 이처럼 개인 데이터 분석에 관심을 갖는 사람들이 '수치화된 나(Quantified Self)'라는 지역별 커뮤니티를 만들어 활동하고 있다. 필자는 2011년부터 보스턴 및 시애틀의 Quantified Self에 활발히 참여하면서 데이터 분석을 통해 자신의 목표를 달성하고 심지어 삶을 바꾸는 여러 경우를 목격하였다. 필자의 행복 측정 프로젝트도 여러 사람의 관심을 끌어 최근에 지역 신문에서 기사화하기도 했다. 이처럼 일과 삶에서 데이터를 활용하는 방법을 고민하면서, 필자는 데이터 과학이 어떤 특정한 산업이나 직업군의 사람에게만 가능한 일은 아니라고 확신하게 되었다. 또한 자신의, 혹은 주변의 데이터를 모으고 분석하는 방법에 대한 사례와 노하우를 블로그, 기고문 등을 통해 공유하기 시작했다. 이런 글들이 여러 사람의 관심과 격려를 받기 시작하면서, 필자는 더 많은 사람에게 이런 메시지를 전달하기 위한 방법을 고민하기 시작했다. 이 책은 그런 고민의 산물이다. ★ 대상 독자 데이터 과학에 대해 책을 쓰겠다는 결심을 하고 서점을 둘러보았을 때, 기존 데이터 과학 관련 책들이 '이미 데이터 과학자이거나 관련 분야의 전공자인 사람'을 대상으로 하고 있다는 사실을 발견했다. 그래서 그 이외의 사람들을, 구체적으로 다음에 해당하는 독자들을 염두에 두고 이 책을 썼다. - 데이터 과학이 남의 이야기라고 생각하는 사람 : 1장은 왜 우리 모두가 데이터 과학에 관심을 가져야 하며, 데이터를 실제로 삶과 업무에 활용하는 것이 생각보다 어려운 일이 아님을 논하고 있다. 5장~6장에서 데이터 과학의 다양한 활용 사례를 찾을 수도 있을 것이다. - 데이터 과학에 관심만 있는 사람 : 데이터 활용에 관심이 있었지만 어디서 시작할지 막막했던 사람이라면, 2장~4장에서 구체적인 방법과 따라 할 수 있는 예제를 찾을 수 있을 것이다. - 데이터 과학을 더 잘 활용하고 싶은 사람 : 데이터 과학을 이미 어느 정도 활용하고 있는 사람이라면, 2장~4장의 방법론을 복습하고, 5장~6장의 사례를 살펴보도록 하자. - 앞으로 데이터 과학자가 되려는 사람 : 데이터 과학자로서의 커리어에 관심이 있는 사람이라면, 앞 부분을 꼼꼼히 살펴본 후 7장에서 소개하는 다양한 자료를 참고하도록 하자. - 데이터 과학자와 함께 일하려는 사람 : 직접 데이터 관련 업무를 담당하지 않더라도 데이터 과학자 및 분석가와 함께 일하는 독자들에게 이 책의 내용은 데이터 과학자 혹은 분석가의 세계를 이해하고 그들과 함께 일하는 데 도움이 될 것이다.