헬로 데이터 과학

김진영
352p
구매 가능한 곳
별점 그래프
평균3.5(40명)
평가하기
3.5
평균 별점
(40명)
흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 '이게 데이터 과학이야?'라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다.

[디아스포라영화제 개최]

단, 5일 간 인천에서 만나요!

디아스포라영화제 · AD

별점 그래프
평균3.5(40명)

[디아스포라영화제 개최]

단, 5일 간 인천에서 만나요!

디아스포라영화제 · AD

저자/역자

목차

1장 데이터 과학 입문 삶과 비즈니스를 바꾸는 데이터의 가능성 __의학을 보완하는 개인 데이터의 힘 : 마크 드랭숄트 __스타트업의 성장 신화를 뒷받침하는 데이터의 힘 : 에어비앤비 __이들은 데이터를 어떻게 활용했나 데이터 과학과 테이블 __데이터는 테이블이다 __데이터 과학은 테이블 놀이다 데이터 과학에 대한 오해와 진실 __스몰데이터로 시작하라 __단순한 도구와 기술로 시작하라 데이터 과학을 시작하는 방법 __데이터 마인드를 가져라 __데이터 습관을 길러라 __관련 지식과 기술을 익혀라 맺음말 2장 데이터 과학에 유용한 도구 데이터 과학을 위한 도구 선택하기 __처리 용량 및 속도 __지원 데이터형 및 프로그래밍 환경 __데이터 분석 및 시각화 기능 __문제 특성에 맞는 도구의 선택 __문제 해결 단계에 맞는 도구 선택 엑셀로 시작하는 데이터 과학 __코드가 아닌 데이터가 중심이다 __올인원 솔루션이다 __결과물을 쉽게 공유할 수 있다 언제부터 엑셀 대신 R을 사용해야 할까 __워크시트에서 변수로 __메뉴에서 함수로 __분석에서 예측으로 <실습> 엑셀의 기초 __데이터 불러오기 __데이터 준비하기 __데이터 분석 및 시각화하기 __데이터 집계하기 <실습> R 맛보기 __R 작업을 위한 환경 구축 __R의 기본 기능 __데이터 준비하기 __데이터 분석하기 맺음말 3장 문제 정의와 데이터 수집 및 준비 데이터 문제 정의하기 __데이터 문제 해결 단계 __데이터 분석 단계 <사례> 직원 만족도 개선을 위한 데이터 분석 __데이터 문제 정의하기 <사례> 넷플릭스 프라이즈 문제 정의 __유의사항 데이터 수집하기 __데이터 수집의 기본 __수집 방법 결정하기 <심화학습> 측정 기술 __어떤 대상도 측정할 수 있는가 __어떤 대상도 측정할 수 있는 방법 __수집 환경 결정하기 <심화학습> 실험 디자인 __무작위 디자인 __블록 디자인 __수집할 데이터양 결정하기 __데이터 품질 점검하기 __유의사항 __데이터 준비하기 __데이터 선택, 추가, 집계하기 <실습> 엑셀을 이용한 데이터 준비 맺음말 4장 데이터 분석과 스토리텔링 현상 이해하기 : 탐색적 데이터 분석 __탐색적 분석 단계 <사례> 엑셀로 해보는 탐색적 데이터 분석 __개별 속성 분석하기 __속성 간의 관계 분석하기 __유의사항 : 관점은 갖되 편견은 금물이다 현상 일반화하기 : 통계적 추론 __통계적 추론의 원리 __통계적 추론의 유형 <실습> 엑셀로 해보는 통계적 추론 __탐색적 데이터 분석 __데이터 가공하기 __통계적 추론 __유의사항 : 데이터에서 도출하는 결론의 가치와 한계 현상 예측하기 : 기계학습 __기계학습 유형 __기계학습 개념 __기계학습 절차 <사례> 스몰데이터로 해보는 기계학습 데이터 스토리텔링 __데이터 스토리텔링 방법 __효과적인 데이터 스토리텔링 원칙 <사례> FiveThirtyEight __서론 __본론 __결론 맺음말 5장 개인 데이터로 공부하는 데이터 과학 개인 데이터 활용으로 삶을 바꾸는 사람들 __개인 데이터 활용의 유형과 목표 __개인 데이터 활용 방법 <사례> 건강 및 식생활 지표화 __문제 정의하기 __건강 데이터화 및 개선하기 __식사 및 운동량 측정하기 __마치며 <사례> 정성적인 현상(행복) 지표화 __행복 측정 프로젝트 __행복을 측정하는 방법 __행복 측정의 결과 __마치며 개인 데이터 수집 및 분석 시작하기 __문제 탐색하기 __데이터 수집하기 __분석 및 결과 실천하기 __자신의 경험 공유하기 __마치며 맺음말 6장 공개 데이터로 공부하는 데이터 과학 공공 데이터를 통한 탐색적 분석 __문제 정의하기 __데이터 수집하기 __탐색적 데이터 분석 __유의사항 : 데이터를 검정하고 목표에 집중하라 경연 데이터를 통한 실전 예측 모델링 __경연 준비하기 : 나도 할 수 있을까 __캐글 참가자들의 성공 비결 __캐글 참여하기 : 타이타닉호 생존자 예측 비즈니스 성장을 위한 데이터 과학 <가상 사례> 식당 운영을 위한 데이터 과학 __식당 창업에 도전한 김 사장의 고민 __데이터 과학자인 조카의 조언 __메뉴의 변화가 매출에 미치는 영향 __고객의 만족도를 알아내는 방법은 무엇인가 __고객의 만족도를 알아내기 : 고객 행동 분석 __실험을 통한 신 메뉴 개발 __데이터 활용의 숨은 장벽들 __고객 유입의 단계별 데이터 활용 야구 통계를 통해 지표 개발 배우기 __야구 통계의 흐름 __야구 통계의 기초와 전통적인 지표들 __현대적인 야구 통계가 가져온 혁신 __마치며 맺음말 328 7장 입문을 넘어서 : 데이터 과학자의 길

출판사 제공 책 소개

우리 모두를 위한 데이터 과학을 꿈꾸며 이 책은 '우리 모두를 위한 데이터 과학'을 이야기한다. 필자가 전달하고자 하는 주된 메시지는 우리 주변에 이미 데이터를 수집하고 분석할 수 있는 다양한 수단이 존재하며, 데이터를 활용하여 삶과 업무를 개선하는 일은 결코 복잡하지 않다는 것이다. 이 책은 초보적인 수준의 통계와 컴퓨터 지식을 갖춘 보통 사람이 데이터 과학을 시작할 수 있는 방법을 제시하고, 이런방법을 개인의 삶과 업무에 활용하는 다양한 사례를 소개한다. 비전문가도 책을 읽고 나서 활용할 수 있도록 엑셀을 사용한다. 따라서 이 책을 읽고 나면 개인 데이터, 생활 데이터 같은 스몰 데이터에 데이터 과학을 접목하여 분명 여러분도 자신의 문제를 해결할 수 있을 것이다. ★ 이 책이 말하는 데이터 과학이란? 흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 '이게 데이터 과학이야?'라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다. ★ 삶과 업무를 바꾸는 데이터 과학의 가능성 필자는 미국의 대학원에서 데이터 과학의 첨단을 대표하는 분야인 정보 검색을 전공하여 박사학위를 받고, 현재 미국 마이크로소프트 온라인 서비스 부문에서 데이터 과학자로 근무하고 있다. 이는 매일 수많은 종류의 데이터를 접하고, 이를 바탕으로 다양한 분석을 수행하는 일이다. 이런 경험은 앞에서 언급한 데이터 혁명의 위력과 파급효과를 그 최전선에서 느낄 수 있게 해주었다. 특히 필자가 담당하는 업무는 미국 검색 트래픽의 30%를 담당하는 빙(Bing.com) 서비스의 품질 측정 및 개선을 위한 데이터 셋과 지표를 만드는 일이다. 검색엔진 개발의 모든 프로세스는 정량적인 지표에 따라 계획, 실행 및 평가되기 때문에 이는 조직의 방향을 결정하는 일이라고 할 수 있다. 또한 업무의 일부로 사내에서 데이터 수집 및 분석에 대한 교육을 진행하면서 데이터를 업무에 제대로 활용하기 위해서는 많은 노하우가 필요하다는 사실을 깨달았다. 보통 데이터라고 하면 일에만 적용하는 것으로 생각하기 쉽다. 그렇지만 필자는 업무 이외의 영역에서도 데이터를 활용하는 방법을 항상 고민해왔다. 대학을 다닐 때부터 '내가 행복하다고 느끼는 시간의 양을 최대화하는 것'이 인생의 목표 중 하나라고 여겨왔던 필자는 개인의 행복도를 측정하고 개선할 수 있는 방법을 찾기 위해 약 10년간 다양한 방법을 개발하였다. 그리고 최근에는 생산성, 건강, 인간관계 등 삶의 다른 영역에서도 비슷한 접근을 시도하고 있다. 미국에는 이처럼 개인 데이터 분석에 관심을 갖는 사람들이 '수치화된 나(Quantified Self)'라는 지역별 커뮤니티를 만들어 활동하고 있다. 필자는 2011년부터 보스턴 및 시애틀의 Quantified Self에 활발히 참여하면서 데이터 분석을 통해 자신의 목표를 달성하고 심지어 삶을 바꾸는 여러 경우를 목격하였다. 필자의 행복 측정 프로젝트도 여러 사람의 관심을 끌어 최근에 지역 신문에서 기사화하기도 했다. 이처럼 일과 삶에서 데이터를 활용하는 방법을 고민하면서, 필자는 데이터 과학이 어떤 특정한 산업이나 직업군의 사람에게만 가능한 일은 아니라고 확신하게 되었다. 또한 자신의, 혹은 주변의 데이터를 모으고 분석하는 방법에 대한 사례와 노하우를 블로그, 기고문 등을 통해 공유하기 시작했다. 이런 글들이 여러 사람의 관심과 격려를 받기 시작하면서, 필자는 더 많은 사람에게 이런 메시지를 전달하기 위한 방법을 고민하기 시작했다. 이 책은 그런 고민의 산물이다. ★ 대상 독자 데이터 과학에 대해 책을 쓰겠다는 결심을 하고 서점을 둘러보았을 때, 기존 데이터 과학 관련 책들이 '이미 데이터 과학자이거나 관련 분야의 전공자인 사람'을 대상으로 하고 있다는 사실을 발견했다. 그래서 그 이외의 사람들을, 구체적으로 다음에 해당하는 독자들을 염두에 두고 이 책을 썼다. - 데이터 과학이 남의 이야기라고 생각하는 사람 : 1장은 왜 우리 모두가 데이터 과학에 관심을 가져야 하며, 데이터를 실제로 삶과 업무에 활용하는 것이 생각보다 어려운 일이 아님을 논하고 있다. 5장~6장에서 데이터 과학의 다양한 활용 사례를 찾을 수도 있을 것이다. - 데이터 과학에 관심만 있는 사람 : 데이터 활용에 관심이 있었지만 어디서 시작할지 막막했던 사람이라면, 2장~4장에서 구체적인 방법과 따라 할 수 있는 예제를 찾을 수 있을 것이다. - 데이터 과학을 더 잘 활용하고 싶은 사람 : 데이터 과학을 이미 어느 정도 활용하고 있는 사람이라면, 2장~4장의 방법론을 복습하고, 5장~6장의 사례를 살펴보도록 하자. - 앞으로 데이터 과학자가 되려는 사람 : 데이터 과학자로서의 커리어에 관심이 있는 사람이라면, 앞 부분을 꼼꼼히 살펴본 후 7장에서 소개하는 다양한 자료를 참고하도록 하자. - 데이터 과학자와 함께 일하려는 사람 : 직접 데이터 관련 업무를 담당하지 않더라도 데이터 과학자 및 분석가와 함께 일하는 독자들에게 이 책의 내용은 데이터 과학자 혹은 분석가의 세계를 이해하고 그들과 함께 일하는 데 도움이 될 것이다.

이 작품이 담긴 컬렉션

2
  • 데이터 출처
  • 서비스 이용약관
  • 개인정보 처리방침
  • 회사 안내
  • © 2024 by WATCHA, Inc. All rights reserved.