파이썬 데이터 과학 통계 학습
파이썬으로 데이터 과학 완전 정복!
『파이썬 데이터 과학 통계 학습』에서는 데이터 과학 데이터 분석을 위한 가장 보편적인 프로그래밍 언어인 파이썬을 다룬다. 파이썬의 설치 방법과 기본적인 지식부터 차근차근 설명해나간다. 자료형, 변수, 예약어, 식별자, 리터럴 상수 등 파이썬의 기초부터 넘파이, 판다스, 사이파이, 사이킷런 등 자주 사용되는 라이브러리를 활용해 다양하면서도 심도 있는 데이터 분석을 진행한다.
『파이썬 데이터 과학 통계 학습』은 총 6개의 파트로 이루어져 있다. 파트 1, 2를 통해서는 데이터 과학을 위한 체계와 도구를 소개한다. 다음으로는 지도 학습과 비지도 학습을 다루어 통계 학습과 기계 학습의 공통 분야를 다룬다. 지도 학습은 파트 3의 회귀와 파트 4의 분류로, 비지도 학습은 파트 5의 그룹화와 파트 6의 차원 축소로 나뉜다. 종속 변수가 존재할 때 사용하는 데이터 분석 방법론인 지도 학습(분류, 회귀)과 종속 변수가 존재하지 않을 때 사용하는 분석 방법론인 그룹화, 차원 축소에 대한 학습을 통해 보다 정확하고 체계적인 통계분석 방법을 제시하고 있다. 두 저자는 독자의 이해를 돕기 위해 도표와 그림, 예제를 적극적으로 활용한다. 책으로 공부하면서 데이터 분석을 직접 실행해볼 수 있기에 더욱 효과적으로 학습할 수 있다. 데이터 분석 방법론을 활용 수단으로 사용하고 싶다면 이 책을 적극 활용하기 바란다.
IBM Cloud and Cognitive Software에서 엔지니어로 근무하고 있다. 연세대학교 정보대학원에서 비즈니스 빅데이터 분석 전공으로 석사 과정을 졸업했다. 이전에는 Airlines and Logistic industry에서 웹, 모바일, SAPERP 시스템 운영 및 다수의 프로젝트를 수행했다. 서울특별시 평생교육 진흥원 모두의학교에서 ‘SNS 프로그래밍’을 강의 했으며 『초보자를 위한 Node.js 200제(정보문화사, 2018)』를 집필했다.
PART 01 데이터 과학을 위한 체계
01 데이터 과학을 위한 기본 지식
02 데이터 과학의 프레임워크
PART 02 데이터 과학을 위한 파이썬
01 개발 환경
02 파이썬의 기초
03 파이썬의 자료형
04 파이썬의 제어문
05 파이썬의 함수
06 파이썬의 모듈
07 넘파이
08 판다스
PART 03 회귀
01 회귀
02 t-검정
03 분산 분석
04 상관 분석
05 선형 회귀분석
06 선형 회귀분석의 주요 이슈
07 모형 선택
PART 04 분류
01 분류의 종류
02 로지스틱 회귀
03 kNN
04 서포트 벡터 머신
05 의사결정나무
06 앙상블 기법
07 분류 모형의 평가와 비교
PART 05 그룹화
01 그룹화
02 군집 분석
PART 06 차원 축소
01 차원 축소
02 주성분 분석 방법론
03 부분최소제곱법