데이터가 보인다
요즘 출판사 마케터들은 책 제목을 정말 잘 짓는다. 표지 디자인도 마찬가지이고...이책은 2012년에 출간된 일본 원서를 번역한 책이다. . 2018년이 보름 남짓 남은 이시점에서 본 도서의 내용은 현재와 미래의 내용을전혀 반영하지 못하고 있으며 그냥 수학/통계 기본도서 같다는 생각이 단다. 그럼에도 불구하고 이 책이 지니는 가치는, 데이터 분석의 기초지식인 기하/조화/가중 평균, 정규분포, 표준편차, 상관관계와 회귀분석 등 기초 통계지식을 그림과 차트를 통해 잘 설명하고 있다는 점이다. 이책을 궁입하려는 독자는 최신 데이터 과학 기술과 소개에 대한 내용이 아닌,데이터 과학의 근간이 되는 통계와 수학적 내용을 중심으로 설명한 책이라는 점에 유의해야 할 것이다.
요즘 IT 관련 매체뿐만 아니라 일반 미디어에서도「빅데이터」라는 말이 거론되고 있다. 빅데이터가 이 정도로 주목 받게 된 배경에는 이를 분석해서 얻어지는 새로운 지식, 그리고 이를 기반으로 고안된 새로운 서비스가 앞으로의 사회를 변화시키지 않을까라는 기대감 때문이다. 즉, 빅데이터가 분석되어 이제 갓 도움이 되고 있는 것이다. 특히 데이터 분석이나 데이터 분석 시스템의 내용에 대한 이해는 이미 일반적인 지식이 되어가고 있다. 이 책은 이러한 데이터 분석 방법과 분석 시스템의 기반기술을 일반인들도 이해할 수 있도록 자세히 설명하고 있다.
1장. 데이터 분석의 개요
1.1 데이터 분석의 개념
__데이터 분석이란 무엇인가?
1.2 데이터 분석 시스템의 구성 요소
__데이터 분석을 실현하는 다양한 IT 기술
2장. 데이터 분석의 기초 지식
2.1 기하평균
__기업의 성장성 분석
2.2 조화평균
__프로그램 개발 생산성 분석
2.3 가중평균
__주식의 기대수익률 분석
2.4 도수분포와 히스토그램
__점포 방문객수 분석
2.5 분산과 표준편차
__생산 리드타임 분석
2.6 정규분포와 표준정규분포
__재고의 발주점 계산
3장. 상관관계와 회귀 분석
3.1 산포도와 버블차트
__재고의 편향을 분석한다
3.2 상관계수
__추천상품을 분석한다
3.3 회귀 분석
__가격탄력성을 분석한다
3.4 결정계수
__앙케이트 결과에서 반복구매 고객을 찾는다
4장. 시계열 분석
4.1 Z 차트
__사업부별 매출경향을 분석한다
4.2 팬 차트
__성장률이 높은 상품을 분석한다
4.3 지수평활법
__재고 수요를 예측한다
4.4 이동평균법
__장래 유망한 사업 찾기
5장. 다차원 분석
5.1 다차원 분석
__매출전망을 확실도 관점에서 분석한다
5.2 RFM 분석
__고객을 그룹화해서 분석한다
5.3 세그먼트그룹별 손익분석
__기업의 업적을 다각적으로 분석한다
6장. 시뮬레이션
6.1 What-If 분석
__손익분기점을 시뮬레이션한다
6.2 선형 계획법
__매출을 최대로 하는 생산계획을 세운다
6.3 주성분 분석
__앙케이트 응답을 분류한다
7장. 데이터 마이닝
7.1 데이터 마이닝이란?
__손익분기점을 시뮬레이션한다
7.2 어소시에이션 룰
__동시에 발생하는 현상을 분석한다
7.3 시퀀스
__다음 행동을 예측한다
7.4 클러스터
__카테고리를 검출한다
7.5 디시전 트리
__주요한 영향원을 분석한다
8장. 비즈니스 인텔리전스
8.1 PDCA 사이클과 BI
__단계별로 다른 BI의 목적
8.2 PLAN 단계에서의 BI
__계획의 근거를 얻는다
8.3 DO 단계에서의 BI
__문제의 조짐을 발견한다
8.4 CHECK 단계에서의 BI
__문제의 요인을 검증한다
8.5 ACT 단계에서의 BI
__대처방안에 대한 힌트를 얻는다
8.6 마케팅 믹스와 BI
__앙케이트 분석에서 프로모션 효과 측정까지
9장. 데이터 웨어하우스
9.1 데이터 웨어하우스란?
__데이터 웨어하우스의 아키텍처
9.2 데이터 스테이징 영역
__ETL 처리를 수행하는 데이터 영역
9.3 스타 스키마
__데이터 웨어하우스의 표준 스키마
9.4 다차원 데이터베이스
__OLAP 툴의 기반 데이터베이스
10장. 데이터 분석의 미래
10.1 빅데이터란?
__보다 대량으로, 보다 실시간으로
10.2 빅데이터와 BI
__사람의 손을 거치지 않고 자동화되는 BI
10.3 Hadoop MapReduce
__빅데이터를 일괄적으로 고속 처리하는 구조
10.4 CEP
__빅데이터를 실시간으로 처리하는 구조
10.5 빅데이터와 데이터 웨어하우스
__빅데이터에 대응하는 3가지 접근방법
10.6 NoSQL 데이터베이스
__비관계형 데이터베이스
10.7 컬럼형 데이터베이스
__컬럼 단위 저장방식으로 고속 처리 실현
10.8 데이터 웨어하우스ㆍ어플라이언스
__하드웨어 레벨의 고속화 기술