카테고리 없음

데이터가 보인다

shungru 2023. 4. 24. 15:25

요즘 출판사 마케터들은 책 제목을 정말 잘 짓는다. 표지 디자인도 마찬가지이고...이책은  2012년에 출간된 일본 원서를 번역한 책이다. .  2018년이 보름 남짓 남은 이시점에서 본 도서의 내용은 현재와 미래의 내용을전혀 반영하지 못하고 있으며  그냥 수학/통계 기본도서 같다는 생각이 단다.  그럼에도 불구하고 이 책이 지니는 가치는, 데이터 분석의 기초지식인 기하/조화/가중 평균, 정규분포, 표준편차, 상관관계와 회귀분석 등 기초 통계지식을 그림과 차트를 통해 잘 설명하고 있다는 점이다.  이책을 궁입하려는 독자는 최신 데이터 과학 기술과 소개에 대한 내용이 아닌,데이터 과학의 근간이 되는 통계와 수학적 내용을 중심으로 설명한 책이라는 점에 유의해야 할 것이다.    

요즘 IT 관련 매체뿐만 아니라 일반 미디어에서도「빅데이터」라는 말이 거론되고 있다. 빅데이터가 이 정도로 주목 받게 된 배경에는 이를 분석해서 얻어지는 새로운 지식, 그리고 이를 기반으로 고안된 새로운 서비스가 앞으로의 사회를 변화시키지 않을까라는 기대감 때문이다. 즉, 빅데이터가 분석되어 이제 갓 도움이 되고 있는 것이다. 특히 데이터 분석이나 데이터 분석 시스템의 내용에 대한 이해는 이미 일반적인 지식이 되어가고 있다. 이 책은 이러한 데이터 분석 방법과 분석 시스템의 기반기술을 일반인들도 이해할 수 있도록 자세히 설명하고 있다.

1장. 데이터 분석의 개요

1.1 데이터 분석의 개념
__데이터 분석이란 무엇인가?

1.2 데이터 분석 시스템의 구성 요소
__데이터 분석을 실현하는 다양한 IT 기술

2장. 데이터 분석의 기초 지식

2.1 기하평균
__기업의 성장성 분석

2.2 조화평균
__프로그램 개발 생산성 분석

2.3 가중평균
__주식의 기대수익률 분석

2.4 도수분포와 히스토그램
__점포 방문객수 분석

2.5 분산과 표준편차
__생산 리드타임 분석

2.6 정규분포와 표준정규분포
__재고의 발주점 계산

3장. 상관관계와 회귀 분석

3.1 산포도와 버블차트
__재고의 편향을 분석한다

3.2 상관계수
__추천상품을 분석한다

3.3 회귀 분석
__가격탄력성을 분석한다

3.4 결정계수
__앙케이트 결과에서 반복구매 고객을 찾는다

4장. 시계열 분석

4.1 Z 차트
__사업부별 매출경향을 분석한다

4.2 팬 차트
__성장률이 높은 상품을 분석한다

4.3 지수평활법
__재고 수요를 예측한다

4.4 이동평균법
__장래 유망한 사업 찾기

5장. 다차원 분석

5.1 다차원 분석
__매출전망을 확실도 관점에서 분석한다

5.2 RFM 분석
__고객을 그룹화해서 분석한다

5.3 세그먼트그룹별 손익분석
__기업의 업적을 다각적으로 분석한다

6장. 시뮬레이션

6.1 What-If 분석
__손익분기점을 시뮬레이션한다

6.2 선형 계획법
__매출을 최대로 하는 생산계획을 세운다

6.3 주성분 분석
__앙케이트 응답을 분류한다

7장. 데이터 마이닝

7.1 데이터 마이닝이란?
__손익분기점을 시뮬레이션한다

7.2 어소시에이션 룰
__동시에 발생하는 현상을 분석한다

7.3 시퀀스
__다음 행동을 예측한다

7.4 클러스터
__카테고리를 검출한다

7.5 디시전 트리
__주요한 영향원을 분석한다

8장. 비즈니스 인텔리전스

8.1 PDCA 사이클과 BI
__단계별로 다른 BI의 목적

8.2 PLAN 단계에서의 BI
__계획의 근거를 얻는다

8.3 DO 단계에서의 BI
__문제의 조짐을 발견한다

8.4 CHECK 단계에서의 BI
__문제의 요인을 검증한다

8.5 ACT 단계에서의 BI
__대처방안에 대한 힌트를 얻는다

8.6 마케팅 믹스와 BI
__앙케이트 분석에서 프로모션 효과 측정까지

9장. 데이터 웨어하우스

9.1 데이터 웨어하우스란?
__데이터 웨어하우스의 아키텍처

9.2 데이터 스테이징 영역
__ETL 처리를 수행하는 데이터 영역

9.3 스타 스키마
__데이터 웨어하우스의 표준 스키마

9.4 다차원 데이터베이스
__OLAP 툴의 기반 데이터베이스

10장. 데이터 분석의 미래

10.1 빅데이터란?
__보다 대량으로, 보다 실시간으로

10.2 빅데이터와 BI
__사람의 손을 거치지 않고 자동화되는 BI

10.3 Hadoop MapReduce
__빅데이터를 일괄적으로 고속 처리하는 구조

10.4 CEP
__빅데이터를 실시간으로 처리하는 구조

10.5 빅데이터와 데이터 웨어하우스
__빅데이터에 대응하는 3가지 접근방법

10.6 NoSQL 데이터베이스
__비관계형 데이터베이스

10.7 컬럼형 데이터베이스
__컬럼 단위 저장방식으로 고속 처리 실현

10.8 데이터 웨어하우스ㆍ어플라이언스
__하드웨어 레벨의 고속화 기술