이 책은 독자들이 간단명료하게 데이터 분석 이론을 습득하고, 오픈 소스 기반이면서 강력한 그래픽 기능을 지원하는 R을 이용하여 실무에서 접할 수 있는 데이터 분석 실습을 할 수 있도록 구성하였습니다. 이 책의 명령어들을 하나씩 입력하면서 예제를 통해 어떤 기법을 사용해야 하는지 익힐 수 있으며, 명령어 옆에 있는 설명과 ‘명령어 정리’를 참고하여 R과 데이터 분석을 이해하고 다양한 상황에 응용할 수 있습니다. 이 책은 분명 중간에 포기하지 않고 재미있게 다양한 분석 기법을 익히도록 도울 것입니다.
데이터 분석 방법을 스스로 깨우친다!
이 책이 다른 책과 다른 점은 원리나 공식을 나열하기보다 언제 어떤 기법을 써서 어떤 결과를 얻을 수 있는지 익힐 수 있도록 구성한 것입니다. 마치, 우리가 운전을 하면서도 엔진 구성이나 타이어의 원리를 모르는 것과 같이 원리나 공식을 암기하지 않더라도 데이터 분석을 자연스럽게 이해하고 응용하면서 각 기법의 의미와 원리, 활용 방향을 깨닫게 됩니다.
분석에 필요한 기술 전부를 익힌다!
데이터 분석 기초 이론부터 다양한 주요 분석 기법(회귀, 의사 결정 나무, 주성분, 연관 규칙, 군집, 시계열), 통계 및 전처리 분석 기법, 특수 상황에 대한 분석 기법(구조 방정식, 소셜 네트워크, 텍스트 마이닝) 등을 재미있게 익히면서 데이터를 분석하고, 데이터 사이 관계를 파악하여 숨은 의미와 유용한 정보를 찾을 수 있습니다.
데이터 분석 전문가 자격증까지 대비한다!
이 책의 내용 대부분은 데이터 분석 전문가 자격증과 밀접하게 연관되어 있습니다. 시험의 주요 내용인 데이터에 대한 이해와 처리 기술에 대한 기본 지식, 시각화 방법을 다루기 때문에 데이터 분석을 익히는 동시에 데이터 분석 전문가(ADP, ADsP) 자격증까지 대비할 수 있습니다. 자격증에 대비하여 우수한 역량을 확보하세요.
200개 이상의 예제와 연습 문제, 복습을 위한 퀴즈 제공!
200개 이상의 실무 예제와 배운 내용을 바로 적용해 보고 생각해 볼 수 있는 연습 문제, 파트별 복습을 위한 퀴즈 등 다양한 구성 요소로 지루할 틈이 없으며, 다양한 방법으로 데이터 분석을 위한 사고를 키울 수 있도록 유도하여 자연스럽게 원리를 익히며 실력을 다질 수 있도록 구성하였습니다. 자기 주도 학습의 교재나 대학, 학원에서의 강의 교재로도 추천합니다.
지은이 조민호(chominhokr@jwu.ac.kr)
중원대학교 컴퓨터공학과 교수로 재직 중이며, 25년 이상 프로그램 개발 및 컨설팅 분야에서 실무를 수행하였다. 컴퓨터 응용 분야에 관심이 많으며 수많은 기업체에서 소프트웨어 모델링, 디자인 분야에 대해 강의하였다. 최근에는 소셜 네트워크, 머신러닝, 데이터 분석 분야에 대해 연구하고 있다.
주요 저서
〈그림으로 정리한 알고리즘과 자료구조[자바+파이썬](2018)〉
〈빅데이터 분석을 위한 R 프로그래밍(2016)〉
〈프로그래머가 알아야 할 1%의 핵심원리(2009)〉 공저
머리말
프롤로그
예제 소스 및 해설 다운로드
이 책의 구성
학습 가이드
PART 1 데이터 분석이란?
__CHAPTER 01 데이터의 개념
____01 데이터의 정의
____02 데이터의 유형
____03 데이터와 정보의 관계
__CHAPTER 02 데이터베이스와 데이터베이스 관리 시스템
____01 데이터베이스의 정의
____02 데이터베이스의 특징
____03 데이터베이스 적용 분야
____04 데이터베이스 관리 시스템(DBMS)
____05 데이터베이스 관리 시스템 종류
____06 CAP 정리
__CHAPTER 03 빅데이터 정의 및 분석 기법
____01 빅데이터의 정의
____02 빅데이터의 가치
____03 빅데이터가 만드는 변화
____04 빅데이터 분석을 위한 기법
____05 데이터 활용 진화 방향
____06 빅데이터 위기와 통제 방안
____07 빅데이터의 미래
__CHAPTER 04 데이터 사이언스
____01 데이터 사이언스의 정의
____02 데이터 사이언스 업무 범위
____03 데이터 사이언스 영역
____04 데이터 사이언스 관련 환경 분석
__CHAPTER 05 데이터 분석 및 기획
____01 데이터 분석 과정
____02 데이터 분석 과정 사례
____03 데이터 분석 기획의 정의
__CHAPTER 06 데이터 분석 방법론
____01 방법론의 구성 요소와 모델 및 진행
____02 데이터 분석 방법론
____03 KDD 분석 방법론
____04 CRISP-DM 분석 방법론
____05 빅데이터 분석 방법론
__CHAPTER 07 분석 과제 발견
____01 하향식 접근 방법
____02 상향식 접근 방법
____03 분석할 과제의 정의
____04 분석 프로젝트 관리 방안
____05 분석 프로젝트 추가 관리 대상
__CHAPTER 08 분석 마스터 플랜과 분석 거버먼트
____01 분석 마스터 플랜
____02 분석 거버넌스 체계
PART 2 R 기초 사용법
__CHAPTER 01 소개 및 환경 구성
____01 R 설치
____02 배치 모드 실행
____03 R 수행 조정 사항
__CHAPTER 02 기초 사용법
____01 R을 계산기처럼 사용
____02 변수 정의 및 사용
____03 데이터 세트 사용
____04 R에서 데이터를 파일에 저장하고 읽어 오기
__CHAPTER 03 데이터 타입
____01 R에서 사용하는 데이터 타입
____02 벡터 데이터 처리
____03 행렬 데이터 처리
____04 데이터 프레임 데이터 처리
____05 배열 데이터 처리
____06 리스트 데이터 처리
__CHAPTER 04 프로그래밍 기능
____01 R 프로그래밍 기능
____02 함수 선언과 사용
____03 함수 저장 및 활용
____04 조건문 사용
____05 반복문 사용
____06 사용자 입력받기
____07 메뉴 사용
____08 정규식 사용
__CHAPTER 05 데이터 조작 관련 명령어
____01 rbind, cbind 명령과 행렬 데이터 사용
____02 apply 계열 함수 사용
____03 summary, order, sample 명령 사용
____04 split, subset, with, merge 명령 사용
____05 which, aggregate 명령 사용
__CHAPTER 06 데이터 조작 관련 패키지 사용
____01 dplyr 패키지 사용
____02 sqldf 패키지 사용
____03 다른 패키지
PART 3 데이터 분석 및 전처리 기법
__CHAPTER 01 데이터 분석 전문가 필요 역량
__CHAPTER 02 데이터 분석의 유형
__CHAPTER 03 데이터 탐색 과정
____01 칼럼 사이 연관관계 파악하기
____02 정보 파악하기
____03 칼럼 사이 연관관계 분석하기
____04 종류별 분포 확인하기
____05 별도 패키지로 탐색하기
__CHAPTER 04 데이터 전처리 - 데이터 클렌징
____01 데이터 전처리
____02 데이터 확인
____03 데이터 형식 변경
____04 결측 값 처리
____05 이상 값 처리
____06 특성 조작
__CHAPTER 05 추가적인 데이터 전처리 기법
____01 데이터 정규화 ? 데이터 변형
____02 주성분 분석 ? 데이터 개수 축소
____03 summary, order, sample 명령 사용
____04 split, subset, with, merge 명령 사용
____05 which, aggregate 명령 사용
__CHAPTER 06 효과적인 분석을 위한 변수 제거 및 선택
____01 0에 가까운 분산을 가지는 변수 제거
____02 상관관계가 높은 변수 제거
____03 카이 제곱 검정을 통한 중요 변수 선발
PART 4 데이터 시각화 의미와 기법
__CHAPTER 01 데이터 시각화 의미
__CHAPTER 02 R 그래프 그리기 절차
__CHAPTER 03 R 그래프 전체 구성 결정
____01 split.screen으로 그래프 화면 전체 구성 결정
____02 par, mfrow로 그래프 화면 전체 구성 결정
__CHAPTER 04 다양한 R 그래프 옵션
__CHAPTER 05 R 그래프 그리기
____01 그래프에 사용할 데이터 확보하기
____02 확보된 데이터를 기반으로 기본 그래프 그리기
____03 x축과 y축 넣기
____04 그래프에 제목과 x, y축의 의미 설정하기
____05 def, ghi 데이터를 그래프에 추가하기
__CHAPTER 06 기본 R 그래프 그리기
____01 막대 그래프 그리기
____02 막대 그래프 응용하기
____03 점 그래프 그리기
____04 히스토그램 그리기
____05 원 그래프 그리기
____06 3차원 파이 그래프 그리기
____07 박스 그래프 그리기
__CHAPTER 07 그래프 그리기의 부가적인 기능
____01 R의 그래픽 윈도우 조절법
____02 꺾은선 그래프 그리기
____03 선분, 화살표, 사각형, 문자열, 직선 그리기
____04 두 종류 그래프 조합하기
__CHAPTER 08 그래프 종류 소개
____01 Sunflowerplot 그래프
____02 Stars 그래프
____03 Persp, Contour 그래프
__CHAPTER 09 패키지로 그래프 그리기
____01 plot3D 패키지
____02 lattice 패키지
__CHAPTER 10 ggplot2 패키지로 그래프 그리기
____01 ggplot2 그래픽 그리기 - 12가지 사례
____02 ggplot2 그래프 응용 사례 ? 7가지 사례
____03 Iris 데이터로 ggplot2 그래프 제작 실습
__CHAPTER 11 데이터 시각화 방법 정리
____01 한 개의 변수가 연속형 데이터인 경우
____02 한 개의 변수가 범주형 데이터인 경우
____03 두 개 이상의 변수가 연속형 데이터인 경우
____04 두 개 이상의 변수가 범주형 데이터인 경우
PART 5 통계 분석
__CHAPTER 01 통계 분석 목적과 데이터 유형
____01 통계 분석을 수행하는 목적
____02 통계에서 사용하는 데이터 유형
__CHAPTER 02 표본 만들기 및 기초 통계량
____01 확률 분포 함수 의미와 종류
____02 난수 만들고 분포 함수 그리기
____03 표본 추출 방법
____04 통계 기본 - 기초 통계량
____05 분할표 작성
__CHAPTER 03 독립성 및 적합성 검정
____01 독립성 검정
____02 적합성 검정
__CHAPTER 04 통계 분석 종류
____01 통계 분석을 통해 알고자 하는 것
____02 통계 분석 방향과 구체적인 기법 정리
__CHAPTER 05 차이 검정
____01 t-test
____02 분산 분석
____03 부호 검정
____04 비율 검정
__CHAPTER 06 인과(상관) 관계 검정
____01 상관계수
____02 상관관계 분석
PART 6 데이터 마이닝
__CHAPTER 01 데이터 마이닝 정의와 사례
____01 데이터 분석 역사
____02 데이터 마이닝 정의
____03 데이터 마이닝 응용 분야
____04 데이터 마이닝 적용 사례
____05 데이터 마이닝 솔루션
____06 데이터 마이닝 수행을 위해 알아야 하는 분야
__CHAPTER 02 데이터 마이닝 학습 분류 및 분석 방법 정리
____01 지도 학습과 분석 방법
____02 자율 학습 또는 비지도 학습과 분석 방법
__CHAPTER 03 데이터 마이닝 추진 단계
PART 7 회귀 모델
__CHAPTER 01 선형 회귀 ? 단순 선형 회귀
__CHAPTER 02 선형 회귀 ? 중선형 회귀 및 적절한 변수 선택
__CHAPTER 03 비선형 회귀 ? 신경망 모델
____01 신경망이란?
____02 신경망 모델
__CHAPTER 04 커널 방법론
__CHAPTER 05 로지스틱 회귀
__CHAPTER 06 다항 로지스틱 회귀
PART 8 지도 학습
__CHAPTER 01 지도 학습
__CHAPTER 02 의사 결정 나무
____01 의사 결정 나무 알고리즘 종류
____02 CART 알고리즘
____03 조건부 추론 나무
__CHAPTER 03 앙상블
____01 앙상블의 정의
____02 앙상블에서 사용되는 기법
____03 배깅
____04 랜덤 포레스트
__CHAPTER 04 서포트 벡터 기계
____01 초평면
____02 분리 초평면
____03 최대 마진 분류기
____04 서포트 벡터 분류기
____05 서포트 벡터 머신
____06 서포트 벡터 머신 사용
__CHAPTER 05 베이지안 방법론
____01 베이지안 추론
____02 베이지안 추론을 이용한 예측 - 베이지안 방법론
PART 9 비지도 학습
__CHAPTER 01 군집 분석
____01 개요
____02 K 평균 군집법
____03 The K-Medoids 군집법
____04 계층적 군집법
____05 밀도 기반 군집법
__CHAPTER 02 차원 축소 기법
____01 차원을 줄이는 방법
____02 주성분 분석
____03 인자 분석
____04 독립 성분 분석
____05 다차원 척도법
PART 10 빅데이터에 적용되는 분석 기법
__CHAPTER 01 연관 규칙 분석
____01 연관 규칙 분석 정의
____02 연관 규칙 분석 적용 예
____03 연관 규칙 분석 실습
____04 순차 패턴 분석 개념과 분석 방법
__CHAPTER 02 판별 분석
____01 판별 분석 종류
____02 선형 판별 분석
____03 이차 판별 분석
__CHAPTER 03 시계열 분석
____01 시계열 분석
____02 시계열 데이터 생성
____03 시계열 데이터 분석 절차(ARIMA 기준)
____04 시계열 데이터 분해 단계
____05 시계열 데이터 변환 단계
____06 최적화된 파라미터 결정 단계
____07 모형 만들기와 예측 단계
____08 변환하지 않은 시계열 데이터 기반 예측
____09 시계열 데이터 군집화
PART 11 특수 분석
__CHAPTER 01 워드 클라우드
____01 워드 클라우드 제작 사례
____02 워드 클라우드를 만드는 프로그램 소개
____03 워드 클라우드 제작 실습
__CHAPTER 02 소셜 네트워크 분석
____01 소셜 네트워크 분석
____02 d3SimpleNetwork 패키지 사용
____03 igraph 패키지 사용
__CHAPTER 03 구조 방정식
____01 경로 분석 정의 및 분석 사례
____02 구조 방정식 모형 및 사례
에필로그
도판 목록
찾아보기
COPYRIGHT 2009 BY ㈜북큐브네트웍스 RIGHTS RESERVED. IF YOU HAVE ANY QUESTION OR COMMENTS.