
파이썬 통계학 기초
Description
책소개
『파이썬 통계학 기초』는 통계학의 중요한 주제들에 대한 개념을 설명하고, 예제를 통한 적용방법과 수행절차를 파이썬 풀이를 통해 학습할 수 있도록 단계별 해설을 제공한다.
목차
1.
통계학과 파이썬
1.1 통계학과 데이터
1.1.1 통계학의 개념과 기본 요소
1.1.1.1 통계학의 개념
1.1.1.2 의사결정과 통계적 사고
1.1.1.3 통계학의 기본 요소
1.1.1.4 통계학 적용의 과제
1.1.2 데이터
1.1.2.1 데이터의 개념과 종류
1.1.2.2 빅데이터의 개념과 특징
1.1.2.3 데이터 활용 방안
1.2 파이썬
1.2.1 파이썬의 강점과 전문 라이브러리
1.2.1.1 파이썬의 강점
1.2.1.2 파이썬의 전문 모듈과 라이브러리
1.2.1.3 파이썬의 통계 전문 라이브러리
1.2.2 파이썬과 관련 패키지 설치
1.2.2.1 파이썬 설치
1.2.2.2 PIP 인스톨
1.2.2.3 ANACONDA 인스톨
1.2.2.4 Jupyter Notebook 인스톨
1.2.2.5 필수 라이브러리의 PIP 사용 인스톨
2.
파이썬 언어 및 데이터프레임과 기본 연산
2.1 파이썬 언어와 데이터프레임
2.1.1 파이썬 언어와 표준 데이터 유형
2.1.1.1 파이썬 언어
2.1.1.2 파이썬 표준 데이터 유형
2.1.2 파이썬의 함수와 리스트 및 문자열 처리
2.1.2.1 파이썬의 함수
2.1.2.2 파이썬 데이터 유형 전환과 주석 표시
2.1.2.3 리스트 처리와 관련 함수
2.1.2.4 문자열 처리
2.1.2.5 f-문자열 사용
2.1.3 데이터프레임의 구조와 활용
2.1.3.1 데이터프레임의 구조
2.1.3.2 NumPy 배열 사용 df 설정과 파일 저장 및 읽기
2.1.3.3 NumPy 배열의 편리한 연산과 수정
2.1.3.4 데이터프레임 병합
2.1.3.5 분할표와 피벗테이블 작성
2.1.3.6 교차표 작성
2.2 파이썬의 기본 연산 함수
2.2.1 파이썬의 기초 연산자와 적용
2.2.1.1 파이썬 기초 연산자
2.2.2 숫자 및 통계 관련 파이썬 기본 함수
2.2.2.1 숫자에 대한 파이썬 기본 함수
2.2.2.2 math모듈 함수
2.2.2.3 날짜 관련 파이썬 기본 함수
2.2.2.4 통계 관련 파이썬 기본 함수
2.2.2.5 명령 문장 흐름 제어
3.
기술통계량 및 데이터 시각화와 도수분포 작성
3.1 기술통계량과 데이터 시각화
3.1.1 기술통계량의 성분과 특성
3.1.1.1 기술통계량의 성분
3.1.1.2 기술통계량의 특성
3.1.2 탐색적 데이터분석과 데이터 시각화
3.1.2.1 탐색적 데이터분석과 주요 도구
3.1.2.2 시각화의 목적 및 목표
3.1.2.3 차트의 역할 및 유형과 적용 방식
3.1.3 도수분포의 원리와 작성
3.1.3.1 도수분포의 원리
3.1.3.2 도수분포의 작성 절차
3.2 정성데이터와 정량데이터 도수분포 작성
3.2.1 정성데이터 도수분포 작성과 차트 작성
3.2.1.1 정성데이터의 도수분포 작성
3.2.1.2 정성데이터의 도수분포 차트 작성
3.2.2 정량데이터 도수분포 작성과 차트 작성
3.2.2.1 정량데이터의 도수분포 작성
3.2.2.2 정량데이터의 도수분포 차트 작성
4.
중심경향 측정값과 분산 및 모양
4.1 중심경향 측정값 및 위치 측정값
4.1.1 중심경향 측정값의 개념
4.1.1.1 평균의 개념
4.1.1.2 최빈값, 중앙값, 중점치
4.1.2 상대적 위치 측정값의 개념
4.1.2.1 표준점수
4.1.2.2 백분위수
4.1.2.3 사분위수 및 십분위수
4.1.3 중심경향 측정값과 위치 측정값의 파이썬 계산
4.2 변동성 측정과 분포 모양 분석
4.2.1 변동성 측정값의 개념과 종류
4.2.1.1 변동성 측정값의 개념
4.2.1.2 범위
4.2.1.3 평균편차
4.2.1.4 분산과 표준편차
4.2.1.5 표준편차 활용
4.2.2 변동성 측정값의 파이썬 계산
4.2.3 분포 모양 측정값의 개념
4.2.3.1 왜도의 개념
4.2.3.2 첨도의 개념과 분포의 형태
4.2.4 분포 모양 측정값의 파이썬 계산
4.2.4.1 왜도의 Pandas 및 Scipy 계산
4.2.4.2 첨도의 Pandas 및 Scipy 계산
4.2.4.3 도수분포곡선 작성을 통한 분포 모양 확인
5.
확률 계산과 분할표 및 베이즈정리
5.1 사상과 확률 계산
5.1.1 사상과 집합
5.1.1.1 실험과 결과
5.1.1.2 집합의 개념과 종류
5.1.1.3 표본공간 및 표본점
5.1.1.4 사상의 개념과 종류
5.1.2 확률의 개념과 계산
5.1.2.1 확률의 개념
5.1.2.2 확률 계산의 접근법
5.1.3 카운팅 법칙과 확률 계산법칙
5.1.3.1 카운팅 법칙
5.1.3.2 확률 계산법칙
5.1.4 파이썬 사용 확률 계산
5.1.4.1 무작위 동전 던지기 앞면 확률 계산
5.1.4.2 무작위 동전 던지기 시뮬레이션과 앞면 확률 계산
5.1.4.3 시뮬레이션의 점도표 작성
5.1.4.4 계승 및 순열과 조합 계산
5.2 조건부확률 및 분할표와 베이즈정리
5.2.1 조건부확률과 결합확률
5.2.1.1 조건부확률과 결합확률
5.2.1.2 독립사상의 조건부확률과 결합확률
5.2.2 분할표와 베이즈법칙
5.2.2.1 분할표
5.2.2.2 결합확률표와 주변확률
5.2.2.3 베이즈법칙과 통시적 해석
5.2.3 파이썬 사용 분할표 작성과 베이즈법칙 풀이
5.2.3.1 파이썬 사용 분할표 작성
5.2.3.2 파이썬 사용 베이즈법칙 풀이
6.
확률변수와 확률분포
6.1 확률변수와 확률분포 및 기대치
6.1.1 확률변수의 개념과 종류
6.1.1.1 확률변수의 개념
6.1.1.2 확률변수의 종류
6.1.1.3 파이썬의 난수 생성
6.1.2 확률변수의 확률분포와 기대치
6.1.2.1 확률분포의 개념
6.1.2.2 확률변수의 기대치와 분산
6.2 이산확률분포와 연속확률분포
6.2.1 이산확률분포
6.2.1.1 이산확률분포의 개념
6.2.1.2 베르누이 시행과 베르누이 과정
6.2.1.3 이항분포
6.2.1.4 포아송분포
6.2.1.5 초기하분포
6.2.1.6 음이항분포 및 기하분포
6.2.2 연속확률분포
6.2.2.1 연속확률분포의 개념
6.2.2.2 균일분포
6.2.2.3 지수분포
6.2.2.4 정규분포
6.2.2.5 중심극한정리와 몬테카를로 시뮬레이션
7.
표본조사 및 표본추출과 표본분포
7.1 표본조사와 표본추출
7.1.1 지식탐구와 표본조사
7.1.1.1 과학적 방법
7.1.1.2 조사의 접근법과 요건
7.1.1.3 표본조사의 장점과 수행절차
7.1.2 표본추출
7.1.2.1 표본추출의 개념
7.1.2.2 표본추출 편향과 표본오차
7.1.2.3 확률표본추출
7.1.2.4 비확률표본추출
7.2 통계적 추론과 표본분포
7.2.1 통계적 추론과 표본통계량
7.2.1.1 통계적 추론의 개념
7.2.1.2 표본통계량
7.2.2 표본분포
7.2.2.1 표본분포의 개념
7.2.2.2 평균의 표본분포
7.2.2.3 평균 표본분포의 기대치와 표준편차
7.2.2.4 표본 수와 표본크기의 결정방법
7.2.2.5 이항분포의 정규근사치와 연속성 수정
7.2.3 기타 표본분포
7.2.3.1 기타 표본 통계량 표본분포
7.2.3.2 t분포
7.2.3.3 카이제곱분포
7.2.3.4 F분포
8.
추정과 신뢰구간
8.1 점 추정과 구간추정
8.1.1 점 추정과 점 추정량
8.1.1.1 점 추정과 점 추정량 및 점 추정치
8.1.1.2 추정량의 요건
8.1.1.3 점 추정 사용의 문제점
8.1.2 구간 추정
8.1.2.1 구간추정의 개념과 성분
8.1.2.2 신뢰구간의 개념과 추정 절차
8.2 평균과 점 추정과 구간추정
8.2.1 파이썬 사용 모집단 평균의 구간추정과 표본크기 결정
8.2.1.1 모집단 평균의 구간추정 : 모집단 분산을 아는 경우
8.2.1.2 모집단 평균의 구간추정 : 모집단 분산을 모르는 경우
8.2.1.3 모집단 평균 추정 최소 표본크기 결정
8.2.1.4 부트스트랩
8.2.2 모집단 비율 및 분산의 구간추정
8.2.2.1 모집단 비율의 구간추정과 표본크기 결정
8.2.2.2 모집단 분산의 구간추정
9.
가설검정
9.1 가설검정 원리
9.1.1 가설검정 원리
9.1.1.1 가설검정의 개념
9.1.1.2 가설의 분류
9.1.2 가설검정 의사결정과 수행 절차
9.1.2.1 가설검정의 의사결정
9.1.2.2 가설검정 의사결정의 오류와 기각역 구분
9.1.2.3 가설검정의 절차
9.2 표본 검정
9.2.1 단일표본 검정
9.2.1.1 일 표본 t-검정
9.2.1.2 비율 z-검정
9.2.1.3 분산 및 표준편차의 가설검정
9.2.1.4 검정력과 오류행렬
9.2.2 두 표본 가설검정의 원리와 절차
9.2.2.1 두 표본 가설검정의 원리
9.2.2.2 독립표본들의 평균 차이 검정
9.2.2.3 두 종속표본 평균 차이 검정
9.2.2.4 두 독립표본 비율 차이 검정
9.2.2.5 두 표본 분산 차이 검정
9.2.3 두 표본 가설검정의 파이썬 예제 풀이
9.2.3.1 두 독립표본 t-검정 : 동일 모집단 분산 양측검정
9.2.3.2 두 독립표본 t-검정 : 다른 모집단 분산 양측검정
9.2.3.3 두 독립표본 t-검정 : 동일 모집단 분산 우측 단측검정
9.2.3.4 두 독립표본 t-검정 : 동일 모집단 분산 좌측 단측검정
9.2.3.5 두 독립표본 평균 차이 z-검정
9.2.3.6 파이썬 ztest 사용 두 독립표본 평균 차이 z-검정
9.2.3.7 파이썬 rp.ttest 사용 두 독립표본 평균 차이 t-검정
9.2.3.8 파이썬 rp.ttest 사용 두 쌍체표본 t-검정
9.2.3.9 파이썬 proportions_ztest사용 두 표본 비율 z-검정
9.2.3.10 파이썬 사용 두 표본 분산 차이 F-검정
10. ANOVA
10.1 실험디자인과 ANOVA 원리
10.1.1 통계적 실험과 실험 디자인
10.1.1.1 통계적 실험
10.1.1.2 실험 디자인
10.1.2 ANOVA 원리 및 종류
10.1.2.1 ANOVA의 원리
10.1.2.2 ANOVA의 종류
10.2 일원 ANOVA
10.2.1 일원 ANOVA의 개념과 수행절차
10.2.1.1 일원 ANOVA의 개념과 특징
10.2.1.2 일원분산분석의 수행절차
10.2.2 일원 분산분석 파이썬 풀이
10.2.2.1 일원 분산분석 파이썬 풀이 방법
10.2.2.2 표본크기가 다른 데이터들의 평균 비교
10.2.2.3 표본크기가 같은 데이터들의 평균 비교
10.2.2.4 범주별 데이터 분할과 평균 비교
10.3 이원 ANOVA
10.3.1 비반복 이원 분산분석 원리와 수행 방식
10.3.1.1 이원 분산분석의 원리
10.3.1.2 비반복 이원 분산분석의 수행 방식
10.3.2 비반복 이원 분산분석 파이썬 풀이
10.4 반복 이원 ANOVA
10.4.1 반복 이원 ANOVA의 원리와 수행 방식
10.4.1.1 반복 이원 ANOVA의 원리
10.4.1.2 반복 이원 ANOVA의 수행 방식
10.4.2 반복 이원 ANOVA의 파이썬 풀이
11.
상관분석과 산점도
11.1 상관분석과 공분산
11.1.1 상관분석과 공분산 개념
11.1.1.1 상관관계와 선형관계
11.1.1.2 공분산
11.1.2 상관계수와 상관관계 검정
11.1.2.1 상관계수의 계산 원리
11.1.2.2 상관계수의 해석
11.1.2.3 상관관계 검정
11.2 산점도
11.2.1 산점도 개념과 해석
11.2.1.1 산점도의 개념과 작성절차
11.2.1.2 산점도 모양과 상관계수의 방향 및 강도
11.2.2 파이썬 사용 산점도 작성
11.2.2.1 두 상관계수 비교 산점도 작성
11.2.2.2 특이값 제외 산점도 작성
11.2.2.3 단일 차트 2개 산점도 작성
12.
회귀분석
12.1 회귀분석 원리와 단순회귀분석
12.1.1 회귀분석 원리
12.1.1.1 회귀의 개념과 목적
12.1.1.2 회귀분석의 본질
12.1.1.3 회귀분석의 종류
12.1.2 단순회귀분석
12.1.2.1 단순선형회귀
12.1.2.2 회귀 적합도와 특이값 영향력 탐색
12.1.2.3 적합도 진단 플롯
12.1.2.4 파이썬 사용 단순선형회귀 수행
12.1.2.5 회귀분석의 신뢰구간과 예측구간
12.1.2.6 파이썬 사용 신뢰구간 및 예측구간 차트 작성
12.2 다중회귀
12.2.1 다중회귀분석 원리
12.2.1.1 다중회귀분석의 본질
12.2.1.2 다중회귀분석 모델 설정
12.2.1.3 다중회귀분석의 검정통계량
12.2.2 파이썬 사용 다중회귀분석
12.2.2.1 개별효과 다중회귀분석
12.2.2.2 파이썬 사용 표준 및 단계별 다중회귀분석 수행
13.
시계열분석
13.1 시계열분석 원리와 시계열 분해
13.1.1 시계열 데이터 본질과 플롯 작성
13.1.1.1 시계열 데이터의 본질
13.1.1.2 파이썬 altair모듈 사용 시계열 플롯 작성
13.1.1.3 파이썬 시리즈 플롯 작성
13.1.2 시계열 데이터의 분해
13.1.2.1 시계열의 4대 결정요인
13.1.2.2 파이썬 날짜 표시
13.1.2.3 추세분석 파이썬 풀이
13.1.2.4 순환변동분석의 파이썬 풀이
13.1.2.5 계절변동분석
13.2 시계열 예측
13.2.1 시계열 예측의 본질과 수행
13.2.1.1 시계열 예측의 개념과 종류
13.2.1.2 시계열 예측의 수행과 요건
13.2.1.3 일변량 시계열 예측의 특징
13.2.2 지수평활 예측
13.2.2.1 평활과 Pandas rolling & mean방법
13.2.2.2 지수평활과 파이썬 활용
13.2.3 시계열 데이터의 정상성과 ARIMA모델
13.2.3.1 시계열 데이터의 정상성
13.2.3.2 시계열의 자기상관 검정
13.2.3.3 ARIMA모델과 SARIMAX
13.2.3.4 시계열 예측의 정확성 평가
13.2.3.5 ARIMA모델과 SARIMA모델의 파이썬 풀이
14.
카이제곱 검정과 비모수검정
14.1 카이제곱 검정
14.1.1 적합성 검정
14.1.1.1 적합성 검정 원리
14.1.1.2 적합도 카이제곱검정법의 특징
14.1.1.3 적합도 카이제곱검정방법의 수행절차
14.1.1.4 적합도 카이제곱검정방법의 파이썬 풀이
14.1.2 독립성 검정
14.1.2.1 독립성 검정의 개념
14.1.2.2 독립성 카이제곱 검정의 수행 절차
14.1.2.3 독립성 카이제곱 검정의 파이썬 풀이
14.2 비모수검정
14.2.1 비모수검정의 개념과 수행 원리
14.2.1.1 비모수검정의 개념과 장점
14.2.1.2 비모수검정의 단점
14.2.1.3 비모수검정의 수행 원리와 가정
14.2.2 비모수검정의 파이썬 풀이
14.2.2.1 연 검정
14.2.2.2 부호검정
14.2.2.3 윌콕슨 순위합 검정
14.2.2.4 윌콕슨 부호순위검정
14.2.2.5 크러스칼-왈리스 검정
14.2.2.6 프리드먼 Fr-검정
14.2.2.7 맥네마 검정
14.2.2.8 스피어먼 순위상관 검정
참고문헌
찾아보기
통계학과 파이썬
1.1 통계학과 데이터
1.1.1 통계학의 개념과 기본 요소
1.1.1.1 통계학의 개념
1.1.1.2 의사결정과 통계적 사고
1.1.1.3 통계학의 기본 요소
1.1.1.4 통계학 적용의 과제
1.1.2 데이터
1.1.2.1 데이터의 개념과 종류
1.1.2.2 빅데이터의 개념과 특징
1.1.2.3 데이터 활용 방안
1.2 파이썬
1.2.1 파이썬의 강점과 전문 라이브러리
1.2.1.1 파이썬의 강점
1.2.1.2 파이썬의 전문 모듈과 라이브러리
1.2.1.3 파이썬의 통계 전문 라이브러리
1.2.2 파이썬과 관련 패키지 설치
1.2.2.1 파이썬 설치
1.2.2.2 PIP 인스톨
1.2.2.3 ANACONDA 인스톨
1.2.2.4 Jupyter Notebook 인스톨
1.2.2.5 필수 라이브러리의 PIP 사용 인스톨
2.
파이썬 언어 및 데이터프레임과 기본 연산
2.1 파이썬 언어와 데이터프레임
2.1.1 파이썬 언어와 표준 데이터 유형
2.1.1.1 파이썬 언어
2.1.1.2 파이썬 표준 데이터 유형
2.1.2 파이썬의 함수와 리스트 및 문자열 처리
2.1.2.1 파이썬의 함수
2.1.2.2 파이썬 데이터 유형 전환과 주석 표시
2.1.2.3 리스트 처리와 관련 함수
2.1.2.4 문자열 처리
2.1.2.5 f-문자열 사용
2.1.3 데이터프레임의 구조와 활용
2.1.3.1 데이터프레임의 구조
2.1.3.2 NumPy 배열 사용 df 설정과 파일 저장 및 읽기
2.1.3.3 NumPy 배열의 편리한 연산과 수정
2.1.3.4 데이터프레임 병합
2.1.3.5 분할표와 피벗테이블 작성
2.1.3.6 교차표 작성
2.2 파이썬의 기본 연산 함수
2.2.1 파이썬의 기초 연산자와 적용
2.2.1.1 파이썬 기초 연산자
2.2.2 숫자 및 통계 관련 파이썬 기본 함수
2.2.2.1 숫자에 대한 파이썬 기본 함수
2.2.2.2 math모듈 함수
2.2.2.3 날짜 관련 파이썬 기본 함수
2.2.2.4 통계 관련 파이썬 기본 함수
2.2.2.5 명령 문장 흐름 제어
3.
기술통계량 및 데이터 시각화와 도수분포 작성
3.1 기술통계량과 데이터 시각화
3.1.1 기술통계량의 성분과 특성
3.1.1.1 기술통계량의 성분
3.1.1.2 기술통계량의 특성
3.1.2 탐색적 데이터분석과 데이터 시각화
3.1.2.1 탐색적 데이터분석과 주요 도구
3.1.2.2 시각화의 목적 및 목표
3.1.2.3 차트의 역할 및 유형과 적용 방식
3.1.3 도수분포의 원리와 작성
3.1.3.1 도수분포의 원리
3.1.3.2 도수분포의 작성 절차
3.2 정성데이터와 정량데이터 도수분포 작성
3.2.1 정성데이터 도수분포 작성과 차트 작성
3.2.1.1 정성데이터의 도수분포 작성
3.2.1.2 정성데이터의 도수분포 차트 작성
3.2.2 정량데이터 도수분포 작성과 차트 작성
3.2.2.1 정량데이터의 도수분포 작성
3.2.2.2 정량데이터의 도수분포 차트 작성
4.
중심경향 측정값과 분산 및 모양
4.1 중심경향 측정값 및 위치 측정값
4.1.1 중심경향 측정값의 개념
4.1.1.1 평균의 개념
4.1.1.2 최빈값, 중앙값, 중점치
4.1.2 상대적 위치 측정값의 개념
4.1.2.1 표준점수
4.1.2.2 백분위수
4.1.2.3 사분위수 및 십분위수
4.1.3 중심경향 측정값과 위치 측정값의 파이썬 계산
4.2 변동성 측정과 분포 모양 분석
4.2.1 변동성 측정값의 개념과 종류
4.2.1.1 변동성 측정값의 개념
4.2.1.2 범위
4.2.1.3 평균편차
4.2.1.4 분산과 표준편차
4.2.1.5 표준편차 활용
4.2.2 변동성 측정값의 파이썬 계산
4.2.3 분포 모양 측정값의 개념
4.2.3.1 왜도의 개념
4.2.3.2 첨도의 개념과 분포의 형태
4.2.4 분포 모양 측정값의 파이썬 계산
4.2.4.1 왜도의 Pandas 및 Scipy 계산
4.2.4.2 첨도의 Pandas 및 Scipy 계산
4.2.4.3 도수분포곡선 작성을 통한 분포 모양 확인
5.
확률 계산과 분할표 및 베이즈정리
5.1 사상과 확률 계산
5.1.1 사상과 집합
5.1.1.1 실험과 결과
5.1.1.2 집합의 개념과 종류
5.1.1.3 표본공간 및 표본점
5.1.1.4 사상의 개념과 종류
5.1.2 확률의 개념과 계산
5.1.2.1 확률의 개념
5.1.2.2 확률 계산의 접근법
5.1.3 카운팅 법칙과 확률 계산법칙
5.1.3.1 카운팅 법칙
5.1.3.2 확률 계산법칙
5.1.4 파이썬 사용 확률 계산
5.1.4.1 무작위 동전 던지기 앞면 확률 계산
5.1.4.2 무작위 동전 던지기 시뮬레이션과 앞면 확률 계산
5.1.4.3 시뮬레이션의 점도표 작성
5.1.4.4 계승 및 순열과 조합 계산
5.2 조건부확률 및 분할표와 베이즈정리
5.2.1 조건부확률과 결합확률
5.2.1.1 조건부확률과 결합확률
5.2.1.2 독립사상의 조건부확률과 결합확률
5.2.2 분할표와 베이즈법칙
5.2.2.1 분할표
5.2.2.2 결합확률표와 주변확률
5.2.2.3 베이즈법칙과 통시적 해석
5.2.3 파이썬 사용 분할표 작성과 베이즈법칙 풀이
5.2.3.1 파이썬 사용 분할표 작성
5.2.3.2 파이썬 사용 베이즈법칙 풀이
6.
확률변수와 확률분포
6.1 확률변수와 확률분포 및 기대치
6.1.1 확률변수의 개념과 종류
6.1.1.1 확률변수의 개념
6.1.1.2 확률변수의 종류
6.1.1.3 파이썬의 난수 생성
6.1.2 확률변수의 확률분포와 기대치
6.1.2.1 확률분포의 개념
6.1.2.2 확률변수의 기대치와 분산
6.2 이산확률분포와 연속확률분포
6.2.1 이산확률분포
6.2.1.1 이산확률분포의 개념
6.2.1.2 베르누이 시행과 베르누이 과정
6.2.1.3 이항분포
6.2.1.4 포아송분포
6.2.1.5 초기하분포
6.2.1.6 음이항분포 및 기하분포
6.2.2 연속확률분포
6.2.2.1 연속확률분포의 개념
6.2.2.2 균일분포
6.2.2.3 지수분포
6.2.2.4 정규분포
6.2.2.5 중심극한정리와 몬테카를로 시뮬레이션
7.
표본조사 및 표본추출과 표본분포
7.1 표본조사와 표본추출
7.1.1 지식탐구와 표본조사
7.1.1.1 과학적 방법
7.1.1.2 조사의 접근법과 요건
7.1.1.3 표본조사의 장점과 수행절차
7.1.2 표본추출
7.1.2.1 표본추출의 개념
7.1.2.2 표본추출 편향과 표본오차
7.1.2.3 확률표본추출
7.1.2.4 비확률표본추출
7.2 통계적 추론과 표본분포
7.2.1 통계적 추론과 표본통계량
7.2.1.1 통계적 추론의 개념
7.2.1.2 표본통계량
7.2.2 표본분포
7.2.2.1 표본분포의 개념
7.2.2.2 평균의 표본분포
7.2.2.3 평균 표본분포의 기대치와 표준편차
7.2.2.4 표본 수와 표본크기의 결정방법
7.2.2.5 이항분포의 정규근사치와 연속성 수정
7.2.3 기타 표본분포
7.2.3.1 기타 표본 통계량 표본분포
7.2.3.2 t분포
7.2.3.3 카이제곱분포
7.2.3.4 F분포
8.
추정과 신뢰구간
8.1 점 추정과 구간추정
8.1.1 점 추정과 점 추정량
8.1.1.1 점 추정과 점 추정량 및 점 추정치
8.1.1.2 추정량의 요건
8.1.1.3 점 추정 사용의 문제점
8.1.2 구간 추정
8.1.2.1 구간추정의 개념과 성분
8.1.2.2 신뢰구간의 개념과 추정 절차
8.2 평균과 점 추정과 구간추정
8.2.1 파이썬 사용 모집단 평균의 구간추정과 표본크기 결정
8.2.1.1 모집단 평균의 구간추정 : 모집단 분산을 아는 경우
8.2.1.2 모집단 평균의 구간추정 : 모집단 분산을 모르는 경우
8.2.1.3 모집단 평균 추정 최소 표본크기 결정
8.2.1.4 부트스트랩
8.2.2 모집단 비율 및 분산의 구간추정
8.2.2.1 모집단 비율의 구간추정과 표본크기 결정
8.2.2.2 모집단 분산의 구간추정
9.
가설검정
9.1 가설검정 원리
9.1.1 가설검정 원리
9.1.1.1 가설검정의 개념
9.1.1.2 가설의 분류
9.1.2 가설검정 의사결정과 수행 절차
9.1.2.1 가설검정의 의사결정
9.1.2.2 가설검정 의사결정의 오류와 기각역 구분
9.1.2.3 가설검정의 절차
9.2 표본 검정
9.2.1 단일표본 검정
9.2.1.1 일 표본 t-검정
9.2.1.2 비율 z-검정
9.2.1.3 분산 및 표준편차의 가설검정
9.2.1.4 검정력과 오류행렬
9.2.2 두 표본 가설검정의 원리와 절차
9.2.2.1 두 표본 가설검정의 원리
9.2.2.2 독립표본들의 평균 차이 검정
9.2.2.3 두 종속표본 평균 차이 검정
9.2.2.4 두 독립표본 비율 차이 검정
9.2.2.5 두 표본 분산 차이 검정
9.2.3 두 표본 가설검정의 파이썬 예제 풀이
9.2.3.1 두 독립표본 t-검정 : 동일 모집단 분산 양측검정
9.2.3.2 두 독립표본 t-검정 : 다른 모집단 분산 양측검정
9.2.3.3 두 독립표본 t-검정 : 동일 모집단 분산 우측 단측검정
9.2.3.4 두 독립표본 t-검정 : 동일 모집단 분산 좌측 단측검정
9.2.3.5 두 독립표본 평균 차이 z-검정
9.2.3.6 파이썬 ztest 사용 두 독립표본 평균 차이 z-검정
9.2.3.7 파이썬 rp.ttest 사용 두 독립표본 평균 차이 t-검정
9.2.3.8 파이썬 rp.ttest 사용 두 쌍체표본 t-검정
9.2.3.9 파이썬 proportions_ztest사용 두 표본 비율 z-검정
9.2.3.10 파이썬 사용 두 표본 분산 차이 F-검정
10. ANOVA
10.1 실험디자인과 ANOVA 원리
10.1.1 통계적 실험과 실험 디자인
10.1.1.1 통계적 실험
10.1.1.2 실험 디자인
10.1.2 ANOVA 원리 및 종류
10.1.2.1 ANOVA의 원리
10.1.2.2 ANOVA의 종류
10.2 일원 ANOVA
10.2.1 일원 ANOVA의 개념과 수행절차
10.2.1.1 일원 ANOVA의 개념과 특징
10.2.1.2 일원분산분석의 수행절차
10.2.2 일원 분산분석 파이썬 풀이
10.2.2.1 일원 분산분석 파이썬 풀이 방법
10.2.2.2 표본크기가 다른 데이터들의 평균 비교
10.2.2.3 표본크기가 같은 데이터들의 평균 비교
10.2.2.4 범주별 데이터 분할과 평균 비교
10.3 이원 ANOVA
10.3.1 비반복 이원 분산분석 원리와 수행 방식
10.3.1.1 이원 분산분석의 원리
10.3.1.2 비반복 이원 분산분석의 수행 방식
10.3.2 비반복 이원 분산분석 파이썬 풀이
10.4 반복 이원 ANOVA
10.4.1 반복 이원 ANOVA의 원리와 수행 방식
10.4.1.1 반복 이원 ANOVA의 원리
10.4.1.2 반복 이원 ANOVA의 수행 방식
10.4.2 반복 이원 ANOVA의 파이썬 풀이
11.
상관분석과 산점도
11.1 상관분석과 공분산
11.1.1 상관분석과 공분산 개념
11.1.1.1 상관관계와 선형관계
11.1.1.2 공분산
11.1.2 상관계수와 상관관계 검정
11.1.2.1 상관계수의 계산 원리
11.1.2.2 상관계수의 해석
11.1.2.3 상관관계 검정
11.2 산점도
11.2.1 산점도 개념과 해석
11.2.1.1 산점도의 개념과 작성절차
11.2.1.2 산점도 모양과 상관계수의 방향 및 강도
11.2.2 파이썬 사용 산점도 작성
11.2.2.1 두 상관계수 비교 산점도 작성
11.2.2.2 특이값 제외 산점도 작성
11.2.2.3 단일 차트 2개 산점도 작성
12.
회귀분석
12.1 회귀분석 원리와 단순회귀분석
12.1.1 회귀분석 원리
12.1.1.1 회귀의 개념과 목적
12.1.1.2 회귀분석의 본질
12.1.1.3 회귀분석의 종류
12.1.2 단순회귀분석
12.1.2.1 단순선형회귀
12.1.2.2 회귀 적합도와 특이값 영향력 탐색
12.1.2.3 적합도 진단 플롯
12.1.2.4 파이썬 사용 단순선형회귀 수행
12.1.2.5 회귀분석의 신뢰구간과 예측구간
12.1.2.6 파이썬 사용 신뢰구간 및 예측구간 차트 작성
12.2 다중회귀
12.2.1 다중회귀분석 원리
12.2.1.1 다중회귀분석의 본질
12.2.1.2 다중회귀분석 모델 설정
12.2.1.3 다중회귀분석의 검정통계량
12.2.2 파이썬 사용 다중회귀분석
12.2.2.1 개별효과 다중회귀분석
12.2.2.2 파이썬 사용 표준 및 단계별 다중회귀분석 수행
13.
시계열분석
13.1 시계열분석 원리와 시계열 분해
13.1.1 시계열 데이터 본질과 플롯 작성
13.1.1.1 시계열 데이터의 본질
13.1.1.2 파이썬 altair모듈 사용 시계열 플롯 작성
13.1.1.3 파이썬 시리즈 플롯 작성
13.1.2 시계열 데이터의 분해
13.1.2.1 시계열의 4대 결정요인
13.1.2.2 파이썬 날짜 표시
13.1.2.3 추세분석 파이썬 풀이
13.1.2.4 순환변동분석의 파이썬 풀이
13.1.2.5 계절변동분석
13.2 시계열 예측
13.2.1 시계열 예측의 본질과 수행
13.2.1.1 시계열 예측의 개념과 종류
13.2.1.2 시계열 예측의 수행과 요건
13.2.1.3 일변량 시계열 예측의 특징
13.2.2 지수평활 예측
13.2.2.1 평활과 Pandas rolling & mean방법
13.2.2.2 지수평활과 파이썬 활용
13.2.3 시계열 데이터의 정상성과 ARIMA모델
13.2.3.1 시계열 데이터의 정상성
13.2.3.2 시계열의 자기상관 검정
13.2.3.3 ARIMA모델과 SARIMAX
13.2.3.4 시계열 예측의 정확성 평가
13.2.3.5 ARIMA모델과 SARIMA모델의 파이썬 풀이
14.
카이제곱 검정과 비모수검정
14.1 카이제곱 검정
14.1.1 적합성 검정
14.1.1.1 적합성 검정 원리
14.1.1.2 적합도 카이제곱검정법의 특징
14.1.1.3 적합도 카이제곱검정방법의 수행절차
14.1.1.4 적합도 카이제곱검정방법의 파이썬 풀이
14.1.2 독립성 검정
14.1.2.1 독립성 검정의 개념
14.1.2.2 독립성 카이제곱 검정의 수행 절차
14.1.2.3 독립성 카이제곱 검정의 파이썬 풀이
14.2 비모수검정
14.2.1 비모수검정의 개념과 수행 원리
14.2.1.1 비모수검정의 개념과 장점
14.2.1.2 비모수검정의 단점
14.2.1.3 비모수검정의 수행 원리와 가정
14.2.2 비모수검정의 파이썬 풀이
14.2.2.1 연 검정
14.2.2.2 부호검정
14.2.2.3 윌콕슨 순위합 검정
14.2.2.4 윌콕슨 부호순위검정
14.2.2.5 크러스칼-왈리스 검정
14.2.2.6 프리드먼 Fr-검정
14.2.2.7 맥네마 검정
14.2.2.8 스피어먼 순위상관 검정
참고문헌
찾아보기
출판사 리뷰
머리말
이 책은 통계학의 중요한 주제들에 대한 개념을 설명하고, 예제를 통한 적용방법과 수행절차를 파이썬 풀이를 통해 학습할 수 있도록 단계별 해설을 제공한다.
컴퓨터의 발달과 정보통신기술의 발전은 1990년 파이썬이라는 새로운 차원의 분석도구의 탄생을 가져왔다.
파이썬은 2010년대 이후 머신러닝과 딥러닝 등의 데이터 사이어스 수행을 위한 필수도구로 자리를 잡아, 데이터의 수집 및 처리와 각종 의사결정에 널리 사용되고 있다.
파이썬에는 재사용이 가능한 많은 함수를 포함하는 코드 모음인 라이브러리가 수십만개 이상이 제공되며, 데이터의 시각화 및 처리에 Matplotlib, Seaborn, Pandas, NumPy, Scikit-learn, Pingouin, Statmodels 등의 모듈을 사용할 수 있다.
이제 파이썬은 빅데이터 시대에서 통계적 사고를 수행하는 필수도구로 위상을 확보하고 있다.
통계학의 문제 풀이와 데이터 처리를 위해 Excel 및 R과 함께, 유로 패키지인 SPSS, SAS, Minitab, Stata 등을 사용하고 있다.
이러한 패키지들의 사용을 위해 각 문제의 해결을 위한 함수와 패키지별 특유의 함수들을 익혀야 하고, 그러한 학습과정이 상당히 어려운 경우도 많다.
또한 패키지를 사용한 결과의 정확성과 타당성을 검증하는 것 역시 어려운 경우가 많다.
기존의 패키지와는 달리 파이썬은 대부분 문제에 대해 함수들이 개발되어 제공되고 있으므로, 사용이 쉽고 간단한 특징을 갖는다.
이러한 장점은 함수를 적용하면서 여건에 맞게 변경할 수 있고, 즉석에서 결과를 출력하여 언제라도 수정 및 개선할 수 있어 더욱 강력하다.
이 책은 모두 14장으로 구성된다.
많은 책에서 파이썬 기초 학습 내용을 부록으로 설명하지만, 본 책은 제2장 파이썬 언어 및 데이터프레임과 기본 연산을 소개하여 각종 주요 도구와 적용방식을 사전에 학습하도록 구성하였다.
제1장은 통계학 적용 과제 및 데이터와 파이썬의 강점 및 관련 패키지 설치방법을 설명한다.
제3장 기술통계량, 제4장 중심경향 측정값과 분산, 제5장 확률 계산과 분할표 및 베이즈정리, 제6장 확률변수와 확률분포, 제7장 표본조사 및 표본추출과 표본분포, 제8장은 추정과 신뢰구간, 제9장은 가설검정, 제10장은 ANOVA, 제11장은 상관분석과 산점도, 제12장은 회귀분석, 제13장은 시계열분석, 제14장은 카이제곱 검정과 비모수검정으로 구성하여 여러 분야의 통계학 교과서에서 다루는 내용들을 모두 포함하였다.
특히 이 책은 통계학의 주요 도구에 대한 원리의 설명과 함께, 관련 예제를 제시하여 파이썬 풀이를 제공하였다.
또한 시각화를 통해 주요 요인들의 규명과 관련 효과를 쉽게 파악할 수 있도록 다각적 방식으로 차트작성을 제공하였다.
기술통계분석인 제3장과 제4장에서 정량데이터 및 정성데이터의 도수분포와 히스토그램, 오자이브, 상자-스웜 통합플롯, 줄기-잎도표의 작성과 중심경향 측정값 및 산포측정값에 대한 예제 풀이와 비교분석을 수행한다.
제5장부터 제7장까지는 기본 추론도구인 확률, 확률변수, 확률분포, 표본조사, 표본추출, 표본분포의 개념과 적용 원리를 설명하고, 그 적용방법을 파이썬 예제 풀이로 제공하였다.
제8장부터 제10장까지는 모집단 평균, 비율, 분산 등의 모수 추정 및 비교를 수행하고, 제11장부터 제13장까지는 일반 데이터 및 시계열 데이터를 이용한 예측 수행을 위해 데이터 특성과 예측 방법 및 성과 검정 방법을 제시했다.
제14장에서는 범주변수에 대한 분석방법과 관련 주요 통계기법들의 적용 원리를 설명하고, 파이썬 풀이를 통한 적용방법과 관련 특징을 규명했다.
프로그램 언어에 생소하더라도 파이썬은 아주 잘 개발된 도구여서, Excel, R, SPSS 등 어느 도구보다 쉽고, 재미있게, 정확한, 다각적 분석 결과를 얻을 수 있다.
특히 강력한 차트작성 기능을 제공하고 있어 시각화에 대해 차원이 다른 성과를 얻을 수 있다.
앞으로 파이썬은 계속 개선된 함수들이 개발되어 제공된다는 점에서 데이터 처리와 통계적 사고의 수행을 통한 효과적인 의사결정의 선도적 역할을 수행할 것이다.
이러한 파이썬 학습의 시대적 과제에 부응하여, 이 책으로 실생활에 필요한 통계학의 주요 원리에 대한 학습과 함께 파이썬 역량 확보에 도움을 받길 바란다.
2025년 8월 저자 일동
책에서 사용한 예제 풀이 파일은 〈https://cafe.naver.com/purpleowzkj〉에서 제공됩니다.
이 책은 통계학의 중요한 주제들에 대한 개념을 설명하고, 예제를 통한 적용방법과 수행절차를 파이썬 풀이를 통해 학습할 수 있도록 단계별 해설을 제공한다.
컴퓨터의 발달과 정보통신기술의 발전은 1990년 파이썬이라는 새로운 차원의 분석도구의 탄생을 가져왔다.
파이썬은 2010년대 이후 머신러닝과 딥러닝 등의 데이터 사이어스 수행을 위한 필수도구로 자리를 잡아, 데이터의 수집 및 처리와 각종 의사결정에 널리 사용되고 있다.
파이썬에는 재사용이 가능한 많은 함수를 포함하는 코드 모음인 라이브러리가 수십만개 이상이 제공되며, 데이터의 시각화 및 처리에 Matplotlib, Seaborn, Pandas, NumPy, Scikit-learn, Pingouin, Statmodels 등의 모듈을 사용할 수 있다.
이제 파이썬은 빅데이터 시대에서 통계적 사고를 수행하는 필수도구로 위상을 확보하고 있다.
통계학의 문제 풀이와 데이터 처리를 위해 Excel 및 R과 함께, 유로 패키지인 SPSS, SAS, Minitab, Stata 등을 사용하고 있다.
이러한 패키지들의 사용을 위해 각 문제의 해결을 위한 함수와 패키지별 특유의 함수들을 익혀야 하고, 그러한 학습과정이 상당히 어려운 경우도 많다.
또한 패키지를 사용한 결과의 정확성과 타당성을 검증하는 것 역시 어려운 경우가 많다.
기존의 패키지와는 달리 파이썬은 대부분 문제에 대해 함수들이 개발되어 제공되고 있으므로, 사용이 쉽고 간단한 특징을 갖는다.
이러한 장점은 함수를 적용하면서 여건에 맞게 변경할 수 있고, 즉석에서 결과를 출력하여 언제라도 수정 및 개선할 수 있어 더욱 강력하다.
이 책은 모두 14장으로 구성된다.
많은 책에서 파이썬 기초 학습 내용을 부록으로 설명하지만, 본 책은 제2장 파이썬 언어 및 데이터프레임과 기본 연산을 소개하여 각종 주요 도구와 적용방식을 사전에 학습하도록 구성하였다.
제1장은 통계학 적용 과제 및 데이터와 파이썬의 강점 및 관련 패키지 설치방법을 설명한다.
제3장 기술통계량, 제4장 중심경향 측정값과 분산, 제5장 확률 계산과 분할표 및 베이즈정리, 제6장 확률변수와 확률분포, 제7장 표본조사 및 표본추출과 표본분포, 제8장은 추정과 신뢰구간, 제9장은 가설검정, 제10장은 ANOVA, 제11장은 상관분석과 산점도, 제12장은 회귀분석, 제13장은 시계열분석, 제14장은 카이제곱 검정과 비모수검정으로 구성하여 여러 분야의 통계학 교과서에서 다루는 내용들을 모두 포함하였다.
특히 이 책은 통계학의 주요 도구에 대한 원리의 설명과 함께, 관련 예제를 제시하여 파이썬 풀이를 제공하였다.
또한 시각화를 통해 주요 요인들의 규명과 관련 효과를 쉽게 파악할 수 있도록 다각적 방식으로 차트작성을 제공하였다.
기술통계분석인 제3장과 제4장에서 정량데이터 및 정성데이터의 도수분포와 히스토그램, 오자이브, 상자-스웜 통합플롯, 줄기-잎도표의 작성과 중심경향 측정값 및 산포측정값에 대한 예제 풀이와 비교분석을 수행한다.
제5장부터 제7장까지는 기본 추론도구인 확률, 확률변수, 확률분포, 표본조사, 표본추출, 표본분포의 개념과 적용 원리를 설명하고, 그 적용방법을 파이썬 예제 풀이로 제공하였다.
제8장부터 제10장까지는 모집단 평균, 비율, 분산 등의 모수 추정 및 비교를 수행하고, 제11장부터 제13장까지는 일반 데이터 및 시계열 데이터를 이용한 예측 수행을 위해 데이터 특성과 예측 방법 및 성과 검정 방법을 제시했다.
제14장에서는 범주변수에 대한 분석방법과 관련 주요 통계기법들의 적용 원리를 설명하고, 파이썬 풀이를 통한 적용방법과 관련 특징을 규명했다.
프로그램 언어에 생소하더라도 파이썬은 아주 잘 개발된 도구여서, Excel, R, SPSS 등 어느 도구보다 쉽고, 재미있게, 정확한, 다각적 분석 결과를 얻을 수 있다.
특히 강력한 차트작성 기능을 제공하고 있어 시각화에 대해 차원이 다른 성과를 얻을 수 있다.
앞으로 파이썬은 계속 개선된 함수들이 개발되어 제공된다는 점에서 데이터 처리와 통계적 사고의 수행을 통한 효과적인 의사결정의 선도적 역할을 수행할 것이다.
이러한 파이썬 학습의 시대적 과제에 부응하여, 이 책으로 실생활에 필요한 통계학의 주요 원리에 대한 학습과 함께 파이썬 역량 확보에 도움을 받길 바란다.
2025년 8월 저자 일동
책에서 사용한 예제 풀이 파일은 〈https://cafe.naver.com/purpleowzkj〉에서 제공됩니다.
GOODS SPECIFICS
- 발행일 : 2025년 08월 11일
- 쪽수, 무게, 크기 : 544쪽 | 188*257*35mm
- ISBN13 : 9791193595336
- ISBN10 : 1193595339
You may also like
카테고리
한국어
한국어