
R을 활용한 보건의료 빅데이터 분석과 머신러닝
Description
책소개
『R을 활용한 보건의료 빅데이터 분석과 머신러닝』은 R과 RStudio의 설치 및 기본적인 사용법부터 시작하여, 데이터의 입력과 정리, 시각적 탐색, 통계 분석 및 머신러닝 기법까지 체계적으로 학습할 수 있도록 구성되었다.
- 책의 일부 내용을 미리 읽어보실 수 있습니다.
미리보기
목차
1장 R 시작하기
1.1 R과 Rstudio 소개
1.2 R 설치하기
1.3 RStudio 설치하기
1.4 RStudio 활용 첫걸음
2장 R 데이터 분석
2.1 데이터 입력 및 저장
2.2 data.frame() 함수로 여러 개의 변수를 하나로 묶기
2.3 변수 연산을 통한 새로운 변수 생성
2.4 조건문을 이용한 변수 생성
2.5 수치로 데이터 요약하기
2.6 데이터 추출하기
2.6.1 데이터프레임의 행과 열 추출조건을 이용한 데이터 추출
2.6.2 subset() 함수를 이용한 데이터 추출
2.7 데이터 정렬하기
2.7.1 R에서 데이터 정렬(1) : 기본 명령 활용
2.7.2 R에서 데이터 정렬(2) : dplyr 패키지 활용
2.8 데이터 내보내기와 불러오기
2.8.1 CSV 파일 생성 및 불러오기
2.8.2 EXCEL 파일 생성 및 불러오기
2.9 대화상자를 활용한 R 패키지 설치
3장 R 그래프를 이용한 데이터 분석
3.1 막대그래프 작성하기
3.2 히스토그램 작성하기
3.3 파이 차트 작성하기
3.4 꺾은선 그래프 작성하기
3.5 상자그림 작성하기
3.6 여러 개의 그래프를 한 화면에서 비교하기
4장 건강검진 빅데이터 분석
4.1 건강검진 공공데이터 준비하기
4.2 변수명 변경
4.3 일부 변수로 새로운 데이터프레임 생성
4.4 BMI 변수 생성 및 비만도 분류
4.5 요약통계 생성하기
4.6 결측값 처리하기
4.6.1 결측값 파악하기
4.6.2 결측값을 갖는 관측치 모두 삭제하기
4.6.3 결측값을 변수의 평균값으로 대체하기
4.7 그룹별 평균, 빈도 및 비율 비교
4.8 교차표 작성(1) : 성별, 연령별 비만도 수준 반영
4.9 교차표 작성(2) : 성별, 연령 및 비만도 수준 반영
5장 빅데이터 시각화 분석
5.1 ggplot2를 활용한 건강검진정보 데이터 시각화 분석
5.1.1 막대그래프
5.1.2 히스토그램
5.1.3 꺾은선 그래프
5.1.4 파이 차트와 도넛 차트
5.1.5 산점도
5.1.6 버블 차트
5.1.7 리본 차트
5.1.8 상자그림
5.2 히트맵을 활용한 진료과별 대기시간 트렌드 분석
5.3 트리맵을 활용한 치과의원 분포 시각화 분석
6장 R 데이터 분석
6.1 통계적 가설검정
6.2 대응표본 t-검정
6.3 독립표본 t-검정
6.4 카이제곱검정
6.5 일원배치 분산분석
6.6 상관분석
6.7 단순회귀분석
6.8 다중회귀분석
6.9 범주형 변수를 활용한 다중회귀분석
6.10 머신러닝 개요 및 학습 방식
6.10.1 통계 기법과 머신러닝 기법의 차이
6.10.2 머신러닝의 학습 방식 : 지도학습, 비지도학습, 강화학습
6.11 머신러닝 알고리즘(1) : 서포트 벡터 머신
6.12 머신러닝 알고리즘(2) : 의사결정나무
6.13 ROC 곡선과 AUC를 활용한 모형 성능 평가
6.13.1 서포트 벡터 머신 모형의 성능 평가
6.13.2 의사결정나무 모형의 성능 평가
1.1 R과 Rstudio 소개
1.2 R 설치하기
1.3 RStudio 설치하기
1.4 RStudio 활용 첫걸음
2장 R 데이터 분석
2.1 데이터 입력 및 저장
2.2 data.frame() 함수로 여러 개의 변수를 하나로 묶기
2.3 변수 연산을 통한 새로운 변수 생성
2.4 조건문을 이용한 변수 생성
2.5 수치로 데이터 요약하기
2.6 데이터 추출하기
2.6.1 데이터프레임의 행과 열 추출조건을 이용한 데이터 추출
2.6.2 subset() 함수를 이용한 데이터 추출
2.7 데이터 정렬하기
2.7.1 R에서 데이터 정렬(1) : 기본 명령 활용
2.7.2 R에서 데이터 정렬(2) : dplyr 패키지 활용
2.8 데이터 내보내기와 불러오기
2.8.1 CSV 파일 생성 및 불러오기
2.8.2 EXCEL 파일 생성 및 불러오기
2.9 대화상자를 활용한 R 패키지 설치
3장 R 그래프를 이용한 데이터 분석
3.1 막대그래프 작성하기
3.2 히스토그램 작성하기
3.3 파이 차트 작성하기
3.4 꺾은선 그래프 작성하기
3.5 상자그림 작성하기
3.6 여러 개의 그래프를 한 화면에서 비교하기
4장 건강검진 빅데이터 분석
4.1 건강검진 공공데이터 준비하기
4.2 변수명 변경
4.3 일부 변수로 새로운 데이터프레임 생성
4.4 BMI 변수 생성 및 비만도 분류
4.5 요약통계 생성하기
4.6 결측값 처리하기
4.6.1 결측값 파악하기
4.6.2 결측값을 갖는 관측치 모두 삭제하기
4.6.3 결측값을 변수의 평균값으로 대체하기
4.7 그룹별 평균, 빈도 및 비율 비교
4.8 교차표 작성(1) : 성별, 연령별 비만도 수준 반영
4.9 교차표 작성(2) : 성별, 연령 및 비만도 수준 반영
5장 빅데이터 시각화 분석
5.1 ggplot2를 활용한 건강검진정보 데이터 시각화 분석
5.1.1 막대그래프
5.1.2 히스토그램
5.1.3 꺾은선 그래프
5.1.4 파이 차트와 도넛 차트
5.1.5 산점도
5.1.6 버블 차트
5.1.7 리본 차트
5.1.8 상자그림
5.2 히트맵을 활용한 진료과별 대기시간 트렌드 분석
5.3 트리맵을 활용한 치과의원 분포 시각화 분석
6장 R 데이터 분석
6.1 통계적 가설검정
6.2 대응표본 t-검정
6.3 독립표본 t-검정
6.4 카이제곱검정
6.5 일원배치 분산분석
6.6 상관분석
6.7 단순회귀분석
6.8 다중회귀분석
6.9 범주형 변수를 활용한 다중회귀분석
6.10 머신러닝 개요 및 학습 방식
6.10.1 통계 기법과 머신러닝 기법의 차이
6.10.2 머신러닝의 학습 방식 : 지도학습, 비지도학습, 강화학습
6.11 머신러닝 알고리즘(1) : 서포트 벡터 머신
6.12 머신러닝 알고리즘(2) : 의사결정나무
6.13 ROC 곡선과 AUC를 활용한 모형 성능 평가
6.13.1 서포트 벡터 머신 모형의 성능 평가
6.13.2 의사결정나무 모형의 성능 평가
상세 이미지
출판사 리뷰
현대 사회에서는 보건의료, 금융, 마케팅, 공학 등 다양한 분야에서 끊임없이 생성되는 방대한 양의 빅데이터로부터 의미 있는 정보를 추출하고, 최적의 의사결정을 반복적으로 수행할 수 있는 역량이 요구되고 있습니다.
이를 위한 대표적인 통계 분석 및 데이터 시각화 도구로서 많은 연구자와 분석가들은 R을 활용하고 있습니다.
이 책은 R과 RStudio의 설치 및 기본적인 사용법부터 시작하여, 데이터의 입력과 정리, 시각적 탐색, 통계 분석 및 머신러닝 기법까지 체계적으로 학습할 수 있도록 구성되었습니다.
1장에서는 R과 RStudio의 설치 방법과 환경 설정 및 기본적인 활용법을 설명합니다.
2장에서는 작은 규모의 데이터를 이용하여 데이터 분석의 기본 원리를 학습하며, 3장에서는 다양한 그래프를 통해 데이터를 효과적으로 요약하고 시각화하는 방법을 익힐 수 있습니다.
4장에서는 100만 명의 건강검진 공공데이터를 활용하여 실제 빅데이터를 데이터 전처리부터 요약 및 분석하는 방법을 배우고, 5장에서는 ggplot2 패키지를 활용하여 건강검진 데이터를 보다 직관적이고 풍부하게 시각화하는 방법을 설명합니다.
마지막으로 6장에서는 통계적 가설검정 기법과 머신러닝 분석 방법을 소개하여, 보건의료 빅데이터 분석과 머신러닝 기법을 효과적으로 습득할 수 있도록 안내합니다.
본 교재의 각 장 끝에는 학습한 내용을 점검하고 실제 분석 능력을 높일 수 있도록 연습문제를 제공하였습니다.
교재에서 활용되는 데이터는 발생 가능한 실제 상황을 기반으로 만들어진 가상의 데이터입니다.
실제 데이터의 복잡성과 개인정보 보호 등의 현실적인 제약을 극복하고, 다양한 분석 방법을 정확히 이해하고 효과적으로 연습할 수 있을 것입니다.
본문의 예제에서 사용한 데이터와 책과 관련 사항들은 자유아카데미 홈페이지 자료실(www.freeaca.com)에서 다운로드 또는 확인하실 수 있습니다.
끝으로 이 책이 출판되도록 수고해 주신 자유아카데미 관계자 여러분과 지금까지 도움 주신 모든 분께 감사의 마음을 전합니다.
이 책을 통해 빅데이터 분석과 머신러닝의 기초를 다지고, 한층 더 발전시켜 데이터에 기반한 문제 해결력을 갖추어 나가기를 기대합니다.
이를 위한 대표적인 통계 분석 및 데이터 시각화 도구로서 많은 연구자와 분석가들은 R을 활용하고 있습니다.
이 책은 R과 RStudio의 설치 및 기본적인 사용법부터 시작하여, 데이터의 입력과 정리, 시각적 탐색, 통계 분석 및 머신러닝 기법까지 체계적으로 학습할 수 있도록 구성되었습니다.
1장에서는 R과 RStudio의 설치 방법과 환경 설정 및 기본적인 활용법을 설명합니다.
2장에서는 작은 규모의 데이터를 이용하여 데이터 분석의 기본 원리를 학습하며, 3장에서는 다양한 그래프를 통해 데이터를 효과적으로 요약하고 시각화하는 방법을 익힐 수 있습니다.
4장에서는 100만 명의 건강검진 공공데이터를 활용하여 실제 빅데이터를 데이터 전처리부터 요약 및 분석하는 방법을 배우고, 5장에서는 ggplot2 패키지를 활용하여 건강검진 데이터를 보다 직관적이고 풍부하게 시각화하는 방법을 설명합니다.
마지막으로 6장에서는 통계적 가설검정 기법과 머신러닝 분석 방법을 소개하여, 보건의료 빅데이터 분석과 머신러닝 기법을 효과적으로 습득할 수 있도록 안내합니다.
본 교재의 각 장 끝에는 학습한 내용을 점검하고 실제 분석 능력을 높일 수 있도록 연습문제를 제공하였습니다.
교재에서 활용되는 데이터는 발생 가능한 실제 상황을 기반으로 만들어진 가상의 데이터입니다.
실제 데이터의 복잡성과 개인정보 보호 등의 현실적인 제약을 극복하고, 다양한 분석 방법을 정확히 이해하고 효과적으로 연습할 수 있을 것입니다.
본문의 예제에서 사용한 데이터와 책과 관련 사항들은 자유아카데미 홈페이지 자료실(www.freeaca.com)에서 다운로드 또는 확인하실 수 있습니다.
끝으로 이 책이 출판되도록 수고해 주신 자유아카데미 관계자 여러분과 지금까지 도움 주신 모든 분께 감사의 마음을 전합니다.
이 책을 통해 빅데이터 분석과 머신러닝의 기초를 다지고, 한층 더 발전시켜 데이터에 기반한 문제 해결력을 갖추어 나가기를 기대합니다.
GOODS SPECIFICS
- 발행일 : 2025년 08월 29일
- 쪽수, 무게, 크기 : 212쪽 | 188*257*13mm
- ISBN13 : 9791158087500
- ISBN10 : 1158087500
You may also like
카테고리
한국어
한국어