Passer aux informations sur le produit
Analyse de données massives avec Python basée sur la science des données
Analyse de données massives avec Python basée sur la science des données
Description
Introduction au livre
Projet d'analyse de données massives avec Python : Apprentissage de la méthodologie de la science des données

Ce livre vous guide systématiquement à travers les méthodologies fondamentales d'analyse et de visualisation des données, de l'analyse statistique de base à l'analyse avancée basée sur l'apprentissage profond.
Après avoir appris les concepts de la science des données et les bases de Python, les étudiants suivent un cours structuré de manière à pouvoir réaliser 18 projets dans l'ordre suivant : collecte de données → préparation → exploration → modélisation → visualisation.
Avant de vous exercer sur chaque projet, vous apprendrez de manière solide les concepts fondamentaux des principales techniques d'analyse, ce qui vous permettra d'acquérir une compréhension équilibrée de la théorie et des méthodes d'application.

Ce livre a été conçu comme manuel pour les cours universitaires, il ne fournit donc pas de réponses aux exercices pratiques.
  • Vous pouvez consulter un aperçu du contenu du livre.
    Aperçu

indice
PARTIE 1 : Analyse du Big Data - Comprendre

Chapitre 1 : La quatrième révolution industrielle et la science des données
01 Comprendre la quatrième révolution industrielle
02 La science des données au service de la quatrième révolution industrielle
03 Cas de service de la quatrième révolution industrielle
addition
Problèmes pratiques

Chapitre 2 : Comprendre et utiliser le Big Data
01 Comprendre le Big Data
02 Utilisation du Big Data
addition
Problèmes pratiques

Chapitre 3 : Analyse des mégadonnées basée sur la science des données
01 Comprendre le secteur du Big Data
02 Méthodes et approches d'analyse des mégadonnées
03 Méthodologie de la science des données pour l'analyse du Big Data
addition
Problèmes pratiques

PARTIE 02 Analyse des mégadonnées - Préparation

Chapitre 4 : Notions de base de la programmation Python
01 Premiers pas avec Python
02 Variables et objets
03 Types de données et opérateurs
04 Instructions conditionnelles et boucles
Fonction 05
06 Traitement des fichiers
07 Bibliothèques clés pour l'analyse des données
addition
Problèmes pratiques

Chapitre 5 : Exploration de données massives à l'aide d'API ouvertes
01 Exploration à l'aide de l'API Naver
1 Qu'est-ce que le ramper ?
2. Inscrivez-vous en tant que développeur Naver
3 Naver News Crawling
02 Exploration basée sur une API de données publiques
1. Demande d'utilisation de données publiques
2. Collecte de données publiques
addition
Problèmes pratiques

Chapitre 6 : Exploration de données massives basée sur l'analyse de pages Web
01 Exploration de pages web statiques
1. Préparation de l'exploration des pages Web statiques
2. Exercice d'exploration de pages Web statiques
02 Exploration dynamique de pages Web
1. Préparation à l'exploration des pages Web dynamiques
2. Entraînez-vous à explorer des pages Web dynamiques.
addition
Problèmes pratiques

PARTIE 03 Analyse des mégadonnées - Projet de base

Chapitre 7 : Analyse statistique
01 [Analyse statistique technique + Graphique] Prédiction des notes de qualité des vins
02 [Analyse de corrélation + Carte thermique] Analyse des taux de survie du Titanic

Chapitre 8 : Analyse de fréquence des textes
01 [Analyse de l'anglais + Nuage de mots] Analyse des mots clés des titres de documents anglais
02 [Analyse coréenne + Nuage de mots] Analyse des mots clés d'articles de presse coréens

Chapitre 9 : Analyse de l'information géographique
01 [Analyse des données d'adresses + Géocartographie] Création d'une carte après analyse des informations géographiques
02 [Analyse des données par district administratif + carte des îlots] Analyse de la situation des établissements médicaux par district administratif

PARTIE 04 Analyse des mégadonnées - Projets d'apprentissage automatique/d'apprentissage profond

Chapitre 10 Analyse de régression
01 [Analyse de régression + Nuage de points/Graphique de régression linéaire] Prédiction de la consommation de carburant d'un véhicule par élément
02 [Analyse de régression linéaire + Diagramme de dispersion/Graphique de régression linéaire] Analyse de la corrélation entre les données de pollution atmosphérique et les particules fines

Chapitre 11 Analyse de classification
01 [Analyse de régression logistique] Diagnostic du cancer du sein à partir de données de caractéristiques
02 [Analyse par arbre de décision + Diagramme de dispersion/Graphique de régression linéaire] Classification des mouvements à partir de données de capteurs

Chapitre 12 Analyse de clusters
01 [Analyse de clustering K-Means + Graphique] Analyse des clusters de consommateurs pour le marketing ciblé

Chapitre 13 Exploration de texte
01 [Modélisation de l'analyse des sentiments] Modélisation de l'analyse des sentiments à partir des données d'avis sur les films
02 [Analyse des sentiments + Graphique à barres] Analyse des sentiments des articles de presse avec ChatGPT
03 [Analyse thématique + Modèle thématique LDA] Analyse des thèmes G Chat PT dans les textes d'actualité

Chapitre 14 Analyse basée sur l'apprentissage profond
01 [Analyse de séries temporelles LSTM] Analyse des séries temporelles des cours boursiers
02 [Analyse des séries temporelles du prophète] Prédiction des cours boursiers à 100 jours à l'avance
03 [Analyse d'images CNN] Classification d'images numériques
04 [Analyse d'images CNN] Classification des races de chiens

supplément
01 Installation et utilisation d'Anaconda Jupyter Notebook
02 Utilisation du mode développeur
03 Installation de la bibliothèque KoNLPy

Image détaillée
Image détaillée 1

Avis de l'éditeur
Partie 1.
Comprendre l'analyse des mégadonnées (chapitres 1 à 3)


Comprendre la relation entre la quatrième révolution industrielle, la science des données et le big data, et comprendre l'analyse du big data qui applique les méthodologies de la science des données.

Partie 2.
Analyse des mégadonnées - Préparation (Chapitres 4 à 6)


Apprenez la programmation Python requise pour l'analyse de données massives basée sur la science des données.
En particulier, l'exploration de données à l'aide de Python est une méthode de collecte de données massives très utile, il est donc important de bien la maîtriser.

Partie 3.
Analyse des mégadonnées - Projet de base (Chapitres 7 à 9)


Réaliser des projets d'analyse de données massives de base en s'appuyant sur une compréhension de la méthodologie de la science des données et des mégadonnées.
Nous réaliserons une analyse statistique, une analyse de fréquence textuelle et une analyse d'informations géographiques avec des techniques de visualisation dans le cadre d'un projet Python.

Partie 4.
Analyse des mégadonnées - Projets d'apprentissage automatique/d'apprentissage profond (Chapitres 10 à 14)


Nous menons tout d'abord un projet d'analyse de données massives basé sur l'apprentissage automatique.
Nous aborderons l'analyse de régression et l'analyse de classification, qui sont des méthodes d'apprentissage supervisé de l'apprentissage automatique, ainsi que le clustering K-means, qui est une méthode d'apprentissage non supervisé, à titre de projets, et nous réaliserons des projets d'exploration de texte.
Dans le domaine de l'analyse de données massives basée sur l'apprentissage profond, nous effectuons des analyses de séries temporelles à l'aide de modèles LSTM et des projets de classification d'images à l'aide de modèles CNN.

supplément

Ce guide vous accompagnera dans l'installation et l'utilisation d'Anaconda Jupyter Notebook, outil indispensable pour vos travaux pratiques.
Il explique également comment utiliser le mode développeur dans un navigateur web et comment installer la bibliothèque KoNLPy pour l'analyse de texte coréen.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 25 novembre 2024
Nombre de pages, poids, dimensions : 524 pages | 957 g | 188 × 235 × 21 mm
- ISBN13 : 9791156640189

Vous aimerez peut-être aussi

카테고리