Passer aux informations sur le produit
Traitement de données Python
Traitement de données Python
Description
Introduction au livre
En science des données, il existe un concept appelé la règle des 80/20.
À proprement parler, il s'agit davantage d'une observation empirique que d'une loi : sur les ressources (temps et main-d'œuvre) consommées dans le processus d'analyse des données, seulement 20 % sont consacrées au travail de modélisation et d'analyse proprement dit, tandis que 80 % des ressources sont dépensées pour la recherche, l'amélioration et la reconstruction des données.
Les données font toujours défaut, et même celles que nous collectons sont souvent incomplètes ou mal formatées.
Les résultats de l'analyse ne correspondent pas à l'intuition, probablement parce que les données contiennent des valeurs étranges.
Quiconque a déjà effectué un véritable travail d'analyse de données partagera ce point de vue.

Les données d'exemple que nous utilisons dans la plupart des cours sont généralement des données « propres », c'est-à-dire prétraitées afin de réduire les tâtonnements.
Ce manuel aborde les bases du prétraitement, la collecte de données « imparfaites » plus réalistes et l'amélioration des données collectées en fonction de l'objectif de l'analyse.
Comme le traitement approfondi de chaque élément (extraction de données Web, programmation API, remplissage des valeurs manquantes, etc.) nécessiterait plusieurs ouvrages, nous présentons les techniques les plus courantes et les plus fondamentales et fournissons des exemples appropriés afin que vous puissiez les appliquer à des données réelles.

Ce manuel contient de nombreux exemples de code Python.
Vous pouvez télécharger ces codes directement depuis le site web de l'auteur, mais comme le traitement des données relève davantage d'une compétence pratique à acquérir que d'une discipline académique systématique, je vous recommande de ne pas vous contenter d'exécuter ces codes ; de les saisir vous-même, de procéder par essais et erreurs et de les transformer en outils utiles pour vous-même.
Je vous recommande de procéder par essais et erreurs pour en faire un outil que vous pourrez utiliser efficacement.

indice
Chapitre 1 : Python et l’environnement de pratique
1. Introduction
2 Introduction et configuration de Google Colab
3. Révision de la grammaire de base de Python

Chapitre 2 ETL des données
1 Introduction à l'ETL de données
2. Concept d'ETL de données
3 Extraction des données
4. Conversion de données
5 Chargement des données

Chapitre 3 Les pandas
1. Qu'est-ce que Pandas ?
2 Structures de données Pandas
3 Sélectionner les données
4. Traitement des données
5. Analyse des données
6. Édition des données

Chapitre 4 : Extraction de données Web
1 Introduction au web scraping
2 outils de web scraping
3. Le processus de web scraping
4 notions de base en HTML

Chapitre 5 Bibliothèques de web scraping
1. Méthode de web scraping
2 BeautifulSoup
3 Sélénium

Chapitre 6 : Collecte de données à l’aide des API Web
1. Comprendre les concepts d'API et les API REST
2. Préparation à l'utilisation des API publiques
3. Appel de l'API avec Python

Chapitre 7 Nettoyage des données (1) - Détection et résolution des valeurs manquantes
1. Concept de nettoyage des données
2 types de valeurs manquantes
3. Détection des valeurs manquantes
4. Gestion des valeurs manquantes

Chapitre 8 Nettoyage des données (2) - Détection et résolution des valeurs aberrantes
1. Signification et importance des valeurs aberrantes
2. Détection des valeurs aberrantes
3. Gestion des valeurs aberrantes
4. Gestion des données dupliquées

Chapitre 9 Nettoyage des données (3) - Fusion et transformation des données
1. Le concept et la nécessité de la conversion de type de données
2. Conversion de types de données avec Pandas
3. Fusionner les data frames

Chapitre 10 Nettoyage des données (4) - Mise à l'échelle et encodage des données
1. Le concept et la nécessité de la mise à l'échelle
2 techniques majeures de mise à l'échelle
3. Encodage des données catégorielles
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 25 juillet 2025
- Nombre de pages, poids, dimensions : 236 pages | 188 × 257 × 20 mm
- ISBN13 : 9788920053382
- ISBN10 : 8920053383

Vous aimerez peut-être aussi

카테고리