
Excel en Python, bibliothèque Pandas
Description
Introduction au livre
La bibliothèque Pandas, souvent surnommée « l'Excel de Python », mérite d'être apprise même si vous n'êtes pas analyste de données.
Si vous travaillez avec des données mais que vous ressentez les limites d'Excel, essayez d'apprendre Pandas.
C'est d'autant plus vrai maintenant que Python est intégré à Microsoft Excel.
De plus, si vous souhaitez vous initier à l'analyse de données avec Python, Pandas est un bon choix.
Ce livre commence par les bases de Pandas et couvre les concepts, fonctionnalités, fonctions et bibliothèques essentiels que vous devez connaître pour une analyse de données pratique.
Il est expliqué de manière conviviale, à l'aide de nombreux exemples et illustrations, ce qui permet même aux débutants d'apprendre facilement. De plus, comme le contenu principal de Pandas est soigneusement organisé, même ceux qui connaissent déjà Pandas auront l'occasion de combler leurs lacunes.
Il fournit également des conseils approfondis pour améliorer l'efficacité de l'analyse des données et une expérience pratique d'analyse des données pour vous aider à vous familiariser avec ce domaine.
Si vous travaillez avec des données mais que vous ressentez les limites d'Excel, essayez d'apprendre Pandas.
C'est d'autant plus vrai maintenant que Python est intégré à Microsoft Excel.
De plus, si vous souhaitez vous initier à l'analyse de données avec Python, Pandas est un bon choix.
Ce livre commence par les bases de Pandas et couvre les concepts, fonctionnalités, fonctions et bibliothèques essentiels que vous devez connaître pour une analyse de données pratique.
Il est expliqué de manière conviviale, à l'aide de nombreux exemples et illustrations, ce qui permet même aux débutants d'apprendre facilement. De plus, comme le contenu principal de Pandas est soigneusement organisé, même ceux qui connaissent déjà Pandas auront l'occasion de combler leurs lacunes.
Il fournit également des conseils approfondis pour améliorer l'efficacité de l'analyse des données et une expérience pratique d'analyse des données pour vous aider à vous familiariser avec ce domaine.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
CHAPITRE 01 Introduction aux pandas
1.1 Introduction à Pandas
1.1.1 Qu'est-ce que la bibliothèque pandas ?
1.1.2 Pandas intégré à Microsoft Excel
1.1.3 Avantages des pandas
1.2 Environnement de développement Python
1.2.1 Présentation de Google Colab
1.2.2 Comment utiliser Colab
CHAPITRE 02 Notions de base de Python et bibliothèque NumPy
2.1 Variables et types de données
2.1.1 Variables
2.1.2 Entier
2.1.3 Erreurs
2.1.4 Chaînes de caractères
2.1.5 Incendie
2.1.6 Liste
2.1.7 Tuples
2.1.8 Dictionnaire
2.2 Instructions et fonctions de contrôle
2.2.1 Instructions de contrôle
2.2.2 Fonction
2.3 Classes, objets et bibliothèques
2.3.1 Classes et objets
2.3.2 Bibliothèque
Bibliothèque NumPy 2.3.3
CHAPITRE 03 Cadres de données et séries
3.1 Cadre de données
3.1.1 Qu'est-ce qu'un cadre de données ?
3.1.2 Vérification de la structure du cadre de données
3.1.3 Création d'un cadre de données
3.1.4 Paramètres, arguments et valeurs par défaut
Série 3.2
Qu'est-ce que la série 3.2.1 ?
3.2.2 Création d'une série
3.2.3 Vérification de la structure de la série
3.3 Chargement d'un cadre de données à partir d'un fichier
3.3.1 Chargement d'un cadre de données à partir d'un fichier Excel (read_excel)
3.3.2 Chargement d'un cadre de données à partir d'un fichier CSV (read_csv)
3.4 Enregistrement d'un cadre de données
3.4.1 Conversion en dictionnaire (to_dict)
3.4.2 Enregistrer dans un fichier (to_excel, to_csv)
3.4.3 Fonctions, méthodes et propriétés
3.5 Exploration des data frames
3.5.1 Comprendre les informations simples concernant un cadre de données (info, etc.)
3.5.2 Récupération d'une partie seulement d'un cadre de données (tête, queue)
3.5.3 Vérification des statistiques descriptives d'un cadre de données (describe)
3.5.4 Vérification des valeurs uniques dans chaque colonne (unique, nunique)
3.5.5 Détermination de la fréquence des valeurs uniques (value_counts)
3.5.6 Tracé d'un histogramme (hist)
3.5.7 Visualisation des DataFrames et des séries (graphique)
CHAPITRE 04 Index
4.1 Indexation et découpage
4.1.1 Indexation par parenthèses
4.1.2 Création de colonnes à l'aide de l'indexation par crochets
4.1.3 Modification des colonnes avec indexation par crochets
4.1.4 Découpage des supports
4.1.5 Indexation et découpage par clé (indexeur loc)
4.1.6 Création de lignes et de colonnes avec l'indexeur loc
4.1.7 Indexation et découpage de l'emplacement (indexeur iloc)
4.1.8 Résumé de l'indexation et du découpage
4.2 Fonctions d'extraction de données
4.2.1 Suppression de lignes et de colonnes
4.2.2 Filtrage par nom de colonne
4.2.3 Sélection des colonnes par type de données (select_dtypes)
4.2.4 Modification des fonctions et des sources Pandas
Exemple Excel 1 : Indexation et segmentation des données des passagers du naufrage du Titanic
4.3 Fonctions qui gèrent les indices et les colonnes
4.3.1 Définition de l'index (set_index)
4.3.2 Réinitialisation de l'index (reset_index)
4.3.3 Modification des index et des colonnes (Exercice)
4.3.4 Modification des index et des colonnes (set_axis)
4.3.5 Renommer une colonne
4.3.6 Cartographie et cartographes
4.3.7 Réindexation des données
4.3.8 Modification du nom de l'index (rename_axis)
4.3.9 Conversion d'une classe d'index en liste (tolist)
4.4 Introduction à l'indexation multiple
4.4.1 Multi-indices et niveaux
4.4.2 Modification de la structure d'un multi-index (pile, désempilement)
CHAPITRE 05 Opérations
5.1 Introduction aux opérations Pandas
5.1.1 Opérations vectorisées
5.1.2 Opérateurs et fonctions de fonctionnement
5.2 Opérations en série
5.2.1 Opérations sur les séries et les valeurs uniques
5.2.2 Opérations entre séries
5.2.3 Opérations entre les colonnes d'un cadre de données
5.3 Opérations sur les cadres de données
5.3.1 Opérations sur les cadres de données et les valeurs uniques
5.3.2 Opérations entre les cadres de données
5.3.3 Effectuer des calculs en remplaçant NaN (valeur de remplissage des fonctions de calcul)
5.3.4 Opérations sur les trames de données et les séries (diffusion)
Exemple Excel 2 : Analyse de la tendance quotidienne du cours des actions
5.4 Application des fonctions statistiques
5.4.1 Fonctions d'agrégation
5.4.2 Fonctions de statistiques cumulatives
5.4.3 Axe des paramètres et spécification des axes
5.4.4 Autres fonctions statistiques
Exemple Excel 3 : Mise en pratique de différentes fonctions statistiques
CHAPITRE 06 Nettoyage des données
6.1 Introduction au nettoyage des données
6.1.1 Introduction au processus d'analyse des données
6.1.2 Qu’est-ce que le nettoyage des données ?
6.2 Tri
6.2.1 Tri par une seule colonne (sort_values)
6.2.2 Ordre croissant et décroissant
6.2.3 Tri par plusieurs colonnes
6.2.4 Tri par index ou par colonnes (sort_index)
6.3 Filtrage
6.3.1 Qu'est-ce que l'indexation booléenne ?
6.3.2 Indexation booléenne à exigence unique
6.3.3 Indexation booléenne à exigences multiples
6.3.4 Fonctions qui créent des objets de type de données booléen
6.3.5 Récupération d'une partie seulement des données en fonction des valeurs d'une colonne spécifique (nlargest, nsmallest)
6.3.6 Extraction aléatoire de données (échantillon)
Exemple Excel 4 : Extraction des données souhaitées à partir des données du PIB des pays de l’OCDE
6.4 Gestion des valeurs manquantes 1
6.4.1 Vérification des valeurs manquantes (isna)
6.4.2 Suppression des données contenant des valeurs manquantes (dropna)
6.4.3 Imputation des valeurs manquantes (fillna)
6.5 Gestion des valeurs aberrantes et des données dupliquées
6.5.1 Gestion des valeurs aberrantes (extrait)
6.5.2 Vérifier et supprimer les données en double (duplicated, drop_duplicates)
6.5.3 Utilisation de la fonction de traitement des données dupliquées
6.6 Conversion des types de données et gestion de la virgule décimale
6.6.1 Conversion vers différents types de données (astype)
6.6.2 Conversion en type numérique (to_numeric)
6.6.3 Gestion des décimales
6.7 Substitution et mappage
6.7.1 Remplacement des données
6.7.2 Données cartographiques (carte)
6.7.3 Différence entre les fonctions de remplacement et de mappage
Exemple Excel 5 : Données sur les pourboires de nettoyage des clients de restaurants américains
CHAPITRE 07 Combinaison de données
7.1 Concaténation de cadres de données
7.1.1 Concaténation de cadres de données (concat)
7.1.2 Joints extérieurs et intérieurs
7.2 Fusion des cadres de données
7.2.1 Fusionner à l'aide de la fonction RECHERCHEV d'Excel
7.2.2 Exécution d'une recherche VLOOKUP à plusieurs critères avec la fonction MERGE
7.2.3 Méthode de fusion de la fonction de fusion
Exemple Excel 6 : Comptabiliser les frappeurs de la Ligue majeure de baseball ayant le pourcentage le plus élevé de coups de circuit parmi les coups de circuit de l’équipe par saison.
Mise à jour 7.3
7.3.1 Mise à jour d'un cadre de données
7.3.2 Mise à jour d'un cadre de données (combine_first)
7.4 Fusionner en plages
7.4.1 Fusionner par plage (merge_asof)
7.4.2 Division des groupes et fusion de ces groupes en plages
Exemple Excel 7 : Calcul du montant des ventes à partir des données de vente d’une imprimerie
CHAPITRE 08 Traitement thermique
8.1 Traitement thermique
8.1.1 Qu'est-ce que le traitement thermique ?
8.1.2 Introduction aux différents procédés de traitement thermique
8.2 Traitement thermique avec différentes opérations
8.2.1 Traitement des colonnes avec des opérations objet-à-objet
8.2.2 Traitement des colonnes avec des opérations au sein des objets
8.2.3 Traitement thermique par opérations mathématiques
Classement 8.3
8.3.1 Classement
8.3.2 Différentes méthodes de départage pour la fonction de rang
8.4 Masquage booléen
8.4.1 Masquage booléen avec indexation booléenne
8.4.2 Masquage des booléens avec les fonctions Pandas (mask, where)
8.4.3 Masquage booléen avec la fonction np.where de NumPy
8.4.4 Masquage booléen avec la fonction np.select de NumPy
8.5 Catégorisation des données numériques
8.5.1 Découper en catégories en divisant les intervalles par des nombres
8.5.2 Diviser les intervalles par percentile et catégoriser (qcut)
Exemple Excel 8 : Traitement des colonnes contenant les données de taille et de poids des élèves (1)
8.6 Gestion des valeurs manquantes 2
8.6.1 Remplacement des valeurs manquantes par des données antérieures et postérieures (ffill, bfill)
8.6.2 Interpolation des valeurs manquantes
8.7 Traitement des colonnes par opérations ligne à ligne
8.7.1 Déplacement de données (décalage)
8.7.2 Trouver la différence entre les lignes (diff)
8.7.3 Calcul du taux de variation entre les lignes (pct_change)
Exemple Excel 9 : Analyse du cours de l’action Samsung Electronics
CHAPITRE 09 appliquer
9.1 Présentation de la fonction d'application
9.1.1 Pourquoi la fonction « appliquer » est-elle nécessaire ?
9.1.2 Fonction de la fonction d'application
Application de la fonction d'application à la série 9.2
Application de la fonction d'application à la série 9.2.1
9.2.2 Fonctions définies par l'utilisateur et application
9.2.3 Fonctions lambda et application
9.2.4 Éléments à prendre en compte lors de l'application de la fonction apply à la série
9.2.5 Apprentissage supplémentaire sur les fonctions lambda
Exemple Excel 10 : Traitement des données de taille et de poids des élèves dans une colonne (2)
9.3 Application de la fonction apply à un data frame
9.3.1 Application de la fonction apply à un data frame
9.3.2 Spécification de l'axe lors de l'application de la fonction apply à un data frame
9.3.3 Application d'une fonction lambda à chaque ligne de données d'entrée provenant de plusieurs colonnes
9.3.4 Comparaison des fonctions apply et map
Exemple Excel 11 : Prétraitement et analyse des données des stations de métro
CHAPITRE 10 MANIPULATION DES CORDES
10.1 Fonctions de manipulation des chaînes de caractères
10.1.1 Pourquoi apprendre les fonctions de manipulation de chaînes de caractères Pandas ?
10.1.2 Fonctionnalités des fonctions de manipulation de chaînes de caractères de Pandas
10.2 Différentes fonctions pour la manipulation des chaînes de caractères
10.2.1 Indexation et découpage
10.2.2 Retourner la longueur d'une chaîne (str.len)
10.2.3 Suppression des espaces d'une chaîne (str.strip et autres)
10.2.4 Fractionner une chaîne (str.split)
10.2.5 Remplacement de chaînes (str.replace et autres)
Exemple Excel 12 : Conversion de données relatives au PIB au format numérique
10.2.6 Vérifier si une chaîne contient une valeur (autre que str.contains)
10.2.7 Extraction de chaînes de caractères (str.extract)
10.3 Expressions régulières
10.3.1 Que sont les expressions régulières ?
10.3.2 Grammaire principale des expressions régulières
10.3.3 Utilisation des expressions régulières avec les fonctions de chaînes de caractères Pandas
10.3.4 Extraction de chaînes de caractères à l'aide d'expressions régulières (str.extractall, etc.)
Exemple Excel 13 : Comptage du nombre de franchises de café dans les arrondissements de Seocho-gu et Gangnam-gu
CHAPITRE 11 Pivots et dépivots
11.1 Tableau croisé dynamique
11.1.1 Pourquoi utiliser des tableaux croisés dynamiques ?
11.1.2 Tableaux croisés dynamiques et fonctions d'agrégation
11.1.3 Création d'un tableau croisé dynamique (pivot_table)
11.1.4 Création d'un tableau croisé dynamique par saisie de plusieurs arguments
11.1.5 Comment saisir une fonction comme argument
11.1.6 Fonctions d'agrégation qui s'appliquent uniquement au regroupement (premier, dernier)
11.1.7 Pivot de chaîne
11.1.8 Création d'un tableau croisé qui agrège les fréquences (tableau croisé)
Exemple Excel 14 : Lors du naufrage du Titanic, les femmes et les enfants ont-ils été secourus en premier ?
11.2 Dépivot
11.2.1 Pourquoi Unpivot est nécessaire
11.2.2 Dépivotage avec la fonction de pile
11.2.3 Dépivotement avec la fonction de fusion
11.2.4 Différences de dépivotage entre les fonctions de pile et de fusion
Exemple Excel 15 : Création d’un nouveau tableau croisé dynamique à partir des données de ventes d’un supermarché
CHAPITRE 12 Regroupement des données
12.1 Traitement des colonnes avec la fonction groupby
12.1.1 Pourquoi la fonction groupby est-elle nécessaire ?
12.1.2 Application de fonctions au sein de groupes (groupby)
12.1.3 Classement avec la fonction groupby
Exemple Excel 16 : Distinguer les personnes portant le même nom
12.1.4 Opération de tri par ligne avec fonction groupby (décalage et autres)
12.1.5 Remplacement des valeurs manquantes par des valeurs antérieures et postérieures à l'aide de la fonction groupby (fonctions ffill et bfill)
12.1.6 Calcul de la somme cumulée à l'aide de la fonction groupby (cumsum)
12.1.7 Recherche de la commande à l'aide de la fonction groupby (cumcount)
Exemple Excel 17 : Traitement de différentes colonnes à l’aide de la fonction GroupBy avec des données OHLCV en stock
12.1.8 Transformation des résultats agrégés en colonnes
12.1.9 Application d'une fonction définie par l'utilisateur avec la fonction Transform
Exemple Excel 18 : Diviser en groupes, calculer les scores standard et attribuer des notes aux élèves.
12.2 Agrégation avec la fonction groupby
12.2.1 Application des fonctions d'agrégation avec la fonction Groupby
12.2.2 Différences entre l'agrégation avec la fonction GROUP BY et les tableaux croisés dynamiques
12.2.3 Agrégation avec les fonctions groupby et agg
12.2.4 Assemblage de chaînes de caractères
12.2.5 Application de fonctions définies par l'utilisateur avec la fonction agg
12.2.6 Différence entre les fonctions d'agrégation et de transformation
Exemple Excel 19 : Création de différentes agrégations à partir des statistiques des passagers du naufrage du Titanic
12.3 Groupage avancé
12.3.1 Différents paramètres de la fonction groupby
12.3.2 Grouper par objets
12.3.3 Fonction groupby et tête, queue et échantillon
12.3.4 Mérou
12.3.5 Différents filtrages de groupe (tous, n'importe lequel) à l'aide de la fonction transform
Exemple Excel 20 : Agrégation des prix des voitures Audi d’occasion
CHAPITRE 13 DONNÉES DE SÉRIES CHRONOLOGIQUES
13.1 Introduction aux données de séries chronologiques
13.1.1 Types de données de séries chronologiques
13.1.2 Type de données datetime
13.1.3 Apprentissage axé sur les données de séries chronologiques
13.2 Conversion et indexation des données de séries chronologiques
13.2.1 Conversion en données de séries temporelles (to_datetime)
13.2.2 Autres fonctions de transformation de séries temporelles
13.2.3 Chargement d'un cadre de données en spécifiant le type de données datetime à partir d'un fichier
13.2.4 Indexation et découpage DatetimeIndex
13.2.5 Extraction de données pour une période spécifique (at_time, between_time)
Exemple Excel 21 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (1)
13.3 Génération et cycle des données de séries temporelles
13.3.1 Cycle
13.3.2 Création de données de séries temporelles (plage de dates)
13.4 Regroupement des données de séries chronologiques
13.4.1 Traitement des colonnes par regroupement (rééchantillonnage)
13.4.2 Comparaison des fonctions resample et groupby
13.4.3 Agrégation des groupes (rééchantillonnage)
13.4.4 Application de la fonction agg à la fonction resample
13.4.5 Application simultanée des fonctions groupby et resample
Exemple Excel 22 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (2)
13.5 Extraction de données de séries chronologiques spécifiques
13.5.1 Différentes méthodes d'extraction de données de séries temporelles spécifiques (accesseur dt)
13.5.2 Conversion en chaîne de caractères (strftime)
13.5.3 Conversion au type de données périodique (to_period)
Exemple Excel 23 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (3)
13.6 Autres fonctions de traitement des données de séries temporelles
13.6.1 Conversion de fuseaux horaires
13.6.2 Création d'un intervalle de temps (DateOffset)
13.6.3 Création d'un groupeur de séries temporelles (Groupeur)
13.6.4 Création d'un tableau contenant uniquement les jours ouvrables (bdate_range)
13.6.5 Suréchantillonnage (asfreq et autres)
Exemple Excel 24 : Suréchantillonnage des journaux d’achat de Bitcoin
CHAPITRE 14 : Pandas avancé 1
14.1 Fonctions Pandas utiles à connaître
14.1.1 Modification en masse des noms de colonnes (add_prefix, add_suffix)
14.1.2 Récupération des données d'une colonne puis suppression de celles-ci (pop)
14.1.3 Création d'une colonne à un emplacement spécifique (insertion)
14.1.4 Création d'une colonne (affectation)
14.1.5 Filtrage par requête
14.1.6 Retourner l'emplacement d'une ligne ou d'une colonne (get_loc)
14.1.7 Conversion d'une classe d'index en un cadre de données ou une série (to_frame, to_series)
14.1.8 Fusion de cadres de données
14.1.9 Utilisation de méthodes consécutives (pipe)
14.1.10 Encodage des données catégorielles (factorisation)
14.1.11 Exécution de l'encodage one-hot (get_dummies)
14.1.12 Exécution de l'encodage one-hot d'une série de chaînes de caractères (str.get_dummies)
14.1.13 Décomposer une liste de cellules en lignes
14.1.14 Encodage basé sur plusieurs colonnes (ngroup)
14.1.15 Vérification de l'égalité des data frames ou des séries
14.1.16 Retourner différentes parties de deux objets (comparer)
14.1.17 Conversion d'un cadre de données horizontal en un cadre vertical (largeur vers longueur)
14.1.18 Chargement d'un cadre de données à partir d'un tableau HTML (read_html)
14.2 Fonctions NumPy utiles à connaître
14.2.1 Fonction de génération de nombres aléatoires de NumPy
14.2.2 Retourner la plus grande valeur de deux tableaux (np.fmax)
14.2.3 Trier chaque ligne ou colonne individuellement (np.sort)
14.3 Classe d'index
14.3.1 Création d'une classe Index
14.3.2 Fonctions appliquées à la classe d'index
14.4 Multi-index
14.4.1 Création d'un index multiple
14.4.2 Indexation d'un DataFrame avec plusieurs index
14.4.3 Fonctions gérant plusieurs indices
14.4.4 Indice d'intervalle
CHAPITRE 15 : Pandas 2 avancé
15.1 Agrégations mobiles et cumulatives
15.1.1 Roulement
15.1.2 Expansion
15.1.3 Approfondissement des agrégats mobiles et cumulatifs
15.2 Types de données de catégorie
15.2.1 Pourquoi utiliser des types de données de catégorie ?
15.2.2 Conversion au type de données catégorielles
15.2.3 Différentes méthodes de types de données de catégorie
15.3 Visualisation
15.3.1 Couleur
15.3.2 Paramètres de la fonction de tracé
15.3.3 Division d'une région pour créer un sous-graphe
15.4 Conseils Pandas
15.4.1 Notation scientifique
15.4.2 Séparer les chiffres par des virgules
15.4.3 Exprimer les nombres décimaux en pourcentages
15.4.4 Fusionner toutes les feuilles d'un fichier Excel en une seule fois
15.4.5 Division d'un cadre de données en groupes et enregistrement de celui-ci dans un fichier Excel
15.4.6 Saisie d'une fonction lambda dans l'indexation booléenne
15.4.7 Modification des noms de colonnes par application d'une fonction lambda à la fonction de renommage
15.4.8 Tri par application d'une fonction aux critères de tri (clé de paramètre)
15.4.9 Échange de positions dans une chaîne à l'aide d'un groupe de capture dans une expression régulière
15.4.10 Création de motifs d'expressions régulières avec la fonction join de Python
15.4.11 Inverser une série ou un cadre de données
15.4.12 Détermination du type de données des éléments individuels d'une colonne d'objet
15.4.13 Regroupement des catégories de poids léger
15.4.14 Conversion de plusieurs index en un seul index à l'aide de la fonction map
15.4.15 Filtrage basé sur un instant précis à l'aide des fonctions cummin et cummax
15.4.16 Renvoi de la première valeur non NaN
15.4.17 Développement des listes et dictionnaires d'une cellule en colonnes distinctes
15.4.18 Agrégation des seules colonnes contenant des données numériques
15.4.19 Créez une ligne qui regroupe les sous-totaux pour chaque groupe.
15.4.20 Regroupement de plusieurs colonnes en les affectant au même groupe, quel que soit leur ordre.
15.4.21 Conversion des données de date dans Excel au format datetime lors de leur importation en tant que nombre
Calculez la différence par rapport à la dernière date de la période, soit le 15 avril 2022.
15.4.23 Données mobiles dans les cycles de séries temporelles
15.4.24 Catégorisation par indice d'intervalle
15.4.25 Application de la fonction apply à l'aide des données de l'index
CHAPITRE 16 : Analyse pratique des données
16.1 Bandes de Bollinger et analyse des tendances du cours des actions
16.2 Analyse des données Moneyball et baseball
16.3 Analyse des résultats des matchs de l'équipe nationale A de football
16.4 Analyse de la distance de franchise
16.5 Analyse des soldes de données massives et de titres
1.1 Introduction à Pandas
1.1.1 Qu'est-ce que la bibliothèque pandas ?
1.1.2 Pandas intégré à Microsoft Excel
1.1.3 Avantages des pandas
1.2 Environnement de développement Python
1.2.1 Présentation de Google Colab
1.2.2 Comment utiliser Colab
CHAPITRE 02 Notions de base de Python et bibliothèque NumPy
2.1 Variables et types de données
2.1.1 Variables
2.1.2 Entier
2.1.3 Erreurs
2.1.4 Chaînes de caractères
2.1.5 Incendie
2.1.6 Liste
2.1.7 Tuples
2.1.8 Dictionnaire
2.2 Instructions et fonctions de contrôle
2.2.1 Instructions de contrôle
2.2.2 Fonction
2.3 Classes, objets et bibliothèques
2.3.1 Classes et objets
2.3.2 Bibliothèque
Bibliothèque NumPy 2.3.3
CHAPITRE 03 Cadres de données et séries
3.1 Cadre de données
3.1.1 Qu'est-ce qu'un cadre de données ?
3.1.2 Vérification de la structure du cadre de données
3.1.3 Création d'un cadre de données
3.1.4 Paramètres, arguments et valeurs par défaut
Série 3.2
Qu'est-ce que la série 3.2.1 ?
3.2.2 Création d'une série
3.2.3 Vérification de la structure de la série
3.3 Chargement d'un cadre de données à partir d'un fichier
3.3.1 Chargement d'un cadre de données à partir d'un fichier Excel (read_excel)
3.3.2 Chargement d'un cadre de données à partir d'un fichier CSV (read_csv)
3.4 Enregistrement d'un cadre de données
3.4.1 Conversion en dictionnaire (to_dict)
3.4.2 Enregistrer dans un fichier (to_excel, to_csv)
3.4.3 Fonctions, méthodes et propriétés
3.5 Exploration des data frames
3.5.1 Comprendre les informations simples concernant un cadre de données (info, etc.)
3.5.2 Récupération d'une partie seulement d'un cadre de données (tête, queue)
3.5.3 Vérification des statistiques descriptives d'un cadre de données (describe)
3.5.4 Vérification des valeurs uniques dans chaque colonne (unique, nunique)
3.5.5 Détermination de la fréquence des valeurs uniques (value_counts)
3.5.6 Tracé d'un histogramme (hist)
3.5.7 Visualisation des DataFrames et des séries (graphique)
CHAPITRE 04 Index
4.1 Indexation et découpage
4.1.1 Indexation par parenthèses
4.1.2 Création de colonnes à l'aide de l'indexation par crochets
4.1.3 Modification des colonnes avec indexation par crochets
4.1.4 Découpage des supports
4.1.5 Indexation et découpage par clé (indexeur loc)
4.1.6 Création de lignes et de colonnes avec l'indexeur loc
4.1.7 Indexation et découpage de l'emplacement (indexeur iloc)
4.1.8 Résumé de l'indexation et du découpage
4.2 Fonctions d'extraction de données
4.2.1 Suppression de lignes et de colonnes
4.2.2 Filtrage par nom de colonne
4.2.3 Sélection des colonnes par type de données (select_dtypes)
4.2.4 Modification des fonctions et des sources Pandas
Exemple Excel 1 : Indexation et segmentation des données des passagers du naufrage du Titanic
4.3 Fonctions qui gèrent les indices et les colonnes
4.3.1 Définition de l'index (set_index)
4.3.2 Réinitialisation de l'index (reset_index)
4.3.3 Modification des index et des colonnes (Exercice)
4.3.4 Modification des index et des colonnes (set_axis)
4.3.5 Renommer une colonne
4.3.6 Cartographie et cartographes
4.3.7 Réindexation des données
4.3.8 Modification du nom de l'index (rename_axis)
4.3.9 Conversion d'une classe d'index en liste (tolist)
4.4 Introduction à l'indexation multiple
4.4.1 Multi-indices et niveaux
4.4.2 Modification de la structure d'un multi-index (pile, désempilement)
CHAPITRE 05 Opérations
5.1 Introduction aux opérations Pandas
5.1.1 Opérations vectorisées
5.1.2 Opérateurs et fonctions de fonctionnement
5.2 Opérations en série
5.2.1 Opérations sur les séries et les valeurs uniques
5.2.2 Opérations entre séries
5.2.3 Opérations entre les colonnes d'un cadre de données
5.3 Opérations sur les cadres de données
5.3.1 Opérations sur les cadres de données et les valeurs uniques
5.3.2 Opérations entre les cadres de données
5.3.3 Effectuer des calculs en remplaçant NaN (valeur de remplissage des fonctions de calcul)
5.3.4 Opérations sur les trames de données et les séries (diffusion)
Exemple Excel 2 : Analyse de la tendance quotidienne du cours des actions
5.4 Application des fonctions statistiques
5.4.1 Fonctions d'agrégation
5.4.2 Fonctions de statistiques cumulatives
5.4.3 Axe des paramètres et spécification des axes
5.4.4 Autres fonctions statistiques
Exemple Excel 3 : Mise en pratique de différentes fonctions statistiques
CHAPITRE 06 Nettoyage des données
6.1 Introduction au nettoyage des données
6.1.1 Introduction au processus d'analyse des données
6.1.2 Qu’est-ce que le nettoyage des données ?
6.2 Tri
6.2.1 Tri par une seule colonne (sort_values)
6.2.2 Ordre croissant et décroissant
6.2.3 Tri par plusieurs colonnes
6.2.4 Tri par index ou par colonnes (sort_index)
6.3 Filtrage
6.3.1 Qu'est-ce que l'indexation booléenne ?
6.3.2 Indexation booléenne à exigence unique
6.3.3 Indexation booléenne à exigences multiples
6.3.4 Fonctions qui créent des objets de type de données booléen
6.3.5 Récupération d'une partie seulement des données en fonction des valeurs d'une colonne spécifique (nlargest, nsmallest)
6.3.6 Extraction aléatoire de données (échantillon)
Exemple Excel 4 : Extraction des données souhaitées à partir des données du PIB des pays de l’OCDE
6.4 Gestion des valeurs manquantes 1
6.4.1 Vérification des valeurs manquantes (isna)
6.4.2 Suppression des données contenant des valeurs manquantes (dropna)
6.4.3 Imputation des valeurs manquantes (fillna)
6.5 Gestion des valeurs aberrantes et des données dupliquées
6.5.1 Gestion des valeurs aberrantes (extrait)
6.5.2 Vérifier et supprimer les données en double (duplicated, drop_duplicates)
6.5.3 Utilisation de la fonction de traitement des données dupliquées
6.6 Conversion des types de données et gestion de la virgule décimale
6.6.1 Conversion vers différents types de données (astype)
6.6.2 Conversion en type numérique (to_numeric)
6.6.3 Gestion des décimales
6.7 Substitution et mappage
6.7.1 Remplacement des données
6.7.2 Données cartographiques (carte)
6.7.3 Différence entre les fonctions de remplacement et de mappage
Exemple Excel 5 : Données sur les pourboires de nettoyage des clients de restaurants américains
CHAPITRE 07 Combinaison de données
7.1 Concaténation de cadres de données
7.1.1 Concaténation de cadres de données (concat)
7.1.2 Joints extérieurs et intérieurs
7.2 Fusion des cadres de données
7.2.1 Fusionner à l'aide de la fonction RECHERCHEV d'Excel
7.2.2 Exécution d'une recherche VLOOKUP à plusieurs critères avec la fonction MERGE
7.2.3 Méthode de fusion de la fonction de fusion
Exemple Excel 6 : Comptabiliser les frappeurs de la Ligue majeure de baseball ayant le pourcentage le plus élevé de coups de circuit parmi les coups de circuit de l’équipe par saison.
Mise à jour 7.3
7.3.1 Mise à jour d'un cadre de données
7.3.2 Mise à jour d'un cadre de données (combine_first)
7.4 Fusionner en plages
7.4.1 Fusionner par plage (merge_asof)
7.4.2 Division des groupes et fusion de ces groupes en plages
Exemple Excel 7 : Calcul du montant des ventes à partir des données de vente d’une imprimerie
CHAPITRE 08 Traitement thermique
8.1 Traitement thermique
8.1.1 Qu'est-ce que le traitement thermique ?
8.1.2 Introduction aux différents procédés de traitement thermique
8.2 Traitement thermique avec différentes opérations
8.2.1 Traitement des colonnes avec des opérations objet-à-objet
8.2.2 Traitement des colonnes avec des opérations au sein des objets
8.2.3 Traitement thermique par opérations mathématiques
Classement 8.3
8.3.1 Classement
8.3.2 Différentes méthodes de départage pour la fonction de rang
8.4 Masquage booléen
8.4.1 Masquage booléen avec indexation booléenne
8.4.2 Masquage des booléens avec les fonctions Pandas (mask, where)
8.4.3 Masquage booléen avec la fonction np.where de NumPy
8.4.4 Masquage booléen avec la fonction np.select de NumPy
8.5 Catégorisation des données numériques
8.5.1 Découper en catégories en divisant les intervalles par des nombres
8.5.2 Diviser les intervalles par percentile et catégoriser (qcut)
Exemple Excel 8 : Traitement des colonnes contenant les données de taille et de poids des élèves (1)
8.6 Gestion des valeurs manquantes 2
8.6.1 Remplacement des valeurs manquantes par des données antérieures et postérieures (ffill, bfill)
8.6.2 Interpolation des valeurs manquantes
8.7 Traitement des colonnes par opérations ligne à ligne
8.7.1 Déplacement de données (décalage)
8.7.2 Trouver la différence entre les lignes (diff)
8.7.3 Calcul du taux de variation entre les lignes (pct_change)
Exemple Excel 9 : Analyse du cours de l’action Samsung Electronics
CHAPITRE 09 appliquer
9.1 Présentation de la fonction d'application
9.1.1 Pourquoi la fonction « appliquer » est-elle nécessaire ?
9.1.2 Fonction de la fonction d'application
Application de la fonction d'application à la série 9.2
Application de la fonction d'application à la série 9.2.1
9.2.2 Fonctions définies par l'utilisateur et application
9.2.3 Fonctions lambda et application
9.2.4 Éléments à prendre en compte lors de l'application de la fonction apply à la série
9.2.5 Apprentissage supplémentaire sur les fonctions lambda
Exemple Excel 10 : Traitement des données de taille et de poids des élèves dans une colonne (2)
9.3 Application de la fonction apply à un data frame
9.3.1 Application de la fonction apply à un data frame
9.3.2 Spécification de l'axe lors de l'application de la fonction apply à un data frame
9.3.3 Application d'une fonction lambda à chaque ligne de données d'entrée provenant de plusieurs colonnes
9.3.4 Comparaison des fonctions apply et map
Exemple Excel 11 : Prétraitement et analyse des données des stations de métro
CHAPITRE 10 MANIPULATION DES CORDES
10.1 Fonctions de manipulation des chaînes de caractères
10.1.1 Pourquoi apprendre les fonctions de manipulation de chaînes de caractères Pandas ?
10.1.2 Fonctionnalités des fonctions de manipulation de chaînes de caractères de Pandas
10.2 Différentes fonctions pour la manipulation des chaînes de caractères
10.2.1 Indexation et découpage
10.2.2 Retourner la longueur d'une chaîne (str.len)
10.2.3 Suppression des espaces d'une chaîne (str.strip et autres)
10.2.4 Fractionner une chaîne (str.split)
10.2.5 Remplacement de chaînes (str.replace et autres)
Exemple Excel 12 : Conversion de données relatives au PIB au format numérique
10.2.6 Vérifier si une chaîne contient une valeur (autre que str.contains)
10.2.7 Extraction de chaînes de caractères (str.extract)
10.3 Expressions régulières
10.3.1 Que sont les expressions régulières ?
10.3.2 Grammaire principale des expressions régulières
10.3.3 Utilisation des expressions régulières avec les fonctions de chaînes de caractères Pandas
10.3.4 Extraction de chaînes de caractères à l'aide d'expressions régulières (str.extractall, etc.)
Exemple Excel 13 : Comptage du nombre de franchises de café dans les arrondissements de Seocho-gu et Gangnam-gu
CHAPITRE 11 Pivots et dépivots
11.1 Tableau croisé dynamique
11.1.1 Pourquoi utiliser des tableaux croisés dynamiques ?
11.1.2 Tableaux croisés dynamiques et fonctions d'agrégation
11.1.3 Création d'un tableau croisé dynamique (pivot_table)
11.1.4 Création d'un tableau croisé dynamique par saisie de plusieurs arguments
11.1.5 Comment saisir une fonction comme argument
11.1.6 Fonctions d'agrégation qui s'appliquent uniquement au regroupement (premier, dernier)
11.1.7 Pivot de chaîne
11.1.8 Création d'un tableau croisé qui agrège les fréquences (tableau croisé)
Exemple Excel 14 : Lors du naufrage du Titanic, les femmes et les enfants ont-ils été secourus en premier ?
11.2 Dépivot
11.2.1 Pourquoi Unpivot est nécessaire
11.2.2 Dépivotage avec la fonction de pile
11.2.3 Dépivotement avec la fonction de fusion
11.2.4 Différences de dépivotage entre les fonctions de pile et de fusion
Exemple Excel 15 : Création d’un nouveau tableau croisé dynamique à partir des données de ventes d’un supermarché
CHAPITRE 12 Regroupement des données
12.1 Traitement des colonnes avec la fonction groupby
12.1.1 Pourquoi la fonction groupby est-elle nécessaire ?
12.1.2 Application de fonctions au sein de groupes (groupby)
12.1.3 Classement avec la fonction groupby
Exemple Excel 16 : Distinguer les personnes portant le même nom
12.1.4 Opération de tri par ligne avec fonction groupby (décalage et autres)
12.1.5 Remplacement des valeurs manquantes par des valeurs antérieures et postérieures à l'aide de la fonction groupby (fonctions ffill et bfill)
12.1.6 Calcul de la somme cumulée à l'aide de la fonction groupby (cumsum)
12.1.7 Recherche de la commande à l'aide de la fonction groupby (cumcount)
Exemple Excel 17 : Traitement de différentes colonnes à l’aide de la fonction GroupBy avec des données OHLCV en stock
12.1.8 Transformation des résultats agrégés en colonnes
12.1.9 Application d'une fonction définie par l'utilisateur avec la fonction Transform
Exemple Excel 18 : Diviser en groupes, calculer les scores standard et attribuer des notes aux élèves.
12.2 Agrégation avec la fonction groupby
12.2.1 Application des fonctions d'agrégation avec la fonction Groupby
12.2.2 Différences entre l'agrégation avec la fonction GROUP BY et les tableaux croisés dynamiques
12.2.3 Agrégation avec les fonctions groupby et agg
12.2.4 Assemblage de chaînes de caractères
12.2.5 Application de fonctions définies par l'utilisateur avec la fonction agg
12.2.6 Différence entre les fonctions d'agrégation et de transformation
Exemple Excel 19 : Création de différentes agrégations à partir des statistiques des passagers du naufrage du Titanic
12.3 Groupage avancé
12.3.1 Différents paramètres de la fonction groupby
12.3.2 Grouper par objets
12.3.3 Fonction groupby et tête, queue et échantillon
12.3.4 Mérou
12.3.5 Différents filtrages de groupe (tous, n'importe lequel) à l'aide de la fonction transform
Exemple Excel 20 : Agrégation des prix des voitures Audi d’occasion
CHAPITRE 13 DONNÉES DE SÉRIES CHRONOLOGIQUES
13.1 Introduction aux données de séries chronologiques
13.1.1 Types de données de séries chronologiques
13.1.2 Type de données datetime
13.1.3 Apprentissage axé sur les données de séries chronologiques
13.2 Conversion et indexation des données de séries chronologiques
13.2.1 Conversion en données de séries temporelles (to_datetime)
13.2.2 Autres fonctions de transformation de séries temporelles
13.2.3 Chargement d'un cadre de données en spécifiant le type de données datetime à partir d'un fichier
13.2.4 Indexation et découpage DatetimeIndex
13.2.5 Extraction de données pour une période spécifique (at_time, between_time)
Exemple Excel 21 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (1)
13.3 Génération et cycle des données de séries temporelles
13.3.1 Cycle
13.3.2 Création de données de séries temporelles (plage de dates)
13.4 Regroupement des données de séries chronologiques
13.4.1 Traitement des colonnes par regroupement (rééchantillonnage)
13.4.2 Comparaison des fonctions resample et groupby
13.4.3 Agrégation des groupes (rééchantillonnage)
13.4.4 Application de la fonction agg à la fonction resample
13.4.5 Application simultanée des fonctions groupby et resample
Exemple Excel 22 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (2)
13.5 Extraction de données de séries chronologiques spécifiques
13.5.1 Différentes méthodes d'extraction de données de séries temporelles spécifiques (accesseur dt)
13.5.2 Conversion en chaîne de caractères (strftime)
13.5.3 Conversion au type de données périodique (to_period)
Exemple Excel 23 : Gestion des données de centres commerciaux en ligne avec des données de séries temporelles (3)
13.6 Autres fonctions de traitement des données de séries temporelles
13.6.1 Conversion de fuseaux horaires
13.6.2 Création d'un intervalle de temps (DateOffset)
13.6.3 Création d'un groupeur de séries temporelles (Groupeur)
13.6.4 Création d'un tableau contenant uniquement les jours ouvrables (bdate_range)
13.6.5 Suréchantillonnage (asfreq et autres)
Exemple Excel 24 : Suréchantillonnage des journaux d’achat de Bitcoin
CHAPITRE 14 : Pandas avancé 1
14.1 Fonctions Pandas utiles à connaître
14.1.1 Modification en masse des noms de colonnes (add_prefix, add_suffix)
14.1.2 Récupération des données d'une colonne puis suppression de celles-ci (pop)
14.1.3 Création d'une colonne à un emplacement spécifique (insertion)
14.1.4 Création d'une colonne (affectation)
14.1.5 Filtrage par requête
14.1.6 Retourner l'emplacement d'une ligne ou d'une colonne (get_loc)
14.1.7 Conversion d'une classe d'index en un cadre de données ou une série (to_frame, to_series)
14.1.8 Fusion de cadres de données
14.1.9 Utilisation de méthodes consécutives (pipe)
14.1.10 Encodage des données catégorielles (factorisation)
14.1.11 Exécution de l'encodage one-hot (get_dummies)
14.1.12 Exécution de l'encodage one-hot d'une série de chaînes de caractères (str.get_dummies)
14.1.13 Décomposer une liste de cellules en lignes
14.1.14 Encodage basé sur plusieurs colonnes (ngroup)
14.1.15 Vérification de l'égalité des data frames ou des séries
14.1.16 Retourner différentes parties de deux objets (comparer)
14.1.17 Conversion d'un cadre de données horizontal en un cadre vertical (largeur vers longueur)
14.1.18 Chargement d'un cadre de données à partir d'un tableau HTML (read_html)
14.2 Fonctions NumPy utiles à connaître
14.2.1 Fonction de génération de nombres aléatoires de NumPy
14.2.2 Retourner la plus grande valeur de deux tableaux (np.fmax)
14.2.3 Trier chaque ligne ou colonne individuellement (np.sort)
14.3 Classe d'index
14.3.1 Création d'une classe Index
14.3.2 Fonctions appliquées à la classe d'index
14.4 Multi-index
14.4.1 Création d'un index multiple
14.4.2 Indexation d'un DataFrame avec plusieurs index
14.4.3 Fonctions gérant plusieurs indices
14.4.4 Indice d'intervalle
CHAPITRE 15 : Pandas 2 avancé
15.1 Agrégations mobiles et cumulatives
15.1.1 Roulement
15.1.2 Expansion
15.1.3 Approfondissement des agrégats mobiles et cumulatifs
15.2 Types de données de catégorie
15.2.1 Pourquoi utiliser des types de données de catégorie ?
15.2.2 Conversion au type de données catégorielles
15.2.3 Différentes méthodes de types de données de catégorie
15.3 Visualisation
15.3.1 Couleur
15.3.2 Paramètres de la fonction de tracé
15.3.3 Division d'une région pour créer un sous-graphe
15.4 Conseils Pandas
15.4.1 Notation scientifique
15.4.2 Séparer les chiffres par des virgules
15.4.3 Exprimer les nombres décimaux en pourcentages
15.4.4 Fusionner toutes les feuilles d'un fichier Excel en une seule fois
15.4.5 Division d'un cadre de données en groupes et enregistrement de celui-ci dans un fichier Excel
15.4.6 Saisie d'une fonction lambda dans l'indexation booléenne
15.4.7 Modification des noms de colonnes par application d'une fonction lambda à la fonction de renommage
15.4.8 Tri par application d'une fonction aux critères de tri (clé de paramètre)
15.4.9 Échange de positions dans une chaîne à l'aide d'un groupe de capture dans une expression régulière
15.4.10 Création de motifs d'expressions régulières avec la fonction join de Python
15.4.11 Inverser une série ou un cadre de données
15.4.12 Détermination du type de données des éléments individuels d'une colonne d'objet
15.4.13 Regroupement des catégories de poids léger
15.4.14 Conversion de plusieurs index en un seul index à l'aide de la fonction map
15.4.15 Filtrage basé sur un instant précis à l'aide des fonctions cummin et cummax
15.4.16 Renvoi de la première valeur non NaN
15.4.17 Développement des listes et dictionnaires d'une cellule en colonnes distinctes
15.4.18 Agrégation des seules colonnes contenant des données numériques
15.4.19 Créez une ligne qui regroupe les sous-totaux pour chaque groupe.
15.4.20 Regroupement de plusieurs colonnes en les affectant au même groupe, quel que soit leur ordre.
15.4.21 Conversion des données de date dans Excel au format datetime lors de leur importation en tant que nombre
Calculez la différence par rapport à la dernière date de la période, soit le 15 avril 2022.
15.4.23 Données mobiles dans les cycles de séries temporelles
15.4.24 Catégorisation par indice d'intervalle
15.4.25 Application de la fonction apply à l'aide des données de l'index
CHAPITRE 16 : Analyse pratique des données
16.1 Bandes de Bollinger et analyse des tendances du cours des actions
16.2 Analyse des données Moneyball et baseball
16.3 Analyse des résultats des matchs de l'équipe nationale A de football
16.4 Analyse de la distance de franchise
16.5 Analyse des soldes de données massives et de titres
Image détaillée

Avis de l'éditeur
Vous travaillez avec des données mais vous vous sentez limité par Excel seul ?
Vous souhaitez vous initier à l'analyse de données ?
Apprenez Pandas avec « L'Excel de Python, la bibliothèque Pandas » !
Ce livre comprend un total de 16 chapitres.
Les chapitres 1 à 5 constituent l'« apprentissage préliminaire » nécessaire pour manipuler sérieusement les données avec Pandas.
En commençant par les bases de Python pour apprendre Pandas, vous découvrirez les concepts fondamentaux et apprendrez à manipuler les classes principales de Pandas : les dataframes, les séries et les indices.
Ensuite, nous aborderons la fonction simple mais puissante de Pandas appelée « opérations ».
Les chapitres 6 à 13 traitent sérieusement de l'analyse des données.
Vous apprendrez systématiquement le processus d'analyse des données, qui consiste globalement en « nettoyage des données », « combinaison des données », « traitement des colonnes » et « regroupement ».
Voici le contenu dont vous avez besoin pour passer du niveau débutant au niveau intermédiaire, et il est également très utile pour les niveaux intermédiaires et confirmés.
Les chapitres 14 et 15 couvrent les fonctions utiles basées sur le cadre principal de Pandas appris jusqu'à présent, ainsi que des informations approfondies sur les index, les fonctions d'agrégation mobiles et cumulatives, les types de données catégorielles et la visualisation.
Vous découvrirez également des astuces Pandas pour améliorer l'efficacité de votre analyse de données.
Enfin, au chapitre 16, vous vous familiariserez avec l'analyse de données en expérimentant l'analyse de données pratique sur divers sujets tels que les cours boursiers, le baseball, le football, les franchises et les sociétés de valeurs mobilières.
Caractéristiques de ce livre
- Nous fournissons des explications détaillées et conviviales, basées sur une riche iconographie.
- Vous pouvez consolider vos acquis grâce à divers exemples Excel et des problèmes pratiques d'analyse de données.
- Il est organisé étape par étape, du niveau débutant au contenu utile aux praticiens.
Découvrez la joie de grandir avec un seul livre.
Vous souhaitez vous initier à l'analyse de données ?
Apprenez Pandas avec « L'Excel de Python, la bibliothèque Pandas » !
Ce livre comprend un total de 16 chapitres.
Les chapitres 1 à 5 constituent l'« apprentissage préliminaire » nécessaire pour manipuler sérieusement les données avec Pandas.
En commençant par les bases de Python pour apprendre Pandas, vous découvrirez les concepts fondamentaux et apprendrez à manipuler les classes principales de Pandas : les dataframes, les séries et les indices.
Ensuite, nous aborderons la fonction simple mais puissante de Pandas appelée « opérations ».
Les chapitres 6 à 13 traitent sérieusement de l'analyse des données.
Vous apprendrez systématiquement le processus d'analyse des données, qui consiste globalement en « nettoyage des données », « combinaison des données », « traitement des colonnes » et « regroupement ».
Voici le contenu dont vous avez besoin pour passer du niveau débutant au niveau intermédiaire, et il est également très utile pour les niveaux intermédiaires et confirmés.
Les chapitres 14 et 15 couvrent les fonctions utiles basées sur le cadre principal de Pandas appris jusqu'à présent, ainsi que des informations approfondies sur les index, les fonctions d'agrégation mobiles et cumulatives, les types de données catégorielles et la visualisation.
Vous découvrirez également des astuces Pandas pour améliorer l'efficacité de votre analyse de données.
Enfin, au chapitre 16, vous vous familiariserez avec l'analyse de données en expérimentant l'analyse de données pratique sur divers sujets tels que les cours boursiers, le baseball, le football, les franchises et les sociétés de valeurs mobilières.
Caractéristiques de ce livre
- Nous fournissons des explications détaillées et conviviales, basées sur une riche iconographie.
- Vous pouvez consolider vos acquis grâce à divers exemples Excel et des problèmes pratiques d'analyse de données.
- Il est organisé étape par étape, du niveau débutant au contenu utile aux praticiens.
Découvrez la joie de grandir avec un seul livre.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 30 septembre 2024
- Nombre de pages, poids, dimensions : 632 pages | 188 × 257 × 35 mm
- ISBN13 : 9791165922962
- ISBN10 : 1165922967
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne