
Visualisation interactive des données en R et Python avec Plotly
Description
Introduction au livre
Transformez des données complexes et difficiles en graphiques et tableaux faciles à comprendre en un coup d'œil.
Ce livre montre comment visualiser des données à l'aide de Plotly, un package de visualisation interactive, en utilisant R et Python, et en prenant comme exemples le taux d'emploi et les données relatives à la COVID-19.
La partie 1 présente le concept et l'importance de la visualisation des données, et la partie 2 explique les concepts de base de Plotly et ses fonctionnalités essentielles telles que la mise en page et les sous-graphiques.
La partie 3 présente les méthodes de visualisation Plotly et ses fonctionnalités spéciales pour différents usages, comme les nuages de points et les graphiques en cascade.
Dans la partie 4, nous apprendrons comment créer et implémenter des commandes telles que des boutons et des curseurs pour utiliser efficacement les visualisations Plotly, ainsi que comment diffuser les résultats en ligne et hors ligne.
Enfin, l'annexe décrit le processus de conception et de mise en œuvre d'un tableau de bord utilisant les packages Dash et Shiny afin d'optimiser les capacités de Plotly.
Ce livre montre comment visualiser des données à l'aide de Plotly, un package de visualisation interactive, en utilisant R et Python, et en prenant comme exemples le taux d'emploi et les données relatives à la COVID-19.
La partie 1 présente le concept et l'importance de la visualisation des données, et la partie 2 explique les concepts de base de Plotly et ses fonctionnalités essentielles telles que la mise en page et les sous-graphiques.
La partie 3 présente les méthodes de visualisation Plotly et ses fonctionnalités spéciales pour différents usages, comme les nuages de points et les graphiques en cascade.
Dans la partie 4, nous apprendrons comment créer et implémenter des commandes telles que des boutons et des curseurs pour utiliser efficacement les visualisations Plotly, ainsi que comment diffuser les résultats en ligne et hors ligne.
Enfin, l'annexe décrit le processus de conception et de mise en œuvre d'un tableau de bord utilisant les packages Dash et Shiny afin d'optimiser les capacités de Plotly.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
Recommandation x
Avis du lecteur bêta xiii
Début XVI
À propos de ce livre xix
PREMIÈRE PARTIE : Les bases de la visualisation des données
CHAPITRE 1 : Qu’est-ce que la visualisation des données ? 3
1.1 Le besoin de visualisation des données 5
1.2 Pourquoi la visualisation des données ? 6
1.3 Que pouvons-nous exprimer grâce à la visualisation des données ? 10
1.4 11 Exemples célèbres de visualisation de données
1.5 Graphiques, diagrammes, diagrammes 15
PARTIE II Principes de base de la visualisation avec Plotly
CHAPITRE 2 Visualisation avec Plotly 19
2.1 Qu'est-ce que Plotly ? 20
2.2 Importation et prétraitement des données d'exemple 22
2.3 Premiers pas avec Plotly 28
CHAPITRE 3 Trace 41
3.1 Génération de traces 41
3.2 Propriétés communes des traces 45
CHAPITRE 4 Propriétés de mise en page 65
4.1 Définition des propriétés de mise en page 65
4.2 Propriétés clés communes de la mise en page 66
CHAPITRE 5 Sous-intrigue 89
5.1 Création d'intrigues secondaires et définition des titres 89
5.2 Définition de la légende de l'intrigue secondaire 97
5.3 Placement et montage des intrigues secondaires 98
5.4 Axe de partage 106
CHAPITRE 6 Réglages de couleur 109
6.1 Couleur continue 110
6.2 Couleur discrète 115
PARTIE III Visualisation Plotly en pratique
CHAPITRE 7 : Visualisation des relations et des distributions 123
7.1 Nuage de points 123
7.2 Histogramme 136
7.3 Diagramme en boîte 146
7.4 Violon Plot 155
CHAPITRE 8 Visualisation de la comparaison et de la composition 162
8.1 Graphique à barres 163
8.2 Graphique à barres de ratio 180
8.3 Graphique en forme de sucette 186
Carte radar 8.4 190
Tableau des haltères 8,5 198
8.6 Diagramme circulaire 200
8.7 Graphique Sunburst 209
8.8 Treemap 217
CHAPITRE 9 : Visualisation du temps et du flux 221
9.1 Graphique linéaire 221
Graphique en chandeliers japonais 9.2 : 245
9.3 Graphique en cascade 264
9.4 Graphique en entonnoir 267
9.5 Diagramme de Sankey 275
CHAPITRE 10 : Visualisation des indices et des cartes 282
10.1 Indicateur 282
10.2 Visualisation cartographique 302
PARTIE IV Utilisation de la visualisation Plotly
CHAPITRE 11 Commandes de visualisation 329
11.1 Réglage des positions de commande 331
11.2 Commande par bouton 332
11.3 Contrôle déroulant 346
11.4 Commande par curseur 349
CHAPITRE 12 Utilisation des visualisations Plotly 355
12.1 Utilisation de la barre de modules 355
12.2 Utilisation de la souris 358
12.3 Utilisation de Legends 360
CHAPITRE 13 Distribution Plotly 361
13.1 Distribution hors ligne 361
13.2 Distribution en ligne 364
CHAPITRE 14 Créer des visualisations efficaces 369
14.1 À qui s'adresse ce contenu ? 370
14.2 Choix du type de visualisation approprié 371
14.3 Supports de visualisation 373
14.4 Visualisation concise 374
14.5 Étiquetage facile à lire 376
14.6 Prévention de la distorsion 378
14.7 Utilisation appropriée des couleurs 381
En conclusion 383
ANNEXE Création d'un tableau de bord à l'aide de la réalité augmentée et de Python 384
A.1 Premiers pas avec les applications Dash utilisant Plotly et Python 384
A.2 Premiers pas avec les applications Shiny utilisant Plotly et R 402
ANNEXE B plotly.express 420
B.1 plotly.express 420
B.2 Description de la fonction, principaux paramètres et exemples d'utilisation 424
Recherche 446
Avis du lecteur bêta xiii
Début XVI
À propos de ce livre xix
PREMIÈRE PARTIE : Les bases de la visualisation des données
CHAPITRE 1 : Qu’est-ce que la visualisation des données ? 3
1.1 Le besoin de visualisation des données 5
1.2 Pourquoi la visualisation des données ? 6
1.3 Que pouvons-nous exprimer grâce à la visualisation des données ? 10
1.4 11 Exemples célèbres de visualisation de données
1.5 Graphiques, diagrammes, diagrammes 15
PARTIE II Principes de base de la visualisation avec Plotly
CHAPITRE 2 Visualisation avec Plotly 19
2.1 Qu'est-ce que Plotly ? 20
2.2 Importation et prétraitement des données d'exemple 22
2.3 Premiers pas avec Plotly 28
CHAPITRE 3 Trace 41
3.1 Génération de traces 41
3.2 Propriétés communes des traces 45
CHAPITRE 4 Propriétés de mise en page 65
4.1 Définition des propriétés de mise en page 65
4.2 Propriétés clés communes de la mise en page 66
CHAPITRE 5 Sous-intrigue 89
5.1 Création d'intrigues secondaires et définition des titres 89
5.2 Définition de la légende de l'intrigue secondaire 97
5.3 Placement et montage des intrigues secondaires 98
5.4 Axe de partage 106
CHAPITRE 6 Réglages de couleur 109
6.1 Couleur continue 110
6.2 Couleur discrète 115
PARTIE III Visualisation Plotly en pratique
CHAPITRE 7 : Visualisation des relations et des distributions 123
7.1 Nuage de points 123
7.2 Histogramme 136
7.3 Diagramme en boîte 146
7.4 Violon Plot 155
CHAPITRE 8 Visualisation de la comparaison et de la composition 162
8.1 Graphique à barres 163
8.2 Graphique à barres de ratio 180
8.3 Graphique en forme de sucette 186
Carte radar 8.4 190
Tableau des haltères 8,5 198
8.6 Diagramme circulaire 200
8.7 Graphique Sunburst 209
8.8 Treemap 217
CHAPITRE 9 : Visualisation du temps et du flux 221
9.1 Graphique linéaire 221
Graphique en chandeliers japonais 9.2 : 245
9.3 Graphique en cascade 264
9.4 Graphique en entonnoir 267
9.5 Diagramme de Sankey 275
CHAPITRE 10 : Visualisation des indices et des cartes 282
10.1 Indicateur 282
10.2 Visualisation cartographique 302
PARTIE IV Utilisation de la visualisation Plotly
CHAPITRE 11 Commandes de visualisation 329
11.1 Réglage des positions de commande 331
11.2 Commande par bouton 332
11.3 Contrôle déroulant 346
11.4 Commande par curseur 349
CHAPITRE 12 Utilisation des visualisations Plotly 355
12.1 Utilisation de la barre de modules 355
12.2 Utilisation de la souris 358
12.3 Utilisation de Legends 360
CHAPITRE 13 Distribution Plotly 361
13.1 Distribution hors ligne 361
13.2 Distribution en ligne 364
CHAPITRE 14 Créer des visualisations efficaces 369
14.1 À qui s'adresse ce contenu ? 370
14.2 Choix du type de visualisation approprié 371
14.3 Supports de visualisation 373
14.4 Visualisation concise 374
14.5 Étiquetage facile à lire 376
14.6 Prévention de la distorsion 378
14.7 Utilisation appropriée des couleurs 381
En conclusion 383
ANNEXE Création d'un tableau de bord à l'aide de la réalité augmentée et de Python 384
A.1 Premiers pas avec les applications Dash utilisant Plotly et Python 384
A.2 Premiers pas avec les applications Shiny utilisant Plotly et R 402
ANNEXE B plotly.express 420
B.1 plotly.express 420
B.2 Description de la fonction, principaux paramètres et exemples d'utilisation 424
Recherche 446
Image détaillée

Dans le livre
La visualisation des données est le processus qui consiste à rendre visibles en un coup d'œil les caractéristiques d'une grande quantité de données.
Alors, que peut exprimer la visualisation des données, et quelles caractéristiques peut-elle révéler ? Nous étudions la visualisation des données depuis l’école primaire.
Aujourd'hui encore, les élèves de CM1 apprennent à représenter des données à l'aide de graphiques à barres dans leurs manuels de mathématiques du premier semestre.
C’est pourquoi la méthode la plus couramment utilisée en visualisation de données est le graphique à barres, et parfois les graphiques linéaires et les diagrammes circulaires sont également fréquemment utilisés.
Avant de procéder à la visualisation des données, vous devez d'abord décider de ce que vous souhaitez exprimer et de la méthode de visualisation à utiliser.
La visualisation des données est généralement efficace pour représenter la distribution, la comparaison, la tendance, la composition, la corrélation et la géographie des données.
--- p.10
Le package Plotly fournit des packages liés à chaque langage afin qu'il puisse être utilisé dans divers langages tels que R, Python, Julia, JavaScript, F# et Matlab.
Plotly propose une variété de graphiques et de représentations pour la visualisation des données, notamment des graphiques de base tels que les nuages de points et les graphiques linéaires, des graphiques statistiques tels que les diagrammes en boîte et les histogrammes, des graphiques scientifiques tels que les cartes thermiques et les diagrammes ternaires, et des graphiques financiers tels que les graphiques de séries chronologiques et les graphiques en chandeliers.
--- p.20
En règle générale, un histogramme représente le nombre de données qui se situent dans une plage définie par la taille des classes, c'est-à-dire le nombre de données.
Plotly trace également un histogramme de base pour exprimer le nombre d'instances de données, mais il offre également la possibilité de remplacer cette valeur par une valeur de fonction spécifique.
Plotly propose cinq fonctions d'histogramme : count, qui affiche le nombre de cas, sum, qui affiche la somme des valeurs appartenant à une classe, avg, qui affiche la moyenne, min, qui affiche la plus petite valeur et max, qui affiche la plus grande valeur.
Les fonctions d'histogramme peuvent être utilisées en définissant le nom de la fonction sur la propriété histfunc de la trace de l'histogramme.
Si vous utilisez une fonction autre que count, vous devez définir la variable à appliquer à chaque fonction dans l'attribut y.
--- p.143
Plotly étant un outil de visualisation de données dynamique, il offre diverses fonctionnalités qui réagissent en fonction des interactions des utilisateurs en ligne.
Plusieurs fonctions sont disponibles, mais celle qui permet une interprétation fluide des données visualisées, telles que les valeurs des données et leurs variations, est la fonction « survol ».
Le survol n'est pas une fonctionnalité exclusive à Plotly, mais était largement utilisé par le passé sous le nom d'« infobulle ».
Autrement dit, il s'agit d'une fonction qui interagit avec la souris ou le dispositif de pointage numérique de l'utilisateur et l'informe de l'emplacement pointé par le dispositif grâce à une petite fenêtre.
Ce survol est également communément appelé « survol de la souris », « hover » ou « hover box » et peut être utilisé dans les navigateurs Web à l'aide de CSS.
--- p.234
Les visualisations statiques créées avec ggplot2 de R ou Matplotlib ou seaborn de Python rendent difficile l'obtention de données supplémentaires à partir de la visualisation elle-même, en plus des données visualisées lors de la création du graphique.
Il faut donc composer avec l'inconvénient de devoir recoder et créer des données supplémentaires pour permettre la visualisation.
En particulier, un recodage est nécessaire pour vérifier les valeurs des données à des emplacements spécifiques ou pour zoomer sur les données de sections spécifiques, et il est impossible de créer d'innombrables visualisations en prédisant les habitudes d'utilisation des utilisateurs.
En revanche, les visualisations dynamiques telles que Plotly offrent diverses fonctions qui peuvent être utilisées pour l'analyse des données, comme la vérification des valeurs caractéristiques des données, le zoom avant et arrière et l'affichage de données spécifiques uniquement.
Dans Plotly, l'ensemble des icônes contenant ces fonctions est appelé la barre de modification.
--- p.355
Il existe deux façons de créer un graphique Plotly en Python : en utilisant le module plotly.graph_objects de la bibliothèque Plotly et en utilisant le module plotly.express.
Le créateur de Plotly recommande également d'utiliser graph_objects pour comprendre les principes de création de Plotly et utiliser des fonctions détaillées.
Cependant, lors de la création d'un graphique Plotly à l'aide du module graph_objects, le code devient très long et très confus lorsqu'une parenthèse est manquante ou affichée incorrectement.
Nous proposons donc le module express pour simplifier l'utilisation de Plotly.
Alors, que peut exprimer la visualisation des données, et quelles caractéristiques peut-elle révéler ? Nous étudions la visualisation des données depuis l’école primaire.
Aujourd'hui encore, les élèves de CM1 apprennent à représenter des données à l'aide de graphiques à barres dans leurs manuels de mathématiques du premier semestre.
C’est pourquoi la méthode la plus couramment utilisée en visualisation de données est le graphique à barres, et parfois les graphiques linéaires et les diagrammes circulaires sont également fréquemment utilisés.
Avant de procéder à la visualisation des données, vous devez d'abord décider de ce que vous souhaitez exprimer et de la méthode de visualisation à utiliser.
La visualisation des données est généralement efficace pour représenter la distribution, la comparaison, la tendance, la composition, la corrélation et la géographie des données.
--- p.10
Le package Plotly fournit des packages liés à chaque langage afin qu'il puisse être utilisé dans divers langages tels que R, Python, Julia, JavaScript, F# et Matlab.
Plotly propose une variété de graphiques et de représentations pour la visualisation des données, notamment des graphiques de base tels que les nuages de points et les graphiques linéaires, des graphiques statistiques tels que les diagrammes en boîte et les histogrammes, des graphiques scientifiques tels que les cartes thermiques et les diagrammes ternaires, et des graphiques financiers tels que les graphiques de séries chronologiques et les graphiques en chandeliers.
--- p.20
En règle générale, un histogramme représente le nombre de données qui se situent dans une plage définie par la taille des classes, c'est-à-dire le nombre de données.
Plotly trace également un histogramme de base pour exprimer le nombre d'instances de données, mais il offre également la possibilité de remplacer cette valeur par une valeur de fonction spécifique.
Plotly propose cinq fonctions d'histogramme : count, qui affiche le nombre de cas, sum, qui affiche la somme des valeurs appartenant à une classe, avg, qui affiche la moyenne, min, qui affiche la plus petite valeur et max, qui affiche la plus grande valeur.
Les fonctions d'histogramme peuvent être utilisées en définissant le nom de la fonction sur la propriété histfunc de la trace de l'histogramme.
Si vous utilisez une fonction autre que count, vous devez définir la variable à appliquer à chaque fonction dans l'attribut y.
--- p.143
Plotly étant un outil de visualisation de données dynamique, il offre diverses fonctionnalités qui réagissent en fonction des interactions des utilisateurs en ligne.
Plusieurs fonctions sont disponibles, mais celle qui permet une interprétation fluide des données visualisées, telles que les valeurs des données et leurs variations, est la fonction « survol ».
Le survol n'est pas une fonctionnalité exclusive à Plotly, mais était largement utilisé par le passé sous le nom d'« infobulle ».
Autrement dit, il s'agit d'une fonction qui interagit avec la souris ou le dispositif de pointage numérique de l'utilisateur et l'informe de l'emplacement pointé par le dispositif grâce à une petite fenêtre.
Ce survol est également communément appelé « survol de la souris », « hover » ou « hover box » et peut être utilisé dans les navigateurs Web à l'aide de CSS.
--- p.234
Les visualisations statiques créées avec ggplot2 de R ou Matplotlib ou seaborn de Python rendent difficile l'obtention de données supplémentaires à partir de la visualisation elle-même, en plus des données visualisées lors de la création du graphique.
Il faut donc composer avec l'inconvénient de devoir recoder et créer des données supplémentaires pour permettre la visualisation.
En particulier, un recodage est nécessaire pour vérifier les valeurs des données à des emplacements spécifiques ou pour zoomer sur les données de sections spécifiques, et il est impossible de créer d'innombrables visualisations en prédisant les habitudes d'utilisation des utilisateurs.
En revanche, les visualisations dynamiques telles que Plotly offrent diverses fonctions qui peuvent être utilisées pour l'analyse des données, comme la vérification des valeurs caractéristiques des données, le zoom avant et arrière et l'affichage de données spécifiques uniquement.
Dans Plotly, l'ensemble des icônes contenant ces fonctions est appelé la barre de modification.
--- p.355
Il existe deux façons de créer un graphique Plotly en Python : en utilisant le module plotly.graph_objects de la bibliothèque Plotly et en utilisant le module plotly.express.
Le créateur de Plotly recommande également d'utiliser graph_objects pour comprendre les principes de création de Plotly et utiliser des fonctions détaillées.
Cependant, lors de la création d'un graphique Plotly à l'aide du module graph_objects, le code devient très long et très confus lorsqu'une parenthèse est manquante ou affichée incorrectement.
Nous proposons donc le module express pour simplifier l'utilisation de Plotly.
--- p.420
Avis de l'éditeur
Comment utiliser Plotly, un outil de visualisation interactive efficace et des connaissances pratiques en matière de visualisation de données
La visualisation des données, que l'on retrouve fréquemment dans les rapports, les articles de journaux et autres formats, vise à persuader en communiquant clairement et efficacement la signification des données ou des informations.
L'intérêt s'est accru notamment avec la popularisation du traitement et de l'analyse des données à l'aide de R et de Python.
Dans R, ggplot2 et dans Python, Matplotlib étaient principalement utilisés comme packages de visualisation de données, mais ils ne sont pas adaptés aux tableaux de bord fonctionnant sur le Web. C'est pourquoi, récemment, le package Plotly, qui permet aux utilisateurs de l'utiliser librement, a été largement utilisé.
Basé sur JavaScript, Plotly prend en charge non seulement R et Python, mais aussi Julia, Matlab et bien d'autres langages.
De plus, il possède une fonction puissante qui permet une transformation simple et dynamique des visualisations créées avec ggplot2, et est également utilisé efficacement pour concevoir des tableaux de bord réactifs à l'utilisateur grâce au package dash qui prend en charge R et Python.
Ce livre se concentre sur la visualisation interactive des données à l'aide de Plotly et sur le code nécessaire à sa mise en œuvre, plutôt que sur la théorie et les principes de la visualisation des données.
Il se compose de quatre parties et inclut du code R et Python ainsi que des résultats, utilisant les taux d'emploi et les données relatives à la COVID-19 comme exemples, vous permettant ainsi d'apprendre les méthodes de visualisation des données quel que soit votre niveau de maîtrise des langues.
Vous apprendrez également les éléments à prendre en compte lors de la création de visualisations de données et comment utiliser Dash et Shiny, des plateformes permettant de créer des tableaux de bord avec Plotly.
La première partie explique le concept et l'importance de la visualisation des données et présente des cas de visualisation de données historiquement significatifs.
La deuxième partie explique les concepts de base et les différentes propriétés de Plotly.
Découvrez les tracés, les mises en page, les sous-graphiques et les propriétés couramment utilisées, essentielles pour la visualisation Plotly.
La partie 3 présente les méthodes de visualisation Plotly pour des applications pratiques de visualisation de données.
Parmi les exemples, citons les graphiques à bulles, les diagrammes en violon, les graphiques en sucette, les graphiques en haltère, les diagrammes de Sankey et les visualisations d'indicateurs.
Dans la partie 4, nous apprendrons comment créer et implémenter des commandes telles que des boutons et des curseurs pour utiliser efficacement les visualisations Plotly, ainsi que comment diffuser les résultats en ligne et hors ligne.
Enfin, en annexe, nous concevons un tableau de bord utilisant les packages Dash et Shiny, plotly.express, afin de maximiser les capacités de Plotly.
Apprenons les bases de la visualisation des données et pratiquons différentes méthodes de visualisation pour communiquer clairement et efficacement la signification des données.
La visualisation des données, que l'on retrouve fréquemment dans les rapports, les articles de journaux et autres formats, vise à persuader en communiquant clairement et efficacement la signification des données ou des informations.
L'intérêt s'est accru notamment avec la popularisation du traitement et de l'analyse des données à l'aide de R et de Python.
Dans R, ggplot2 et dans Python, Matplotlib étaient principalement utilisés comme packages de visualisation de données, mais ils ne sont pas adaptés aux tableaux de bord fonctionnant sur le Web. C'est pourquoi, récemment, le package Plotly, qui permet aux utilisateurs de l'utiliser librement, a été largement utilisé.
Basé sur JavaScript, Plotly prend en charge non seulement R et Python, mais aussi Julia, Matlab et bien d'autres langages.
De plus, il possède une fonction puissante qui permet une transformation simple et dynamique des visualisations créées avec ggplot2, et est également utilisé efficacement pour concevoir des tableaux de bord réactifs à l'utilisateur grâce au package dash qui prend en charge R et Python.
Ce livre se concentre sur la visualisation interactive des données à l'aide de Plotly et sur le code nécessaire à sa mise en œuvre, plutôt que sur la théorie et les principes de la visualisation des données.
Il se compose de quatre parties et inclut du code R et Python ainsi que des résultats, utilisant les taux d'emploi et les données relatives à la COVID-19 comme exemples, vous permettant ainsi d'apprendre les méthodes de visualisation des données quel que soit votre niveau de maîtrise des langues.
Vous apprendrez également les éléments à prendre en compte lors de la création de visualisations de données et comment utiliser Dash et Shiny, des plateformes permettant de créer des tableaux de bord avec Plotly.
La première partie explique le concept et l'importance de la visualisation des données et présente des cas de visualisation de données historiquement significatifs.
La deuxième partie explique les concepts de base et les différentes propriétés de Plotly.
Découvrez les tracés, les mises en page, les sous-graphiques et les propriétés couramment utilisées, essentielles pour la visualisation Plotly.
La partie 3 présente les méthodes de visualisation Plotly pour des applications pratiques de visualisation de données.
Parmi les exemples, citons les graphiques à bulles, les diagrammes en violon, les graphiques en sucette, les graphiques en haltère, les diagrammes de Sankey et les visualisations d'indicateurs.
Dans la partie 4, nous apprendrons comment créer et implémenter des commandes telles que des boutons et des curseurs pour utiliser efficacement les visualisations Plotly, ainsi que comment diffuser les résultats en ligne et hors ligne.
Enfin, en annexe, nous concevons un tableau de bord utilisant les packages Dash et Shiny, plotly.express, afin de maximiser les capacités de Plotly.
Apprenons les bases de la visualisation des données et pratiquons différentes méthodes de visualisation pour communiquer clairement et efficacement la signification des données.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 5 décembre 2023
- Nombre de pages, poids, dimensions : 480 pages | 188 × 245 × 23 mm
- ISBN13 : 9791192987378
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne