
Principes fondamentaux des statistiques en Python
Description
Introduction au livre
« Principes fondamentaux des statistiques en Python » explique les concepts de sujets statistiques importants et fournit des explications étape par étape des méthodes d'application et des procédures d'exécution à travers des exemples et des solutions en Python.
indice
1.
Statistiques et Python
1.1 Statistiques et données
1.1.1 Concepts et éléments de base des statistiques
1.1.1.1 Concepts de statistiques
1.1.1.2 Prise de décision et raisonnement statistique
1.1.1.3 Éléments fondamentaux des statistiques
1.1.1.4 Défis liés à l'application des statistiques
1.1.2 Données
1.1.2.1 Concepts et types de données
1.1.2.2 Concept et caractéristiques du Big Data
1.1.2.3 Plan d'utilisation des données
1.2 Python
1.2.1 Points forts et bibliothèques spécialisées de Python
1.2.1.1 Points forts de Python
1.2.1.2 Modules et bibliothèques spécialisés de Python
1.2.1.3 Bibliothèque statistique spécialisée de Python
1.2.2 Installation de Python et des packages associés
1.2.2.1 Installation de Python
1.2.2.2 Installation PIP
1.2.2.3 Installation d'ANACONDA
1.2.2.4 Installation de Jupyter Notebook
1.2.2.5 Installation des bibliothèques requises à l'aide de PIP
2.
Le langage Python, les data frames et les opérations de base
2.1 Langage Python et DataFrames
2.1.1 Langage Python et types de données standard
2.1.1.1 Langage Python
2.1.1.2 Types de données standard Python
2.1.2 Fonctions Python et traitement des listes et des chaînes de caractères
2.1.2.1 Fonctions Python
2.1.2.2 Conversion et annotation des types de données en Python
2.1.2.3 Traitement des listes et fonctions associées
2.1.2.4 Gestion des chaînes de caractères
2.1.2.5 Utilisation des f-strings
2.1.3 Structure et utilisation des cadres de données
2.1.3.1 Structure du cadre de données
2.1.3.2 Configuration de df à l'aide de tableaux NumPy et enregistrement et lecture de fichiers
2.1.3.3 Opérations et modifications pratiques des tableaux NumPy
2.1.3.4 Fusion des cadres de données
2.1.3.5 Création d'un tableau fractionné et d'un tableau croisé dynamique
2.1.3.6 Création d'un tableau croisé
2.2 Fonctions opérationnelles de base de Python
2.2.1 Opérateurs de base et applications de Python
2.2.1.1 Opérateurs Python de base
2.2.2 Fonctions Python de base liées aux nombres et aux statistiques
2.2.2.1 Fonctions de base Python pour les nombres
2.2.2.2 Fonctions du module mathématique
2.2.2.3 Fonctions de base de Python liées aux dates
2.2.2.4 Fonctions de base de Python liées aux statistiques
2.2.2.5 Contrôle du flux des instructions de commande
3.
Statistiques descriptives et visualisation des données, et génération de distributions de fréquence
3.1 Statistiques descriptives et visualisation des données
3.1.1 Composantes et caractéristiques des statistiques descriptives
3.1.1.1 Composantes des statistiques descriptives
3.1.1.2 Caractéristiques des statistiques descriptives
3.1.2 Analyse exploratoire des données et visualisation des données
3.1.2.1 Analyse exploratoire des données et outils clés
3.1.2.2 But et objectifs de la visualisation
3.1.2.3 Rôles et types de graphiques et leur application
3.1.3 Principes et préparation de la distribution de fréquence
3.1.3.1 Principe de la distribution de fréquence
3.1.3.2 Procédure de création d'une distribution de fréquences
3.2 Création de distributions de fréquences pour les données qualitatives et quantitatives
3.2.1 Création d'un tableau de distribution de fréquences pour les données qualitatives
3.2.1.1 Création d'une distribution de fréquence des données qualitatives
3.2.1.2 Création d'un graphique de distribution de fréquences pour les données qualitatives
3.2.2 Création d'un tableau de distribution de fréquences et d'un graphique de données quantitatives
3.2.2.1 Création d'une distribution de fréquences de données quantitatives
3.2.2.2 Création d'un graphique de distribution de fréquences pour les données quantitatives
4.
Mesures de tendance centrale, de dispersion et de forme
4.1 Mesures de tendance centrale et mesures de position
4.1.1 Concept de mesures de tendance centrale
4.1.1.1 Concept de moyenne
4.1.1.2 Mode, médiane et point médian
4.1.2 Concept de mesure de position relative
4.1.2.1 Score standard
4.1.2.2 Percentile
4.1.2.3 Quartiles et déciles
4.1.3 Calcul en Python des mesures de tendance centrale et des mesures de position
4.2 Mesure de la volatilité et analyse de la forme de la distribution
4.2.1 Concept et types de mesures de volatilité
4.2.1.1 Concept de mesure de la volatilité
4.2.1.2 Portée
4.2.1.3 Écart moyen
4.2.1.4 Variance et écart type
4.2.1.5 Utilisation de l'écart type
4.2.2 Calcul des mesures de volatilité avec Python
4.2.3 Concept de mesure de la forme de la distribution
4.2.3.1 Le concept d'asymétrie
4.2.3.2 Le concept de kurtosis et la forme de la distribution
4.2.4 Calcul en Python des mesures de forme de distribution
4.2.4.1 Calculs d'asymétrie avec Pandas et Scipy
4.2.4.2 Calcul du kurtosis avec Pandas et Scipy
4.2.4.3 Vérification de la forme de la distribution par la création d'une courbe de distribution de fréquence
5.
Calculs de probabilités, tableaux de contingence et théorème de Bayes
5.1 Calculs de réflexion et de probabilité
5.1.1 Pensée et ensemble
5.1.1.1 Expériences et résultats
5.1.1.2 Concept et types d'ensembles
5.1.1.3 Espace d'échantillonnage et points d'échantillonnage
5.1.1.4 Concept et types de pensée
5.1.2 Concept et calcul de la probabilité
5.1.2.1 Concept de probabilité
5.1.2.2 Approche du calcul des probabilités
5.1.3 Règles de dénombrement et règles de calcul des probabilités
5.1.3.1 Règle de dénombrement
5.1.3.2 Règles de calcul des probabilités
5.1.4 Calcul des probabilités avec Python
5.1.4.1 Calcul de la probabilité d'obtenir pile lors d'un lancer de pièce aléatoire
5.1.4.2 Simulation d'un lancer de pièce aléatoire et calcul de la probabilité d'obtenir face
5.1.4.3 Création d'un diagramme à points pour une simulation
5.1.4.4 Calculs factoriels, de permutation et de combinaison
5.2 Probabilité conditionnelle, tableaux de contingence et théorème de Bayes
5.2.1 Probabilité conditionnelle et probabilité conjointe
5.2.1.1 Probabilité conditionnelle et probabilité conjointe
5.2.1.2 Probabilité conditionnelle et probabilité conjointe d'événements indépendants
5.2.2 Table de partition et règle de Bayes
5.2.2.1 Table de partition
5.2.2.2 Tableau de probabilité conjointe et probabilité marginale
5.2.2.3 Loi de Bayes et interprétation diachronique
5.2.3 Création d'une table de partition et résolution de la règle de Bayes à l'aide de Python
5.2.3.1 Création d'une table de partitions avec Python
5.2.3.2 Solution de la loi de Bayes en Python
6.
Variables aléatoires et distributions de probabilité
6.1 Variables aléatoires, distributions de probabilité et espérances
6.1.1 Concept et types de variables aléatoires
6.1.1.1 Concept de variable aléatoire
6.1.1.2 Types de variables aléatoires
6.1.1.3 Génération de nombres aléatoires en Python
6.1.2 Distribution de probabilité et espérance des variables aléatoires
6.1.2.1 Concept de distribution de probabilité
6.1.2.2 Espérance et variance des variables aléatoires
6.2 Distributions de probabilité discrètes et continues
6.2.1 Distribution de probabilité discrète
6.2.1.1 Concept de distribution de probabilité discrète
6.2.1.2 L'épreuve de Bernoulli et le processus de Bernoulli
6.2.1.3 Distribution binomiale
6.2.1.4 Distribution de Poisson
6.2.1.5 Distribution géométrique initiale
6.2.1.6 Distribution binomiale négative et distribution géométrique
6.2.2 Distribution de probabilité continue
6.2.2.1 Concept de distribution de probabilité continue
6.2.2.2 Distribution uniforme
6.2.2.3 Distribution exponentielle
6.2.2.4 Distribution normale
6.2.2.5 Théorème central limite et simulation de Monte Carlo
7.
Échantillonnage, échantillonnage et distribution des échantillons
7.1 Échantillonnage et prélèvement
7.1.1 Exploration et échantillonnage des connaissances
7.1.1.1 Méthode scientifique
7.1.1.2 Approche et exigences de l'enquête
7.1.1.3 Avantages et procédures de réalisation d'enquêtes par sondage
7.1.2 Échantillonnage
7.1.2.1 Concept d'échantillonnage
7.1.2.2 Biais d'échantillonnage et erreur d'échantillonnage
7.1.2.3 Échantillonnage probabiliste
7.1.2.4 Échantillonnage non probabiliste
7.2 Inférence statistique et distributions d'échantillonnage
7.2.1 Inférence statistique et statistiques d'échantillon
7.2.1.1 Concepts d'inférence statistique
7.2.1.2 Statistiques de l'échantillon
7.2.2 Distribution d'échantillonnage
7.2.2.1 Concept de distribution d'échantillonnage
7.2.2.2 Distribution d'échantillonnage de la moyenne
7.2.2.3 Valeur attendue et écart type de la distribution d'échantillonnage moyenne
7.2.2.4 Méthode de détermination de la taille et du nombre d'échantillons
7.2.2.5 Approximation normale et correction de continuité de la distribution binomiale
7.2.3 Autres distributions d'échantillonnage
7.2.3.1 Autres statistiques d'échantillon et distributions d'échantillonnage
7.2.3.2 Distribution t
7.2.3.3 Distribution du chi carré
7.2.3.4 Distribution F
8.
Estimation et intervalles de confiance
8.1 Estimation ponctuelle et estimation par intervalle
8.1.1 Estimation ponctuelle et estimateurs ponctuels
8.1.1.1 Estimation ponctuelle et estimateurs ponctuels
8.1.1.2 Exigences relatives à la quantité estimée
8.1.1.3 Problèmes liés à l'utilisation de l'estimation ponctuelle
8.1.2 Estimation par intervalle
8.1.2.1 Concept et composantes de l'estimation par intervalle
8.1.2.2 Concept et procédure d'estimation des intervalles de confiance
8.2 Estimation par la moyenne, par point et par intervalle
8.2.1 Estimation par intervalle de la moyenne de la population et détermination de la taille de l'échantillon à l'aide de Python
8.2.1.1 Estimation par intervalle de la moyenne de la population : lorsque la variance de la population est connue
8.2.1.2 Estimation par intervalle de la moyenne de la population : lorsque la variance de la population est inconnue
8.2.1.3 Détermination de la taille minimale de l'échantillon pour estimer la moyenne de la population
8.2.1.4 Bootstrap
8.2.2 Estimation par intervalle des proportions et des variances de la population
8.2.2.1 Estimation par intervalle des proportions de population et détermination de la taille de l'échantillon
8.2.2.2 Estimation par intervalle de la variance de la population
9.
Tests d'hypothèses
9.1 Principes de vérification d'hypothèses
9.1.1 Principes des tests d'hypothèses
9.1.1.1 Concept de test d'hypothèse
9.1.1.2 Classification des hypothèses
9.1.2 Procédures de test d’hypothèses, de prise de décision et de mise en œuvre
9.1.2.1 Prise de décision dans les tests d'hypothèses
9.1.2.2 Distinguer le seuil d'erreur du seuil de rejet dans les décisions de test d'hypothèses
9.1.2.3 Procédure de test d'hypothèse
9.2 Tests d'échantillons
9.2.1 Test sur un seul échantillon
9.2.1.1 Test t à un échantillon
9.2.1.2 Test z de proportion
9.2.1.3 Tests d'hypothèses sur la variance et l'écart type
9.2.1.4 Matrice de puissance et d'erreur
9.2.2 Principes et procédures des tests d'hypothèses à deux échantillons
9.2.2.1 Principes des tests d'hypothèses à deux échantillons
9.2.2.2 Test de différence des moyennes d'échantillons indépendants
9.2.2.3 Test de différence des moyennes de deux échantillons dépendants
9.2.2.4 Test de différence de proportions entre deux échantillons indépendants
9.2.2.5 Test de différence entre deux variances d'échantillons
9.2.3 Exemple de solution Python pour un test d'hypothèse à deux échantillons
9.2.3.1 Test t à deux échantillons : variances de population égales – test bilatéral
9.2.3.2 Test t à deux échantillons : Test bilatéral avec variances de population différentes
9.2.3.3 Test t de Student pour deux échantillons indépendants : variances de population égales (test unilatéral à droite)
9.2.3.4 Test t de Student pour deux échantillons indépendants : variances de population égales (test unilatéral à gauche)
9.2.3.5 Test z de différence de moyennes de deux échantillons indépendants
9.2.3.6 Utilisation du test z en Python pour tester la différence entre deux moyennes d'échantillons indépendants
9.2.3.7 Utilisation de la fonction rp.ttest de Python pour tester la différence entre deux moyennes d'échantillons indépendants
9.2.3.8 Test t à deux échantillons avec Python (rp.ttest)
9.2.3.9 Test Z de proportions à deux échantillons avec la fonction Proportions_ztest de Python
9.2.3.10 Test F de différence de variances entre deux échantillons avec Python
10. ANOVA
10.1 Principes de conception expérimentale et d'ANOVA
10.1.1 Expériences statistiques et conception expérimentale
10.1.1.1 Expériences statistiques
10.1.1.2 Conception expérimentale
10.1.2 Principes et types d'ANOVA
10.1.2.1 Principes de l'ANOVA
10.1.2.2 Types d'ANOVA
10.2 ANOVA à un facteur
10.2.1 Concept et procédure de mise en œuvre de l'ANOVA à un facteur
10.2.1.1 Concept et caractéristiques de l'ANOVA à un facteur
10.2.1.2 Procédure pour réaliser une ANOVA à un facteur
10.2.2 Solution Python pour l'ANOVA à un facteur
10.2.2.1 Solution Python pour l'ANOVA à un facteur
10.2.2.2 Comparaison des moyennes de données avec des tailles d'échantillon différentes
10.2.2.3 Comparaison des moyennes de données avec la même taille d'échantillon
10.2.2.4 Répartition des données par catégorie et comparaison des moyennes
10.3 ANOVA à deux facteurs
10.3.1 Principes et méthodes de l'ANOVA à deux facteurs non répétée
10.3.1.1 Principes de l'ANOVA à deux facteurs
10.3.1.2 Comment réaliser une ANOVA à deux facteurs non répétée
10.3.2 Solution Python pour l'ANOVA à deux facteurs non répétée
10.4 ANOVA à deux facteurs avec mesures répétées
10.4.1 Principes et méthode de mise en œuvre de l'ANOVA à deux facteurs avec mesures répétées
10.4.1.1 Principes de l'ANOVA à deux facteurs avec mesures répétées
10.4.1.2 Comment réaliser une ANOVA à deux facteurs avec mesures répétées
10.4.2 Solution Python pour l'ANOVA à deux facteurs avec mesures répétées
11.
Analyse de corrélation et diagramme de dispersion
11.1 Analyse de corrélation et de covariance
11.1.1 Concepts d'analyse de corrélation et de covariance
11.1.1.1 Corrélation et relation linéaire
11.1.1.2 Covariance
11.1.2 Coefficient de corrélation et test de corrélation
11.1.2.1 Principe de calcul du coefficient de corrélation
11.1.2.2 Interprétation des coefficients de corrélation
11.1.2.3 Test de corrélation
11.2 Diagramme de dispersion
11.2.1 Concepts et interprétation des nuages de points
11.2.1.1 Concept et procédure de préparation d'un nuage de points
11.2.1.2 Forme et direction du nuage de points et force du coefficient de corrélation
11.2.2 Création d'un nuage de points avec Python
11.2.2.1 Création d'un nuage de points comparant deux coefficients de corrélation
11.2.2.2 Création d'un nuage de points excluant les valeurs aberrantes
11.2.2.3 Création d'un graphique unique avec deux nuages de points
12.
Analyse de régression
12.1 Principes de l'analyse de régression et analyse de régression simple
12.1.1 Principes de l'analyse de régression
12.1.1.1 Concept et objectif de la régression
12.1.1.2 L'essence de l'analyse de régression
12.1.1.3 Types d'analyse de régression
12.1.2 Analyse de régression simple
12.1.2.1 Régression linéaire simple
12.1.2.2 Exploration de l'ajustement de la régression et de l'influence des valeurs aberrantes
12.1.2.3 Graphique de diagnostic d'adéquation
12.1.2.4 Réalisation d'une régression linéaire simple avec Python
12.1.2.5 Intervalles de confiance et intervalles de prédiction en analyse de régression
12.1.2.6 Création de graphiques d'intervalles de confiance et d'intervalles de prédiction à l'aide de Python
12.2 Régression multiple
12.2.1 Principes de l'analyse de régression multiple
12.2.1.1 L'essence de l'analyse de régression multiple
12.2.1.2 Mise en place d'un modèle d'analyse de régression multiple
12.2.1.3 Statistiques de test pour l'analyse de régression multiple
12.2.2 Analyse de régression multiple avec Python
12.2.2.1 Analyse de régression multiple des effets individuels
12.2.2.2 Réalisation d'une analyse de régression multiple standard et pas à pas à l'aide de Python
13.
Analyse des séries chronologiques
13.1 Principes de l'analyse et de la décomposition des séries temporelles
13.1.1 Nature des données de séries temporelles et création de graphiques
13.1.1.1 Nature des données de séries temporelles
13.1.1.2 Création d'un graphique de série temporelle à l'aide du module Altair de Python
13.1.1.3 Création d'un graphique de série Python
13.1.2 Décomposition des données de séries temporelles
13.1.2.1 Quatre déterminants majeurs des séries temporelles
13.1.2.2 Affichage de la date en Python
13.1.2.3 Solution Python d'analyse des tendances
13.1.2.4 Solution Python pour l'analyse des variations cycliques
13.1.2.5 Analyse des variations saisonnières
13.2 Prévision des séries chronologiques
13.2.1 Nature et performance des prévisions de séries temporelles
13.2.1.1 Concepts et types de prévision de séries chronologiques
13.2.1.2 Performances et exigences en matière de prévision des séries temporelles
13.2.1.3 Caractéristiques de la prévision de séries temporelles univariées
13.2.2 Prévision par lissage exponentiel
13.2.2.1 Lissage et méthode de moyenne mobile Pandas
13.2.2.2 Lissage exponentiel et utilisation de Python
13.2.3 Stationnarité des données de séries temporelles et modèles ARIMA
13.2.3.1 Stationnarité des données de séries chronologiques
13.2.3.2 Test d'autocorrélation des séries temporelles
13.2.3.3 Modèle ARIMA et SARIMAX
13.2.3.4 Évaluation de la précision des prévisions de séries chronologiques
13.2.3.5 Solutions Python pour les modèles ARIMA et SARIMA
14.
Test du chi carré et test non paramétrique
14.1 Test du chi carré
14.1.1 Test de conformité
14.1.1.1 Principe du test de conformité
14.1.1.2 Caractéristiques du test du chi carré d'adéquation
14.1.1.3 Procédure de réalisation du test du chi carré d'adéquation
14.1.1.4 Solution Python pour le test du chi carré d'adéquation
14.1.2 Test d'indépendance
14.1.2.1 Test du concept d'indépendance
14.1.2.2 Procédure pour réaliser le test du chi carré d'indépendance
14.1.2.3 Solution Python pour le test du chi carré d'indépendance
14.2 Tests non paramétriques
14.2.1 Concept et principes de fonctionnement des tests non paramétriques
14.2.1.1 Concepts et avantages des tests non paramétriques
14.2.1.2 Inconvénients des tests non paramétriques
14.2.1.3 Principes et hypothèses des tests non paramétriques
14.2.2 Solution Python pour les tests non paramétriques
14.2.2.1 Année noire
14.2.2.2 Test de signalisation
14.2.2.3 Test de Wilcoxon-Mann-Whitney
14.2.2.4 Test de Wilcoxon sur les rangs signés
14.2.2.5 Test de Kruskal-Wallis
14.2.2.6 Test de Friedman
14.2.2.7 Test de McNemar
14.2.2.8 Test de corrélation de rang de Spearman
Références
Recherche
Statistiques et Python
1.1 Statistiques et données
1.1.1 Concepts et éléments de base des statistiques
1.1.1.1 Concepts de statistiques
1.1.1.2 Prise de décision et raisonnement statistique
1.1.1.3 Éléments fondamentaux des statistiques
1.1.1.4 Défis liés à l'application des statistiques
1.1.2 Données
1.1.2.1 Concepts et types de données
1.1.2.2 Concept et caractéristiques du Big Data
1.1.2.3 Plan d'utilisation des données
1.2 Python
1.2.1 Points forts et bibliothèques spécialisées de Python
1.2.1.1 Points forts de Python
1.2.1.2 Modules et bibliothèques spécialisés de Python
1.2.1.3 Bibliothèque statistique spécialisée de Python
1.2.2 Installation de Python et des packages associés
1.2.2.1 Installation de Python
1.2.2.2 Installation PIP
1.2.2.3 Installation d'ANACONDA
1.2.2.4 Installation de Jupyter Notebook
1.2.2.5 Installation des bibliothèques requises à l'aide de PIP
2.
Le langage Python, les data frames et les opérations de base
2.1 Langage Python et DataFrames
2.1.1 Langage Python et types de données standard
2.1.1.1 Langage Python
2.1.1.2 Types de données standard Python
2.1.2 Fonctions Python et traitement des listes et des chaînes de caractères
2.1.2.1 Fonctions Python
2.1.2.2 Conversion et annotation des types de données en Python
2.1.2.3 Traitement des listes et fonctions associées
2.1.2.4 Gestion des chaînes de caractères
2.1.2.5 Utilisation des f-strings
2.1.3 Structure et utilisation des cadres de données
2.1.3.1 Structure du cadre de données
2.1.3.2 Configuration de df à l'aide de tableaux NumPy et enregistrement et lecture de fichiers
2.1.3.3 Opérations et modifications pratiques des tableaux NumPy
2.1.3.4 Fusion des cadres de données
2.1.3.5 Création d'un tableau fractionné et d'un tableau croisé dynamique
2.1.3.6 Création d'un tableau croisé
2.2 Fonctions opérationnelles de base de Python
2.2.1 Opérateurs de base et applications de Python
2.2.1.1 Opérateurs Python de base
2.2.2 Fonctions Python de base liées aux nombres et aux statistiques
2.2.2.1 Fonctions de base Python pour les nombres
2.2.2.2 Fonctions du module mathématique
2.2.2.3 Fonctions de base de Python liées aux dates
2.2.2.4 Fonctions de base de Python liées aux statistiques
2.2.2.5 Contrôle du flux des instructions de commande
3.
Statistiques descriptives et visualisation des données, et génération de distributions de fréquence
3.1 Statistiques descriptives et visualisation des données
3.1.1 Composantes et caractéristiques des statistiques descriptives
3.1.1.1 Composantes des statistiques descriptives
3.1.1.2 Caractéristiques des statistiques descriptives
3.1.2 Analyse exploratoire des données et visualisation des données
3.1.2.1 Analyse exploratoire des données et outils clés
3.1.2.2 But et objectifs de la visualisation
3.1.2.3 Rôles et types de graphiques et leur application
3.1.3 Principes et préparation de la distribution de fréquence
3.1.3.1 Principe de la distribution de fréquence
3.1.3.2 Procédure de création d'une distribution de fréquences
3.2 Création de distributions de fréquences pour les données qualitatives et quantitatives
3.2.1 Création d'un tableau de distribution de fréquences pour les données qualitatives
3.2.1.1 Création d'une distribution de fréquence des données qualitatives
3.2.1.2 Création d'un graphique de distribution de fréquences pour les données qualitatives
3.2.2 Création d'un tableau de distribution de fréquences et d'un graphique de données quantitatives
3.2.2.1 Création d'une distribution de fréquences de données quantitatives
3.2.2.2 Création d'un graphique de distribution de fréquences pour les données quantitatives
4.
Mesures de tendance centrale, de dispersion et de forme
4.1 Mesures de tendance centrale et mesures de position
4.1.1 Concept de mesures de tendance centrale
4.1.1.1 Concept de moyenne
4.1.1.2 Mode, médiane et point médian
4.1.2 Concept de mesure de position relative
4.1.2.1 Score standard
4.1.2.2 Percentile
4.1.2.3 Quartiles et déciles
4.1.3 Calcul en Python des mesures de tendance centrale et des mesures de position
4.2 Mesure de la volatilité et analyse de la forme de la distribution
4.2.1 Concept et types de mesures de volatilité
4.2.1.1 Concept de mesure de la volatilité
4.2.1.2 Portée
4.2.1.3 Écart moyen
4.2.1.4 Variance et écart type
4.2.1.5 Utilisation de l'écart type
4.2.2 Calcul des mesures de volatilité avec Python
4.2.3 Concept de mesure de la forme de la distribution
4.2.3.1 Le concept d'asymétrie
4.2.3.2 Le concept de kurtosis et la forme de la distribution
4.2.4 Calcul en Python des mesures de forme de distribution
4.2.4.1 Calculs d'asymétrie avec Pandas et Scipy
4.2.4.2 Calcul du kurtosis avec Pandas et Scipy
4.2.4.3 Vérification de la forme de la distribution par la création d'une courbe de distribution de fréquence
5.
Calculs de probabilités, tableaux de contingence et théorème de Bayes
5.1 Calculs de réflexion et de probabilité
5.1.1 Pensée et ensemble
5.1.1.1 Expériences et résultats
5.1.1.2 Concept et types d'ensembles
5.1.1.3 Espace d'échantillonnage et points d'échantillonnage
5.1.1.4 Concept et types de pensée
5.1.2 Concept et calcul de la probabilité
5.1.2.1 Concept de probabilité
5.1.2.2 Approche du calcul des probabilités
5.1.3 Règles de dénombrement et règles de calcul des probabilités
5.1.3.1 Règle de dénombrement
5.1.3.2 Règles de calcul des probabilités
5.1.4 Calcul des probabilités avec Python
5.1.4.1 Calcul de la probabilité d'obtenir pile lors d'un lancer de pièce aléatoire
5.1.4.2 Simulation d'un lancer de pièce aléatoire et calcul de la probabilité d'obtenir face
5.1.4.3 Création d'un diagramme à points pour une simulation
5.1.4.4 Calculs factoriels, de permutation et de combinaison
5.2 Probabilité conditionnelle, tableaux de contingence et théorème de Bayes
5.2.1 Probabilité conditionnelle et probabilité conjointe
5.2.1.1 Probabilité conditionnelle et probabilité conjointe
5.2.1.2 Probabilité conditionnelle et probabilité conjointe d'événements indépendants
5.2.2 Table de partition et règle de Bayes
5.2.2.1 Table de partition
5.2.2.2 Tableau de probabilité conjointe et probabilité marginale
5.2.2.3 Loi de Bayes et interprétation diachronique
5.2.3 Création d'une table de partition et résolution de la règle de Bayes à l'aide de Python
5.2.3.1 Création d'une table de partitions avec Python
5.2.3.2 Solution de la loi de Bayes en Python
6.
Variables aléatoires et distributions de probabilité
6.1 Variables aléatoires, distributions de probabilité et espérances
6.1.1 Concept et types de variables aléatoires
6.1.1.1 Concept de variable aléatoire
6.1.1.2 Types de variables aléatoires
6.1.1.3 Génération de nombres aléatoires en Python
6.1.2 Distribution de probabilité et espérance des variables aléatoires
6.1.2.1 Concept de distribution de probabilité
6.1.2.2 Espérance et variance des variables aléatoires
6.2 Distributions de probabilité discrètes et continues
6.2.1 Distribution de probabilité discrète
6.2.1.1 Concept de distribution de probabilité discrète
6.2.1.2 L'épreuve de Bernoulli et le processus de Bernoulli
6.2.1.3 Distribution binomiale
6.2.1.4 Distribution de Poisson
6.2.1.5 Distribution géométrique initiale
6.2.1.6 Distribution binomiale négative et distribution géométrique
6.2.2 Distribution de probabilité continue
6.2.2.1 Concept de distribution de probabilité continue
6.2.2.2 Distribution uniforme
6.2.2.3 Distribution exponentielle
6.2.2.4 Distribution normale
6.2.2.5 Théorème central limite et simulation de Monte Carlo
7.
Échantillonnage, échantillonnage et distribution des échantillons
7.1 Échantillonnage et prélèvement
7.1.1 Exploration et échantillonnage des connaissances
7.1.1.1 Méthode scientifique
7.1.1.2 Approche et exigences de l'enquête
7.1.1.3 Avantages et procédures de réalisation d'enquêtes par sondage
7.1.2 Échantillonnage
7.1.2.1 Concept d'échantillonnage
7.1.2.2 Biais d'échantillonnage et erreur d'échantillonnage
7.1.2.3 Échantillonnage probabiliste
7.1.2.4 Échantillonnage non probabiliste
7.2 Inférence statistique et distributions d'échantillonnage
7.2.1 Inférence statistique et statistiques d'échantillon
7.2.1.1 Concepts d'inférence statistique
7.2.1.2 Statistiques de l'échantillon
7.2.2 Distribution d'échantillonnage
7.2.2.1 Concept de distribution d'échantillonnage
7.2.2.2 Distribution d'échantillonnage de la moyenne
7.2.2.3 Valeur attendue et écart type de la distribution d'échantillonnage moyenne
7.2.2.4 Méthode de détermination de la taille et du nombre d'échantillons
7.2.2.5 Approximation normale et correction de continuité de la distribution binomiale
7.2.3 Autres distributions d'échantillonnage
7.2.3.1 Autres statistiques d'échantillon et distributions d'échantillonnage
7.2.3.2 Distribution t
7.2.3.3 Distribution du chi carré
7.2.3.4 Distribution F
8.
Estimation et intervalles de confiance
8.1 Estimation ponctuelle et estimation par intervalle
8.1.1 Estimation ponctuelle et estimateurs ponctuels
8.1.1.1 Estimation ponctuelle et estimateurs ponctuels
8.1.1.2 Exigences relatives à la quantité estimée
8.1.1.3 Problèmes liés à l'utilisation de l'estimation ponctuelle
8.1.2 Estimation par intervalle
8.1.2.1 Concept et composantes de l'estimation par intervalle
8.1.2.2 Concept et procédure d'estimation des intervalles de confiance
8.2 Estimation par la moyenne, par point et par intervalle
8.2.1 Estimation par intervalle de la moyenne de la population et détermination de la taille de l'échantillon à l'aide de Python
8.2.1.1 Estimation par intervalle de la moyenne de la population : lorsque la variance de la population est connue
8.2.1.2 Estimation par intervalle de la moyenne de la population : lorsque la variance de la population est inconnue
8.2.1.3 Détermination de la taille minimale de l'échantillon pour estimer la moyenne de la population
8.2.1.4 Bootstrap
8.2.2 Estimation par intervalle des proportions et des variances de la population
8.2.2.1 Estimation par intervalle des proportions de population et détermination de la taille de l'échantillon
8.2.2.2 Estimation par intervalle de la variance de la population
9.
Tests d'hypothèses
9.1 Principes de vérification d'hypothèses
9.1.1 Principes des tests d'hypothèses
9.1.1.1 Concept de test d'hypothèse
9.1.1.2 Classification des hypothèses
9.1.2 Procédures de test d’hypothèses, de prise de décision et de mise en œuvre
9.1.2.1 Prise de décision dans les tests d'hypothèses
9.1.2.2 Distinguer le seuil d'erreur du seuil de rejet dans les décisions de test d'hypothèses
9.1.2.3 Procédure de test d'hypothèse
9.2 Tests d'échantillons
9.2.1 Test sur un seul échantillon
9.2.1.1 Test t à un échantillon
9.2.1.2 Test z de proportion
9.2.1.3 Tests d'hypothèses sur la variance et l'écart type
9.2.1.4 Matrice de puissance et d'erreur
9.2.2 Principes et procédures des tests d'hypothèses à deux échantillons
9.2.2.1 Principes des tests d'hypothèses à deux échantillons
9.2.2.2 Test de différence des moyennes d'échantillons indépendants
9.2.2.3 Test de différence des moyennes de deux échantillons dépendants
9.2.2.4 Test de différence de proportions entre deux échantillons indépendants
9.2.2.5 Test de différence entre deux variances d'échantillons
9.2.3 Exemple de solution Python pour un test d'hypothèse à deux échantillons
9.2.3.1 Test t à deux échantillons : variances de population égales – test bilatéral
9.2.3.2 Test t à deux échantillons : Test bilatéral avec variances de population différentes
9.2.3.3 Test t de Student pour deux échantillons indépendants : variances de population égales (test unilatéral à droite)
9.2.3.4 Test t de Student pour deux échantillons indépendants : variances de population égales (test unilatéral à gauche)
9.2.3.5 Test z de différence de moyennes de deux échantillons indépendants
9.2.3.6 Utilisation du test z en Python pour tester la différence entre deux moyennes d'échantillons indépendants
9.2.3.7 Utilisation de la fonction rp.ttest de Python pour tester la différence entre deux moyennes d'échantillons indépendants
9.2.3.8 Test t à deux échantillons avec Python (rp.ttest)
9.2.3.9 Test Z de proportions à deux échantillons avec la fonction Proportions_ztest de Python
9.2.3.10 Test F de différence de variances entre deux échantillons avec Python
10. ANOVA
10.1 Principes de conception expérimentale et d'ANOVA
10.1.1 Expériences statistiques et conception expérimentale
10.1.1.1 Expériences statistiques
10.1.1.2 Conception expérimentale
10.1.2 Principes et types d'ANOVA
10.1.2.1 Principes de l'ANOVA
10.1.2.2 Types d'ANOVA
10.2 ANOVA à un facteur
10.2.1 Concept et procédure de mise en œuvre de l'ANOVA à un facteur
10.2.1.1 Concept et caractéristiques de l'ANOVA à un facteur
10.2.1.2 Procédure pour réaliser une ANOVA à un facteur
10.2.2 Solution Python pour l'ANOVA à un facteur
10.2.2.1 Solution Python pour l'ANOVA à un facteur
10.2.2.2 Comparaison des moyennes de données avec des tailles d'échantillon différentes
10.2.2.3 Comparaison des moyennes de données avec la même taille d'échantillon
10.2.2.4 Répartition des données par catégorie et comparaison des moyennes
10.3 ANOVA à deux facteurs
10.3.1 Principes et méthodes de l'ANOVA à deux facteurs non répétée
10.3.1.1 Principes de l'ANOVA à deux facteurs
10.3.1.2 Comment réaliser une ANOVA à deux facteurs non répétée
10.3.2 Solution Python pour l'ANOVA à deux facteurs non répétée
10.4 ANOVA à deux facteurs avec mesures répétées
10.4.1 Principes et méthode de mise en œuvre de l'ANOVA à deux facteurs avec mesures répétées
10.4.1.1 Principes de l'ANOVA à deux facteurs avec mesures répétées
10.4.1.2 Comment réaliser une ANOVA à deux facteurs avec mesures répétées
10.4.2 Solution Python pour l'ANOVA à deux facteurs avec mesures répétées
11.
Analyse de corrélation et diagramme de dispersion
11.1 Analyse de corrélation et de covariance
11.1.1 Concepts d'analyse de corrélation et de covariance
11.1.1.1 Corrélation et relation linéaire
11.1.1.2 Covariance
11.1.2 Coefficient de corrélation et test de corrélation
11.1.2.1 Principe de calcul du coefficient de corrélation
11.1.2.2 Interprétation des coefficients de corrélation
11.1.2.3 Test de corrélation
11.2 Diagramme de dispersion
11.2.1 Concepts et interprétation des nuages de points
11.2.1.1 Concept et procédure de préparation d'un nuage de points
11.2.1.2 Forme et direction du nuage de points et force du coefficient de corrélation
11.2.2 Création d'un nuage de points avec Python
11.2.2.1 Création d'un nuage de points comparant deux coefficients de corrélation
11.2.2.2 Création d'un nuage de points excluant les valeurs aberrantes
11.2.2.3 Création d'un graphique unique avec deux nuages de points
12.
Analyse de régression
12.1 Principes de l'analyse de régression et analyse de régression simple
12.1.1 Principes de l'analyse de régression
12.1.1.1 Concept et objectif de la régression
12.1.1.2 L'essence de l'analyse de régression
12.1.1.3 Types d'analyse de régression
12.1.2 Analyse de régression simple
12.1.2.1 Régression linéaire simple
12.1.2.2 Exploration de l'ajustement de la régression et de l'influence des valeurs aberrantes
12.1.2.3 Graphique de diagnostic d'adéquation
12.1.2.4 Réalisation d'une régression linéaire simple avec Python
12.1.2.5 Intervalles de confiance et intervalles de prédiction en analyse de régression
12.1.2.6 Création de graphiques d'intervalles de confiance et d'intervalles de prédiction à l'aide de Python
12.2 Régression multiple
12.2.1 Principes de l'analyse de régression multiple
12.2.1.1 L'essence de l'analyse de régression multiple
12.2.1.2 Mise en place d'un modèle d'analyse de régression multiple
12.2.1.3 Statistiques de test pour l'analyse de régression multiple
12.2.2 Analyse de régression multiple avec Python
12.2.2.1 Analyse de régression multiple des effets individuels
12.2.2.2 Réalisation d'une analyse de régression multiple standard et pas à pas à l'aide de Python
13.
Analyse des séries chronologiques
13.1 Principes de l'analyse et de la décomposition des séries temporelles
13.1.1 Nature des données de séries temporelles et création de graphiques
13.1.1.1 Nature des données de séries temporelles
13.1.1.2 Création d'un graphique de série temporelle à l'aide du module Altair de Python
13.1.1.3 Création d'un graphique de série Python
13.1.2 Décomposition des données de séries temporelles
13.1.2.1 Quatre déterminants majeurs des séries temporelles
13.1.2.2 Affichage de la date en Python
13.1.2.3 Solution Python d'analyse des tendances
13.1.2.4 Solution Python pour l'analyse des variations cycliques
13.1.2.5 Analyse des variations saisonnières
13.2 Prévision des séries chronologiques
13.2.1 Nature et performance des prévisions de séries temporelles
13.2.1.1 Concepts et types de prévision de séries chronologiques
13.2.1.2 Performances et exigences en matière de prévision des séries temporelles
13.2.1.3 Caractéristiques de la prévision de séries temporelles univariées
13.2.2 Prévision par lissage exponentiel
13.2.2.1 Lissage et méthode de moyenne mobile Pandas
13.2.2.2 Lissage exponentiel et utilisation de Python
13.2.3 Stationnarité des données de séries temporelles et modèles ARIMA
13.2.3.1 Stationnarité des données de séries chronologiques
13.2.3.2 Test d'autocorrélation des séries temporelles
13.2.3.3 Modèle ARIMA et SARIMAX
13.2.3.4 Évaluation de la précision des prévisions de séries chronologiques
13.2.3.5 Solutions Python pour les modèles ARIMA et SARIMA
14.
Test du chi carré et test non paramétrique
14.1 Test du chi carré
14.1.1 Test de conformité
14.1.1.1 Principe du test de conformité
14.1.1.2 Caractéristiques du test du chi carré d'adéquation
14.1.1.3 Procédure de réalisation du test du chi carré d'adéquation
14.1.1.4 Solution Python pour le test du chi carré d'adéquation
14.1.2 Test d'indépendance
14.1.2.1 Test du concept d'indépendance
14.1.2.2 Procédure pour réaliser le test du chi carré d'indépendance
14.1.2.3 Solution Python pour le test du chi carré d'indépendance
14.2 Tests non paramétriques
14.2.1 Concept et principes de fonctionnement des tests non paramétriques
14.2.1.1 Concepts et avantages des tests non paramétriques
14.2.1.2 Inconvénients des tests non paramétriques
14.2.1.3 Principes et hypothèses des tests non paramétriques
14.2.2 Solution Python pour les tests non paramétriques
14.2.2.1 Année noire
14.2.2.2 Test de signalisation
14.2.2.3 Test de Wilcoxon-Mann-Whitney
14.2.2.4 Test de Wilcoxon sur les rangs signés
14.2.2.5 Test de Kruskal-Wallis
14.2.2.6 Test de Friedman
14.2.2.7 Test de McNemar
14.2.2.8 Test de corrélation de rang de Spearman
Références
Recherche
Avis de l'éditeur
préface
Ce livre explique les concepts des sujets importants en statistiques et fournit des explications étape par étape sur la manière de les appliquer à travers des exemples et des procédures, ainsi que des solutions en Python.
Le développement des ordinateurs et des technologies de l'information et de la communication a conduit à la naissance, en 1990, d'un nouvel outil d'analyse appelé Python.
Depuis les années 2010, Python s'est imposé comme un outil essentiel pour la science des données, notamment l'apprentissage automatique et l'apprentissage profond, et est largement utilisé pour la collecte et le traitement des données ainsi que pour diverses prises de décision.
Python fournit des centaines de milliers de bibliothèques, qui sont des collections de code contenant de nombreuses fonctions réutilisables, et des modules tels que Matplotlib, Seaborn, Pandas, NumPy, Scikit-learn, Pingouin et Statmodels peuvent être utilisés pour visualiser et traiter des données.
Aujourd'hui, Python s'impose comme un outil essentiel de la pensée statistique à l'ère du big data.
Pour la résolution de problèmes statistiques et le traitement des données, nous utilisons Excel et R, ainsi que des logiciels européens tels que SPSS, SAS, Minitab et Stata.
Pour utiliser ces logiciels, il faut apprendre les fonctions permettant de résoudre chaque problème ainsi que les fonctions spécifiques à chaque logiciel, et ce processus d'apprentissage est souvent assez difficile.
De plus, il est souvent difficile de vérifier l'exactitude et la validité des résultats obtenus avec ce logiciel.
Contrairement aux packages existants, Python fournit des fonctions développées pour la plupart des problèmes, ce qui le rend facile et simple à utiliser.
Cet avantage est d'autant plus important que la fonction peut être modifiée en fonction des conditions pendant son application, et que les résultats peuvent être obtenus immédiatement, permettant ainsi des modifications et des améliorations à tout moment.
Ce livre comporte 14 chapitres.
De nombreux ouvrages incluent une annexe expliquant les bases de Python, mais celui-ci est structuré de manière à ce que vous puissiez apprendre à l'avance divers outils et méthodes d'application majeurs grâce à l'introduction du langage Python, des data frames et des opérations de base au chapitre 2.
Le chapitre 1 explique les applications statistiques et les données, les atouts de Python et comment installer les packages associés.
Il est composé du chapitre 3 Statistiques descriptives, du chapitre 4 Mesures de tendance centrale et de variance, du chapitre 5 Calcul des probabilités, tableaux de contingence et théorème de Bayes, du chapitre 6 Variables aléatoires et distributions de probabilité, du chapitre 7 Échantillonnage et distributions d'échantillonnage, du chapitre 8 Estimation et intervalles de confiance, du chapitre 9 Tests d'hypothèses, du chapitre 10 ANOVA, du chapitre 11 Analyse de corrélation et nuages de points, du chapitre 12 Analyse de régression, du chapitre 13 Analyse des séries chronologiques et du chapitre 14 Test du chi carré et tests non paramétriques, couvrant tout le contenu abordé dans les manuels de statistiques dans divers domaines.
Ce livre propose notamment des solutions en Python, ainsi que des explications sur les principes des principaux outils statistiques et des exemples connexes.
De plus, nous fournissons des graphiques à multiples facettes pour vous aider à identifier facilement les facteurs clés et à comprendre leurs effets connexes grâce à la visualisation.
Dans les chapitres 3 et 4 de l'analyse statistique descriptive, nous créerons des distributions de fréquences, des histogrammes, des ogives, des diagrammes intégrés en boîte et en essaim, et des diagrammes en tiges et feuilles pour les données quantitatives et qualitatives, et nous fournirons des exemples et des analyses comparatives des mesures de tendance centrale et des mesures de dispersion.
Les chapitres 5 à 7 expliquent les concepts et les principes d'application des outils d'inférence de base tels que la probabilité, les variables aléatoires, les distributions de probabilité, l'échantillonnage et les distributions d'échantillonnage, et fournissent des exemples de solutions en Python pour démontrer comment les appliquer.
Les chapitres 8 à 10 traitent de l'estimation et de la comparaison de paramètres tels que la moyenne, la proportion et la variance de la population, et les chapitres 11 à 13 présentent les caractéristiques des données, les méthodes de prédiction et les méthodes de test de performance pour effectuer des prédictions à l'aide de données générales et de données de séries chronologiques.
Le chapitre 14 explique les méthodes analytiques pour les variables catégorielles et les principes d'application des principales techniques statistiques, et identifie les méthodes d'application et les caractéristiques connexes à travers des solutions Python.
Même si vous n'êtes pas familier avec les langages de programmation, Python est un outil bien développé qui vous permet d'obtenir des résultats d'analyse précis et multifacettes plus facilement, plus agréablement et avec une plus grande précision que tout autre outil, tel qu'Excel, R ou SPSS.
Il offre des capacités de création de graphiques particulièrement puissantes, vous permettant d'obtenir des résultats de visualisation de niveau supérieur.
À l'avenir, Python continuera de jouer un rôle de premier plan dans la prise de décision efficace grâce au traitement des données et au raisonnement statistique, tout en continuant à se développer et à fournir des fonctionnalités améliorées.
Face à ces défis contemporains liés à l'apprentissage de Python, j'espère que ce livre vous aidera à acquérir des compétences en Python tout en apprenant les principes statistiques clés nécessaires aux situations réelles.
Août 2025, tous les auteurs
Les fichiers de solution d'exemple utilisés dans le livre sont disponibles à l'adresse 〈https://cafe.naver.com/purpleowzkj〉.
Ce livre explique les concepts des sujets importants en statistiques et fournit des explications étape par étape sur la manière de les appliquer à travers des exemples et des procédures, ainsi que des solutions en Python.
Le développement des ordinateurs et des technologies de l'information et de la communication a conduit à la naissance, en 1990, d'un nouvel outil d'analyse appelé Python.
Depuis les années 2010, Python s'est imposé comme un outil essentiel pour la science des données, notamment l'apprentissage automatique et l'apprentissage profond, et est largement utilisé pour la collecte et le traitement des données ainsi que pour diverses prises de décision.
Python fournit des centaines de milliers de bibliothèques, qui sont des collections de code contenant de nombreuses fonctions réutilisables, et des modules tels que Matplotlib, Seaborn, Pandas, NumPy, Scikit-learn, Pingouin et Statmodels peuvent être utilisés pour visualiser et traiter des données.
Aujourd'hui, Python s'impose comme un outil essentiel de la pensée statistique à l'ère du big data.
Pour la résolution de problèmes statistiques et le traitement des données, nous utilisons Excel et R, ainsi que des logiciels européens tels que SPSS, SAS, Minitab et Stata.
Pour utiliser ces logiciels, il faut apprendre les fonctions permettant de résoudre chaque problème ainsi que les fonctions spécifiques à chaque logiciel, et ce processus d'apprentissage est souvent assez difficile.
De plus, il est souvent difficile de vérifier l'exactitude et la validité des résultats obtenus avec ce logiciel.
Contrairement aux packages existants, Python fournit des fonctions développées pour la plupart des problèmes, ce qui le rend facile et simple à utiliser.
Cet avantage est d'autant plus important que la fonction peut être modifiée en fonction des conditions pendant son application, et que les résultats peuvent être obtenus immédiatement, permettant ainsi des modifications et des améliorations à tout moment.
Ce livre comporte 14 chapitres.
De nombreux ouvrages incluent une annexe expliquant les bases de Python, mais celui-ci est structuré de manière à ce que vous puissiez apprendre à l'avance divers outils et méthodes d'application majeurs grâce à l'introduction du langage Python, des data frames et des opérations de base au chapitre 2.
Le chapitre 1 explique les applications statistiques et les données, les atouts de Python et comment installer les packages associés.
Il est composé du chapitre 3 Statistiques descriptives, du chapitre 4 Mesures de tendance centrale et de variance, du chapitre 5 Calcul des probabilités, tableaux de contingence et théorème de Bayes, du chapitre 6 Variables aléatoires et distributions de probabilité, du chapitre 7 Échantillonnage et distributions d'échantillonnage, du chapitre 8 Estimation et intervalles de confiance, du chapitre 9 Tests d'hypothèses, du chapitre 10 ANOVA, du chapitre 11 Analyse de corrélation et nuages de points, du chapitre 12 Analyse de régression, du chapitre 13 Analyse des séries chronologiques et du chapitre 14 Test du chi carré et tests non paramétriques, couvrant tout le contenu abordé dans les manuels de statistiques dans divers domaines.
Ce livre propose notamment des solutions en Python, ainsi que des explications sur les principes des principaux outils statistiques et des exemples connexes.
De plus, nous fournissons des graphiques à multiples facettes pour vous aider à identifier facilement les facteurs clés et à comprendre leurs effets connexes grâce à la visualisation.
Dans les chapitres 3 et 4 de l'analyse statistique descriptive, nous créerons des distributions de fréquences, des histogrammes, des ogives, des diagrammes intégrés en boîte et en essaim, et des diagrammes en tiges et feuilles pour les données quantitatives et qualitatives, et nous fournirons des exemples et des analyses comparatives des mesures de tendance centrale et des mesures de dispersion.
Les chapitres 5 à 7 expliquent les concepts et les principes d'application des outils d'inférence de base tels que la probabilité, les variables aléatoires, les distributions de probabilité, l'échantillonnage et les distributions d'échantillonnage, et fournissent des exemples de solutions en Python pour démontrer comment les appliquer.
Les chapitres 8 à 10 traitent de l'estimation et de la comparaison de paramètres tels que la moyenne, la proportion et la variance de la population, et les chapitres 11 à 13 présentent les caractéristiques des données, les méthodes de prédiction et les méthodes de test de performance pour effectuer des prédictions à l'aide de données générales et de données de séries chronologiques.
Le chapitre 14 explique les méthodes analytiques pour les variables catégorielles et les principes d'application des principales techniques statistiques, et identifie les méthodes d'application et les caractéristiques connexes à travers des solutions Python.
Même si vous n'êtes pas familier avec les langages de programmation, Python est un outil bien développé qui vous permet d'obtenir des résultats d'analyse précis et multifacettes plus facilement, plus agréablement et avec une plus grande précision que tout autre outil, tel qu'Excel, R ou SPSS.
Il offre des capacités de création de graphiques particulièrement puissantes, vous permettant d'obtenir des résultats de visualisation de niveau supérieur.
À l'avenir, Python continuera de jouer un rôle de premier plan dans la prise de décision efficace grâce au traitement des données et au raisonnement statistique, tout en continuant à se développer et à fournir des fonctionnalités améliorées.
Face à ces défis contemporains liés à l'apprentissage de Python, j'espère que ce livre vous aidera à acquérir des compétences en Python tout en apprenant les principes statistiques clés nécessaires aux situations réelles.
Août 2025, tous les auteurs
Les fichiers de solution d'exemple utilisés dans le livre sont disponibles à l'adresse 〈https://cafe.naver.com/purpleowzkj〉.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 11 août 2025
- Nombre de pages, poids, dimensions : 544 pages | 188 × 257 × 35 mm
- ISBN13 : 9791193595336
- ISBN10 : 1193595339
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne