
Statistiques 101 x Analyse des données pour des connaissances pertinentes à l'ère du Big Data
Description
Introduction au livre
Une solide base en statistiques devient la pierre angulaire de mon analyse de données !
Pourquoi devrions-nous comprendre les statistiques avant de manipuler des données ?
Il existe de nombreuses façons d'analyser et d'interpréter des données, mais elles partagent toutes un fondement commun : la pensée statistique.
Par conséquent, pour analyser sérieusement des données, il est indispensable d'acquérir au préalable des connaissances et des perspectives adéquates dans le domaine des statistiques.
Ce livre s'adresse à ceux qui sont fréquemment confrontés à des données et qui souhaitent acquérir des connaissances statistiques systématiques applicables à leur travail, mais qui ont du mal à y consacrer un temps et des efforts considérables.
Il couvre un large éventail de sujets, allant des statistiques inférentielles essentielles à l'analyse des données aux tests d'hypothèses, à la corrélation et à la causalité, à la modélisation statistique, aux statistiques bayésiennes, à l'apprentissage automatique et aux modèles mathématiques, le tout à un niveau parfaitement adapté.
L'introduction du concept était aussi simple que possible, avec le moins de formules mathématiques ou d'explications possible.
Par ailleurs, nous avons inclus autant d'exemples d'images et de graphiques que possible, et avons également présenté plusieurs cas familiers.
Je suis convaincu qu'avec ce seul livre, « Statistiques 101 x Analyse des données », vous serez en mesure d'apprendre suffisamment les différents concepts et perspectives statistiques de base nécessaires à l'analyse pratique des données.
Pourquoi devrions-nous comprendre les statistiques avant de manipuler des données ?
Il existe de nombreuses façons d'analyser et d'interpréter des données, mais elles partagent toutes un fondement commun : la pensée statistique.
Par conséquent, pour analyser sérieusement des données, il est indispensable d'acquérir au préalable des connaissances et des perspectives adéquates dans le domaine des statistiques.
Ce livre s'adresse à ceux qui sont fréquemment confrontés à des données et qui souhaitent acquérir des connaissances statistiques systématiques applicables à leur travail, mais qui ont du mal à y consacrer un temps et des efforts considérables.
Il couvre un large éventail de sujets, allant des statistiques inférentielles essentielles à l'analyse des données aux tests d'hypothèses, à la corrélation et à la causalité, à la modélisation statistique, aux statistiques bayésiennes, à l'apprentissage automatique et aux modèles mathématiques, le tout à un niveau parfaitement adapté.
L'introduction du concept était aussi simple que possible, avec le moins de formules mathématiques ou d'explications possible.
Par ailleurs, nous avons inclus autant d'exemples d'images et de graphiques que possible, et avons également présenté plusieurs cas familiers.
Je suis convaincu qu'avec ce seul livre, « Statistiques 101 x Analyse des données », vous serez en mesure d'apprendre suffisamment les différents concepts et perspectives statistiques de base nécessaires à l'analyse pratique des données.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
Pour commencer
Chapitre 1 : Qu'est-ce que la statistique ? : Le rôle de la statistique dans l'analyse des données
1.1 Analyse des données
Données et statistiques
Objectif de l'analyse des données
1.2 Le rôle des statistiques
Les statistiques sont plus puissantes lorsque les données sont réparties.
Un phénomène dans lequel la dispersion des données est faible
1.3 Vue d'ensemble des statistiques
Statistiques descriptives et inférentielles
Diverses méthodes d'analyse
Chapitre 2 Population et échantillon : définition de l’objectif et de la cible de l’analyse des données
2.1 Objectif de l'analyse des données et public cible
Objectif de l'analyse des données
Objet d'intérêt
2.2 Population
Pensez à la population
taille de la population
2.3 Connaître les propriétés de la population
Nature de la population
enquête exhaustive
enquête par sondage
taille de l'échantillon
Chapitre 3 : Fondements de l'analyse statistique : types de données, statistiques et probabilités
3.1 Types de données
Population et échantillon
variable
Différents types de données
3.2 Distribution des données
Représenter la distribution des données sous forme graphique
Un histogramme est simplement une représentation graphique.
3.3 Statistiques
Données de caractérisation
Diverses statistiques descriptives
Diagrammes en boîte à moustaches pour vérifier la variance
Valeurs aberrantes
3.4 Probabilité
Avant d'apprendre les probabilités
Réflexions élémentaires sur les probabilités
Statistiques inférentielles et distributions de probabilité
Lorsqu'il y a deux variables aléatoires
3.5 Distribution de probabilité théorique
Distributions de probabilité et paramètres
distribution normale
standardisation
Diverses distributions de probabilité
Chapitre 4 : Statistiques inférentielles – Intervalles de confiance : Estimation des propriétés de la population à partir des données
4.1 Avant d'apprendre les statistiques inférentielles
Recensement et enquêtes par sondage
Récupération des données
échantillonnage aléatoire
Comprendre intuitivement les statistiques inférentielles
4.2 Erreur d'échantillonnage et intervalles de confiance
Compte tenu de l'erreur entre la population et les données
erreur d'échantillonnage
Distribution de probabilité de l'erreur d'échantillonnage
Qu'est-ce qu'un intervalle de confiance ?
distribution t et intervalle de confiance à 95 %
Intervalles de confiance et tests d'hypothèses
Chapitre 5 Tests d'hypothèses : Tests d'hypothèses et valeurs p
5.1 Principes des tests d'hypothèses
Une autre méthode de statistiques inférentielles
En statistiques, qu'est-ce qu'une hypothèse ?
valeur p
Résumé du déroulement d'une inspection à domicile
5.2 Tests d'hypothèses
Calculs spécifiques pour les tests d'hypothèses
Seuil de rejet et valeur p
La relation entre les intervalles de confiance et les tests d'hypothèses
Exemples précis de tests d'hypothèses
5.3 Graphiques associés aux tests d'hypothèses
barres d'erreur
Notation indiquant « statistiquement significatif »
5.4 Erreurs de type I et de type II
Quatre modèles de vérité et de jugement
α et β sont en relation de compromis
α et β lorsque la taille de l'effet est différente
Chapitre 6 : Différents tests d’hypothèses : des tests t aux tests ANOVA et aux tests du χ²
6.1 Différents tests d'hypothèses
Distinguer les méthodes de test d'hypothèses
6.2 Comparaison des valeurs représentatives
Comparaison des valeurs moyennes des tests de paramètres
Comparaison des valeurs représentatives des tests non paramétriques
Analyse de variance (comparaison des moyennes de trois groupes ou plus)
test de comparaison multiple
6.3 Comparaison des ratios
données catégorielles
test binomial
Test du chi carré : test d’adéquation
Test du chi carré : test d'indépendance
Chapitre 7 : Corrélation et régression : Analyse de la relation entre deux variables quantitatives
7.1 Révéler la relation entre les variables quantitatives
Données composées de deux variables quantitatives
Nuage de points
préoccupation
retour
7.2 Corrélation
coefficient de corrélation de Pearson
Coefficient de corrélation non paramétrique
Coefficient de corrélation et hypothèse
corrélation non linéaire
7.3 Régression linéaire
Qu'est-ce que l'analyse de régression ?
Coefficient de régression
coefficient de détermination
Homovariance et normalité des erreurs
variables explicatives et variables de réponse
Chapitre 8 Modélisation statistique : de la régression linéaire aux modèles linéaires généralisés
8.1 Extension du principe de régression linéaire
La régression linéaire sert de base à diverses méthodes d'interprétation.
régression multiple
Coefficient de régression partielle
Les variables catégorielles comme variables explicatives
Analyse de covariance
Problèmes de données de grande dimension
multicolinéarité
8.2 Modification de la forme du modèle de régression
Interaction
ANOVA à deux facteurs
régression non linéaire
8.3 Concept de modèle linéaire généralisé
Extension du principe de régression linéaire
Méthodes de vraisemblance et de maximum de vraisemblance
régression logistique
Régression de Poisson
Divers modèles linéaires généralisés
8.4 Évaluation et comparaison des modèles statistiques
Noir du monde
test du rapport de vraisemblance
AIC
BIC
Autres critères d'information
Chapitre 9 : Précautions lors des tests d’hypothèses : reproductibilité et manipulation des valeurs p
9.1 Reproductibilité
Tests d'hypothèses : difficiles à comprendre mais simples à mettre en œuvre.
Crise de la reproductibilité
Qu’est-ce qui provoque l’irréproductibilité ?
Processus de publication d'articles scientifiques
9.2 Problèmes liés aux tests d'hypothèses
Comprendre les tests d'hypothèses
Retour sur les valeurs p
Test de type Fisher et test de type Neyman-Pearson
taille de l'effet
Argument bayésien
La probabilité que le document soit incorrect
Élaborer une bonne hypothèse
9.3 p Piratage
Qu'est-ce que le p-hacking ?
Efforts pour prévenir le p-hacking
Éléments à vérifier pour comprendre les tests d'hypothèses
Chapitre 10 : Cause et effet : une façon de penser pour éviter les malentendus
10.1 Causalité et corrélation
Découvrir la causalité
Causalité et corrélation
Divers exemples de causalité et de corrélation
10.2 Essais contrôlés randomisés
Afin de clarifier la relation de cause à effet
essais contrôlés randomisés
10.3 Inférence causale statistique
Une autre façon d'estimer les effets causaux
Chapitre 11 Statistiques bayésiennes : vers une analyse flexible
11.1 Raisonnement statistique bayésien
Deux courants de statistiques
Image des statistiques bayésiennes
modèle statistique
mentalité des statistiques bayésiennes
Avantages des statistiques bayésiennes
11.2 Algorithme statistique bayésien
Méthode MCMC
Exemples de méthodes MCMC
11.3 Exemples de statistiques bayésiennes
Comparaison des moyennes d'échantillons
Exemple de régression de Poisson
Modèle bayésien hiérarchique
Chapitre 12 : Autres méthodes d’analyse statistique : de l’analyse en composantes principales à l’apprentissage automatique
12.1 Analyse en composantes principales
Dimension des variables
analyse en composantes principales
Analyse factorielle
12.2 Introduction à l'apprentissage automatique
Qu'est-ce que l'apprentissage automatique ?
La différence entre les statistiques et l'apprentissage automatique
12.3 Apprentissage non supervisé
Qu'est-ce que l'apprentissage non supervisé ?
12.4 Apprentissage supervisé
Qu'est-ce que l'apprentissage supervisé ?
Mesure des performances de prédiction ① : Classification binaire
Mesure de la performance de prédiction ② : Régression
Chapitre 13 : Modèles : Modèles statistiques, modèles d’apprentissage automatique et modèles mathématiques
13.1 Qu'est-ce qu'un modèle ?
Modèles statistiques, modèles d'apprentissage automatique et modèles mathématiques
Les modèles sont des outils permettant de comprendre les phénomènes.
Qu'est-ce qu'un modèle de réparation ?
13.2 Modèles mathématiques : Équations différentielles
Équations différentielles et équations aux différences finies
Cas de réparation du modèle ① : Modélisation de l’évolution des nombres
Cas modèle de réparation 2 : Modèle de maladie infectieuse
Avec un modèle complexe
13.3 Modèles mathématiques : Modèles probabilistes
Modèle probabiliste
Le rôle des modèles de réparation
En conclusion
Recherche
Chapitre 1 : Qu'est-ce que la statistique ? : Le rôle de la statistique dans l'analyse des données
1.1 Analyse des données
Données et statistiques
Objectif de l'analyse des données
1.2 Le rôle des statistiques
Les statistiques sont plus puissantes lorsque les données sont réparties.
Un phénomène dans lequel la dispersion des données est faible
1.3 Vue d'ensemble des statistiques
Statistiques descriptives et inférentielles
Diverses méthodes d'analyse
Chapitre 2 Population et échantillon : définition de l’objectif et de la cible de l’analyse des données
2.1 Objectif de l'analyse des données et public cible
Objectif de l'analyse des données
Objet d'intérêt
2.2 Population
Pensez à la population
taille de la population
2.3 Connaître les propriétés de la population
Nature de la population
enquête exhaustive
enquête par sondage
taille de l'échantillon
Chapitre 3 : Fondements de l'analyse statistique : types de données, statistiques et probabilités
3.1 Types de données
Population et échantillon
variable
Différents types de données
3.2 Distribution des données
Représenter la distribution des données sous forme graphique
Un histogramme est simplement une représentation graphique.
3.3 Statistiques
Données de caractérisation
Diverses statistiques descriptives
Diagrammes en boîte à moustaches pour vérifier la variance
Valeurs aberrantes
3.4 Probabilité
Avant d'apprendre les probabilités
Réflexions élémentaires sur les probabilités
Statistiques inférentielles et distributions de probabilité
Lorsqu'il y a deux variables aléatoires
3.5 Distribution de probabilité théorique
Distributions de probabilité et paramètres
distribution normale
standardisation
Diverses distributions de probabilité
Chapitre 4 : Statistiques inférentielles – Intervalles de confiance : Estimation des propriétés de la population à partir des données
4.1 Avant d'apprendre les statistiques inférentielles
Recensement et enquêtes par sondage
Récupération des données
échantillonnage aléatoire
Comprendre intuitivement les statistiques inférentielles
4.2 Erreur d'échantillonnage et intervalles de confiance
Compte tenu de l'erreur entre la population et les données
erreur d'échantillonnage
Distribution de probabilité de l'erreur d'échantillonnage
Qu'est-ce qu'un intervalle de confiance ?
distribution t et intervalle de confiance à 95 %
Intervalles de confiance et tests d'hypothèses
Chapitre 5 Tests d'hypothèses : Tests d'hypothèses et valeurs p
5.1 Principes des tests d'hypothèses
Une autre méthode de statistiques inférentielles
En statistiques, qu'est-ce qu'une hypothèse ?
valeur p
Résumé du déroulement d'une inspection à domicile
5.2 Tests d'hypothèses
Calculs spécifiques pour les tests d'hypothèses
Seuil de rejet et valeur p
La relation entre les intervalles de confiance et les tests d'hypothèses
Exemples précis de tests d'hypothèses
5.3 Graphiques associés aux tests d'hypothèses
barres d'erreur
Notation indiquant « statistiquement significatif »
5.4 Erreurs de type I et de type II
Quatre modèles de vérité et de jugement
α et β sont en relation de compromis
α et β lorsque la taille de l'effet est différente
Chapitre 6 : Différents tests d’hypothèses : des tests t aux tests ANOVA et aux tests du χ²
6.1 Différents tests d'hypothèses
Distinguer les méthodes de test d'hypothèses
6.2 Comparaison des valeurs représentatives
Comparaison des valeurs moyennes des tests de paramètres
Comparaison des valeurs représentatives des tests non paramétriques
Analyse de variance (comparaison des moyennes de trois groupes ou plus)
test de comparaison multiple
6.3 Comparaison des ratios
données catégorielles
test binomial
Test du chi carré : test d’adéquation
Test du chi carré : test d'indépendance
Chapitre 7 : Corrélation et régression : Analyse de la relation entre deux variables quantitatives
7.1 Révéler la relation entre les variables quantitatives
Données composées de deux variables quantitatives
Nuage de points
préoccupation
retour
7.2 Corrélation
coefficient de corrélation de Pearson
Coefficient de corrélation non paramétrique
Coefficient de corrélation et hypothèse
corrélation non linéaire
7.3 Régression linéaire
Qu'est-ce que l'analyse de régression ?
Coefficient de régression
coefficient de détermination
Homovariance et normalité des erreurs
variables explicatives et variables de réponse
Chapitre 8 Modélisation statistique : de la régression linéaire aux modèles linéaires généralisés
8.1 Extension du principe de régression linéaire
La régression linéaire sert de base à diverses méthodes d'interprétation.
régression multiple
Coefficient de régression partielle
Les variables catégorielles comme variables explicatives
Analyse de covariance
Problèmes de données de grande dimension
multicolinéarité
8.2 Modification de la forme du modèle de régression
Interaction
ANOVA à deux facteurs
régression non linéaire
8.3 Concept de modèle linéaire généralisé
Extension du principe de régression linéaire
Méthodes de vraisemblance et de maximum de vraisemblance
régression logistique
Régression de Poisson
Divers modèles linéaires généralisés
8.4 Évaluation et comparaison des modèles statistiques
Noir du monde
test du rapport de vraisemblance
AIC
BIC
Autres critères d'information
Chapitre 9 : Précautions lors des tests d’hypothèses : reproductibilité et manipulation des valeurs p
9.1 Reproductibilité
Tests d'hypothèses : difficiles à comprendre mais simples à mettre en œuvre.
Crise de la reproductibilité
Qu’est-ce qui provoque l’irréproductibilité ?
Processus de publication d'articles scientifiques
9.2 Problèmes liés aux tests d'hypothèses
Comprendre les tests d'hypothèses
Retour sur les valeurs p
Test de type Fisher et test de type Neyman-Pearson
taille de l'effet
Argument bayésien
La probabilité que le document soit incorrect
Élaborer une bonne hypothèse
9.3 p Piratage
Qu'est-ce que le p-hacking ?
Efforts pour prévenir le p-hacking
Éléments à vérifier pour comprendre les tests d'hypothèses
Chapitre 10 : Cause et effet : une façon de penser pour éviter les malentendus
10.1 Causalité et corrélation
Découvrir la causalité
Causalité et corrélation
Divers exemples de causalité et de corrélation
10.2 Essais contrôlés randomisés
Afin de clarifier la relation de cause à effet
essais contrôlés randomisés
10.3 Inférence causale statistique
Une autre façon d'estimer les effets causaux
Chapitre 11 Statistiques bayésiennes : vers une analyse flexible
11.1 Raisonnement statistique bayésien
Deux courants de statistiques
Image des statistiques bayésiennes
modèle statistique
mentalité des statistiques bayésiennes
Avantages des statistiques bayésiennes
11.2 Algorithme statistique bayésien
Méthode MCMC
Exemples de méthodes MCMC
11.3 Exemples de statistiques bayésiennes
Comparaison des moyennes d'échantillons
Exemple de régression de Poisson
Modèle bayésien hiérarchique
Chapitre 12 : Autres méthodes d’analyse statistique : de l’analyse en composantes principales à l’apprentissage automatique
12.1 Analyse en composantes principales
Dimension des variables
analyse en composantes principales
Analyse factorielle
12.2 Introduction à l'apprentissage automatique
Qu'est-ce que l'apprentissage automatique ?
La différence entre les statistiques et l'apprentissage automatique
12.3 Apprentissage non supervisé
Qu'est-ce que l'apprentissage non supervisé ?
12.4 Apprentissage supervisé
Qu'est-ce que l'apprentissage supervisé ?
Mesure des performances de prédiction ① : Classification binaire
Mesure de la performance de prédiction ② : Régression
Chapitre 13 : Modèles : Modèles statistiques, modèles d’apprentissage automatique et modèles mathématiques
13.1 Qu'est-ce qu'un modèle ?
Modèles statistiques, modèles d'apprentissage automatique et modèles mathématiques
Les modèles sont des outils permettant de comprendre les phénomènes.
Qu'est-ce qu'un modèle de réparation ?
13.2 Modèles mathématiques : Équations différentielles
Équations différentielles et équations aux différences finies
Cas de réparation du modèle ① : Modélisation de l’évolution des nombres
Cas modèle de réparation 2 : Modèle de maladie infectieuse
Avec un modèle complexe
13.3 Modèles mathématiques : Modèles probabilistes
Modèle probabiliste
Le rôle des modèles de réparation
En conclusion
Recherche
Image détaillée

Avis de l'éditeur
De la recherche aux affaires, à tout moment, partout
« Statistiques 101 », un cours de statistiques personnalisé, axé sur les sciences humaines, pour tous ceux qui travaillent avec des données !
À l'ère du big data, où les enregistrements et les données s'accumulent presque instantanément, de plus en plus de personnes commencent à manipuler des données.
La collecte de données, leur analyse ponctuelle et l'examen de chiffres, de tableaux et de graphiques deviennent des pratiques de plus en plus familières au quotidien.
Parce que l'analyse des données peut fournir des preuves fiables et des prédictions convaincantes des conditions futures, elle est largement utilisée dans divers domaines d'études, notamment les sciences naturelles, la psychologie, l'économie et les sciences sociales, ainsi que dans le monde des affaires.
Les fondements de la science des données reposent sur les « statistiques ».
Les statistiques sont le fruit d'une quête de longue date visant à obtenir des « descriptions quantitatives des phénomènes ou des données ».
Par conséquent, ce n'est qu'en incarnant pleinement les principes, les perspectives et l'état d'esprit que nous pourrons véritablement tirer les bonnes conclusions des chiffres et des données.
C'est un peu comme l'idée que savoir écrire toutes les lettres ne signifie pas forcément savoir bien construire des phrases.
Pour collecter correctement les données, choisir la bonne méthode d'analyse et éviter de mal interpréter les résultats, il est essentiel de comprendre d'abord les statistiques.
Mais nous sommes occupés.
Rien qu'en regardant les données actuelles, on voit clairement un tas énorme.
Il y a aussi tellement de choses à faire, à expérimenter et à rechercher par soi-même.
D'un autre côté, il faut aussi apprendre à utiliser un logiciel statistique, mais ce n'est pas facile non plus.
Si l'on se concentre trop sur « l'analyse des données » elle-même, les « statistiques », qui sont pourtant essentielles pour tirer les bonnes conclusions des données, ont tendance à passer au second plan.
Parfois, lorsque je ressens le besoin d'apprendre les statistiques, je repense au cours de « Probabilités et Statistiques » que j'ai brièvement suivi au lycée, mais des concepts comme la distribution et les intervalles de confiance restent fragmentaires et ne sont pas facilement systématisés.
Si je voulais lire un livre sérieusement, c'était soit « un ouvrage technique excessivement difficile, rempli de formules », soit « un essai centré sur des anecdotes intéressantes avec quelques notions de statistiques », il n'était donc pas facile d'acquérir exactement les connaissances statistiques que je souhaitais.
Si c'est votre histoire, vous êtes au bon endroit.
Ce livre est un cours de statistiques de niveau licence 1, axé sur l'analyse des données.
Des populations et des échantillons à la corrélation et à la causalité, des statistiques descriptives à l'apprentissage automatique.
Il contient toutes les statistiques essentielles dont j'ai besoin en ce moment, dans un format coloré et détaillé !
Pour éviter de consacrer trop de temps et d'énergie aux statistiques et de vous épuiser, et pour vous aider à vous concentrer sur votre cœur de métier/vos recherches, bienvenue dans le cours d'introduction aux statistiques ! Dans cet ouvrage, « Statistiques 101 x Analyse de données », l'auteur Masato Abe s'attache à présenter de la manière la plus accessible et exhaustive possible les concepts et les méthodes d'analyse statistique essentiels à une analyse de données complète.
Il a mis à profit son expérience d'enseignement des statistiques de base à des étudiants de diverses filières, notamment la biologie, la psychologie et l'agriculture, ainsi qu'à des étudiants universitaires n'ayant jamais étudié les statistiques auparavant, pour affiner ses phrases afin de les rendre aussi lisibles que possible et pour minimiser autant que possible les explications mathématiques tout en s'efforçant de fournir les explications les plus précises.
Ce livre est particulièrement bienveillant et utile, expliquant en détail les points sur lesquels les débutants sont particulièrement susceptibles de commettre des erreurs.
Parmi elles, les meilleures sont les quelque 200 photos.
En incluant de nombreux diagrammes (images) uniques qui aident les lecteurs à comprendre des concepts complexes en un coup d'œil et avec clarté, le livre est soigneusement agencé de sorte que même les lecteurs sans formation mathématique ou manquant de confiance puissent le lire intégralement.
《Statistiques 101 x Analyse des données》 comprend 13 chapitres.
Les chapitres 1 à 3 offrent un aperçu complet de l'objectif de l'analyse des données et des connaissances et concepts de base nécessaires à l'analyse statistique.
Les chapitres 4 et 5 traitent du concept de statistiques inférentielles, qui constituent une analyse statistique à part entière, et les chapitres 6 à 8 examinent diverses méthodes d'analyse statistique inférentielle en fonction du type de données ou de l'objectif.
Le chapitre 9 examine les sujets d'actualité récents concernant l'utilisation et la reproductibilité des tests d'hypothèses, tandis que le chapitre 10 se concentre sur la différence importante entre corrélation et causalité lors de l'interprétation des résultats.
Si ce chapitre traite des « statistiques de fréquence », les trois chapitres suivants abordent des domaines d'application plus diversifiés.
Le chapitre 11 explique les statistiques bayésiennes, une technique statistique qui constitue les deux piliers des statistiques fréquentistes et qui permet une analyse des données plus flexible.
Dans les chapitres 12 et 13, nous explorerons l'apprentissage automatique et les modèles mathématiques, qui sont étroitement liés aux statistiques.
En particulier, le chapitre 13 présente un modèle de transmission de maladie infectieuse comme étude de cas en modélisation mathématique, créant une structure qui vous maintient en haleine jusqu'à la toute fin.
Ainsi, 《Statistiques 101 x Analyse de données》 regorge de connaissances essentielles à l'analyse de données moderne.
Les sujets abordés sont véritablement diversifiés, allant des concepts statistiques de base aux tests d'hypothèses, à la modélisation statistique, et même à l'inférence causale, aux statistiques bayésiennes, à l'apprentissage automatique et à la modélisation mathématique.
Ce livre vous donnera une vue d'ensemble des statistiques et des méthodes d'analyse statistique des données, et jettera les bases d'une analyse pratique des données.
[Fortement recommandé pour ces personnes !]
● Les personnes qui ont déjà été confrontées aux statistiques mais qui les trouvent difficiles ou ne les comprennent pas encore clairement.
● Les personnes qui souhaitent commencer à étudier sérieusement la science des données dès maintenant
● Une personne qui réalise diverses enquêtes ou études et effectue des analyses de données dans le cadre de ce processus.
● Les personnes qui souhaitent avoir une vue d'ensemble car il existe trop de méthodes d'analyse statistique et cela peut prêter à confusion.
« Statistiques 101 », un cours de statistiques personnalisé, axé sur les sciences humaines, pour tous ceux qui travaillent avec des données !
À l'ère du big data, où les enregistrements et les données s'accumulent presque instantanément, de plus en plus de personnes commencent à manipuler des données.
La collecte de données, leur analyse ponctuelle et l'examen de chiffres, de tableaux et de graphiques deviennent des pratiques de plus en plus familières au quotidien.
Parce que l'analyse des données peut fournir des preuves fiables et des prédictions convaincantes des conditions futures, elle est largement utilisée dans divers domaines d'études, notamment les sciences naturelles, la psychologie, l'économie et les sciences sociales, ainsi que dans le monde des affaires.
Les fondements de la science des données reposent sur les « statistiques ».
Les statistiques sont le fruit d'une quête de longue date visant à obtenir des « descriptions quantitatives des phénomènes ou des données ».
Par conséquent, ce n'est qu'en incarnant pleinement les principes, les perspectives et l'état d'esprit que nous pourrons véritablement tirer les bonnes conclusions des chiffres et des données.
C'est un peu comme l'idée que savoir écrire toutes les lettres ne signifie pas forcément savoir bien construire des phrases.
Pour collecter correctement les données, choisir la bonne méthode d'analyse et éviter de mal interpréter les résultats, il est essentiel de comprendre d'abord les statistiques.
Mais nous sommes occupés.
Rien qu'en regardant les données actuelles, on voit clairement un tas énorme.
Il y a aussi tellement de choses à faire, à expérimenter et à rechercher par soi-même.
D'un autre côté, il faut aussi apprendre à utiliser un logiciel statistique, mais ce n'est pas facile non plus.
Si l'on se concentre trop sur « l'analyse des données » elle-même, les « statistiques », qui sont pourtant essentielles pour tirer les bonnes conclusions des données, ont tendance à passer au second plan.
Parfois, lorsque je ressens le besoin d'apprendre les statistiques, je repense au cours de « Probabilités et Statistiques » que j'ai brièvement suivi au lycée, mais des concepts comme la distribution et les intervalles de confiance restent fragmentaires et ne sont pas facilement systématisés.
Si je voulais lire un livre sérieusement, c'était soit « un ouvrage technique excessivement difficile, rempli de formules », soit « un essai centré sur des anecdotes intéressantes avec quelques notions de statistiques », il n'était donc pas facile d'acquérir exactement les connaissances statistiques que je souhaitais.
Si c'est votre histoire, vous êtes au bon endroit.
Ce livre est un cours de statistiques de niveau licence 1, axé sur l'analyse des données.
Des populations et des échantillons à la corrélation et à la causalité, des statistiques descriptives à l'apprentissage automatique.
Il contient toutes les statistiques essentielles dont j'ai besoin en ce moment, dans un format coloré et détaillé !
Pour éviter de consacrer trop de temps et d'énergie aux statistiques et de vous épuiser, et pour vous aider à vous concentrer sur votre cœur de métier/vos recherches, bienvenue dans le cours d'introduction aux statistiques ! Dans cet ouvrage, « Statistiques 101 x Analyse de données », l'auteur Masato Abe s'attache à présenter de la manière la plus accessible et exhaustive possible les concepts et les méthodes d'analyse statistique essentiels à une analyse de données complète.
Il a mis à profit son expérience d'enseignement des statistiques de base à des étudiants de diverses filières, notamment la biologie, la psychologie et l'agriculture, ainsi qu'à des étudiants universitaires n'ayant jamais étudié les statistiques auparavant, pour affiner ses phrases afin de les rendre aussi lisibles que possible et pour minimiser autant que possible les explications mathématiques tout en s'efforçant de fournir les explications les plus précises.
Ce livre est particulièrement bienveillant et utile, expliquant en détail les points sur lesquels les débutants sont particulièrement susceptibles de commettre des erreurs.
Parmi elles, les meilleures sont les quelque 200 photos.
En incluant de nombreux diagrammes (images) uniques qui aident les lecteurs à comprendre des concepts complexes en un coup d'œil et avec clarté, le livre est soigneusement agencé de sorte que même les lecteurs sans formation mathématique ou manquant de confiance puissent le lire intégralement.
《Statistiques 101 x Analyse des données》 comprend 13 chapitres.
Les chapitres 1 à 3 offrent un aperçu complet de l'objectif de l'analyse des données et des connaissances et concepts de base nécessaires à l'analyse statistique.
Les chapitres 4 et 5 traitent du concept de statistiques inférentielles, qui constituent une analyse statistique à part entière, et les chapitres 6 à 8 examinent diverses méthodes d'analyse statistique inférentielle en fonction du type de données ou de l'objectif.
Le chapitre 9 examine les sujets d'actualité récents concernant l'utilisation et la reproductibilité des tests d'hypothèses, tandis que le chapitre 10 se concentre sur la différence importante entre corrélation et causalité lors de l'interprétation des résultats.
Si ce chapitre traite des « statistiques de fréquence », les trois chapitres suivants abordent des domaines d'application plus diversifiés.
Le chapitre 11 explique les statistiques bayésiennes, une technique statistique qui constitue les deux piliers des statistiques fréquentistes et qui permet une analyse des données plus flexible.
Dans les chapitres 12 et 13, nous explorerons l'apprentissage automatique et les modèles mathématiques, qui sont étroitement liés aux statistiques.
En particulier, le chapitre 13 présente un modèle de transmission de maladie infectieuse comme étude de cas en modélisation mathématique, créant une structure qui vous maintient en haleine jusqu'à la toute fin.
Ainsi, 《Statistiques 101 x Analyse de données》 regorge de connaissances essentielles à l'analyse de données moderne.
Les sujets abordés sont véritablement diversifiés, allant des concepts statistiques de base aux tests d'hypothèses, à la modélisation statistique, et même à l'inférence causale, aux statistiques bayésiennes, à l'apprentissage automatique et à la modélisation mathématique.
Ce livre vous donnera une vue d'ensemble des statistiques et des méthodes d'analyse statistique des données, et jettera les bases d'une analyse pratique des données.
[Fortement recommandé pour ces personnes !]
● Les personnes qui ont déjà été confrontées aux statistiques mais qui les trouvent difficiles ou ne les comprennent pas encore clairement.
● Les personnes qui souhaitent commencer à étudier sérieusement la science des données dès maintenant
● Une personne qui réalise diverses enquêtes ou études et effectue des analyses de données dans le cadre de ce processus.
● Les personnes qui souhaitent avoir une vue d'ensemble car il existe trop de méthodes d'analyse statistique et cela peut prêter à confusion.
SPÉCIFICATIONS DES PRODUITS
- Date de publication : 31 octobre 2022
Nombre de pages, poids, dimensions : 400 pages | 686 g | 152 × 225 × 24 mm
- ISBN13 : 9788965403388
- ISBN10 : 8965403383
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne