
Cours de statistiques pour les personnes qui ont des difficultés avec les chiffres
Description
Introduction au livre
Les statistiques sont devenues la nouvelle discipline des arts libéraux essentiels à l'ère du big data.
De la prévision des prix de l'immobilier au suivi des maladies et à l'analyse des tendances en matière de meurtres.
Dans un monde saturé d'informations, toutes les réponses se cachent dans les statistiques !
— On dit que le jambon et les saucisses augmentent le risque de cancer de 18 %. Cela signifie-t-il qu'une personne sur cinq développera un cancer ?
- Les accidents de la route ont-ils diminué « grâce à » l'installation de radars de vitesse dans les zones accidentogènes ?
Combien de décès supplémentaires devraient survenir par rapport au nombre normal attendu avant qu'il ne soit considéré comme un tueur en série ?
Les statistiques analysent les données individuelles pour déduire la situation globale et l'exprimer en chiffres précis.
Les statistiques sont utilisées de diverses manières, des graphiques boursiers aux répartitions de population, car elles révèlent des tendances et des schémas dans des choses qui, autrement, paraîtraient complexes et déroutantes lorsqu'elles seraient considérées individuellement.
Surtout à l'ère du big data, où même les goûts et les intérêts personnels sont quantifiés, l'analyse statistique et les compétences de réflexion sont aussi importantes que les compétences en lecture et en écriture.
« Statistiques pour les personnes qui ont du mal avec les chiffres » présente les statistiques, qui vont au-delà du simple calcul de la moyenne ou de l’écart type, pour étudier les tendances et les relations significatives dans les données.
Il utilise également des données et des exemples concrets pour démontrer que les statistiques sont un outil utile pour résoudre un large éventail de problèmes, allant des curiosités quotidiennes aux questions sociales, économiques, scientifiques et médicales.
Grâce à ce livre, les lecteurs peuvent acquérir la puissance de la pensée statistique pour comprendre le tout à partir des parties et interpréter correctement le fonctionnement du monde au-delà des chiffres.
De la prévision des prix de l'immobilier au suivi des maladies et à l'analyse des tendances en matière de meurtres.
Dans un monde saturé d'informations, toutes les réponses se cachent dans les statistiques !
— On dit que le jambon et les saucisses augmentent le risque de cancer de 18 %. Cela signifie-t-il qu'une personne sur cinq développera un cancer ?
- Les accidents de la route ont-ils diminué « grâce à » l'installation de radars de vitesse dans les zones accidentogènes ?
Combien de décès supplémentaires devraient survenir par rapport au nombre normal attendu avant qu'il ne soit considéré comme un tueur en série ?
Les statistiques analysent les données individuelles pour déduire la situation globale et l'exprimer en chiffres précis.
Les statistiques sont utilisées de diverses manières, des graphiques boursiers aux répartitions de population, car elles révèlent des tendances et des schémas dans des choses qui, autrement, paraîtraient complexes et déroutantes lorsqu'elles seraient considérées individuellement.
Surtout à l'ère du big data, où même les goûts et les intérêts personnels sont quantifiés, l'analyse statistique et les compétences de réflexion sont aussi importantes que les compétences en lecture et en écriture.
« Statistiques pour les personnes qui ont du mal avec les chiffres » présente les statistiques, qui vont au-delà du simple calcul de la moyenne ou de l’écart type, pour étudier les tendances et les relations significatives dans les données.
Il utilise également des données et des exemples concrets pour démontrer que les statistiques sont un outil utile pour résoudre un large éventail de problèmes, allant des curiosités quotidiennes aux questions sociales, économiques, scientifiques et médicales.
Grâce à ce livre, les lecteurs peuvent acquérir la puissance de la pensée statistique pour comprendre le tout à partir des parties et interpréter correctement le fonctionnement du monde au-delà des chiffres.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
Entrée
Chapitre 1 : Représentation des proportions : données catégorielles et pourcentages
Chapitre 2 : Résumer et communiquer les données : localisation, dispersion et relations entre elles
Déduire l'ensemble à partir de la partie 3 : Populations et mesures
Chapitre 4 : Qu'est-ce qui cause quoi ? : La causalité
Chapitre 5 : Modélisation des relations : Modèles de régression
Chapitre 6 : Analyse et prédiction : les algorithmes
Chapitre 7 : Quel degré de confiance pouvez-vous accorder à vos estimations ? : Taille de l'échantillon et intervalles d'incertitude
Chapitre 8 : Le langage de l'incertitude et de la volatilité : lois et théorie des probabilités
Chapitre 9 : Quand probabilités et statistiques se rencontrent : l’inférence statistique basée sur des modèles probabilistes
Chapitre 10 : Répondre aux questions et présenter les résultats : Tests d’hypothèses et signification statistique
Chapitre 11 Leçons tirées de l'expérience : méthodes bayésiennes
Chapitre 12 Comment les choses tournent mal : erreurs et tromperies
Chapitre 13 : Vers de meilleures statistiques : Fiabilité et questions éthiques
Conclusion du chapitre 14 : 10 façons de devenir un bon statisticien
Remerciements
Glossaire
Amériques
Recherche
Chapitre 1 : Représentation des proportions : données catégorielles et pourcentages
Chapitre 2 : Résumer et communiquer les données : localisation, dispersion et relations entre elles
Déduire l'ensemble à partir de la partie 3 : Populations et mesures
Chapitre 4 : Qu'est-ce qui cause quoi ? : La causalité
Chapitre 5 : Modélisation des relations : Modèles de régression
Chapitre 6 : Analyse et prédiction : les algorithmes
Chapitre 7 : Quel degré de confiance pouvez-vous accorder à vos estimations ? : Taille de l'échantillon et intervalles d'incertitude
Chapitre 8 : Le langage de l'incertitude et de la volatilité : lois et théorie des probabilités
Chapitre 9 : Quand probabilités et statistiques se rencontrent : l’inférence statistique basée sur des modèles probabilistes
Chapitre 10 : Répondre aux questions et présenter les résultats : Tests d’hypothèses et signification statistique
Chapitre 11 Leçons tirées de l'expérience : méthodes bayésiennes
Chapitre 12 Comment les choses tournent mal : erreurs et tromperies
Chapitre 13 : Vers de meilleures statistiques : Fiabilité et questions éthiques
Conclusion du chapitre 14 : 10 façons de devenir un bon statisticien
Remerciements
Glossaire
Amériques
Recherche
Image détaillée

Dans le livre
Ce livre s'adresse aussi bien aux étudiants recherchant une introduction non technique aux statistiques qu'au grand public désireux d'approfondir ses connaissances en statistiques utilisées dans son travail et sa vie quotidienne.
Mon objectif est de leur permettre de manipuler les statistiques avec habileté et méticulosité.
Le monde des chiffres peut sembler froid et rigide, mais comme nous l'avons vu lors de précédentes tentatives de mesure de choses comme les arbres, le bonheur et la mort, les chiffres doivent toujours être manipulés avec précaution.
--- p.22
Les statistiques peuvent apporter clarté et compréhension aux problèmes auxquels nous sommes confrontés, mais elles peuvent aussi être mal utilisées pour promouvoir des opinions ou simplement attirer l'attention.
Par conséquent, la capacité à juger de la crédibilité des affirmations statistiques revêt une importance croissante dans la société moderne.
J'espère que ce livre vous incitera à vous poser des questions sur les chiffres que vous rencontrez dans votre vie quotidienne.
--- p.22
Apprenons-en un peu plus sur l'encadrement.
En 2011, une publicité est apparue dans le métro londonien affirmant que « 99 % des jeunes Londoniens ne commettent pas de violences graves ».
Cette publicité a peut-être pour but de rassurer les passagers, mais deux simples modifications pourraient avoir l'effet inverse.
Premièrement, affirmer que 99 % des jeunes ne commettent pas de violence grave signifie que 1 % des jeunes commettent des actes de violence très graves.
Deuxièmement, Londres compte environ 9 millions d'habitants, dont environ 1 million sont âgés de 15 à 25 ans.
Si l'on considère ce groupe d'âge comme celui des adolescents, on compte environ 10 000 adolescents très violents.
Comment cela peut-il nous rassurer ? Nous utilisons ici deux méthodes pour manipuler l’effet statistique.
Tout d'abord, le cadre positif a été transformé en cadre négatif.
Deuxièmement, nous avons converti les pourcentages en nombres précis.
Par conséquent, afin de fournir une information impartiale, il est souhaitable de présenter à la fois des points de vue positifs et négatifs.
--- p.34
Au Royaume-Uni, environ 6 personnes sur 100 développeront un cancer colorectal.
Que se passerait-il si ces 100 personnes consommaient des sandwichs au bacon tous les jours ? En appliquant le risque relatif de 18 % indiqué dans le rapport du Centre international de recherche sur le cancer, ce nombre passerait de six à sept.* Autrement dit, pour chaque vie entière de consommation de bacon, une personne supplémentaire sur 100 développerait un cancer colorectal.
Ce n'est pas aussi impressionnant que le risque relatif (augmentation de 18 %).
Il nous faut faire la distinction entre ce qui paraît effrayant et ce qui représente un danger réel.
--- p.42
La moyenne arithmétique peut être très trompeuse lorsque les données ne sont pas distribuées symétriquement autour de la médiane mais sont asymétriques, ou lorsqu'il existe quelques valeurs très élevées ou très basses qui forment de longues queues aux extrémités, même si la majorité des cas sont standards.
Par exemple, comparées aux personnes de votre âge et de votre sexe, vos chances de mourir l'année prochaine seront bien inférieures à la moyenne (moyenne arithmétique).
Selon les tables d'espérance de vie britanniques, 1 % des personnes âgées actuellement de 63 ans mourront avant leur 64e anniversaire.
Cependant, la plupart de ces personnes sont déjà dans un état grave, et les chances de décès pour la majorité des personnes en bonne santé sont inférieures à ce risque moyen.
--- p.59
Pour généraliser les résultats d'un échantillon à l'ensemble de la population, l'échantillon doit être représentatif.
Le fait d'avoir beaucoup de données ne signifie pas nécessairement qu'il s'agit d'un bon échantillon, et cela peut même donner une fausse impression de confiance.
Par exemple, lors des élections générales britanniques de 2015, les instituts de sondage ont interrogé des milliers d'électeurs potentiels, mais n'ont pas réussi à faire de prédictions.
Cela s'explique par le fait que le processus d'échantillonnage était inadéquat.
Les agences contactaient principalement les lignes fixes, avec des taux de réponse inférieurs à 10 %.
De tels échantillons sont difficilement représentatifs.
--- p.97
Comme il s'agissait d'une étude de grande envergure utilisant les données d'une population pertinente, la conclusion selon laquelle les personnes plus instruites présentent un risque légèrement plus élevé de tumeurs cérébrales est relativement crédible.
Alors, est-ce que toute cette sueur et ce sang qui coulent de la bibliothèque ont surchauffé mon cerveau et provoqué une mutation de mes cellules en quelque chose d'étrange ? J'en doute.
Les auteurs de l'article ajoutent également que « ces conclusions peuvent être dues à l'incomplétude des registres du cancer et à un biais de détection ».
Autrement dit, les personnes plus riches et plus instruites ont peut-être bénéficié de davantage de tests diagnostiques.
--- pp.113~114
La forte tendance psychologique à attribuer le changement à l'intervention rend les comparaisons avant-après peu fiables.
Un exemple typique est celui d'un radar de vitesse.
Ces caméras sont souvent installées dans des endroits où des accidents récents se sont produits.
Lorsque le taux d'accidents diminue après l'installation des caméras, les gens pensent que c'est grâce à elles.
Mais le taux d'accidents n'aurait-il pas diminué de toute façon ? Une série de coups de chance ou de malchance ne dure pas éternellement, et la situation finira par se calmer.
Il s'agit d'une régression vers la moyenne.
C'est comme un père de grande taille ayant un fils plus petit.
Cependant, si nous croyons que cette chance ou cette malchance persistante indique un état de fait permanent, nous serons amenés à la conclusion erronée que le retour à la normale est le résultat d'une intervention quelconque.
--- pp.149~150
Il existe des formules pour calculer la taille et la puissance d'un test en fonction du type d'expérience, et elles dépendent crucialement de la taille de l'échantillon.
Cependant, lorsque la taille de l'échantillon est fixe, un compromis est inévitable.
Pour accroître la puissance du test, le seuil de signification devrait être assoupli.
Cela augmente la probabilité d'identifier avec précision l'effet réel, mais augmente également la probabilité de commettre une erreur de type I.
Pour reprendre une analogie juridique, on peut assouplir les critères permettant de conclure à la culpabilité en réduisant l'exigence de preuve hors de tout doute raisonnable.
De ce fait, davantage de criminels sont condamnés à juste titre, tandis que davantage d'innocents sont condamnés à tort.
--- p.315
L'article, intitulé « Regarder la télévision sans réfléchir peut-il vous tuer ? », est issu d'une étude épidémiologique.
L'étude a estimé que les personnes qui regardaient plus de cinq heures de télévision par soir avaient un risque relatif de développer une embolie de 2,5 par rapport à celles qui regardaient moins de deux heures et demie de télévision par soir.
Cependant, si l'on considère le risque absolu dans le groupe à haut risque (13 personnes sur 158 000 par an), cela signifie que vous pourriez vous attendre à vivre cet événement si vous regardiez plus de cinq heures de télévision chaque soir pendant 12 000 ans.
Cela atténue l'impact dramatique du titre de l'article.
--- pp.390~391
Le tableau 13.1 présente les prévisions et les résultats définitifs des élections de juin 2017.
Le nombre de sièges prévu était étonnamment proche du résultat réel.
La différence était au maximum de quatre sièges.
Le tableau 13.1 montre que ces prédictions statistiques se sont avérées assez précises lors des trois dernières élections britanniques.
En 2015, lorsque les statisticiens ont prédit une défaite majeure pour les Libéraux-démocrates, faisant chuter leur nombre de sièges de 57 à 10, un homme politique libéral-démocrate de premier plan a déclaré lors d'une interview télévisée en direct que s'ils avaient raison, il « mangerait son chapeau ».
En réalité, le parti n'a remporté que huit sièges.
Mon objectif est de leur permettre de manipuler les statistiques avec habileté et méticulosité.
Le monde des chiffres peut sembler froid et rigide, mais comme nous l'avons vu lors de précédentes tentatives de mesure de choses comme les arbres, le bonheur et la mort, les chiffres doivent toujours être manipulés avec précaution.
--- p.22
Les statistiques peuvent apporter clarté et compréhension aux problèmes auxquels nous sommes confrontés, mais elles peuvent aussi être mal utilisées pour promouvoir des opinions ou simplement attirer l'attention.
Par conséquent, la capacité à juger de la crédibilité des affirmations statistiques revêt une importance croissante dans la société moderne.
J'espère que ce livre vous incitera à vous poser des questions sur les chiffres que vous rencontrez dans votre vie quotidienne.
--- p.22
Apprenons-en un peu plus sur l'encadrement.
En 2011, une publicité est apparue dans le métro londonien affirmant que « 99 % des jeunes Londoniens ne commettent pas de violences graves ».
Cette publicité a peut-être pour but de rassurer les passagers, mais deux simples modifications pourraient avoir l'effet inverse.
Premièrement, affirmer que 99 % des jeunes ne commettent pas de violence grave signifie que 1 % des jeunes commettent des actes de violence très graves.
Deuxièmement, Londres compte environ 9 millions d'habitants, dont environ 1 million sont âgés de 15 à 25 ans.
Si l'on considère ce groupe d'âge comme celui des adolescents, on compte environ 10 000 adolescents très violents.
Comment cela peut-il nous rassurer ? Nous utilisons ici deux méthodes pour manipuler l’effet statistique.
Tout d'abord, le cadre positif a été transformé en cadre négatif.
Deuxièmement, nous avons converti les pourcentages en nombres précis.
Par conséquent, afin de fournir une information impartiale, il est souhaitable de présenter à la fois des points de vue positifs et négatifs.
--- p.34
Au Royaume-Uni, environ 6 personnes sur 100 développeront un cancer colorectal.
Que se passerait-il si ces 100 personnes consommaient des sandwichs au bacon tous les jours ? En appliquant le risque relatif de 18 % indiqué dans le rapport du Centre international de recherche sur le cancer, ce nombre passerait de six à sept.* Autrement dit, pour chaque vie entière de consommation de bacon, une personne supplémentaire sur 100 développerait un cancer colorectal.
Ce n'est pas aussi impressionnant que le risque relatif (augmentation de 18 %).
Il nous faut faire la distinction entre ce qui paraît effrayant et ce qui représente un danger réel.
--- p.42
La moyenne arithmétique peut être très trompeuse lorsque les données ne sont pas distribuées symétriquement autour de la médiane mais sont asymétriques, ou lorsqu'il existe quelques valeurs très élevées ou très basses qui forment de longues queues aux extrémités, même si la majorité des cas sont standards.
Par exemple, comparées aux personnes de votre âge et de votre sexe, vos chances de mourir l'année prochaine seront bien inférieures à la moyenne (moyenne arithmétique).
Selon les tables d'espérance de vie britanniques, 1 % des personnes âgées actuellement de 63 ans mourront avant leur 64e anniversaire.
Cependant, la plupart de ces personnes sont déjà dans un état grave, et les chances de décès pour la majorité des personnes en bonne santé sont inférieures à ce risque moyen.
--- p.59
Pour généraliser les résultats d'un échantillon à l'ensemble de la population, l'échantillon doit être représentatif.
Le fait d'avoir beaucoup de données ne signifie pas nécessairement qu'il s'agit d'un bon échantillon, et cela peut même donner une fausse impression de confiance.
Par exemple, lors des élections générales britanniques de 2015, les instituts de sondage ont interrogé des milliers d'électeurs potentiels, mais n'ont pas réussi à faire de prédictions.
Cela s'explique par le fait que le processus d'échantillonnage était inadéquat.
Les agences contactaient principalement les lignes fixes, avec des taux de réponse inférieurs à 10 %.
De tels échantillons sont difficilement représentatifs.
--- p.97
Comme il s'agissait d'une étude de grande envergure utilisant les données d'une population pertinente, la conclusion selon laquelle les personnes plus instruites présentent un risque légèrement plus élevé de tumeurs cérébrales est relativement crédible.
Alors, est-ce que toute cette sueur et ce sang qui coulent de la bibliothèque ont surchauffé mon cerveau et provoqué une mutation de mes cellules en quelque chose d'étrange ? J'en doute.
Les auteurs de l'article ajoutent également que « ces conclusions peuvent être dues à l'incomplétude des registres du cancer et à un biais de détection ».
Autrement dit, les personnes plus riches et plus instruites ont peut-être bénéficié de davantage de tests diagnostiques.
--- pp.113~114
La forte tendance psychologique à attribuer le changement à l'intervention rend les comparaisons avant-après peu fiables.
Un exemple typique est celui d'un radar de vitesse.
Ces caméras sont souvent installées dans des endroits où des accidents récents se sont produits.
Lorsque le taux d'accidents diminue après l'installation des caméras, les gens pensent que c'est grâce à elles.
Mais le taux d'accidents n'aurait-il pas diminué de toute façon ? Une série de coups de chance ou de malchance ne dure pas éternellement, et la situation finira par se calmer.
Il s'agit d'une régression vers la moyenne.
C'est comme un père de grande taille ayant un fils plus petit.
Cependant, si nous croyons que cette chance ou cette malchance persistante indique un état de fait permanent, nous serons amenés à la conclusion erronée que le retour à la normale est le résultat d'une intervention quelconque.
--- pp.149~150
Il existe des formules pour calculer la taille et la puissance d'un test en fonction du type d'expérience, et elles dépendent crucialement de la taille de l'échantillon.
Cependant, lorsque la taille de l'échantillon est fixe, un compromis est inévitable.
Pour accroître la puissance du test, le seuil de signification devrait être assoupli.
Cela augmente la probabilité d'identifier avec précision l'effet réel, mais augmente également la probabilité de commettre une erreur de type I.
Pour reprendre une analogie juridique, on peut assouplir les critères permettant de conclure à la culpabilité en réduisant l'exigence de preuve hors de tout doute raisonnable.
De ce fait, davantage de criminels sont condamnés à juste titre, tandis que davantage d'innocents sont condamnés à tort.
--- p.315
L'article, intitulé « Regarder la télévision sans réfléchir peut-il vous tuer ? », est issu d'une étude épidémiologique.
L'étude a estimé que les personnes qui regardaient plus de cinq heures de télévision par soir avaient un risque relatif de développer une embolie de 2,5 par rapport à celles qui regardaient moins de deux heures et demie de télévision par soir.
Cependant, si l'on considère le risque absolu dans le groupe à haut risque (13 personnes sur 158 000 par an), cela signifie que vous pourriez vous attendre à vivre cet événement si vous regardiez plus de cinq heures de télévision chaque soir pendant 12 000 ans.
Cela atténue l'impact dramatique du titre de l'article.
--- pp.390~391
Le tableau 13.1 présente les prévisions et les résultats définitifs des élections de juin 2017.
Le nombre de sièges prévu était étonnamment proche du résultat réel.
La différence était au maximum de quatre sièges.
Le tableau 13.1 montre que ces prédictions statistiques se sont avérées assez précises lors des trois dernières élections britanniques.
En 2015, lorsque les statisticiens ont prédit une défaite majeure pour les Libéraux-démocrates, faisant chuter leur nombre de sièges de 57 à 10, un homme politique libéral-démocrate de premier plan a déclaré lors d'une interview télévisée en direct que s'ils avaient raison, il « mangerait son chapeau ».
En réalité, le parti n'a remporté que huit sièges.
--- p.411
Avis de l'éditeur
Évitez les mensonges et les coïncidences dans le flot d'informations.
Le pouvoir du raisonnement statistique pour guider des choix judicieux
En 2015, l'OMS a choqué le monde en annonçant que les viandes transformées telles que le jambon et les saucisses étaient classées comme « cancérogènes du groupe 1 », au même titre que le tabac et l'amiante, et que la consommation de 50 grammes de viande transformée par jour pouvait augmenter de 18 % le risque de développer un cancer de l'intestin.
Cela signifie-t-il que près d'une personne sur cinq développera un cancer ?
La réaction fut immédiate.
Les ventes de jambon et de saucisses dans les supermarchés ont sensiblement diminué.
Les appels se multiplient pour éliminer complètement les viandes transformées, comme le jambon et les saucisses, des menus des cantines scolaires.
Le secteur de la restauration, y compris celui des hamburgers, a été durement touché par la forte baisse de la consommation.
En réalité, ce chiffre effrayant de 18 % correspond à un taux de croissance relatif.
Au Royaume-Uni, la proportion moyenne de personnes atteintes d'un cancer colorectal est d'environ 6 sur 100.
Si l'on applique un taux de croissance relatif de 18 %, ces 6 personnes deviennent 7 personnes.
Autrement dit, le nombre de personnes qui contractent réellement un cancer n'augmente que d'une seule.
« Statistiques pour les personnes qui ont du mal avec les chiffres » vous apprend à douter raisonnablement des chiffres que vous rencontrez dans la vie quotidienne et à distinguer entre le vrai et le faux, la coïncidence et la nécessité.
L'auteur, David Spiegelhalter, est un statisticien de renommée mondiale qui a été professeur de statistique à l'université de Cambridge et président de la Royal Statistical Society.
Il explique avec une clarté et une facilité surprenantes des concepts statistiques fondamentaux tels que le risque relatif et absolu, la corrélation et la causalité, la sagesse des foules et la régression vers la moyenne, sans recourir à des mathématiques complexes.
Nous parlons et pensons déjà à presque tout en termes de statistiques.
Ce livre aidera les lecteurs à développer les compétences statistiques pratiques et productives nécessaires à l'ère du big data.
Les statistiques peuvent apporter clarté et compréhension aux problèmes auxquels nous sommes confrontés, mais elles peuvent aussi être mal utilisées pour promouvoir des opinions ou simplement attirer l'attention.
Par conséquent, la capacité à juger de la crédibilité des affirmations statistiques revêt une importance croissante dans la société moderne.
J'espère que ce livre vous incitera à vous poser des questions sur les chiffres que vous rencontrez dans votre vie quotidienne.
(Page 22)
Même les débutants peuvent le lire !
Étudiez les statistiques facilement et efficacement
Ces derniers temps, les statistiques ont suscité de vives réactions au sein de la société coréenne.
Le débat se poursuit concernant les bases de calcul des indices économiques relatifs à l'emploi, aux revenus et à l'immobilier annoncés par le gouvernement.
Face à la multiplication des critiques publiques concernant les prévisions météorologiques largement erronées durant cette saison des pluies, l'Administration météorologique coréenne peine à fournir une explication.
Si les gens sont si sensibles aux statistiques, c'est parce qu'ils utilisent largement les données statistiques dans leurs prises de décision quotidiennes.
Nous consultons les prévisions météorologiques et décidons si nous devons emporter un parapluie ou non.
Pour choisir un restaurant ou un film, je me réfère aux avis des utilisateurs fournis par le portail.
De plus, les résultats des sondages d'opinion influencent le vote, et les indicateurs économiques influencent les opérations des ménages telles que les investissements.
La capacité d'interpréter ces chiffres et d'analyser de manière critique les conclusions statistiques est appelée culture des données.
Surtout à l'ère du big data, où les données deviennent plus volumineuses et plus complexes, il est devenu plus important que jamais de déterminer la valeur réelle d'un élément de preuve.
L'auteur soutient que pour développer la culture des données, nous devons apprendre les statistiques pour résoudre des problèmes concrets, et non les statistiques pour résoudre des problèmes mathématiques.
Ce livre emmène les lecteurs dans un voyage intellectuel à la découverte du monde véritable à travers 48 questions fascinantes.
Voici quelques exemples résumés :
√ Combien de morts supplémentaires par rapport au nombre normal de décès seraient nécessaires avant que des meurtres en série puissent être détectés ?
Harold Shipman est le meurtrier le plus prolifique de Grande-Bretagne.
Médecin de famille, il a administré des doses excessives de sédatifs à au moins 215 de ses patients entre 1975 et 1998, provoquant leur décès.
Sa famille était sous le choc qu'il ait pu commettre des crimes pendant si longtemps sans être soupçonné.
L'équipe d'enquête a conclu qu'un suivi statistique aurait permis de constater un nombre important de décès en excès en 1984, et que si le cas de Shipman avait été signalé à ce moment-là, environ 175 personnes auraient pu être sauvées.
√ La prière peut-elle aider les patients à guérir ?
Les chercheurs ont divisé 1 800 patients subissant une chirurgie cardiaque en trois groupes.
Le premier groupe a reçu des prières sans le savoir.
Le deuxième groupe n'a pas reçu la prière et n'en avait pas connaissance non plus.
Le troisième groupe a reçu la prière et l'a su.
Les résultats de l'expérience n'ont montré aucune différence significative entre le groupe ayant reçu des prières et le groupe n'en ayant pas reçu.
Toutefois, dans le troisième groupe, on a constaté une légère augmentation du nombre de patients souffrant de complications.
Un chercheur a déclaré :
« Les patients étaient peut-être anxieux, se demandant s’ils étaient si malades qu’il fallait prier pour eux. »
√ Est-il vraiment vrai que les radars de vitesse ont réduit les accidents de la route ?
Lorsque le nombre d'accidents diminue après l'installation de radars de vitesse, les gens attribuent cette baisse à ces radars.
Mais le taux d'accidents n'aurait-il pas diminué de toute façon ? Pour déterminer l'efficacité réelle des radars de vitesse, les chercheurs les ont placés de manière aléatoire.
En conséquence, on a estimé qu'environ deux tiers de l'effet de l'installation de la caméra étaient dus à la régression vers la moyenne.
Autrement dit, une série de chance ou de malchance ne dure pas éternellement, et les choses finiront par se calmer.
√ Quelle est la probabilité qu'une personne ayant un résultat positif au test de dépistage du cancer, dont la précision est de 90 %, soit réellement atteinte d'un cancer ?
Supposons que 1000 personnes aient été testées et que 1% d'entre elles (10 personnes) aient effectivement développé un cancer.
Neuf personnes sur dix (90 %) sont testées positives.
Par ailleurs, 99 personnes sur 990 (10 %) qui n’ont pas de cancer recevront un résultat faussement positif.
Par conséquent, la probabilité qu'une personne testée positive ait réellement un cancer n'est que de 9/108, soit environ 8 %.
Cet exercice sur les probabilités conditionnelles est contre-intuitif.
Bien que le test soit précis à 90 %, la majorité des personnes testées positives n'ont en réalité pas de cancer.
Il faut faire la distinction entre la probabilité qu'un test soit positif lorsqu'on a un cancer et la probabilité d'avoir un cancer lorsqu'on obtient un résultat positif.
Comment sont créés les algorithmes qui régissent nos vies ?
Les statistiques comme cours de sciences humaines pour la science des données et l'intelligence artificielle
Francis Summerton, un Anglais, acheta un billet de troisième classe sur le Titanic pour huit livres et un shilling, avec l'intention de laisser sa femme et sa jeune fille en Angleterre et de partir en Amérique pour gagner de l'argent.
Pendant ce temps, Karl Dahl, un ébéniste norvégien de 45 ans, embarqua seul sur le navire, payant le même prix que Somerton.
Ils étaient tous deux aussi pauvres et désespérés, mais dans la nuit du 14 avril 1912, leurs destins se sont séparés.
Le Summerton a sombré au fond de la mer froide, mais Dahl a réussi à monter à bord du canot de sauvetage numéro 15.
Summerton a-t-il simplement manqué de chance ? Ou ses chances de survie étaient-elles réellement minces ? On pourrait supposer intuitivement qu’il était un homme voyageant en troisième classe, et donc peu susceptible de survivre.
Cependant, en concevant divers algorithmes de prédiction de la survie des passagers du Titanic à partir de données telles que le titre, le sexe, l'âge et le prix du billet, nous pouvons obtenir des taux de survie plus précis.
Aujourd'hui, nous sommes entourés d'algorithmes qui collectent des informations sur le trafic en temps réel pour nous guider vers les itinéraires optimaux et nous proposer des publicités personnalisées en fonction de notre historique d'achats en ligne.
De plus, à mesure que la science des données utilisant le big data progresse, le recours aux algorithmes dans des domaines tels que la santé, la finance et la sécurité publique augmentera.
Par conséquent, même si vous n'êtes pas un expert, vous devez comprendre la structure de l'algorithme et ses limitations.
Ce livre propose une explication facile à comprendre des théories statistiques qui constituent la base des algorithmes, tels que la régression, le surapprentissage, la validation croisée et l'inférence bayésienne.
Ce livre constituera un guide précieux non seulement pour les débutants qui étudient les statistiques pour la première fois, mais aussi pour ceux qui souhaitent apprendre les statistiques dans le cadre d'une formation en sciences humaines appliquée à la science des données et à l'intelligence artificielle.
10 façons de penser comme un maître des statistiques
Enfin, l'auteur présente 10 conseils à ceux qui souhaitent devenir de fins experts en statistiques.
1.
Les méthodes statistiques doivent permettre aux données de répondre aux questions scientifiques.
Plutôt que de nous concentrer sur une technique spécifique, demandons-nous pourquoi nous faisons cela.
2.
Le signal est toujours accompagné de bruit.
C'est justement cette capacité à faire la distinction entre les deux qui rend les statistiques intéressantes.
La volatilité est inévitable, et les modèles probabilistes sont utiles en tant que concepts abstraits.
3.
Prévoyez à l'avance, prévoyez vraiment à l'avance.
Dans les études confirmatoires, utilisez des notes explicatives préalables pour éviter les biais du chercheur.
4.
Veillez à la qualité de vos données.
Tout dépend des données.
5.
L'analyse statistique ne se résume pas à de simples calculs.
Il n'est pas judicieux de simplement insérer des données dans une formule ou d'exécuter un logiciel sans savoir pourquoi.
6.
Faites simple.
Les communications importantes doivent être aussi simples que possible.
Évitons de faire étalage de nos compétences avec une modélisation inutilement compliquée.
7.
Fournir une évaluation de la volatilité.
Toutefois, il convient de préciser que la marge d'erreur est plus importante que ce qui est généralement affirmé.
8.
Vérifiez vos hypothèses.
Et soyons clairs sur les cas où cela n'était pas possible.
9.
Si possible, reproduisez-le ! Ou encouragez les autres à le faire.
10.
Rendez votre analyse reproductible.
D'autres personnes devraient pouvoir accéder à vos données et à votre code.
Les statistiques jouent un rôle essentiel dans tous les aspects de notre vie et elles évoluent constamment à mesure que de plus en plus de données deviennent disponibles.
Cela affecte non seulement la société, mais aussi les individus.
En préparant ce livre, j'espère que vous vous rendrez compte à quel point les statistiques ont enrichi ma vie.
Si ce n'est pas maintenant, ce sera un jour dans le futur. (p. 418)
« Ce livre m’a tellement choquée. »
« J’ai l’impression d’avoir appris davantage grâce à ce livre qu’avec mes études de maîtrise et de doctorat. » – Avis d’un blogueur
Un ouvrage incontournable pour tous les politiciens, journalistes, professionnels de la santé et tous les autres. – Popular Science
Cela montre clairement comment les données peuvent nous aider à mieux comprendre le monde.
_"Nature"
Un excellent correctif aux fausses informations et aux idées fausses – Kirkus Reviews
Le pouvoir du raisonnement statistique pour guider des choix judicieux
En 2015, l'OMS a choqué le monde en annonçant que les viandes transformées telles que le jambon et les saucisses étaient classées comme « cancérogènes du groupe 1 », au même titre que le tabac et l'amiante, et que la consommation de 50 grammes de viande transformée par jour pouvait augmenter de 18 % le risque de développer un cancer de l'intestin.
Cela signifie-t-il que près d'une personne sur cinq développera un cancer ?
La réaction fut immédiate.
Les ventes de jambon et de saucisses dans les supermarchés ont sensiblement diminué.
Les appels se multiplient pour éliminer complètement les viandes transformées, comme le jambon et les saucisses, des menus des cantines scolaires.
Le secteur de la restauration, y compris celui des hamburgers, a été durement touché par la forte baisse de la consommation.
En réalité, ce chiffre effrayant de 18 % correspond à un taux de croissance relatif.
Au Royaume-Uni, la proportion moyenne de personnes atteintes d'un cancer colorectal est d'environ 6 sur 100.
Si l'on applique un taux de croissance relatif de 18 %, ces 6 personnes deviennent 7 personnes.
Autrement dit, le nombre de personnes qui contractent réellement un cancer n'augmente que d'une seule.
« Statistiques pour les personnes qui ont du mal avec les chiffres » vous apprend à douter raisonnablement des chiffres que vous rencontrez dans la vie quotidienne et à distinguer entre le vrai et le faux, la coïncidence et la nécessité.
L'auteur, David Spiegelhalter, est un statisticien de renommée mondiale qui a été professeur de statistique à l'université de Cambridge et président de la Royal Statistical Society.
Il explique avec une clarté et une facilité surprenantes des concepts statistiques fondamentaux tels que le risque relatif et absolu, la corrélation et la causalité, la sagesse des foules et la régression vers la moyenne, sans recourir à des mathématiques complexes.
Nous parlons et pensons déjà à presque tout en termes de statistiques.
Ce livre aidera les lecteurs à développer les compétences statistiques pratiques et productives nécessaires à l'ère du big data.
Les statistiques peuvent apporter clarté et compréhension aux problèmes auxquels nous sommes confrontés, mais elles peuvent aussi être mal utilisées pour promouvoir des opinions ou simplement attirer l'attention.
Par conséquent, la capacité à juger de la crédibilité des affirmations statistiques revêt une importance croissante dans la société moderne.
J'espère que ce livre vous incitera à vous poser des questions sur les chiffres que vous rencontrez dans votre vie quotidienne.
(Page 22)
Même les débutants peuvent le lire !
Étudiez les statistiques facilement et efficacement
Ces derniers temps, les statistiques ont suscité de vives réactions au sein de la société coréenne.
Le débat se poursuit concernant les bases de calcul des indices économiques relatifs à l'emploi, aux revenus et à l'immobilier annoncés par le gouvernement.
Face à la multiplication des critiques publiques concernant les prévisions météorologiques largement erronées durant cette saison des pluies, l'Administration météorologique coréenne peine à fournir une explication.
Si les gens sont si sensibles aux statistiques, c'est parce qu'ils utilisent largement les données statistiques dans leurs prises de décision quotidiennes.
Nous consultons les prévisions météorologiques et décidons si nous devons emporter un parapluie ou non.
Pour choisir un restaurant ou un film, je me réfère aux avis des utilisateurs fournis par le portail.
De plus, les résultats des sondages d'opinion influencent le vote, et les indicateurs économiques influencent les opérations des ménages telles que les investissements.
La capacité d'interpréter ces chiffres et d'analyser de manière critique les conclusions statistiques est appelée culture des données.
Surtout à l'ère du big data, où les données deviennent plus volumineuses et plus complexes, il est devenu plus important que jamais de déterminer la valeur réelle d'un élément de preuve.
L'auteur soutient que pour développer la culture des données, nous devons apprendre les statistiques pour résoudre des problèmes concrets, et non les statistiques pour résoudre des problèmes mathématiques.
Ce livre emmène les lecteurs dans un voyage intellectuel à la découverte du monde véritable à travers 48 questions fascinantes.
Voici quelques exemples résumés :
√ Combien de morts supplémentaires par rapport au nombre normal de décès seraient nécessaires avant que des meurtres en série puissent être détectés ?
Harold Shipman est le meurtrier le plus prolifique de Grande-Bretagne.
Médecin de famille, il a administré des doses excessives de sédatifs à au moins 215 de ses patients entre 1975 et 1998, provoquant leur décès.
Sa famille était sous le choc qu'il ait pu commettre des crimes pendant si longtemps sans être soupçonné.
L'équipe d'enquête a conclu qu'un suivi statistique aurait permis de constater un nombre important de décès en excès en 1984, et que si le cas de Shipman avait été signalé à ce moment-là, environ 175 personnes auraient pu être sauvées.
√ La prière peut-elle aider les patients à guérir ?
Les chercheurs ont divisé 1 800 patients subissant une chirurgie cardiaque en trois groupes.
Le premier groupe a reçu des prières sans le savoir.
Le deuxième groupe n'a pas reçu la prière et n'en avait pas connaissance non plus.
Le troisième groupe a reçu la prière et l'a su.
Les résultats de l'expérience n'ont montré aucune différence significative entre le groupe ayant reçu des prières et le groupe n'en ayant pas reçu.
Toutefois, dans le troisième groupe, on a constaté une légère augmentation du nombre de patients souffrant de complications.
Un chercheur a déclaré :
« Les patients étaient peut-être anxieux, se demandant s’ils étaient si malades qu’il fallait prier pour eux. »
√ Est-il vraiment vrai que les radars de vitesse ont réduit les accidents de la route ?
Lorsque le nombre d'accidents diminue après l'installation de radars de vitesse, les gens attribuent cette baisse à ces radars.
Mais le taux d'accidents n'aurait-il pas diminué de toute façon ? Pour déterminer l'efficacité réelle des radars de vitesse, les chercheurs les ont placés de manière aléatoire.
En conséquence, on a estimé qu'environ deux tiers de l'effet de l'installation de la caméra étaient dus à la régression vers la moyenne.
Autrement dit, une série de chance ou de malchance ne dure pas éternellement, et les choses finiront par se calmer.
√ Quelle est la probabilité qu'une personne ayant un résultat positif au test de dépistage du cancer, dont la précision est de 90 %, soit réellement atteinte d'un cancer ?
Supposons que 1000 personnes aient été testées et que 1% d'entre elles (10 personnes) aient effectivement développé un cancer.
Neuf personnes sur dix (90 %) sont testées positives.
Par ailleurs, 99 personnes sur 990 (10 %) qui n’ont pas de cancer recevront un résultat faussement positif.
Par conséquent, la probabilité qu'une personne testée positive ait réellement un cancer n'est que de 9/108, soit environ 8 %.
Cet exercice sur les probabilités conditionnelles est contre-intuitif.
Bien que le test soit précis à 90 %, la majorité des personnes testées positives n'ont en réalité pas de cancer.
Il faut faire la distinction entre la probabilité qu'un test soit positif lorsqu'on a un cancer et la probabilité d'avoir un cancer lorsqu'on obtient un résultat positif.
Comment sont créés les algorithmes qui régissent nos vies ?
Les statistiques comme cours de sciences humaines pour la science des données et l'intelligence artificielle
Francis Summerton, un Anglais, acheta un billet de troisième classe sur le Titanic pour huit livres et un shilling, avec l'intention de laisser sa femme et sa jeune fille en Angleterre et de partir en Amérique pour gagner de l'argent.
Pendant ce temps, Karl Dahl, un ébéniste norvégien de 45 ans, embarqua seul sur le navire, payant le même prix que Somerton.
Ils étaient tous deux aussi pauvres et désespérés, mais dans la nuit du 14 avril 1912, leurs destins se sont séparés.
Le Summerton a sombré au fond de la mer froide, mais Dahl a réussi à monter à bord du canot de sauvetage numéro 15.
Summerton a-t-il simplement manqué de chance ? Ou ses chances de survie étaient-elles réellement minces ? On pourrait supposer intuitivement qu’il était un homme voyageant en troisième classe, et donc peu susceptible de survivre.
Cependant, en concevant divers algorithmes de prédiction de la survie des passagers du Titanic à partir de données telles que le titre, le sexe, l'âge et le prix du billet, nous pouvons obtenir des taux de survie plus précis.
Aujourd'hui, nous sommes entourés d'algorithmes qui collectent des informations sur le trafic en temps réel pour nous guider vers les itinéraires optimaux et nous proposer des publicités personnalisées en fonction de notre historique d'achats en ligne.
De plus, à mesure que la science des données utilisant le big data progresse, le recours aux algorithmes dans des domaines tels que la santé, la finance et la sécurité publique augmentera.
Par conséquent, même si vous n'êtes pas un expert, vous devez comprendre la structure de l'algorithme et ses limitations.
Ce livre propose une explication facile à comprendre des théories statistiques qui constituent la base des algorithmes, tels que la régression, le surapprentissage, la validation croisée et l'inférence bayésienne.
Ce livre constituera un guide précieux non seulement pour les débutants qui étudient les statistiques pour la première fois, mais aussi pour ceux qui souhaitent apprendre les statistiques dans le cadre d'une formation en sciences humaines appliquée à la science des données et à l'intelligence artificielle.
10 façons de penser comme un maître des statistiques
Enfin, l'auteur présente 10 conseils à ceux qui souhaitent devenir de fins experts en statistiques.
1.
Les méthodes statistiques doivent permettre aux données de répondre aux questions scientifiques.
Plutôt que de nous concentrer sur une technique spécifique, demandons-nous pourquoi nous faisons cela.
2.
Le signal est toujours accompagné de bruit.
C'est justement cette capacité à faire la distinction entre les deux qui rend les statistiques intéressantes.
La volatilité est inévitable, et les modèles probabilistes sont utiles en tant que concepts abstraits.
3.
Prévoyez à l'avance, prévoyez vraiment à l'avance.
Dans les études confirmatoires, utilisez des notes explicatives préalables pour éviter les biais du chercheur.
4.
Veillez à la qualité de vos données.
Tout dépend des données.
5.
L'analyse statistique ne se résume pas à de simples calculs.
Il n'est pas judicieux de simplement insérer des données dans une formule ou d'exécuter un logiciel sans savoir pourquoi.
6.
Faites simple.
Les communications importantes doivent être aussi simples que possible.
Évitons de faire étalage de nos compétences avec une modélisation inutilement compliquée.
7.
Fournir une évaluation de la volatilité.
Toutefois, il convient de préciser que la marge d'erreur est plus importante que ce qui est généralement affirmé.
8.
Vérifiez vos hypothèses.
Et soyons clairs sur les cas où cela n'était pas possible.
9.
Si possible, reproduisez-le ! Ou encouragez les autres à le faire.
10.
Rendez votre analyse reproductible.
D'autres personnes devraient pouvoir accéder à vos données et à votre code.
Les statistiques jouent un rôle essentiel dans tous les aspects de notre vie et elles évoluent constamment à mesure que de plus en plus de données deviennent disponibles.
Cela affecte non seulement la société, mais aussi les individus.
En préparant ce livre, j'espère que vous vous rendrez compte à quel point les statistiques ont enrichi ma vie.
Si ce n'est pas maintenant, ce sera un jour dans le futur. (p. 418)
« Ce livre m’a tellement choquée. »
« J’ai l’impression d’avoir appris davantage grâce à ce livre qu’avec mes études de maîtrise et de doctorat. » – Avis d’un blogueur
Un ouvrage incontournable pour tous les politiciens, journalistes, professionnels de la santé et tous les autres. – Popular Science
Cela montre clairement comment les données peuvent nous aider à mieux comprendre le monde.
_"Nature"
Un excellent correctif aux fausses informations et aux idées fausses – Kirkus Reviews
SPÉCIFICATIONS DES PRODUITS
- Date de publication : 12 août 2020
Nombre de pages, poids, dimensions : 460 pages | 586 g | 152 × 225 × 21 mm
- ISBN13 : 9788901244488
- ISBN10 : 8901244489
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne