Passer aux informations sur le produit
L'analyse prédictive par apprentissage automatique : une méthodologie scientifique pour prédire l'avenir
L'analyse prédictive par apprentissage automatique : une méthodologie scientifique pour prédire l'avenir
Description
Introduction au livre
Ce livre contient trois parties principales.
Nous examinerons tout d'abord les fondements théoriques et le développement historique de l'analyse prédictive.
Cela permettra aux lecteurs de comprendre que les prédictions ne sont pas simplement une tendance technologique récente, mais le prolongement de recherches scientifiques accumulées depuis le passé.
Deuxièmement, nous expliquerons différents algorithmes d'apprentissage automatique.
Il propose des explications faciles à comprendre de techniques représentatives telles que l'analyse de régression, les arbres de décision, les forêts aléatoires et les réseaux neuronaux, et guide les lecteurs dans le développement de leur capacité à les appliquer directement en pratique.
Troisièmement, nous abordons la manière dont l'analyse prédictive et l'analyse des données peuvent être utilisées et l'impact qu'elles peuvent avoir dans la société et les contextes industriels réels.
Cela souligne que les prédictions peuvent aller au-delà de la simple recherche académique et contribuer à la résolution des problèmes sociaux.
Cet ouvrage s'attache notamment à trouver un équilibre entre rigueur académique et applicabilité pratique.
Nous espérons qu'il servira de manuel systématique aux étudiants de premier et de deuxième cycles, de guide d'études de cas pour les chercheurs et d'outil pratique pour les praticiens.

indice
Préface / 06

1.
Pourquoi l'analyse prédictive est-elle importante ?
1.1.
Signification en termes / 16
1.2.
La différence entre l'analyse et l'analytique / 20
1.3.
Quelle est la place de l'exploration de données ? / 20
1.4.
Pourquoi l'analyse et la science des données suscitent-elles soudainement autant d'intérêt ? / 21
1.5.
Applications de l'analyse / 24
1.6.
Principaux défis en matière d'analyse de données / 25
Résumé / 31

2.
Taxonomie de l'analyse commerciale
Résumé / 48

3.
Analyse prédictive et exploration de données
3.1.
Qu'est-ce que l'exploration de données ? / 55
3.2.
Qu'est-ce qui n'est pas de l'exploration de données ? / 58
3.3.
Applications courantes d'exploration de données / 60
3.4.
Types de modèles découverts grâce à l'exploration de données / 66
3.5.
Classification des méthodes d'apprentissage en exploration de données / 68
3.6.
L'ombre du forage de données : violations de la vie privée / 73
Résumé / 78

4.
Procédures normalisées pour l'analyse prédictive
4.1. Processus KDD (Découverte de connaissances dans les bases de données) / 81
4.2. CRISP-DM : Un processus standard universel d’exploration de données / 82
4.3. SEMMA / 94
4.4. Comparaison de SEMMA et CRISP-DM / 99
4.5.
Six Sigma pour l'exploration de données / 100
4.6.
Quelle méthodologie est la meilleure ? / 103
Résumé / 103

5.
Procédures normalisées pour l'analyse prédictive
5.1.
La nature des données dans l'analyse des données / 107
5.2.
Caractéristiques des données catégorielles et numériques / 108
5.3.
Prétraitement des données pour l'analyse / 113
5.4.
Techniques d'exploration de données / 121
5.5.
Aperçu des techniques de classification / 137
5.6.
Mythes et réalités de l'exploration de données et de l'analyse prédictive / 160
Résumé / 164
6.
Entraînement des modèles d'apprentissage automatique
6.1.
Modèles de régression et de classification / 166
6.2.
Fonctions de coût et entraînement des modèles d'apprentissage automatique / 170
6.3.
Estimation du maximum de vraisemblance / 172
6.4.
Apprentissage basé sur le gradient / 174
6.5.
Évaluation des performances dans les tâches de régression et de classification / 179
Résumé / 182

7.
Procédures normalisées pour l'analyse prédictive
7.1.
Bayes naïf / 187
7.2.
k plus proches voisins (k-NN) / 193
7.3.
Réseaux de neurones artificiels (RNA) / 199
7.4.
Machines à vecteurs de support (SVM) / 205
7.5.
Régression linéaire / 211
7.6.
Régression logistique / 218
7.7.
Prévision de séries chronologiques / 220
Résumé / 222

8.
Analyse de texte, modélisation thématique et analyse des sentiments
8.1.
Traitement automatique du langage naturel (TALN) / 231
8.2.
Processus d'exploration de texte / 238
8.3.
Modélisation thématique / 248
8.4.
Analyse des sentiments / 253
Résumé / 264

Dans le livre
1.
Pourquoi l'analyse prédictive est-elle importante ?

L'analyse prédictive, sujet central de ce livre, joue un rôle très important dans l'analyse commerciale.
L’objectif principal de l’analyse prédictive est d’anticiper les événements et les situations futurs, aidant ainsi les décideurs à saisir les opportunités à venir en temps opportun, à prévenir les problèmes avant qu’ils ne surviennent ou à minimiser leur impact (Dada et al., 2024).
L'analyse prédictive se situe entre l'analyse descriptive, qui se concentre sur l'analyse des événements passés, et l'analyse prescriptive, qui guide de manière proactive les décisions futures.
L'analyse prédictive utilise les données et les tendances historiques issues de l'analyse technique pour anticiper les résultats futurs probables. Ces informations servent ensuite à l'analyse prescriptive, fournissant ainsi des indications précieuses pour une prise de décision optimale.

Comparée à l’intelligence d’affaires, l’analyse d’affaires est un terme relativement nouveau qui gagne rapidement en popularité dans les contextes industriels réels (Adaga et al., 2024).
De manière générale, l'analyse de données est une technologie qui utilise des modèles mathématiques complexes, des données diverses et des connaissances d'experts pour découvrir des informations pertinentes et faciliter une prise de décision précise et opportune fondée sur ces informations.
En d'autres termes, l'analyse peut être considérée comme l'ensemble du processus de prise de décision et de résolution de problèmes.
Nous vivons aujourd'hui à l'ère du déluge de données, où existent des quantités massives de données, et où les outils d'analyse qui trient et traitent de grandes quantités de données diverses et complexes deviennent de plus en plus importants.

Bien que l'analyse prédictive soit souvent basée sur les données, il existe également des projets d'analyse qui fonctionnent sans données.
Elles ne sont pas axées sur les données, mais s'appuient sur des technologies de processus ou des connaissances d'experts, en utilisant des modèles mathématiques ou symboliques (par exemple, l'optimisation, la simulation, les systèmes experts, l'analyse de cas, etc.).
C’est pourquoi le terme plus spécifique d’« analyse de données » a émergé afin de distinguer clairement quelles analyses étaient réellement basées sur des données.
Parallèlement, l’analyse commerciale consiste à appliquer ces outils, techniques et principes analytiques à des problèmes commerciaux complexes (Kim Soo-kyung, 2024).
Plus particulièrement, les organisations appliquent des techniques analytiques dans des domaines riches en données pour expliquer, prédire et trouver des solutions optimales en matière de performance, de la manière suivante :

•Améliorer les relations clients (acquisition de clients, fidélisation, augmentation de la valeur, etc.)
• Réduire les coûts et améliorer les performances en détectant les transactions frauduleuses ou les comportements/résultats indésirables.
• Améliorer les caractéristiques et les prix des produits et services afin d’accroître la satisfaction et la fidélité des clients et d’améliorer la rentabilité.
• Prévoir la demande pour des produits ou services spécifiques afin de prévenir l’épuisement des stocks et ainsi optimiser l’efficacité opérationnelle.
Optimisez vos campagnes marketing et publicitaires pour toucher davantage de clients avec le bon message au moindre coût.
• Poursuivre une gestion opérationnelle et une allocation des ressources efficaces grâce à la simulation et à l'optimisation, et réduire les coûts.
• Fournir des informations et des analyses permettant aux employés de prendre des décisions plus rapides et plus précises lors du service à la clientèle.

Le terme « analytique » a rapidement gagné en popularité ces dernières années, remplaçant de nombreux termes auparavant largement utilisés.
Par exemple, « business intelligence » devient « business analytics », « customer intelligence » devient « customer analytics », « web mining » devient « web analytics » et « knowledge discovery » devient « data analytics ».
À mesure que le mot « analyse » se généralise, de nouveaux termes tels que « science des données », « analyse des mégadonnées » et « apprentissage automatique appliqué » émergent, complexifiant ainsi le système terminologique.
Cette évolution rapide de la terminologie témoigne également de l'intérêt croissant des entreprises pour la valeur qu'elles peuvent créer grâce à l'analyse des données.

1.1.
Signification en termes

Il est également bien connu que, la création constante de nouveaux mots rendant de plus en plus difficile la distinction entre les similitudes et les différences conceptuelles entre les différents termes, il devient évident qu'il est impossible de les distinguer.
Parmi les termes souvent confondus figurent « intelligence d'affaires », « analyse commerciale » et « science des données », tandis que d'autres termes largement utilisés incluent « mégadonnées », « apprentissage automatique » et « traitement automatique du langage naturel (TALN) ».
Pour organiser cette terminologie complexe, nous présentons un diagramme conceptuel simple (Figure 1.1).
Selon ce schéma conceptuel, la « veille stratégique » est pleinement intégrée à l’« analyse métier », ce qui signifie que la « veille stratégique » est une étape d’analyse technique de l’« analyse métier ».
De plus, « l'analyse commerciale » est partiellement englobée sous le terme de « science des données ».
En effet, l’« analyse d’affaires » englobe non seulement les méthodes d’analyse qui utilisent les données, mais aussi les méthodes d’analyse basées sur la représentation et l’utilisation des processus métier ou des connaissances d’experts.

Parmi les termes présentés dans la [Figure 1.1], le big data, l'apprentissage automatique et le traitement du langage naturel font référence à trois termes principaux : la science des données, l'analyse commerciale et les technologies qui permettent l'intelligence d'affaires.
Le terme big data fait parfois référence à l'analyse des big data, mais la définition correcte est basée sur le volume, la variété et la vitesse de l'information (Ayyalasomayajula, 2025).
Ces caractéristiques élèvent les capacités de l'analyse commerciale et de la science des données à des niveaux sans précédent.
Alors que la veille stratégique traite des données structurées (données stockées en lignes et en colonnes dans une base de données ou une feuille de calcul Excel), l'analyse commerciale et la science des données traitent à la fois des données structurées et non structurées.
Le terme « big data » englobe non seulement les données structurées, mais aussi les données non structurées telles que le texte et le multimédia, créant ainsi une nouvelle valeur dans les domaines de l'analyse et de la science des données.
--- Extrait du texte
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 26 septembre 2025
- Nombre de pages, poids, dimensions : 227 pages | 153 × 225 × 20 mm
- ISBN13 : 9791194716259
- ISBN10 : 1194716253

Vous aimerez peut-être aussi

카테고리