Passer aux informations sur le produit
Analyse de données basée sur des sources ouvertes
Analyse de données basée sur des sources ouvertes
Description
Introduction au livre
« Au final, il ne faut mesurer et analyser que les chiffres qui incitent à l'action, c'est-à-dire les données qui indiquent la marche à suivre. » - Alexander Peiniger

Ces mots sonnent à la fois comme une réflexion et une mise en garde sur la façon dont nous, vivant à l'ère de l'innovation informationnelle, devrions considérer les données et l'analyse.
Le mot « données » a été utilisé à tort et à travers ces dernières années, pourtant notre capacité à les collecter, les affiner, les interpréter et les transformer correctement en données exploitables et synthétisées reste très limitée.
Stocker des données est une chose ; en tirer du sens et le mettre en pratique en est une autre.

Ce manuel, « Analyse de données basée sur des sources ouvertes », est une tentative pédagogique et pratique visant à combler cette lacune.
La société moderne est devenue une société axée sur les données, avec des millions de points de données générés chaque seconde par les médias sociaux, les capteurs, les journaux Web, le commerce électronique, et bien plus encore.
Par exemple, les entreprises analysent le comportement des consommateurs pour leur suggérer des produits, les gouvernements prévoient la propagation des maladies infectieuses et conçoivent des politiques de quarantaine, et les hôpitaux analysent les informations génétiques et les dossiers médicaux des patients pour fournir une médecine de précision.
Les données ne sont plus seulement un outil complémentaire ; elles sont devenues une ressource essentielle pour expliquer les faits et concevoir l'avenir.
Mais le simple fait de disposer de données ne crée pas automatiquement du sens.
Le sens naît de l'analyse.
L'analyse n'est pas simplement une technique ; c'est une manière d'interpréter, et cette manière d'analyser permet d'acquérir une perspective juste sur le monde.
Ce manuel est conçu pour développer le sens de l'observation des données, la capacité à les manipuler et l'esprit à les interpréter.
Ce manuel se distingue notamment des autres manuels d'analyse de données par le fait qu'il est basé sur des logiciels libres.

L'open source va au-delà du simple concept d'« outil gratuit » pour embrasser la philosophie du partage, de la réutilisation et de l'évolution collaborative des technologies.
Les outils analytiques que nous utilisons dans notre pratique (Linux, Python, Jupyter Notebooks, Pandas, GitHub, VS Code) sont tous issus de l'écosystème open source.
Ces outils, créés grâce aux contributions volontaires d'innombrables développeurs, chercheurs et étudiants anonymes, sont devenus la norme en matière d'analyse de données aujourd'hui, et ce manuel est conçu pour vous aider à comprendre et à participer à cet écosystème technologique ouvert.

indice
Chapitre 1 : Comprendre l’analyse des données et les sources ouvertes
1.1.
Comprendre l'analyse des données
1.2.
processus d'analyse des données
1.3.
Classification des données
1.4.
environnement open source

Chapitre 2 : Python pour l’analyse des données
2.1.
Listes et dictionnaires
2.2.
Entrée/sortie de données
2.3.
Éléments de syntaxe Python
2.4.
programmation fonctionnelle

Chapitre 3 Collecte et stockage des données
3.1.
Qu'est-ce que la collecte de données ?
3.2.
Type de données
3.3.
méthodes de collecte de données
3.4.
stockage de données
3.5.
Comprendre et utiliser les DataFrames de Pandas
3.6.
Pratique d'organisation des concepts

Chapitre 4 Prétraitement des données
4.1.
Qu'est-ce que le prétraitement des données ?
4.2.
Mesure des données avec Pandas
4.3.
Nettoyage de données avec Pandas
4.4.
Résoudre les problèmes de données avec Pandas
4.5.
Pratique d'organisation des concepts

Chapitre 5 : Analyse des données
5.1.
Comprendre l'analyse des données
5.2.
Progrès dans les méthodologies d'analyse des données
5.3.
Analyse exploratoire des données (AED)
5.4.
Méthodologie d'analyse statistique
5.5.
Méthodologie d'analyse basée sur l'apprentissage automatique
5.6.
Méthodologie d'analyse basée sur l'apprentissage profond

Chapitre 6 Visualisation des données
6.1.
Qu'est-ce que la visualisation des données ?
6.2.
Bibliothèque Matplotlib
6.3.
Techniques de visualisation des données
6.4.
Techniques et style de visualisation des données
6.5.
Techniques avancées de visualisation des données
6.6.
Résumé pratique du concept

Chapitre 7 : Analyse des données structurées : Utilisation des données sur les vélos en libre-service de la ville de Séoul
7.1.
Aperçu pratique du projet
7.2.
Collecte et prétraitement des données
7.3.
analyse des données
7.4.
Analyse de liaison

Chapitre 8 : Analyse de données semi-structurées : Utilisation des données publiées sur les forums
8.1.
Aperçu pratique du projet
8.2.
Collecte de données
8.3.
prétraitement des données textuelles
8.4.
Analyse des mots clés
8.5.
Classification et visualisation de textes

Chapitre 9 : Analyse des données non structurées : Utilisation des données photographiques de mode
9.1.
Aperçu pratique du projet
9.2.
Collecte de données
9.3. Analyse d'images à l'aide de VLM
9.4. Analyse des mots-clés et rédaction de rapports à l'aide d'un LLM

Chapitre 10 : Analyse des données de séries chronologiques : Utilisation des données sur les cours boursiers
10.1.
Aperçu pratique du projet
10.2.
Collecte de données
10.3.
Analyse des séries chronologiques financières
10.4.
Prédiction fondée sur les prophètes
10.5. Prédiction basée sur GBRT
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 25 juillet 2025
- Nombre de pages, poids, dimensions : 540 pages | 188 × 257 × 35 mm
- ISBN13 : 9788920052859
- ISBN10 : 8920052859

Vous aimerez peut-être aussi

카테고리