Passer aux informations sur le produit
Analyse de données en auto-apprentissage avec Python
Analyse de données en auto-apprentissage avec Python
Description
Introduction au livre
L'autoformation suffit ! Ce tutoriel d'analyse de données vous apprend à le faire vous-même, comme lors d'une séance de tutorat individuelle.
Ce livre est conçu pour aider les débutants qui apprennent l'analyse de données en autodidacte à en maîtriser les bases.
Je comprends parfaitement le sentiment de confusion des débutants qui ne savent même pas ce qu'ils ignorent, c'est pourquoi je me contente de souligner les points clés, comme le ferait un professeur particulier.
Dès l'instant où vous ouvrirez le livre et jusqu'à la dernière page, vous vous sentirez en confiance et assuré de pouvoir apprendre l'analyse de données par vous-même !

Un livre personnalisé pour débutants, validé par des bêta-lecteurs et créé ensemble.
Nous avons travaillé avec des bêta-lecteurs pour déterminer le niveau de difficulté, la longueur et les éléments d'apprentissage adaptés aux débutants, et nous avons activement tenu compte de ces conclusions.
Les termes et concepts difficiles sont réexpliqués, et les explications complexes sont illustrées par des schémas faciles à comprendre.
Le principal atout de ce livre est qu'il reflète tout au long de son contenu le point de vue du débutant et celui de nombreux débutants qui ont « étudié par eux-mêmes ».


indice
Chapitre 1 : Introduction à l'analyse des données

01-1 Qu'est-ce que l'analyse de données ?
Analyse des données et science des données
__Analyste de données
Outils d'analyse des données
[En savoir plus] Exploration de données et apprentissage automatique
[Points clés résumés en trois mots-clés]
[Package clé essentiel pour l'apprentissage]
[Problème de confirmation]

01-2 Google Colab et Jupyter Notebook
__Google Colab
__ordinateur portable
[En savoir plus] Format Markdown
[Points clés résumés en 5 mots-clés]
[Barre d'outils pour organiser le texte en tableaux]
[Problème de confirmation]

01-3 Quel sera le succès de ce livre ?
__Trouver des données de livres
__Vérification des données dans Colab
Générer un fichier CSV avec Python
__Utilisation des DataFrames : Pandas
__[Processus de résolution de problèmes] Recherche, chargement et lecture des données appropriées
[En savoir plus] Sites représentatifs pour les ensembles de données publics et les forums populaires
[Points clés résumés en 5 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 2 Collecte de données

02-1 Utilisation de l'API
Qu'est-ce qu'une API ?
Gestion des données JSON en Python
Gestion des données XML en Python
Trouver les livres les plus populaires auprès des jeunes de 20 à 30 ans grâce à une API
__[Processus de dépannage] Récupération de données sur le Web avec des API publiques
[Points clés résumés en quatre mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

02-2 Utilisation du web scraping
Trouvez le numéro de page du livre
__Obtenir la page de résultats de recherche
Extraction de données à partir de HTML : Beautiful Soup
__Obtenez le nombre total de pages du livre
Éléments à surveiller lors du scraping du web
__[Processus de dépannage] Collecte de code HTML par extraction de données Web
[En savoir plus] Paramètres de la fonction merge()
[Points clés résumés en deux mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 3 Nettoyage des données

03-1 Suppression des données inutiles
Supprimer __colonne
Supprimer __ ligne
__Trouver les lignes en double
Collecte par groupe
__Mettre à jour les données originales
__[Processus de dépannage] Création d'une fonction de traitement par lots
[Points clés organisés en 6 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

03-2 Correction des données incorrectes
__Vérifiez le résumé des informations du cadre de données
Gestion des valeurs manquantes
__Expression régulière
__Remplacer les valeurs incorrectes
__Complétez les informations manquantes
__[Processus de résolution de problèmes] Comprendre et affiner correctement les données
[Points clés résumés en deux mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 4 : Synthèse des données

04-1 Résumé avec statistiques
__Obtenir des statistiques descriptives
__Trouvez la moyenne
__Trouver la médiane
__Trouver les valeurs minimales et maximales
Trouver l'ambiance __
__Déterminer la variance
__Calcul de l'écart type
__Trouvez la valeur la plus fréquente
__[Processus de résolution de problèmes] Obtention de statistiques descriptives à partir d'un cadre de données
[En savoir plus] Fonctions de statistiques descriptives de NumPy
[Points clés organisés en 6 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

04-2 Résumé de la distribution
__Tracer un nuage de points
__Tracer un histogramme
Dessiner une barbe en boîte
__[Processus de résolution de problèmes] Représentation visuelle des statistiques
[En savoir plus] Fonctions graphiques Pandas
[Points clés organisés en 6 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 5 : Visualisation des données

05-1 Apprendre les éléments de base de Matplotlib
__Objet Figure
objet __rcParams
Impression de plusieurs sous-graphiques
[Points clés résumés en 5 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

05-2 Tracé de graphiques linéaires et de graphiques à barres
Calculer le nombre de livres publiés par année
Calculer le nombre de livres par sujet
Tracer un graphique linéaire
__Tracer un graphique à barres
__[Processus de résolution de problèmes] Création de graphiques linéaires et à barres avec Matplotlib
[En savoir plus (1)] Impression et enregistrement d'images
[En savoir plus (2)] Enregistrer un graphique sous forme d'image
[Points clés résumés en deux mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 6 : Représentation de données complexes

06-1 Décoration de graphes avec des API orientées objet
Méthode __pyplot et méthode API orientée objet
__Imprimer du coréen sur un graphique
__Élaborer un nuage de points représentant les livres publiés par éditeur
__[Processus de résolution de problèmes] Amélioration des graphiques grâce aux différentes fonctionnalités de Matplotlib
[Points clés résumés en trois mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

06-2 Apprentissage des fonctionnalités avancées de Matplotlib
Préparation du laboratoire
__Tracer plusieurs graphiques linéaires sur une seule figure
__Tracer plusieurs graphiques à barres sur une seule figure
__Tracer un diagramme circulaire
__Représenter graphiquement des sous-graphiques à l'aide de différents types de graphiques
__[Processus de résolution de problèmes] Dessiner des graphiques complexes avec Matplotlib
[En savoir plus] Dessiner plusieurs graphiques avec Pandas
[Points clés résumés en 5 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

Chapitre 7 Vérification et prédiction

07-1 Inférence statistique
__Qu'est-ce qu'un test paramétrique ?
__Calcul du score standard
__Apprendre le théorème central limite
__Estimation de l'étendue d'une moyenne de population : intervalles de confiance
Vérification de la signification statistique : Tests d’hypothèses
Tests d'hypothèses lorsque les distributions ne sont pas normales : tests de permutation
[Processus de résolution de problèmes] Prise de décisions à partir de données d'échantillon
[Points clés organisés en 6 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]
[Problème de confirmation]

07-2 Prédiction par apprentissage automatique
Termes d'apprentissage automatique à connaître
__Entraînement du modèle
Évaluation du modèle entraîné : coefficient de détermination
Prédiction des valeurs continues : régression linéaire
Prédiction des catégories : régression logistique
__[Processus de résolution de problèmes] Prédiction du nombre de prêts en fonction du nombre de livres
[En savoir plus] Évaluation des modèles avec l'erreur quadratique moyenne et l'erreur absolue moyenne
[Points clés organisés en 8 mots-clés]
[Fonctions et méthodes principales résumées dans un tableau]

Annexe A Pour aller plus loin : Bases de données et SQL
Annexe B Fonctions et méthodes apprises dans ce livre
Annexe C Épilogue

__Cochez la bonne réponse à la question
__Trouver

Image détaillée
Image détaillée 1

Avis de l'éditeur
À qui s'adresse ce livre ?

Les personnes non spécialisées qui ne savent pas comment débuter l'analyse de données
ㆍDébutants en Python qui souhaitent apprendre Python et acquérir ensuite une expérience pratique significative
Développeurs qui connaissent la programmation mais qui ont besoin de comprendre l'analyse (statistiques)
• Les travailleurs qui souhaitent tirer des résultats significatifs des données et les appliquer à la planification ou au marketing.
Toute personne intéressée par les carrières d'analystes de données et de scientifiques des données

Tout d'abord, une conception pédagogique solide qui répète systématiquement la « structure en 7 étapes adaptée aux débutants » !

Ce livre est structuré pour vous aider à mémoriser naturellement les concepts fondamentaux de l'analyse de données en les apprenant de manière répétée en sept étapes.
Dans [Mots-clés] et [Avant de commencer], nous nous échauffons avec des concepts représentatifs pour le sujet de chaque section, et après avoir passé en revue la théorie et la pratique, nous les passons tous en revue en une seule fois dans la conclusion avec [Points clés] et [Questions de vérification].
Si vous suivez le programme, qui vous permet d'étudier à votre rythme, jusqu'au bout, même les débutants en analyse de données pourront terminer le livre sans difficulté !

Deuxièmement, apprenez l'analyse de données « réelle » en résolvant des problèmes dans des histoires intéressantes qui pourraient réellement se produire !

Nous avons conçu ce cours pour vous apprendre à gérer les données à travers des histoires captivantes, vous permettant d'apprendre de manière immersive, même si vous ne connaissez pas Python et les données.
Ce livre vous explique comment collecter des données directement dans le monde qui vous entoure, notamment en utilisant des API et le web scraping pour récupérer des données à partir de bibliothèques physiques et de sites web de librairies en ligne.
Vous pouvez également acquérir des compétences en programmation en utilisant diverses bibliothèques Python utiles pour l'analyse de données, telles que Pandas, NumPy et Matplotlib, et construire une base solide en matière de connaissances statistiques fondamentales.
Enfin, vous aurez un aperçu de l'apprentissage automatique, qui prédit l'avenir à partir d'analyses, ce qui vous permettra d'apprendre l'analyse de données du début à la fin.

Troisièmement, nous proposons des cours vidéo et un site d'apprentissage pour vous donner les moyens de maîtriser le « honkong » !

Pour les débutants qui ont encore du mal à apprendre uniquement à partir de livres, nous proposons également des vidéos de cours dispensés directement par l'auteur.
Nous mettons également à votre disposition un site d'apprentissage vous permettant de poser des questions à l'auteur à tout moment pendant vos études.
Non seulement l'auteur répondra personnellement à chaque question, mais vous aurez également accès aux dernières technologies et informations.
De plus, nous animons un groupe d'auto-apprentissage pour les personnes qui souhaitent étudier seules mais qui manquent de confiance en elles.
En rejoignant le groupe d'étude de Hong Kong, vous pourrez terminer le cours sans abandonner.
▶ https://hongong.hanbit.co.kr
▶ https://github.com/rickiepark/hg-da

Quatrièmement, nous fournissons une [Note de terminologie] que vous pouvez facilement consulter à tout moment et n'importe où !

Nous fournissons une [Note de terminologie] qui regroupe uniquement les concepts et termes clés que vous devez retenir.
La difficulté rencontrée par les débutants en programmation tient à la terminologie qui leur est inconnue.
Cependant, ce n’est pas difficile, mais plutôt déroutant en raison du manque de familiarité, alors chaque fois que vous avez du mal à vous souvenir d’un terme ou d’un concept, n’hésitez pas à ouvrir la [Note de terminologie].
Outre les termes présentés, vous pouvez également prendre plaisir à compléter votre propre glossaire en y ajoutant de nouveaux termes.

Un mot des bêta-lecteurs qui l'ont lu en premier

L'histoire se déroule en suivant le processus réel d'analyse des données, ce qui la rend facile à lire, et les études de cas fictives la rendent amusante à lire.
Kim Jin-hyung

J'ai apprécié la façon dont les méthodes d'analyse des données étaient expliquées de manière simple et compréhensible.
Les explications et les exemples sont si bien faits que j'ai envie d'essayer de fabriquer et d'appliquer moi-même ces choses simples.
_Doyoon

Ce livre se distingue des autres ouvrages par ses explications sur les API, JSON et le web scraping, et par des exemples adaptés à une utilisation dans des environnements réels.
Kim Hyung-hoon

J'ai pu constater que même les débutants peuvent y arriver facilement grâce aux explications claires et simples et aux schémas intuitifs.
Lee Jong-won

Les mots clés et les fonctions sont résumés pour chaque section, ce qui vous permet de revoir ce que vous avez appris jusqu'à présent et de construire une base solide.
_Jeon Ji-min

ㆍApprenez l'analyse de données Python avec des termes et concepts essentiels, des explications visuelles et du code simple écrit à la main.
Hong Chang-soo
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 2 janvier 2023
Nombre de pages, poids, dimensions : 496 pages | 1 050 g | 188 × 257 × 22 mm
- ISBN13 : 9791169210287
- ISBN10 : 1169210287

Vous aimerez peut-être aussi

카테고리