Passer aux informations sur le produit
Ingénierie de l'IA
Ingénierie de l'IA
Description
Introduction au livre
Chip Huyen, expert de premier plan en IA, apporte son expérience de terrain et son expertise acquises chez NVIDIA, Snorkel AI et Stanford !
Au-delà de l'utilisation des modèles : un guide pratique de la conception de services d'IA

« Quel type de conception convient au niveau du produit ? »


Nous sommes entrés dans une ère où n'importe qui peut facilement créer des applications d'IA en utilisant le modèle Foundation.
Mais lorsqu'il s'agit de construire des systèmes de production concrets, se contenter d'effectuer des appels d'API ou d'écrire des invites ne suffit pas.
Pour transformer les idées en services satisfaisants pour l'utilisateur, les applications d'IA doivent être conçues et exploitées de manière fiable et efficace dans un contexte d'environnements de modèles et de piles technologiques en constante évolution, augmentant ainsi le potentiel d'utilisation et les risques associés.

Ce livre est un guide pratique d'ingénierie de l'IA qui apporte des réponses claires aux préoccupations de ce secteur.
Cet ouvrage explique de manière systématique l'ensemble du processus de connexion des modèles d'IA aux services du monde réel, depuis diverses techniques telles que l'ingénierie rapide, RAG, le réglage fin, les agents et la conception d'ensembles de données jusqu'à la conception de métriques d'évaluation, l'optimisation de l'infrastructure et la mise en place de boucles d'amélioration grâce aux commentaires des utilisateurs.
Le modèle Foundation ne se contente pas d'expliquer « comment l'utiliser », il vous guide à travers les problèmes qu'il peut résoudre et la manière de les concevoir et de les développer.

Je recommande ce livre à tous ceux qui envisagent de passer des modèles fondamentaux à la conception, à l'exploitation et à l'amélioration de produits d'IA fiables.
  • Vous pouvez consulter un aperçu du contenu du livre.
    Aperçu

indice
Chapitre 1 : Introduction aux applications de l'IA à l'aide de modèles de base
1.1 L'essor de l'ingénierie de l'IA
__1.1.1 Des modèles de langage aux modèles de langage à grande échelle
1.1.2 Des modèles de langage à grande échelle aux modèles de base
1.1.3 Du modèle de base à l'ingénierie de l'IA
_1.2 Cas d'utilisation du modèle de base
__1.2.1 Codage
1.2.2 Création d'images et de vidéos
__1.2.3 Écriture
1.2.4 Éducation
__1.2.5 Bot conversationnel
1.2.6 Agrégation d'informations
1.2.7 Systématisation des données
__1.2.8 Automatisation des flux de travail
_1.3 Planification des applications d'IA
1.3.1 Évaluation des cas d'utilisation
1.3.2 Définir les attentes
__1.3.3 Plan d'étape
1.3.4 Maintenance
_1.4 Pile d'ingénierie IA
1.4.1 Les trois couches de l'IA
1.4.2 Ingénierie de l'IA vs. Ingénierie du ML
1.4.3 Ingénierie en IA vs. Ingénierie Full-Stack
_1.5 En conclusion

Chapitre 2 : Comprendre le modèle de base
2.1 Données d'entraînement
__2.1.1 Modèle multilingue
__2.1.2 Modèle spécifique au domaine
_2.2 Modélisation
__2.2.1 Architecture du modèle
__2.2.2 Taille du modèle
_2.3 Après l'étude
__2.3.1 Réglage fin de la carte
__2.3.2 Réglage fin des préférences
_2.4 Échantillonnage
__2.4.1 Principes de base de l'échantillonnage
2.4.2 Stratégie d'échantillonnage
__2.4.3 Opérations sur les points de test
__2.4.4 Sortie structurée
__2.4.5 Caractéristiques probabilistes de l'IA
_2.5 En conclusion

Chapitre 3 Méthodologie d'évaluation
_3.1 Difficultés d'évaluation des modèles de fondation
_3.2 Comprendre les métriques de modélisation du langage
3.2.1 Entropie
3.2.2 Entropie croisée
3.2.3 Bits par caractère et bits par octet
__3.2.4 Perplexité
3.2.5 Analyse de la perplexité et exemples d'application
3.3 Évaluation précise
3.3.1 Correction fonctionnelle
3.3.2 Mesure de la similarité des données de référence
__3.3.3 Introduction à l'intégration
_3.4 Évaluateur d'IA
__3.4.1 Pourquoi utiliser des évaluateurs IA ?
3.4.2 Comment utiliser l'évaluateur d'IA
3.4.3 Limites des évaluateurs d'IA
3.4.4 Modèles pouvant servir d’évaluateurs
3.5 Classement des modèles par évaluation comparative
3.5.1 Tâches d'évaluation comparative
3.5.2 L'avenir de l'évaluation comparative
3.6 En conclusion

Chapitre 4 : Évaluation des systèmes d'IA
_4.1 Critères d'évaluation
4.1.1 Capacités spécifiques au domaine
4.1.2 Capacité de création
4.1.3 Capacité à suivre des instructions
4.1.4 Coût et latence
4.2 Sélection du modèle
4.2.1 Processus de sélection du modèle
4.2.2 Développement de votre propre modèle vs. achat d'un modèle commercial
__4.2.3 Exploration des points de référence publics
_4.3 Conception du processus d'évaluation
4.3.1 Étape 1 : Évaluer tous les composants du système
4.3.2 Étape 2 : Élaboration des lignes directrices d’évaluation
4.3.3 Étape 3 : Définition des méthodes d’évaluation et des données
4.4 En conclusion

Chapitre 5 : Ingénierie rapide
_5.1 Introduction des invites
5.1.1 Apprentissage en contexte : apprentissage zéro-exemple et apprentissage avec peu d’exemples
5.1.2 Messages système et messages utilisateur
5.1.3 Longueur et efficacité du contexte
5.2 Meilleures pratiques d'ingénierie rapide
5.2.1 Rédiger des instructions claires et explicites
5.2.2 Fournir un contexte suffisant
5.2.3 Décomposition des tâches complexes en sous-tâches plus simples
5.2.4 Laissez le modèle réfléchir
__5.2.5 Répéter et améliorer les invites
__5.2.6 Évaluation des outils d'ingénierie rapide
5.2.7 Organisation et gestion des versions des invites
5.3 Ingénierie défensive réactive
__5.3.1 Invites exclusives et invites inversées d'ingénierie
5.3.2 Débruitage et injection rapide
5.3.3 Extraction d'informations
5.3.4 Défense contre les attaques rapides
5.4 En conclusion

Chapitre 6 RAG et agents
_6.1 CHIFFON
__6.1.1 Architecture RAG
__6.1.2 Algorithme de recherche
6.1.3 Optimisation pour les moteurs de recherche
__6.1.4 RAG Au-delà du texte
_6.2 Agent
6.2.1 Aperçu de l'agent
__6.2.2 Outils
6.2.3 Planification
6.2.4 Types de défaillance des agents et évaluation
_6.3 Mémoire
6.4 En conclusion

Chapitre 7 Réglage fin
7.1 Aperçu du réglage fin
7.2 Quand un réglage fin est nécessaire
7.2.1 Pourquoi effectuer un réglage fin ?
7.2.2 Pourquoi il ne faut pas effectuer de réglages fins
7.2.3 Réglage fin et RAG
7.3 Goulot d'étranglement de la mémoire
7.3.1 Rétropropagation et paramètres apprenables
7.3.2 Calculs de mémoire
7.3.3 Représentation numérique
__7.3.4 Quantification
_7.4 Techniques de réglage fin
__7.4.1 Réglage fin efficace des paramètres
__7.4.2 Fusion de modèles et réglage fin multitâche
__7.4.3 Tactiques de mise au point
7.5 En conclusion

Chapitre 8 : Ingénierie des ensembles de données
8.1 Conservation des données
8.1.1 Qualité des données
8.1.2 Couverture des données
8.1.3 Volume de données
8.1.4 Collecte et annotation des données
_8.2 Augmentation et synthèse des données
__8.2.1 Pourquoi effectuer une synthèse de données ?
8.2.2 Techniques traditionnelles de génération de données
8.2.3 Synthèse de données basée sur l'IA
8.2.4 Distillation modèle
8.3 Traitement des données
8.3.1 Inspection des données
8.3.2 Déduplication des données
8.3.3 Nettoyage et filtrage des données
8.3.4 Correspondance des formats de données
8.4 En conclusion

Chapitre 9 Optimisation de l'inférence
_9.1 Comprendre l'optimisation de l'inférence
__9.1.1 Aperçu de l'inférence
__9.1.2 Métriques de performance d'inférence
__9.1.3 Accélérateur d'IA
_9.2 Optimisation de l'inférence
__9.2.1 Optimisation du modèle
__9.2.2 Optimisation du service d'inférence
_9.3 En conclusion

Chapitre 10 : Architecture d’ingénierie de l’IA et retours des utilisateurs
_10.1 Architecture d'ingénierie de l'IA
__10.1.1 Étape 1 : Enrichissement du contexte
__10.1.2 Étape 2 : Introduction des garde-fous
__10.1.3 Étape 3 : Ajout d’un routeur et d’une passerelle modèles
__10.1.4 Étape 4 : Réduction de la latence grâce aux caches
__10.1.5 Étape 5 : Ajout du modèle d’agent
10.1.6 Surveillance et observabilité
__10.1.7 Orchestration du pipeline d'IA
_10.2 Commentaires des utilisateurs
10.2.1 Extraction des retours interactifs
__10.2.2 Conception du système de rétroaction
10.2.3 Limites du feedback
10.3 En conclusion

Image détaillée
Image détaillée 1

Avis de l'éditeur
De la planification à la conception et à l'exploitation des systèmes d'IA, combler le fossé entre la théorie et la réalité
Une nouvelle norme qui capture l'essence de l'ingénierie de l'IA de manière réaliste et efficace.
Si le prototypage d'une idée est devenu plus facile, la transformer en un produit d'IA fiable est une toute autre histoire.
Les connaissances fragmentées et dispersées sur le web, ainsi que l'IA générative seule, ne suffisent pas à relever les défis rencontrés dans les environnements de production complexes.
L'ouvrage « Ingénierie de l'IA » débute précisément à ce stade, offrant un guide pratique de pointe couvrant l'ensemble du processus de planification, de conception et d'exploitation des applications d'IA à l'aide du modèle Foundation. Plutôt que de présenter une théorie abstraite, il propose un cadre systématique qui comble les lacunes du domaine.
Ce livre relie et explique de manière organique les connaissances essentielles pour les praticiens, depuis l'ingénierie rapide, le RAG, le réglage fin, l'optimisation de l'inférence et la conception d'architecture.
Plutôt que de se contenter d'énumérer les technologies, il aborde les défis et le contexte décisionnel auxquels sont confrontées les équipes réelles, offrant ainsi une vision équilibrée de la technologie et des réalités du terrain.
Il s'agit d'une structure qui offre à la fois des connaissances pratiques applicables immédiatement sur le terrain et les principes nécessaires à une croissance à long terme.

Ce qui distingue avant tout cet ouvrage, c'est qu'il aborde l'évaluation comme un sujet central, et non comme une simple annexe. Puisque la qualité et la fiabilité des systèmes d'IA ne peuvent être garanties sans évaluation, deux chapitres sont consacrés aux méthodologies d'évaluation permettant d'assurer performance et fiabilité.
Cela vous permettra d'établir des principes de prise de décision fondés sur des données, et non sur la seule « intuition ». À l'instar de son prédécesseur, « Conception de systèmes d'apprentissage automatique », cet ouvrage constituera un manuel et un ouvrage de référence solides, jetant les bases d'une approche qui restera inébranlable même dans l'écosystème de l'IA en constante évolution.

● Présenter des concepts et une feuille de route clairs : définir en quoi l’ingénierie de l’IA diffère de l’ingénierie ML traditionnelle et fournir une vision et une stratégie holistiques pour développer des applications d’IA réussies.
● Stratégies clés pour maximiser les performances et l'efficacité : va au-delà de la simple énumération des dernières techniques comme l'ingénierie rapide, RAG et le réglage fin, et présente des critères clairs et des compromis sur quand utiliser quoi.
● Renforcement des capacités de prise de décision fondée sur les données : Nous fournissons une méthode de conception de pipeline d’évaluation systématique et un guide pratique de sélection d’indicateurs pour vous aider à sélectionner la combinaison optimale de modèles et de technologies afin de favoriser la réussite de votre projet parmi de nombreux modèles et technologies.
● Savoir-faire opérationnel pratique : Apprenez des méthodes d'optimisation pratiques pour le déploiement et l'exploitation de systèmes d'IA dans des contraintes réalistes telles que la latence et le coût.
● Créer un système durable : Apprenez à collecter et à prendre en compte systématiquement les commentaires des utilisateurs afin de créer un système d’IA qui s’améliore en permanence, plutôt que d’être construit une seule fois.

Contenu principal

● Analyse du concept d'ingénierie de l'IA et de ses différences avec l'ingénierie du ML
● Défis rencontrés lors du développement d'applications et stratégies de solution
● Techniques clés telles que l'ingénierie des prompts, RAG, le réglage fin, les agents et la conception d'ensembles de données
● Optimisation du déploiement et de l'exploitation du modèle en tenant compte du temps de latence et du coût
● Comment sélectionner les modèles, les ensembles de données, les critères d'évaluation et les indicateurs appropriés à l'objectif
● Mettre en place un cycle d'amélioration reproductible basé sur les retours des utilisateurs

À qui s'adresse ce livre ?

● Les ingénieurs en IA/ML qui souhaitent mettre en œuvre ou étendre les modèles LLM et les modèles de base dans leur pratique
● Les data scientists et les chercheurs qui souhaitent appliquer l'évaluation de modèles, la conception d'ensembles de données et les techniques de réglage fin à des projets concrets.
● Les chefs de produit et les planificateurs qui doivent comprendre le processus de développement d'applications d'IA et collaborer avec l'équipe
● Les développeurs en apprentissage automatique sont confrontés à de nouveaux défis lors de leur transition du ML traditionnel au développement basé sur LLM.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 30 septembre 2025
- Nombre de pages, poids, dimensions : 580 pages | 183 × 235 × 35 mm
- ISBN13 : 9791169214278
- ISBN10 : 1169214274

Vous aimerez peut-être aussi

카테고리