
Développement d'agents IA (LLM) : Apprenez à travers 7 projets
Description
Introduction au livre
L'ère des agents IA est arrivée.
Un agent est une intelligence artificielle capable de comprendre le langage naturel, de générer des réponses appropriées et d'effectuer des tâches spécifiques.
Au-delà d'être un simple outil de création de contenu, il constitue un maillon essentiel qui relie harmonieusement des tâches complexes.
Cet ouvrage explore en détail la création d'un service de livraison de fleurs, depuis le cadre technique et les outils de développement de l'agent jusqu'aux exemples de projets concrets et aux avancées technologiques de pointe.
De plus, en créant sept agents performants, nous analysons en détail leur conception et leur mise en œuvre, et présentons même les perspectives et les tendances futures du développement d'agents. En tirant parti de technologies de pointe telles que GPT-4, l'API OpenAI Assistants, LangChain, LlamaIndex et MetaGPT, nous explorerons les rôles remarquables que les agents peuvent jouer dans l'automatisation de bureau, la planification intelligente et la gestion des risques.
Assistez par vous-même aux performances incroyables de l'agent et découvrez les possibilités infinies de l'ère de l'IA.
Un agent est une intelligence artificielle capable de comprendre le langage naturel, de générer des réponses appropriées et d'effectuer des tâches spécifiques.
Au-delà d'être un simple outil de création de contenu, il constitue un maillon essentiel qui relie harmonieusement des tâches complexes.
Cet ouvrage explore en détail la création d'un service de livraison de fleurs, depuis le cadre technique et les outils de développement de l'agent jusqu'aux exemples de projets concrets et aux avancées technologiques de pointe.
De plus, en créant sept agents performants, nous analysons en détail leur conception et leur mise en œuvre, et présentons même les perspectives et les tendances futures du développement d'agents. En tirant parti de technologies de pointe telles que GPT-4, l'API OpenAI Assistants, LangChain, LlamaIndex et MetaGPT, nous explorerons les rôles remarquables que les agents peuvent jouer dans l'automatisation de bureau, la planification intelligente et la gestion des risques.
Assistez par vous-même aux performances incroyables de l'agent et découvrez les possibilités infinies de l'ère de l'IA.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
Préface du traducteur xi
Recommandation XIII
Revue du lecteur bêta xiv
Recommandation XVII
À partir de 19
À propos de ce livre xxiii
CHAPITRE 1 Qu'est-ce qu'un agent et pourquoi est-ce un agent ? 1
1.1 Une conférence qui stimule l'imagination : La vie 3.0 2
1.2 Alors, qu'est-ce qu'un agent exactement ? 6
1.3 Le cerveau de l'agent : les capacités de raisonnement général du LLM 11
Le cerveau humain est incroyable.
Agent pré-LLM 13
__LLM est le cerveau de l'agent 14
__Les sommets des attentes et les creux des déceptions 17
Connaissance, mémoire, compréhension, expression, raisonnement, réflexion, généralisation, perfectionnement personnel 20
Développement d'applications d'IA basées sur les capacités d'inférence de __LLM 24
1.4 Capacités de détection des agents : interaction linguistique et traitement multimodal 26
__Compétences en interaction linguistique 26
Capacité de traitement multimode 26
__Combiner les compétences d'interaction linguistique et les compétences de traitement multimodal 27
1.5 Capacités d'exécution de l'agent : capacité de sortie linguistique et capacité d'utilisation des outils 28
Capacité de production langagière 28
Capacité d'utilisation des outils 29
__Réalisation de l'intelligence concrète 30
1.6 Comment les agents améliorent l'efficacité dans chaque secteur 31
__Assistance automatisée aux tâches de bureau 33
__La révolution du service client 33
Recommandation personnalisée 34
Automatisation des processus et optimisation des ressources 34
__Changements dans les services médicaux 35
1.7 Nouveaux modèles commerciaux et changements apportés par les agents 37
Les huit prédictions clés de Gartner 38
__AaaS 39
Collaboration multi-agents 41
Intelligence artificielle auto-évolutive 42
__Développement de l'intelligence concrète 44
1.8 Résumé 45
CHAPITRE 2 Systèmes à base d'agents basés sur LLM 47
2.1 Quatre éléments clés d'un agent 47
2.2 Capacités de planification et de prise de décision des agents 51
2.3 Divers mécanismes de mémoire des agents 53
2.4 Technologie de base de l'agent : invocation d'outil 54
2.5 Moteur d'inférence de l'agent : Système basé sur ReAct 57
Qu'est-ce que ReAct ? 57
__Implémentation d'un agent simple à l'aide d'un système basé sur ReAct 61
Invite système basée sur __ReAct 65
__Créer une instance LLM 69
Définition de l'outil de recherche 70
__Création d'un agent ReAct 71
Exécution de l'agent __ReAct 72
2.6 Autres systèmes cognitifs à base d'agents 76
__Appel de fonction 76
__Planification et exécution 76
Question et réponse 76
__Révision critique 77
__Enchaînement d'accidents 77
__Arbre de la pensée 77
2.7 Résumé 78
CHAPITRE 3 API OpenAI, LangChain, LlamaIndex 81
3.1 Qu'est-ce que l'API OpenAI ? 83
__À propos d'une entreprise appelée OpenAI 83
__API OpenAI et développement d'agents 89
Exemple 92 d'un programme conversationnel utilisant l'API OpenAI
Exemple 101 de génération d'images utilisant l'API OpenAI
Notes sur l'utilisation de l'API OpenAI 103
3.2 Qu'est-ce que LangChain ? 106
__À propos de LangChain 107
Les six modules de LangChain 114
LangChain et développement d'agents 115
Comment utiliser __LangSmith 117
3.3 Qu'est-ce que LlamaIndex ? 120
À propos de __LlamaIndex 120
Développement d'une IA basée sur LlamaIndex et la génération de recherche augmentée 121
Exemple 126 de développement d'un index de lamas simple
3.4 Résumé 130
CHAPITRE 4 Agent 1 : Implémentation automatisée d’Office – Création de présentations à l’aide de l’API Assistants et du modèle DALL·E 3 132
4.1 Qu'est-ce que l'assistant d'OpenAI ? 134
4.2 Essai de l'assistant dans l'environnement de test sans programmation 136
4.3 Un exemple simple de l'API Assistants 142
__Créer un assistant 143
__Créer un flux de dialogue 149
__Ajouter le message 153
__Exécution de l'assistant 157
Afficher la réponse 163
4.4 Création d'une présentation virtuelle simple 167
Collecte et organisation des données 168
__Création d'un assistant OpenAI 169
Générer automatiquement des graphiques d'analyse de données 172
Générer automatiquement des informations sur les données 179
Générer automatiquement les titres des pages 182
Création de l'image de la première page d'une présentation à l'aide du modèle __DALL·E 3 183
Générer automatiquement des présentations 185
4.5 Résumé 191
CHAPITRE 5 Agent 2 : Moteur de sélection multifonctionnel - Appel de fonction 193
5.1 Fonction 195 d'OpenAI
Qu'est-ce que l'outil __Function ? 195
__Pourquoi la description de l'outil de fonction est importante 196
Signification de l'outil de fonction __, exemple de définition 198
Qu'est-ce qu'un appel de fonction ? 199
5.2 Définition des fonctions dans les terrains de jeu 201
5.3 Implémentation des appels de fonction à l'aide de l'API Assistants 205
Création d'un assistant pouvant utiliser l'outil __function 207
__Exécuter directement le programme d'assistance sans appeler la fonction 210
__Terminer la boucle lorsque la session en cours est dans un état nécessitant une action 219
__Récupération des informations d'attribut renvoyées par l'assistant 221
__Appel d'une fonction via les informations de retour d'une fonction auxiliaire 223
Soumettez les résultats et terminez les tâches 225
5.4 Implémentation des appels d'outils à l'aide de l'API ChatCompletion 231
__Initialisation de la conversation et définition des fonctions disponibles 232
Premier appel LLM : après avoir transmis le contenu de la conversation et la définition de l’outil, obtenir une réponse 233
Appel de l'outil sélectionné par le modèle et création d'un nouveau message 237
Deuxième appel pour le LLM : Réception de la réponse finale 241
5.5 Résumé 244
CHAPITRE 6 Agent 3 : Collaboration entre raisonnement et action – Mise en œuvre de la tarification automatique à l’aide du framework ReAct de LangChain 246
6.1 Revue du système basé sur ReAct 247
6.2 Implémentation des agents ReAct dans LangChain 251
6.3 Outils et boîte à outils de LangChain 253
6.4 Agent ReAct 256 qui fixe les prix des fleurs
6.5 Analyse approfondie du mécanisme d'exécution d'AgentExecutor 263
Définition d'un point d'arrêt dans __AgentExecutor 263
Première impression : le modèle décide de rechercher 267
Première action : effectuer une recherche à l’aide des outils 272
Deuxième accident : le modèle décide de calculer 276
Deuxième action : Effectuer des calculs à l'aide d'outils 277
Troisième réflexion : Le modèle accomplit la tâche 279
6.6 Résumé 280
CHAPITRE 7 Agent 4 : Séparation de la planification et de l’exécution – Création d’un planificateur intelligent à l’aide des agents de planification et d’exécution de LangChain 282
7.1 Propositions de stratégies de planification et de résolution 284
7.2 Agent de planification et d'exécution de LangChain 290
7.3 Mise en œuvre de la gestion logistique à l'aide d'agents de planification et d'exécution 291
Définition d'un outil pour l'allocation automatique des stocks dans l'agent 291
Création d'un plan et d'un agent d'exécution et tentative de résolution d'une tâche insoluble 294
__Spécifiez les demandes pour que les agents accomplissent les tâches 303
7.4 Du mono-agent au multi-agents 309
7.5 Résumé 309
CHAPITRE 8 Agent 5 : Extraction et intégration des connaissances – Mise en œuvre de la génération de recherche augmentée à l’aide de LlamaIndex 311
8.1 Qu'est-ce que la génération d'augmentation de la recherche ? 313
__Ingénierie des prompts, génération de recherche augmentée, réglage fin 314
__Pipeline 316 dans la partie recherche d'un point de vue technique
__Le processus de génération de recherche augmentée du point de vue de l'utilisateur 317
8.2 Génération d'augmentation de la recherche et agent 319
8.3 Recherche de rapports financiers à l'aide de l'agent de génération de recherche augmentée ReAct 321
Téléchargement du fichier de rapport financier d'une entreprise de commerce électronique 321
Conversion des données de rapports financiers en données vectorielles 322
Création d'un moteur de requêtes et d'outils 324
Configuration de LLM, le moteur de génération de texte 325
Création d'un agent de récupération d'informations financières 325
8.4 Résumé 327
CHAPITRE 9 Agent 6 : Exploration des agents populaires sur GitHub – AutoGPT, BabyAGI, CAMEL 329
9.1 AutoGPT 330
__Présentation d'AutoGPT 330
Exercice AutoGPT 332
9.2 BabyAGI 338
__Aperçu de BabyAGI 338
__BabyAGI Exercice 341
9.3 CAMEL 356
__CAMEL Aperçu 356
Scénario 358 de CAMEL Paper sur les transactions boursières
Exercice 364 du chameau
9.4 Résumé 373
CHAPITRE 10 Agent 7 : Systèmes multi-agents - AutoGen, MetaGPT 375
10.1 AutoGen 376
Présentation d'AutoGen 377
__AutoGen Pratique 379
10.2 MetaGPT 386
Présentation de MetaGPT 386
Exercice MetaGPT 388
10.3 Résumé 395
ANNEXE A : Le berceau des agents de nouvelle génération : nouvelles idées issues de la littérature académique 397
A.1 Deux articles de haute qualité présentant une analyse complète des agents 398
A.2 Articles recommandés : Apprentissage autonome des agents, Coopération multi-agents, Évaluation de la fiabilité des agents, Déploiement de systèmes périphériques, Implémentation de l’intelligence incarnée 401
A.3 Résumé 402
En conclusion 404
Recherche 407
Recommandation XIII
Revue du lecteur bêta xiv
Recommandation XVII
À partir de 19
À propos de ce livre xxiii
CHAPITRE 1 Qu'est-ce qu'un agent et pourquoi est-ce un agent ? 1
1.1 Une conférence qui stimule l'imagination : La vie 3.0 2
1.2 Alors, qu'est-ce qu'un agent exactement ? 6
1.3 Le cerveau de l'agent : les capacités de raisonnement général du LLM 11
Le cerveau humain est incroyable.
Agent pré-LLM 13
__LLM est le cerveau de l'agent 14
__Les sommets des attentes et les creux des déceptions 17
Connaissance, mémoire, compréhension, expression, raisonnement, réflexion, généralisation, perfectionnement personnel 20
Développement d'applications d'IA basées sur les capacités d'inférence de __LLM 24
1.4 Capacités de détection des agents : interaction linguistique et traitement multimodal 26
__Compétences en interaction linguistique 26
Capacité de traitement multimode 26
__Combiner les compétences d'interaction linguistique et les compétences de traitement multimodal 27
1.5 Capacités d'exécution de l'agent : capacité de sortie linguistique et capacité d'utilisation des outils 28
Capacité de production langagière 28
Capacité d'utilisation des outils 29
__Réalisation de l'intelligence concrète 30
1.6 Comment les agents améliorent l'efficacité dans chaque secteur 31
__Assistance automatisée aux tâches de bureau 33
__La révolution du service client 33
Recommandation personnalisée 34
Automatisation des processus et optimisation des ressources 34
__Changements dans les services médicaux 35
1.7 Nouveaux modèles commerciaux et changements apportés par les agents 37
Les huit prédictions clés de Gartner 38
__AaaS 39
Collaboration multi-agents 41
Intelligence artificielle auto-évolutive 42
__Développement de l'intelligence concrète 44
1.8 Résumé 45
CHAPITRE 2 Systèmes à base d'agents basés sur LLM 47
2.1 Quatre éléments clés d'un agent 47
2.2 Capacités de planification et de prise de décision des agents 51
2.3 Divers mécanismes de mémoire des agents 53
2.4 Technologie de base de l'agent : invocation d'outil 54
2.5 Moteur d'inférence de l'agent : Système basé sur ReAct 57
Qu'est-ce que ReAct ? 57
__Implémentation d'un agent simple à l'aide d'un système basé sur ReAct 61
Invite système basée sur __ReAct 65
__Créer une instance LLM 69
Définition de l'outil de recherche 70
__Création d'un agent ReAct 71
Exécution de l'agent __ReAct 72
2.6 Autres systèmes cognitifs à base d'agents 76
__Appel de fonction 76
__Planification et exécution 76
Question et réponse 76
__Révision critique 77
__Enchaînement d'accidents 77
__Arbre de la pensée 77
2.7 Résumé 78
CHAPITRE 3 API OpenAI, LangChain, LlamaIndex 81
3.1 Qu'est-ce que l'API OpenAI ? 83
__À propos d'une entreprise appelée OpenAI 83
__API OpenAI et développement d'agents 89
Exemple 92 d'un programme conversationnel utilisant l'API OpenAI
Exemple 101 de génération d'images utilisant l'API OpenAI
Notes sur l'utilisation de l'API OpenAI 103
3.2 Qu'est-ce que LangChain ? 106
__À propos de LangChain 107
Les six modules de LangChain 114
LangChain et développement d'agents 115
Comment utiliser __LangSmith 117
3.3 Qu'est-ce que LlamaIndex ? 120
À propos de __LlamaIndex 120
Développement d'une IA basée sur LlamaIndex et la génération de recherche augmentée 121
Exemple 126 de développement d'un index de lamas simple
3.4 Résumé 130
CHAPITRE 4 Agent 1 : Implémentation automatisée d’Office – Création de présentations à l’aide de l’API Assistants et du modèle DALL·E 3 132
4.1 Qu'est-ce que l'assistant d'OpenAI ? 134
4.2 Essai de l'assistant dans l'environnement de test sans programmation 136
4.3 Un exemple simple de l'API Assistants 142
__Créer un assistant 143
__Créer un flux de dialogue 149
__Ajouter le message 153
__Exécution de l'assistant 157
Afficher la réponse 163
4.4 Création d'une présentation virtuelle simple 167
Collecte et organisation des données 168
__Création d'un assistant OpenAI 169
Générer automatiquement des graphiques d'analyse de données 172
Générer automatiquement des informations sur les données 179
Générer automatiquement les titres des pages 182
Création de l'image de la première page d'une présentation à l'aide du modèle __DALL·E 3 183
Générer automatiquement des présentations 185
4.5 Résumé 191
CHAPITRE 5 Agent 2 : Moteur de sélection multifonctionnel - Appel de fonction 193
5.1 Fonction 195 d'OpenAI
Qu'est-ce que l'outil __Function ? 195
__Pourquoi la description de l'outil de fonction est importante 196
Signification de l'outil de fonction __, exemple de définition 198
Qu'est-ce qu'un appel de fonction ? 199
5.2 Définition des fonctions dans les terrains de jeu 201
5.3 Implémentation des appels de fonction à l'aide de l'API Assistants 205
Création d'un assistant pouvant utiliser l'outil __function 207
__Exécuter directement le programme d'assistance sans appeler la fonction 210
__Terminer la boucle lorsque la session en cours est dans un état nécessitant une action 219
__Récupération des informations d'attribut renvoyées par l'assistant 221
__Appel d'une fonction via les informations de retour d'une fonction auxiliaire 223
Soumettez les résultats et terminez les tâches 225
5.4 Implémentation des appels d'outils à l'aide de l'API ChatCompletion 231
__Initialisation de la conversation et définition des fonctions disponibles 232
Premier appel LLM : après avoir transmis le contenu de la conversation et la définition de l’outil, obtenir une réponse 233
Appel de l'outil sélectionné par le modèle et création d'un nouveau message 237
Deuxième appel pour le LLM : Réception de la réponse finale 241
5.5 Résumé 244
CHAPITRE 6 Agent 3 : Collaboration entre raisonnement et action – Mise en œuvre de la tarification automatique à l’aide du framework ReAct de LangChain 246
6.1 Revue du système basé sur ReAct 247
6.2 Implémentation des agents ReAct dans LangChain 251
6.3 Outils et boîte à outils de LangChain 253
6.4 Agent ReAct 256 qui fixe les prix des fleurs
6.5 Analyse approfondie du mécanisme d'exécution d'AgentExecutor 263
Définition d'un point d'arrêt dans __AgentExecutor 263
Première impression : le modèle décide de rechercher 267
Première action : effectuer une recherche à l’aide des outils 272
Deuxième accident : le modèle décide de calculer 276
Deuxième action : Effectuer des calculs à l'aide d'outils 277
Troisième réflexion : Le modèle accomplit la tâche 279
6.6 Résumé 280
CHAPITRE 7 Agent 4 : Séparation de la planification et de l’exécution – Création d’un planificateur intelligent à l’aide des agents de planification et d’exécution de LangChain 282
7.1 Propositions de stratégies de planification et de résolution 284
7.2 Agent de planification et d'exécution de LangChain 290
7.3 Mise en œuvre de la gestion logistique à l'aide d'agents de planification et d'exécution 291
Définition d'un outil pour l'allocation automatique des stocks dans l'agent 291
Création d'un plan et d'un agent d'exécution et tentative de résolution d'une tâche insoluble 294
__Spécifiez les demandes pour que les agents accomplissent les tâches 303
7.4 Du mono-agent au multi-agents 309
7.5 Résumé 309
CHAPITRE 8 Agent 5 : Extraction et intégration des connaissances – Mise en œuvre de la génération de recherche augmentée à l’aide de LlamaIndex 311
8.1 Qu'est-ce que la génération d'augmentation de la recherche ? 313
__Ingénierie des prompts, génération de recherche augmentée, réglage fin 314
__Pipeline 316 dans la partie recherche d'un point de vue technique
__Le processus de génération de recherche augmentée du point de vue de l'utilisateur 317
8.2 Génération d'augmentation de la recherche et agent 319
8.3 Recherche de rapports financiers à l'aide de l'agent de génération de recherche augmentée ReAct 321
Téléchargement du fichier de rapport financier d'une entreprise de commerce électronique 321
Conversion des données de rapports financiers en données vectorielles 322
Création d'un moteur de requêtes et d'outils 324
Configuration de LLM, le moteur de génération de texte 325
Création d'un agent de récupération d'informations financières 325
8.4 Résumé 327
CHAPITRE 9 Agent 6 : Exploration des agents populaires sur GitHub – AutoGPT, BabyAGI, CAMEL 329
9.1 AutoGPT 330
__Présentation d'AutoGPT 330
Exercice AutoGPT 332
9.2 BabyAGI 338
__Aperçu de BabyAGI 338
__BabyAGI Exercice 341
9.3 CAMEL 356
__CAMEL Aperçu 356
Scénario 358 de CAMEL Paper sur les transactions boursières
Exercice 364 du chameau
9.4 Résumé 373
CHAPITRE 10 Agent 7 : Systèmes multi-agents - AutoGen, MetaGPT 375
10.1 AutoGen 376
Présentation d'AutoGen 377
__AutoGen Pratique 379
10.2 MetaGPT 386
Présentation de MetaGPT 386
Exercice MetaGPT 388
10.3 Résumé 395
ANNEXE A : Le berceau des agents de nouvelle génération : nouvelles idées issues de la littérature académique 397
A.1 Deux articles de haute qualité présentant une analyse complète des agents 398
A.2 Articles recommandés : Apprentissage autonome des agents, Coopération multi-agents, Évaluation de la fiabilité des agents, Déploiement de systèmes périphériques, Implémentation de l’intelligence incarnée 401
A.3 Résumé 402
En conclusion 404
Recherche 407
Image détaillée

Dans le livre
Les agents acquièrent des capacités de prise de décision dynamiques grâce à un système basé sur ReAct.
Lorsqu'un agent rencontre un problème qu'il ne peut résoudre avec ses seules connaissances internes, il effectue des recherches ou fait appel à des outils pour élargir ses connaissances.
Au-delà de cela, nous tirons parti de la flexibilité de divers outils pour manipuler et transformer de multiples ensembles de données, afin d'obtenir finalement les données nécessaires à la prise de décision.
Après chaque étape, l'agent observe le résultat et intègre les nouvelles informations dans son processus de décision suivant, faisant preuve d'un apprentissage et d'une adaptabilité remarquables.
--- p.79
La stratégie de LlamaIndex est légèrement différente de celle de LangChain.
LlamaIndex n'est pas si « grand et complet », mais il se concentre sur le développement d'une technologie de génération d'augmentation de recherche basée sur l'IA et sur la construction d'un système de génération d'augmentation de recherche (RAG) multi-locataire.
Les solutions d'entreprise basées sur LlamaIndex visent à supprimer les barrières technologiques et de sécurité et à permettre aux entreprises d'exploiter leurs données et d'améliorer leurs capacités de service.
Le travail de LlamaIndex ne se concentre pas seulement sur le développement technologique, mais aussi sur l'application de ces technologies à des entreprises réelles afin d'améliorer leur efficacité opérationnelle et l'expérience client.
--- p.120
Bien sûr, cela pourrait aussi s'expliquer par le fait que LangChain est devenu tellement massif et s'est développé de manière si exhaustive qu'il est devenu difficile de déterminer sa direction.
Il existe de nombreux cas où les détails font particulièrement défaut, et si vous consultez la page GitHub de LangChain, vous constaterez qu'il existe des milliers de problèmes ouverts.
Ainsi, si vous souhaitez vous concentrer uniquement sur l'amélioration de la recherche et de la génération de documents, le « petit et beau » LlamaIndex pourrait être un meilleur choix.
--- p.121
J'ai légèrement modifié le modèle ReAct comme indiqué ci-dessus, ce qui m'a permis de vérifier la capacité du modèle GPT à comprendre les langues autres que l'anglais.
Et même après avoir modifié cela, il arrive qu'on ait envie de briller en anglais ; dans ce cas, on peut insister sur le fait que la consigne doit être en coréen.
Comme le montrent ces résultats, au sein de LangChain, l'agent a automatiquement formé un flux parfait de pensées et d'actions, et a fourni les réponses correctes en conséquence.
--- p.262
Le cadre de planification et de résolution basé sur les fonctions cognitives exige que les titulaires d'un LLM résolvent les problèmes en deux étapes.
Cette méthode consiste d'abord à élaborer un plan pour résoudre le problème, puis à créer un plan d'action étape par étape basé sur ce plan, et enfin à exécuter ce plan pour trouver la solution.
Autrement dit, il s'agit d'une méthode consistant à planifier d'abord chaque étape de la solution, puis à exécuter les étapes planifiées.
Les systèmes cognitifs qui planifient et résolvent les problèmes les décomposent en sous-tâches plus petites et les résolvent selon un plan.
Lorsqu'un agent rencontre un problème qu'il ne peut résoudre avec ses seules connaissances internes, il effectue des recherches ou fait appel à des outils pour élargir ses connaissances.
Au-delà de cela, nous tirons parti de la flexibilité de divers outils pour manipuler et transformer de multiples ensembles de données, afin d'obtenir finalement les données nécessaires à la prise de décision.
Après chaque étape, l'agent observe le résultat et intègre les nouvelles informations dans son processus de décision suivant, faisant preuve d'un apprentissage et d'une adaptabilité remarquables.
--- p.79
La stratégie de LlamaIndex est légèrement différente de celle de LangChain.
LlamaIndex n'est pas si « grand et complet », mais il se concentre sur le développement d'une technologie de génération d'augmentation de recherche basée sur l'IA et sur la construction d'un système de génération d'augmentation de recherche (RAG) multi-locataire.
Les solutions d'entreprise basées sur LlamaIndex visent à supprimer les barrières technologiques et de sécurité et à permettre aux entreprises d'exploiter leurs données et d'améliorer leurs capacités de service.
Le travail de LlamaIndex ne se concentre pas seulement sur le développement technologique, mais aussi sur l'application de ces technologies à des entreprises réelles afin d'améliorer leur efficacité opérationnelle et l'expérience client.
--- p.120
Bien sûr, cela pourrait aussi s'expliquer par le fait que LangChain est devenu tellement massif et s'est développé de manière si exhaustive qu'il est devenu difficile de déterminer sa direction.
Il existe de nombreux cas où les détails font particulièrement défaut, et si vous consultez la page GitHub de LangChain, vous constaterez qu'il existe des milliers de problèmes ouverts.
Ainsi, si vous souhaitez vous concentrer uniquement sur l'amélioration de la recherche et de la génération de documents, le « petit et beau » LlamaIndex pourrait être un meilleur choix.
--- p.121
J'ai légèrement modifié le modèle ReAct comme indiqué ci-dessus, ce qui m'a permis de vérifier la capacité du modèle GPT à comprendre les langues autres que l'anglais.
Et même après avoir modifié cela, il arrive qu'on ait envie de briller en anglais ; dans ce cas, on peut insister sur le fait que la consigne doit être en coréen.
Comme le montrent ces résultats, au sein de LangChain, l'agent a automatiquement formé un flux parfait de pensées et d'actions, et a fourni les réponses correctes en conséquence.
--- p.262
Le cadre de planification et de résolution basé sur les fonctions cognitives exige que les titulaires d'un LLM résolvent les problèmes en deux étapes.
Cette méthode consiste d'abord à élaborer un plan pour résoudre le problème, puis à créer un plan d'action étape par étape basé sur ce plan, et enfin à exécuter ce plan pour trouver la solution.
Autrement dit, il s'agit d'une méthode consistant à planifier d'abord chaque étape de la solution, puis à exécuter les étapes planifiées.
Les systèmes cognitifs qui planifient et résolvent les problèmes les décomposent en sous-tâches plus petites et les résolvent selon un plan.
--- p.288
Avis de l'éditeur
Plongez dans le monde des agents d'IA qui changeront l'avenir
Grâce aux récents progrès de la technologie de l'IA, les agents d'IA ne se limitent plus aux simples chatbots, mais deviennent des outils puissants qui automatisent et optimisent diverses tâches.
Les entreprises tireront parti des agents d'IA pour innover dans divers domaines, notamment la bureautique, le service client, les recommandations personnalisées, l'automatisation des processus, l'optimisation des ressources et la santé.
L'apprentissage et l'exploitation de la technologie des agents d'IA deviennent une compétence essentielle pour les développeurs.
Ce livre est conçu pour vous aider à apprendre facilement les concepts et techniques fondamentaux du développement d'agents d'IA à travers sept exemples de projets d'agents d'IA qui assistent les services de livraison de fleurs.
Au-delà des simples explications théoriques, il aborde en détail les méthodes de résolution de problèmes et les stratégies d'optimisation qui se présentent lors de la construction proprement dite.
Ce guide pratique sera utile à tous, des développeurs souhaitant apprendre les techniques d'automatisation à l'aide d'agents d'IA aux chercheurs et planificateurs désireux de comprendre les dernières tendances en matière d'intelligence artificielle.
Grâce à ce livre, découvrez par vous-même le potentiel des agents d'IA et préparez-vous à évoluer au cœur des futures technologies d'IA !
Public cible
● Développeurs en IA et en logiciels : Développeurs souhaitant acquérir une expérience pratique en pratiquant le développement d’agents d’IA.
● Data Scientists et chercheurs : professionnels qui souhaitent apprendre à utiliser les technologies LLM et RAG pour mener des recherches intelligentes et exploiter les données.
● Planificateurs informatiques et fondateurs de startups : Planificateurs et dirigeants de startups qui souhaitent appliquer les dernières technologies d’IA à leurs services.
● Public général intéressé par les agents IA : ceux qui souhaitent découvrir comment la technologie IA est appliquée concrètement grâce au LLM
7 études de cas
● Agent 1 : Générer automatiquement des présentations à l’aide de l’API Assistants et du modèle DALL·E 3
● Agent 2 : Faites en sorte que l’agent appelle des fonctions OpenAI à l’aide de l’API OpenAI Assistants.
● Agent 3 : Génération des prix à l’aide du système basé sur ReAct de LangChain
● Agent 4 : Mise en œuvre de la gestion logistique à l’aide des agents de planification et d’exécution de LangChain
● Agent 5 : Mettre en œuvre l’augmentation de la recherche à l’aide de LlamaIndex et rechercher et analyser des rapports financiers
● Agent 6 : Établir une stratégie de stockage des produits avec l’agent de gestion des tâches multi-étapes BabyAGI
● Agent 7 : Construction d'un système multi-agents qui gère tout, de la réception des commandes à la gestion des coûts, à l'aide d'AutoGen et de MetaGPT.
Grâce aux récents progrès de la technologie de l'IA, les agents d'IA ne se limitent plus aux simples chatbots, mais deviennent des outils puissants qui automatisent et optimisent diverses tâches.
Les entreprises tireront parti des agents d'IA pour innover dans divers domaines, notamment la bureautique, le service client, les recommandations personnalisées, l'automatisation des processus, l'optimisation des ressources et la santé.
L'apprentissage et l'exploitation de la technologie des agents d'IA deviennent une compétence essentielle pour les développeurs.
Ce livre est conçu pour vous aider à apprendre facilement les concepts et techniques fondamentaux du développement d'agents d'IA à travers sept exemples de projets d'agents d'IA qui assistent les services de livraison de fleurs.
Au-delà des simples explications théoriques, il aborde en détail les méthodes de résolution de problèmes et les stratégies d'optimisation qui se présentent lors de la construction proprement dite.
Ce guide pratique sera utile à tous, des développeurs souhaitant apprendre les techniques d'automatisation à l'aide d'agents d'IA aux chercheurs et planificateurs désireux de comprendre les dernières tendances en matière d'intelligence artificielle.
Grâce à ce livre, découvrez par vous-même le potentiel des agents d'IA et préparez-vous à évoluer au cœur des futures technologies d'IA !
Public cible
● Développeurs en IA et en logiciels : Développeurs souhaitant acquérir une expérience pratique en pratiquant le développement d’agents d’IA.
● Data Scientists et chercheurs : professionnels qui souhaitent apprendre à utiliser les technologies LLM et RAG pour mener des recherches intelligentes et exploiter les données.
● Planificateurs informatiques et fondateurs de startups : Planificateurs et dirigeants de startups qui souhaitent appliquer les dernières technologies d’IA à leurs services.
● Public général intéressé par les agents IA : ceux qui souhaitent découvrir comment la technologie IA est appliquée concrètement grâce au LLM
7 études de cas
● Agent 1 : Générer automatiquement des présentations à l’aide de l’API Assistants et du modèle DALL·E 3
● Agent 2 : Faites en sorte que l’agent appelle des fonctions OpenAI à l’aide de l’API OpenAI Assistants.
● Agent 3 : Génération des prix à l’aide du système basé sur ReAct de LangChain
● Agent 4 : Mise en œuvre de la gestion logistique à l’aide des agents de planification et d’exécution de LangChain
● Agent 5 : Mettre en œuvre l’augmentation de la recherche à l’aide de LlamaIndex et rechercher et analyser des rapports financiers
● Agent 6 : Établir une stratégie de stockage des produits avec l’agent de gestion des tâches multi-étapes BabyAGI
● Agent 7 : Construction d'un système multi-agents qui gère tout, de la réception des commandes à la gestion des coûts, à l'aide d'AutoGen et de MetaGPT.
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 22 avril 2025
Nombre de pages, poids, dimensions : 436 pages | 858 g | 188 × 245 × 21 mm
- ISBN13 : 9791194587200
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne