Passer aux informations sur le produit
Données d'inférence en langage naturel pour les modèles d'IA
Données d'inférence en langage naturel pour les modèles d'IA
Description
Introduction au livre
Les êtres humains ont besoin de diverses capacités intellectuelles pour écouter, comprendre et répondre aux autres.
Nos conversations quotidiennes se fondent sur cette vaste accumulation de connaissances linguistiques et extralinguistiques, et l'inférence est constituée d'innombrables pièces de puzzle logiques qui rendent possible ce traitement intellectuel complexe.
Ce livre commence par une réflexion sur les raisons pour lesquelles les modèles de langage d'IA, qui fonctionnent actuellement remarquablement bien dans les conversations entre humains, ne parviennent toujours pas à démontrer des capacités de raisonnement semblables à celles des humains dans de nombreux domaines.
Il est incontestable que la capacité d'inférence des modèles d'IA peut être améliorée lorsque des données d'entraînement fiables sont fournies à cette fin, mais il reste encore beaucoup à découvrir concernant la question de la structuration des données d'« inférence en langage naturel (NLI) » à cette fin.


Cet ouvrage présente les tendances de recherche sur l'ensemble de données NLI proposé pour l'apprentissage de la capacité d'inférence en langage naturel des modèles de langage d'IA, et examine quelles caractéristiques du langage naturel devraient être prises en compte pour surmonter les limitations actuellement constatées.
Afin de concevoir un ensemble de données NLI spécifiquement pour le coréen, nous avons examiné en détail quelles propriétés linguistiques propres au coréen devaient être décrites.
Ce livre est divisé en trois parties :
Le chapitre 1 examine les tendances actuelles de la recherche en matière de construction d'ensembles de données d'inférence en langage naturel, et le chapitre 2 traite des phénomènes linguistiques jugés importants pour la construction d'ensembles de données d'inférence en langage naturel basés sur les propriétés syntaxiques et sémantiques de la langue coréenne, catégorisées en 78 types.
Enfin, au chapitre 3, le schéma d'inférence en langage naturel proposé KOLINS et les données d'inférence coréennes KOLIN (version V_1.0) construites sur la base de cet attribut spécifique au type sont présentés et leurs performances évaluées.

Ce livre est destiné aux chercheurs du groupe de développement qui souhaitent créer des modèles d'IA pour diverses tâches spécialisées en coréen, ainsi qu'aux chercheurs en linguistique des données intéressés par la construction de données linguistiques pour la compréhension du langage naturel, et aux chercheurs en linguistique théorique et en études de la langue coréenne qui souhaitent mener des recherches linguistiques sur les propriétés lexicales, syntaxiques et sémantiques impliquées dans les relations inférentielles en coréen.
Ce livre a débuté comme un ouvrage basé sur des cours universitaires et des recherches, mais il est également devenu un schéma pratique pour la construction d'ensembles de données d'entraînement destinés à l'ajustement fin des modèles de langage.
Grâce à la réflexion sur les types de propriétés linguistiques du coréen classées et proposées dans cette étude, on espère que les futurs modèles de langage seront capables d'identifier les aspects dans lesquels ils sont particulièrement vulnérables à la compréhension des phénomènes syntaxiques et sémantiques du langage, et qu'une augmentation personnalisée des données à cette fin sera possible.
Nous espérons que cela permettra de constater une fois de plus pourquoi cette « approche symbolique » doit être utilisée conjointement avec d'autres approches pour surmonter les limitations des modèles de langage actuels.

indice
indice
Préface | Préface de l'auteur ii
Structure du livre | Table des matières iv

Chapitre 1.
Tendances de la recherche sur les ensembles de données d'inférence en langage naturel 1


1 Inférence en langage naturel 3
1.1 Définition de l'inférence en langage naturel 3
1.2 Inférence en langage naturel (ILN) et premières considérations linguistiques 8

2 Jeux de données et bancs d'essai pour l'inférence en langage naturel 29
2.1 Jeu de données de reconnaissance d'enveloppes de texte (RTE) 30
2.2 L'émergence de benchmarks d'inférence en langage naturel à grande échelle 32
2.3 Étude des ensembles de données basée sur le vocabulaire, la logique et la syntaxe 44
2.4 Étude des ensembles de données d'inférence en langage naturel basée sur le bon sens et le contexte 60
2.5 Étude des ensembles de données d'apprentissage de l'inférence en langage naturel domestique 79

3 Approches pour la construction d'ensembles de données d'inférence en langage naturel 86
3.1 Prémisse fondée sur les documents Web et hypothèse du travailleur à la tâche 86
3.2 Conception d'un ensemble de données prenant en compte les caractéristiques linguistiques 88

Chapitre 2.
Une étude sur les données d'inférence coréennes basée sur les propriétés linguistiques 91


JE.
Schéma de transformation d'arguments 97
1 A01 Intersection du sujet et de l'argument « N-et » 100
2 A02 Intersection de l'objet et de l'argument « N-et » 104
3 A03 Intersection du sujet et de l'argument « N-à/à » 106
4 A04 Intersection de l'objet et de l'argument « N-à/à » 109
5 A05 Intersection de l'objet et du sujet 110
6 A06 Transformation du génitif en nominatif argument 114
7 A07 Transformation de l'argument accusatif en argument objectif 116
8 A08 Transformation du nominatif d'une proposition subordonnée en objet de la proposition principale 118
9 A09 Transformation du cas nominatif en un argument non marqué 120
10 A10 Transformation du cas objectif en un argument non marqué 122
11 A11 Variations postpositionnelles de l'adverbial 125
12 A12 Suppression de l'argument nominatif 130
13 A13 Suppression de l'argument au nominatif 132
14 A14 Suppression de l'argument objectif 141
15 A15 Suppression de l'argument dans le cas objectif 142
16 A16 Suppression d'argument dans une structure argumentale homonyme 147
17 A17 Suppression de l'argument adverbial 149
18 A18 Suppression de l'argument du pronom nominal 151
19 A19 ET Coordination des groupes nominaux 155
20 A20 OU Coordination des groupes nominaux 158
21 A21 Coordination externe des arguments nominatifs 161
22 A22 Coordination externe de l'argument objectif 163
23 A23 Connexion externe de l'argument adverbial 165

II.
Schéma de transformation de prédicat 167
24 P01 Négation des prédicats du groupe verbal 170
25 P02 Négation du prédicat du groupe adjectival 172
26 P03 Négation des prédicats du groupe nominal 176
27 P04 Phrase à double prédicat négatif 178
28 P05 Transformation de la phrase passive du prédicat 184
29 P06 Transformation temporelle des prédicats 188
30 P07 Construction allégorique des prédicats 190
31 P08 Transformation de la clause complémentaire du prédicat 194
32 P09 Nominalisation des prédicats enchâssés 196
33 P10 Adverbialisation des prédicats adjectivaux 199
34 P11 Suppression des verbes sous-entendus 203
35 P12 Suppression des verbes factuels 210
36 P13 Suppression du verbe de service 215
37 P14 ET Coordination des prédicats 218
38 P15 OU Coordination des prédicats 221

III.
Schéma de conversion des composants de la formule 227
39 M01 Variation des quantificateurs/expressions temporelles 230
40 M02 Variation du quantificateur existentiel de forgeage ascendant 235
41 M03 Variation du quantificateur universel de forgeage vers le bas 237
42 M04 Variation non monotone de l'adjectif 239
43 M05 Transformation croisée de deux adjectifs 240
44 M06 Variation positionnelle des adjectifs 243
45 M07 Variation par suppression des adjectifs 245
46 M08 ET Coordination des adjectifs 248
47 M09 OU Coordination des adjectifs 252
48 M10 Transformation de la clause nominative sujet 258
49 M11 Transformation de proposition relative non nominale sujet 263
50 M12 Transformation des arguments non sujets en propositions relatives nominales 266
51 M13 Transformation de proposition relative non nominative avec argument non sujet 269
52 M14 Variation de phrases contenant des propositions subordonnées conditionnelles adverbiales 272
53 M15 Variation de phrases contenant des propositions subordonnées adverbiales de concession 274
54 M16 Transformation de phrases contenant des propositions subordonnées adverbiales de but 276
55 M17 Transformation de phrases contenant des propositions subordonnées circonstancielles causales 278
56 M18 Transformation de phrases contenant des propositions subordonnées circonstancielles de temps 280
57 M19 Description : Variation de phrases contenant des propositions subordonnées adverbiales 283
58 M20 Conformité/Attitude Expression Phrase Transformation adverbiale 287
59 M21 Variations des adverbes d'incertitude 289

IV.
Schéma de transformation du vocabulaire et des connaissances 293
60 L01 Transformation synonymique des noms 296
61 L02 Transformations de vocabulaire synonymique dans la catégorie des non-noms 298
62 L03 Antonymes des noms - Transformation du vocabulaire 301
63 L04 Variation du vocabulaire antonymes dans la catégorie des non-noms 304
64 L05 Synonymes métaphoriques et idiomatiques 308
65 L06 Transformation dérivée par préfixe négatif 310
66 L07 Hyperonyme et hyponyme du nom Transformation lexicale 313
67 L08 Variation du vocabulaire des surordonnés et des hyponymes de la catégorie non nominale 316
68 L09 Transformation lexicale du nom (partiel/total) 319
69 L10 Transformation lexicale métonymique des noms 322
70 L11 Transformation fondée sur les connaissances culturelles et religieuses 325
71 L12 Variations basées sur les connaissances géographiques 327
72 L13 Variations basées sur des connaissances historiques 329
73 L14 Transformation basée sur la connaissance artistique 331
74 L15 Transformation fondée sur les connaissances juridiques et sociales 334
75 L16 Transformation basée sur les connaissances économiques et sportives 336
76 L17 Modification basée sur des connaissances mathématiques 338
77 L18 Modification fondée sur des connaissances scientifiques et médicales 340
78 L19 Variation basée sur les connaissances générales 342

Chapitre 3. Schéma KOLINS et ensemble de données KOLIN 345

1 Schéma de données d'inférence coréenne KOLINS 347
2 Construction de l'ensemble de données d'inférence de langue coréenne KOLIN 353
3 Évaluation des performances du jeu de données KOLIN 364
Référence 371
SPÉCIFICATIONS DES PRODUITS
- Date d'émission : 20 janvier 2025
- Nombre de pages, poids, dimensions : 386 pages | 148 × 210 × 30 mm
- ISBN13 : 9791198899156
- ISBN10 : 1198899158

Vous aimerez peut-être aussi

카테고리