Glossaire

Modélisation du langage

Découvre comment la modélisation du langage alimente les applications NLP et AI telles que la génération de texte, la traduction automatique et la reconnaissance vocale grâce à des techniques avancées.

La modélisation du langage est une tâche fondamentale de l'intelligence artificielle (IA) et du traitement du langage naturel (NLP). Son objectif principal est de construire des systèmes capables de comprendre, de générer et de prédire le langage humain. À la base, un modèle de langage apprend la distribution de probabilité des séquences de mots (ou de caractères, ou de tokens) en se basant sur de grandes quantités de données textuelles. Cela permet au modèle de déterminer la probabilité qu'une phrase ou une expression particulière se produise naturellement, ce qui lui permet d'effectuer efficacement diverses tâches liées au langage. Il s'agit d'une technologie fondamentale pour de nombreuses applications modernes d'intelligence artificielle, des assistants virtuels aux éditeurs de texte sophistiqués.

Comment fonctionne la modélisation linguistique

Les modèles de langage fonctionnent en analysant les modèles, la grammaire et les relations contextuelles dans les données textuelles sur lesquelles ils sont formés. Les premières approches reposaient sur des méthodes statistiques telles que les n-grammes, qui calculent la probabilité d'un mot en fonction des "n" mots qui le précèdent. Bien qu'utiles, ces méthodes ont souvent du mal à gérer les dépendances à long terme et à saisir le sens sémantique profond.

L'avènement du deep learning (DL) a considérablement fait progresser la modélisation du langage. Les architectures de réseaux neuronaux (NN), telles que :

Réseaux neuronaux récurrents (RNN): Traitent des séquences en maintenant un état interne ou une mémoire, bien expliqué dans cet article du blog de Colah.
Mémoire à long terme (LSTM): Un type avancé de RNN mieux équipé pour traiter les longues séquences et atténuer le problème du gradient qui s'évanouit.
Transformateurs: Utilise les mécanismes d'attention, en particulier l'auto-attention, permettant au modèle de peser l'importance des différents mots dans la séquence d'entrée, quelle que soit leur distance. Cette architecture, présentée dans l'article fondateur"Attention Is All You Need", est à la base de la plupart des modèles de pointe.

Ces modèles neuronaux sont généralement formés à l'aide d'outils tels que PyTorch ou TensorFlow sur des corpus de textes massifs, en apprenant des caractéristiques linguistiques complexes grâce à des techniques comme la rétropropagation.

Applications de la modélisation du langage

La capacité de prédire et de comprendre les séquences de mots rend la modélisation du langage incroyablement polyvalente. Voici quelques applications clés :

Texte prédictif et autocomplétion : Lorsque le clavier de ton smartphone suggère le mot suivant ou que ton moteur de recherche complète ta requête, les modèles de langage sont à l'œuvre, prédisant la suite la plus probable en fonction de ce qui a été saisi jusqu'à présent. Cela améliore l'expérience de l'utilisateur et la vitesse de frappe, comme le montrent des outils tels que Smart Compose deGoogle.
Traduction automatique : Des outils comme Google Translate utilisent des modèles linguistiques sophistiqués, souvent basés sur des modèles de séquence à séquence, pour traduire des textes d'une langue à l'autre avec précision et fluidité. Les modèles apprennent les alignements entre les langues et génèrent des traductions qui préservent le sens et la structure grammaticale. Voir l'entrée du glossaire de la traduction automatique pour plus d'informations.
Reconnaissance de la parole: La conversion du langage parlé en texte implique de prédire la séquence de mots la plus probable correspondant à l'entrée audio, ce qui alimente des technologies telles que Siri d'Apple.
Génération de texte: Création de textes semblables à ceux des humains pour les articles, les résumés, les systèmes de dialogue(Chatbots) et l'écriture créative.
Analyse des sentiments: Détermination du ton émotionnel (positif, négatif, neutre) exprimé dans un morceau de texte, souvent utilisé pour analyser les avis des clients ou les médias sociaux.
Réponse aux questions: Comprendre les questions posées en langage naturel et fournir des réponses pertinentes en fonction d'un contexte donné ou d'une base de connaissances, comme les systèmes développés par l'Allen Institute for AI.

Concepts apparentés

Il est utile de distinguer la modélisation linguistique des termes apparentés :

Traitement du langage naturel (NLP) : La modélisation du langage est un sous-domaine ou une tâche essentielle du TAL. Le TAL est le domaine plus large qui permet aux ordinateurs de traiter, d'analyser et de comprendre le langage humain en général. Jette un coup d'œil à notre vue d'ensemble du TAL.
Grands modèles linguistiques (LLM): Il s'agit essentiellement de très grands et puissants modèles de langage, généralement construits à l'aide de l'architecture Transformer et entraînés sur d'énormes ensembles de données (tirant souvent parti des principes du Big Data ). Il s'agit par exemple de modèles tels que GPT-4 et BERT. Les LLM sont souvent considérés comme des modèles de fondation, un concept détaillé par le Centre de recherche sur les modèles de fondation (CRFM) de Stanford.
Vision par ordinateur (CV): Alors que les modèles de langage traitent le texte, la CV se concentre sur le fait de permettre aux machines d'interpréter et de comprendre les informations visuelles des images et des vidéos. Les tâches comprennent la détection d'objets, la classification d'images et la segmentation d'images, souvent abordées par des modèles tels que Ultralytics YOLO. L'intersection de ces domaines est explorée dans les modèles multimodaux et les modèles de langage de vision, qui traitent à la fois les données textuelles et visuelles. Des plateformes comme Ultralytics HUB rationalisent la formation et le déploiement de divers modèles d'IA, y compris ceux destinés aux tâches de vision. Tu peux explorer diverses tâches de CV prises en charge par Ultralytics.

Modélisation du langage

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Comment fonctionne la modélisation linguistique

Applications de la modélisation du langage

Concepts apparentés

Lire plus de blogs

Rejoins la communauté Ultralytics

Modélisation du langage

Entraîne les modèles YOLO simplementavec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Comment fonctionne la modélisation linguistique

Applications de la modélisation du langage

Concepts apparentés

Lire plus de blogs

Rejoins la communauté Ultralytics

Entraîne les modèles YOLO simplement
avec Ultralytics HUB