Glossaire

Grand modèle linguistique (LLM)

Découvrez comment les grands modèles de langage (LLM) révolutionnent l'IA avec un NLP avancé, en alimentant les chatbots, la création de contenu et bien plus encore. Apprenez les concepts clés !

Un grand modèle linguistique (LLM) est un type de modèle d'intelligence artificielle (IA) conçu pour comprendre, générer et interagir avec le langage humain. Ces modèles sont "volumineux" parce qu'ils contiennent des milliards de paramètres et sont entraînés sur de grandes quantités de données textuelles, englobant souvent une partie importante de l'internet public, des livres et d'autres sources. Cette formation approfondie leur permet de reconnaître des modèles complexes, la grammaire, le contexte et les nuances du langage, ce qui en fait des outils puissants pour un large éventail de tâches de traitement du langage naturel (NLP).

L'architecture fondamentale de la plupart des LLM modernes est le Transformer, introduit dans l'article influent"Attention Is All You Need" (L'attention est tout ce dont vous avez besoin). Cette architecture permet au modèle d'évaluer l'importance des différents mots (ou tokens) dans une séquence, en capturant les dépendances à long terme et les relations contextuelles de manière bien plus efficace que les modèles précédents tels que les réseaux neuronaux récurrents (RNN).

Comment les LLM sont utilisés

Les LLM ont été intégrés dans d'innombrables applications dans divers secteurs, changeant fondamentalement la façon dont nous interagissons avec la technologie. Leur capacité à générer des textes cohérents et pertinents sur le plan contextuel les rend très polyvalents.

Parmi les exemples concrets les plus marquants, on peut citer

Chatbots et assistants virtuels avancés: Les entreprises utilisent les LLM pour créer des chatbots sophistiqués pour le service client qui peuvent comprendre l'intention de l'utilisateur et fournir des réponses détaillées et conversationnelles. Les assistants numériques tels que Google Assistant et Alexa d'Amazon exploitent la technologie LLM pour des interactions plus naturelles.
Création de contenu et résumés: Les LLM sont largement utilisés pour rédiger des courriers électroniques, des articles, des textes créatifs et des textes de marketing. Ils sont également capables de résumer des textes, de condenser de longs documents en résumés concis, ce qui est inestimable dans des domaines tels que le droit et la recherche.

LLMs vs. autres modèles d'IA

Il est important de différencier les LLM d'autres types de modèles d'IA, en particulier ceux utilisés dans des domaines différents tels que la vision par ordinateur.

Modélisation du langage vs. LLM: la modélisation du langage est la tâche principale qui consiste à prédire le mot suivant dans une séquence. Un LLM est une implémentation à très grande échelle d'un modèle de langage, tel que le GPT-4 d'OpenAI ou les modèles Llama de Meta.
Modèles de base vs. LLM: Les LLM constituent une catégorie importante de modèles de base. Le terme "modèle de base", popularisé par le Center for Research on Foundation Models (CRFM) de Stanford, est plus large et englobe de grands modèles formés sur divers types de données, et pas seulement sur du texte.
Modèles de vision par ordinateur et LLM: il s'agit là d'une distinction essentielle. Alors que les LLM traitent et génèrent du texte, les modèles de vision artificielle comme Ultralytics YOLO11 sont spécialisés dans l'interprétation de données visuelles provenant d'images et de vidéos. Les modèles de vision par ordinateur effectuent des tâches telles que la détection d'objets, la classification d'images et la segmentation d'instances. Des plateformes comme Ultralytics HUB sont conçues pour rationaliser le cycle de vie des modèles de vision, de la gestion des ensembles de données au déploiement.

L'avenir : Intégration multimodale

La frontière entre l'IA du langage et de la vision s'estompe avec le développement des modèles multimodaux. Ces modèles avancés, souvent appelés modèles de langage visuel (VLM), peuvent traiter et intégrer des informations provenant de modalités multiples, telles que du texte et des images. Par exemple, un utilisateur peut télécharger une photo d'un repas et demander la recette au modèle. Cette convergence, explorée dans des modèles tels que le GPT-4o, constitue une étape importante vers des systèmes d'IA plus complets.

Malgré leur puissance, il est essentiel d'être conscient des limites des LLM, notamment le risque de générer des informations incorrectes(hallucinations) et d'hériter des biais de leurs données d'apprentissage. Ces défis soulignent l'importance constante de l'éthique de l'IA et des pratiques de développement responsables. Pour plus d'informations sur la création d'applications d'IA, vous pouvez consulter la documentation d'Ultralytics.

Grand modèle linguistique (LLM)

Une solution flexible de licences d'entreprise pour stimuler votre innovation

Entraîner des modèles d'IA en quelques secondes avec Ultralytics YOLO

Former des modèles YOLO en toute simplicité avec Ultralytics HUB

Comment les LLM sont utilisés

LLMs vs. autres modèles d'IA

L'avenir : Intégration multimodale

Plus d'informations dans cette catégorie

Comprendre la fabrication additive : Technologie et cas d'utilisation

Suivi des opérations au sol dans les aéroports avec Ultralytics YOLO11

L'évolution et l'avenir de la robotique dans l'industrie manufacturière

Rejoindre la communauté Ultralytics