Glossaire

Réseau bayésien

Découvre comment les réseaux bayésiens utilisent des modèles probabilistes pour expliquer les relations, prédire les résultats et gérer l'incertitude dans l'IA et la ML.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Un réseau bayésien, également connu sous le nom de réseau de croyance ou de modèle graphique acyclique dirigé, est un modèle graphique probabiliste qui représente un ensemble de variables et leurs dépendances conditionnelles à l'aide d'un graphe acyclique dirigé (DAG). Il combine les principes de la théorie des graphes et de la théorie des probabilités pour modéliser l'incertitude et raisonner sur les relations de causalité entre les variables. Ces réseaux sont particulièrement utiles en intelligence artificielle (IA) et en apprentissage automatique (ML) pour les tâches de prédiction, de détection d'anomalies, de diagnostic et de prise de décision dans l'incertitude.

Comment fonctionnent les réseaux bayésiens

La structure de base d'un réseau bayésien est constituée de nœuds et d'arêtes dirigées :

  • Nœuds : Chaque nœud représente une variable aléatoire, qui peut être discrète (par exemple, "Maladie présente" vs "Maladie absente") ou continue (par exemple, "Température").
  • Arêtes : Les arêtes dirigées (flèches) relient des paires de nœuds, indiquant une dépendance probabiliste. Une flèche allant du nœud A au nœud B implique que A a une influence directe sur B. Il est essentiel que le graphe soit acyclique, ce qui signifie qu'il n'y a pas de cycles dirigés ; tu ne peux pas partir d'un nœud et suivre les flèches jusqu'au nœud de départ. Cette structure encode les hypothèses d'indépendance conditionnelle - une variable est indépendante de ses non-descendants compte tenu de ses parents.
  • Tables de probabilités conditionnelles (CPT) : Chaque nœud est associé à une distribution de probabilités. Pour les nœuds ayant des parents, il s'agit d'une distribution de probabilité conditionnelle, souvent représentée par une TPC, qui quantifie l'effet des parents sur ce nœud. Les nœuds sans parents ont une distribution de probabilités a priori.

L'inférence dans les réseaux bayésiens consiste à calculer la distribution de probabilité de certaines variables à partir d'observations (preuves) concernant d'autres variables, souvent à l'aide d'algorithmes basés sur le théorème de Bayes. L'apprentissage implique soit l'apprentissage de la structure (identification de la topologie du graphe à partir des données), soit l'apprentissage des paramètres (estimation des CPT à partir des données).

La pertinence dans l'intelligence artificielle et l'apprentissage automatique

Les réseaux bayésiens offrent plusieurs avantages en matière d'IA et de ML :

  • Gestion de l'incertitude : Ils fournissent un cadre naturel pour représenter et raisonner avec l'incertitude, qui est inhérente à de nombreux problèmes du monde réel.
  • Inférence causale : La nature dirigée du graphique peut souvent représenter des relations causales, permettant de raisonner sur la cause et l'effet, bien que l'établissement de la causalité nécessite une conception et des hypothèses prudentes(travail de Judea Pearl sur la causalité).
  • Combinaison des connaissances : Elles permettent d'intégrer les connaissances d'un domaine expert (dans la structuration du graphique) aux données d'observation (dans l'apprentissage des probabilités).
  • Interprétabilité : La structure graphique rend souvent les hypothèses et les dépendances du modèle plus faciles à comprendre par rapport aux modèles à boîte noire comme les réseaux neuronaux complexes (NN).

Bien que puissants pour le raisonnement probabiliste, ils diffèrent des modèles tels que les architectures d'apprentissage profond (DL) (par exemple, les réseaux neuronaux convolutifs (CNN) utilisés dans... Ultralytics YOLO pour la détection d'objets ou la segmentation d'images) qui excellent dans l'apprentissage de caractéristiques hiérarchiques à partir de données brutes comme les images, mais qui manquent souvent d'interprétabilité probabiliste explicite. Les réseaux bayésiens modélisent des dépendances explicites, alors que les réseaux nationaux apprennent des fonctions complexes, souvent implicites. Ils se distinguent également des modèles de séquence tels que les modèles de Markov cachés (HMM), bien qu'il s'agisse dans les deux cas de modèles graphiques.

Applications dans le monde réel

Les réseaux bayésiens sont utilisés dans divers domaines :

  • Diagnostic médical : Ils peuvent modéliser les relations entre les maladies, les symptômes, les antécédents du patient et les résultats des tests. Par exemple, un réseau peut prendre en compte des symptômes comme la fièvre et la toux, ainsi que l'âge du patient, pour prédire la probabilité de maladies respiratoires spécifiques(exemple d'article sur le diagnostic médical). Cela aide les cliniciens à poser un diagnostic, en complément de techniques telles que l'analyse d'images médicales. Explore les solutions d'IA dans le domaine de la santé.
  • Filtrage des spams : Les caractéristiques des courriels (présence de certains mots-clés, réputation de l'expéditeur, inclusion de liens) peuvent être modélisées en tant que variables dans un réseau bayésien pour calculer la probabilité qu'un courriel entrant soit un spam(Aperçu du filtrage bayésien des spams).
  • Évaluation des risques : Utilisé en finance et en ingénierie pour modéliser les facteurs contribuant au risque (par exemple, les conditions du marché, les défaillances des composants) et estimer la probabilité de résultats indésirables(Applications de modélisation du risque financier).
  • Bioinformatique : Appliquée à la modélisation des réseaux de régulation des gènes et à la compréhension des systèmes biologiques complexes(Application in Systems Biology).
  • Dépannage de systèmes : Modélisation des composants et des modes de défaillance pour diagnostiquer les problèmes dans les systèmes complexes comme les imprimantes ou les réseaux.

Outils et ressources

Plusieurs bibliothèques de logiciels facilitent la création et l'utilisation des réseaux bayésiens :

  • pgmpy: Une bibliothèque Python populaire pour travailler avec des modèles graphiques probabilistes.
  • ProbabilitéTensorFlow : Une extension de TensorFlow fournissant des outils pour le raisonnement probabiliste, y compris les réseaux bayésiens.
  • PyTorch: Bien qu'il n'y ait pas de bibliothèque BN dédiée dans le noyau, les bibliothèques de programmation probabiliste construites sur PyTorch comme Pyro peuvent être utilisées.
  • Boîte à outils Bayes Net pour Matlab: Une boîte à outils largement utilisée dans la communauté universitaire.

Des plateformes comme Ultralytics HUB peuvent aider à gérer le cycle de vie plus large des projets d'IA, même si le modèle de base est un réseau bayésien développé à l'aide d'outils spécialisés. Comprendre les réseaux bayésiens permet d'acquérir des compétences précieuses pour aborder les problèmes impliquant l'incertitude et le raisonnement causal dans le domaine plus large de l'apprentissage automatique. Explore la documentation d'Ultralytics pour en savoir plus sur les modèles et les applications d'IA.

Tout lire