Glossario

Classificazione delle immagini

Scopri la classificazione delle immagini con Ultralytics YOLO : addestra modelli personalizzati per la sanità, l'agricoltura, la vendita al dettaglio e molto altro ancora utilizzando strumenti all'avanguardia.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La classificazione delle immagini è un'attività fondamentale della Computer Vision (CV) che consiste nell'assegnare un'etichetta o una categoria a un'intera immagine in base al suo contenuto visivo. Si tratta di una capacità fondamentale nell'ambito dell'Intelligenza Artificiale (AI), che consente alle macchine di comprendere e classificare le immagini in modo simile a come gli esseri umani riconoscono le scene o gli oggetti. Grazie alle tecniche di Machine Learning (ML) e in particolare di Deep Learning (DL), la classificazione delle immagini mira a rispondere alla domanda: "Qual è il soggetto principale di questa immagine?".

Come funziona la classificazione delle immagini

Il processo prevede in genere l'addestramento di un modello, spesso un tipo specializzato di rete neurale chiamato rete neurale convoluzionale (CNN), su un ampio set di immagini etichettate. Famosi dataset come ImageNet contengono milioni di immagini classificate in migliaia di classi. Durante l'addestramento, il modello impara a identificare i modelli e le caratteristiche - come texture, forme e distribuzione dei colori - che distinguono le diverse categorie. Framework come PyTorch e TensorFlow forniscono gli strumenti per costruire e addestrare questi modelli. Puoi esplorare diversi dataset di classificazioneUltralytics per avviare i tuoi progetti. L'obiettivo è che il modello addestrato preveda con precisione l'etichetta della classe per nuove immagini non viste. Per una comprensione tecnica più approfondita, risorse come il corso CS231n di Stanford offrono materiale completo sulle CNN.

Differenze chiave rispetto ad altri compiti

La classificazione delle immagini si concentra sull'assegnazione di una singola etichetta all'intera immagine. Ciò la distingue da altri compiti comuni di CV:

  • Rilevamento di oggetti: Identifica più oggetti all'interno di un'immagine e li localizza utilizzando i riquadri di delimitazione. Risponde alla domanda "Quali oggetti sono presenti nell'immagine e dove si trovano?".
  • Segmentazione delle istanze: Fa un passo avanti rispetto al rilevamento degli oggetti, delineando i confini esatti dei pixel di ogni istanza di oggetto distinta.
  • Segmentazione semantica: Classifica ogni pixel dell'immagine in un insieme di categorie predefinite (ad esempio, "cielo", "strada", "auto"), ma non distingue tra le singole istanze della stessa categoria.

Comprendere queste differenze è fondamentale per selezionare la tecnica più adatta a un determinato problema.

Applicazioni del mondo reale

La classificazione delle immagini è ampiamente utilizzata in diversi ambiti grazie alla sua relativa semplicità ed efficacia:

Classificazione delle immagini con Ultralytics

I modelli Ultralytics YOLO , famosi per il rilevamento degli oggetti, eccellono anche nelle attività di classificazione delle immagini. Le architetture moderne come Ultralytics YOLOv11 possono essere facilmente addestrate per la classificazione utilizzando il pacchettoUltralytics Python o la piattaforma no-code Ultralytics HUB. Questi strumenti forniscono risorse complete, tra cui suggerimenti per l'addestramento dei modelli e una documentazione chiara come la guida su come usare Ultralytics YOLOv11 per la classificazione delle immagini. Per esercitarti, considera l'opportunità di esplorare i tutorial di classificazione diPyTorch o di partecipare alle gare di classificazione di immagini di Kaggle. Resta aggiornato sugli ultimi progressi della ricerca grazie a risorse come Papers With Code.

Leggi tutto