Scopri la classificazione delle immagini con Ultralytics YOLO : addestra modelli personalizzati per la sanità, l'agricoltura, la vendita al dettaglio e molto altro ancora utilizzando strumenti all'avanguardia.
La classificazione delle immagini è un'attività fondamentale della Computer Vision (CV) che consiste nell'assegnare un'etichetta o una categoria a un'intera immagine in base al suo contenuto visivo. Si tratta di una capacità fondamentale nell'ambito dell'Intelligenza Artificiale (AI), che consente alle macchine di comprendere e classificare le immagini in modo simile a come gli esseri umani riconoscono le scene o gli oggetti. Grazie alle tecniche di Machine Learning (ML) e in particolare di Deep Learning (DL), la classificazione delle immagini mira a rispondere alla domanda: "Qual è il soggetto principale di questa immagine?". Questo compito funge da base per molti problemi di comprensione visiva più complessi.
Il processo prevede in genere l'addestramento di un modello, spesso un tipo specializzato di rete neurale chiamato rete neurale convoluzionale (CNN), su un ampio set di immagini etichettate. I famosi dataset come ImageNet, che contengono milioni di immagini suddivise in migliaia di categorie, sono comunemente utilizzati per l'addestramento di modelli robusti. Durante l'addestramento, il modello impara a identificare i modelli e le caratteristiche distintive - come texture, forme, bordi e distribuzione dei colori - che caratterizzano le diverse categorie. Framework come PyTorch e TensorFlow forniscono gli strumenti e le librerie necessarie per costruire e addestrare questi modelli di deep learning. Puoi esplorare vari dataset di classificazioneUltralytics come CIFAR-100 o MNIST per iniziare i tuoi progetti. L'obiettivo finale è che il modello addestrato sia in grado di prevedere con precisione l'etichetta della classe di appartenenza di nuove immagini inedite. Per una comprensione tecnica più approfondita dei meccanismi sottostanti, risorse come il corso CS231n di Stanford sulle Reti Neurali Convoluzionali per il Riconoscimento Visivo offrono materiale completo.
La classificazione delle immagini si concentra sull'assegnazione di una singola etichetta generale all'intera immagine. Per questo motivo si distingue da altri compiti comuni di computer vision:
Comprendere queste differenze è fondamentale per selezionare la tecnica più adatta a un problema specifico, poiché ogni compito fornisce un diverso livello di dettaglio sul contenuto dell'immagine.
La classificazione delle immagini è ampiamente utilizzata in diversi ambiti grazie alla sua efficacia nel categorizzare le informazioni visive:
I modelli Ultralytics YOLO , pur essendo rinomati per il rilevamento degli oggetti, dimostrano anche ottime prestazioni nei compiti di classificazione delle immagini. Architetture all'avanguardia come Ultralytics YOLO11 possono essere facilmente addestrate o messe a punto per la classificazione utilizzando l'intuitivo pacchettoUltralytics Python o la piattaforma no-code Ultralytics HUB. Questi strumenti forniscono risorse complete, tra cui suggerimenti per l'addestramento dei modelli e una documentazione chiara, come la guida su come usare Ultralytics YOLO11 per la classificazione delle immagini. Per esercitarti ulteriormente, considera la possibilità di esplorare i tutorial di classificazione diPyTorch o di partecipare alle gare di classificazione di immagini di Kaggle. Per rimanere aggiornati sugli ultimi progressi della ricerca, risorse come Papers With Code sono preziose. Puoi anche confrontare le prestazioni del modello YOLO su benchmark standard.