Glossario

ImageNet

Esplora ImageNet, il dataset fondamentale per il deep learning. Scopri come alimenta Ultralytics tramite il transfer learning per una classificazione delle immagini altamente accurata.

ImageNet un monumentale database visivo progettato per essere utilizzato nella ricerca sul software di riconoscimento visivo degli oggetti ed è ampiamente considerato il catalizzatore che ha dato il via alla moderna rivoluzione del deep learning. Organizzato secondo la gerarchia WordNet, ImageNet milioni di immagini etichettate in migliaia di categorie, fornendo l'enorme quantità di dati necessaria per addestrare sofisticate reti neurali. Per i ricercatori e gli sviluppatori nel campo della visione artificiale, ImageNet da benchmark standard per valutare le prestazioni degli algoritmi, in particolare in compiti come la classificazione delle immagini e la localizzazione degli oggetti.

ImageNet e l'ascesa delle CNN

Il set di dati ha acquisito importanza a livello mondiale grazie all' ImageNet Scale Visual Recognition Challenge (ILSVRC), una competizione annuale tenutasi tra il 2010 e il 2017. Questo concorso richiedeva algoritmi in grado di classify in una delle 1.000 categorie con elevata precisione. Una svolta storica si è verificata nel 2012, quando una rete neurale convoluzionale (CNN) nota come AlexNet ha raggiunto un tasso di errore notevolmente inferiore rispetto ai suoi concorrenti. Questa vittoria ha dimostrato la superiorità delle reti neurali profonde rispetto ai tradizionali metodi di estrazione delle caratteristiche, dando effettivamente il via all'era attuale dell'IA. Oggi, architetture all'avanguardia come Ultralytics continuano a basarsi sui principi fondamentali stabiliti durante queste sfide.

Il ruolo della pre-formazione e dell'apprendimento trasferibile

Uno dei contributi più significativi di ImageNet il suo ruolo nel transfer learning. Addestrare una rete neurale profonda da zero richiede enormi risorse computazionali e grandi quantità di dati di addestramento. Per aggirare questo ostacolo, gli sviluppatori utilizzano spesso "modelli pre-addestrati", ovvero reti che hanno già imparato a estrarre ricche rappresentazioni di caratteristiche da ImageNet.

Quando un modello viene pre-addestrato su ImageNet, impara a identificare elementi visivi fondamentali come bordi, texture e forme. I pesi del modello appresi possono quindi essere ottimizzati su un set di dati più piccolo e specifico per un'attività diversa. Questo processo accelera notevolmente i cicli di sviluppo e migliora le prestazioni, soprattutto quando si utilizzano strumenti come Ultralytics per l'addestramento di modelli personalizzati.

Applicazioni nel mondo reale

L'influenza di ImageNet ben oltre la ricerca accademica e ImageNet ai sistemi di IA pratici e di uso quotidiano:

Checkout automatizzato nei negozi: i sistemi che identificano automaticamente i prodotti in un chiosco self-checkout si basano su capacità di classificazione affinate su enormi set di dati come ImageNet. Distinguendo tra articoli visivamente simili (ad esempio, diversi tipi di mele), questi sistemi ottimizzano l' AI nel settore della vendita al dettaglio.
Moderazione dei contenuti: le piattaforme di social media utilizzano il riconoscimento visivo per scansionare automaticamente milioni di immagini caricate alla ricerca di contenuti inappropriati. La capacità fondamentale di riconoscere oggetti e scene deriva spesso da backbone originariamente addestrati sulle ImageNet .

ImageNet . COCO . CIFAR-10

Sebbene ImageNet il gold standard per la classificazione, è importante distinguerlo da altri dataset popolari:

ImageNet . COCO: Il dataset COCO Common Objects in Context) è il principale benchmark per il rilevamento e la segmentazione degli oggetti. Mentre ImageNet "cosa" c'è nell'immagine (classificazione), COCO su "dove" si trovano gli oggetti e sui loro confini precisi.
ImageNet ImageNet ImageNet . CIFAR-10: CIFAR-10 è un set di dati molto più piccolo composto da immagini di dimensioni ridotte (32x32 pixel). Viene spesso utilizzato per la prototipazione rapida o per scopi didattici, mentre ImageNet rappresenta una sfida di livello professionale e ad alta risoluzione per modelli pronti per la produzione.

Utilizzo dei modelli preaddestrati ImageNet

I moderni framework di IA consentono agli utenti di sfruttare senza sforzo ImageNet . L'esempio seguente mostra come caricare un modello di classificazione YOLO26, pre-addestrato su ImageNet, per classify .

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

Questo frammento utilizza il yolo26n-cls.pt modello, che ha appreso le 1.000 ImageNet , consentendogli di riconoscere istantaneamente il contenuto dell'immagine in ingresso senza alcun addestramento aggiuntivo.

ImageNet

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

ImageNet e l'ascesa delle CNN

Il ruolo della pre-formazione e dell'apprendimento trasferibile

Applicazioni nel mondo reale

ImageNet . COCO . CIFAR-10

Utilizzo dei modelli preaddestrati ImageNet

Leggi di più in questa categoria

12 casi d'uso delle immagini aeree basati sulla visione artificiale

Che cos'è la stima della profondità monoculare? Una panoramica

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Unitevi alla comunità di Ultralytics