Glossario

Riconoscimento delle immagini

Scopri come il riconoscimento delle immagini consente all'intelligenza artificiale di classificare e comprendere le immagini, promuovendo l'innovazione nei settori della sanità, della vendita al dettaglio, della sicurezza e altro ancora.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Il riconoscimento delle immagini è una branca cruciale dell'intelligenza artificiale (AI) e della computer vision (CV) che consente alle macchine di identificare e interpretare le informazioni visive contenute nelle immagini o nei video. Non si tratta solo di vedere i pixel, ma di comprendere i contenuti, come oggetti, persone, scene e azioni rappresentate nei dati visivi. Questa tecnologia costituisce la base di innumerevoli applicazioni, consentendo ai sistemi di "vedere" e dare un senso al mondo in modo simile agli esseri umani.

Come funziona il riconoscimento delle immagini

Il riconoscimento delle immagini si basa essenzialmente sull'apprendimento automatico (ML), in particolare sugli algoritmi di deep learning (DL). Le reti neurali convoluzionali (CNN) sono un componente fondamentale, progettato per apprendere automaticamente e in modo adattivo gerarchie spaziali di caratteristiche dalle immagini. Il processo prevede in genere l'addestramento di un modello su vasti dataset di immagini etichettate, come ad esempio il dataset ImageNet, in cui ogni immagine è etichettata con informazioni sul suo contenuto. Durante l'addestramento, il modello impara ad associare specifici modelli e caratteristiche visive a diverse etichette o categorie. Una volta addestrato, il modello può analizzare nuove immagini inedite e prevedere gli oggetti o i concetti presenti al loro interno.

Distinzione dai termini correlati

Sebbene sia correlato ad altre attività di computer vision, il riconoscimento delle immagini presenta sfumature specifiche:

  • Classificazione delle immagini: Spesso utilizzata in modo intercambiabile con il riconoscimento delle immagini, la classificazione si concentra in genere sull'assegnazione di una singola etichetta primaria a un'intera immagine (ad esempio, identificare un'immagine come contenente un "gatto" o un "cane"). Il riconoscimento delle immagini può talvolta implicare una comprensione più ampia, come l'identificazione di più oggetti o azioni all'interno della scena. I modelliYOLO Ultralytics , come YOLOv11, possono eseguire compiti di classificazione delle immagini.
  • Rilevamento degli oggetti: Questo compito fa un passo avanti rispetto al semplice riconoscimento, identificando non solo gli oggetti presenti nell'immagine ma anche la loro posizione, in genere disegnando dei riquadri di delimitazione intorno ad essi.
  • Segmentazione delle immagini: Fornisce una comprensione più dettagliata classificando ogni pixel di un'immagine per determinare l'esatto contorno o la forma degli oggetti, distinguendo tra diverse istanze(segmentazione di istanza) o categorie(segmentazione semantica).

Applicazioni del mondo reale

Il riconoscimento delle immagini è alla base di un'ampia gamma di applicazioni in diversi settori:

  • Assistenza sanitaria: Viene utilizzata nell'analisi delle immagini mediche per aiutare i radiologi a rilevare anomalie come tumori o fratture nelle radiografie, nelle TAC e nelle risonanze magnetiche, portando potenzialmente a diagnosi più precoci. Ad esempio, i modelli possono essere addestrati per compiti come il rilevamento dei tumori nell'imaging medico.
  • Vendita al dettaglio: Consente applicazioni come i sistemi di cassa automatizzati che identificano i prodotti senza codice a barre, migliora la gestione dell'inventario al dettaglio monitorando i livelli delle scorte e analizza il comportamento dei clienti nei negozi.
  • Sicurezza e sorveglianza: Alimenta i sistemi di riconoscimento facciale per la verifica dell'identità e il controllo degli accessi e rileva intrusioni o attività insolite nei feed video, contribuendo a sistemi come la computer vision per la prevenzione dei furti.
  • Veicoli autonomi: È essenziale che l 'intelligenza artificiale delle auto a guida autonoma riconosca i pedoni, gli altri veicoli, i semafori e i segnali stradali, consentendo una navigazione sicura.
  • Moderazione dei contenuti: Le piattaforme di social media e i servizi online utilizzano il riconoscimento delle immagini per individuare e filtrare automaticamente i contenuti inappropriati o dannosi, come i deepfake o le immagini che violano le politiche, guidati dai principi dell'etica dell'IA.

Strumenti e tecnologie

Lo sviluppo di sistemi di riconoscimento delle immagini spesso implica l'utilizzo di strumenti e framework specializzati. Librerie come OpenCV forniscono funzioni essenziali di elaborazione delle immagini, mentre framework di deep learning come PyTorch e TensorFlow offrono gli elementi di base per la creazione e l'addestramento di complessi modelli di reti neurali. Piattaforme come Ultralytics HUB semplificano il processo di formazione, distribuzione e gestione dei modelli di computer vision, compresi quelli utilizzati per il riconoscimento e la classificazione.

Leggi tutto