Glossario

Riconoscimento delle immagini

Scoprite come il riconoscimento delle immagini consenta all'intelligenza artificiale di classificare e comprendere le immagini, promuovendo l'innovazione nei settori della sanità, della vendita al dettaglio, della sicurezza e altro ancora.

Il riconoscimento delle immagini è un ampio campo della computer vision che consente alle macchine di identificare e interpretare oggetti, persone, luoghi e azioni all'interno di immagini o video digitali. È una tecnologia fondamentale che alimenta innumerevoli applicazioni, dallo sblocco del telefono con il viso alla possibilità per i veicoli autonomi di navigare in ambienti complessi. Il riconoscimento delle immagini utilizza algoritmi di apprendimento automatico (ML) e di apprendimento profondo (DL) per analizzare i pixel ed estrarre modelli significativi, imitando la capacità umana di comprendere le informazioni visive.

Riconoscimento di immagini e compiti correlati

Anche se spesso viene usato in modo intercambiabile, il riconoscimento delle immagini è un termine generale che comprende diversi compiti più specifici. È importante distinguerlo dai suoi sottocampi:

  • Classificazione delle immagini: È la forma più semplice di riconoscimento delle immagini. Consiste nell'assegnare una singola etichetta a un'intera immagine da un insieme predefinito di categorie. Ad esempio, un modello potrebbe classificare un'immagine come contenente un "gatto", un "cane" o un'"automobile". Il risultato è un'etichetta per l'intera immagine.
  • Rilevamento degli oggetti: Un'attività più avanzata, il rilevamento degli oggetti non solo classifica gli oggetti all'interno di un'immagine, ma li localizza anche, in genere disegnando un riquadro di delimitazione intorno a ciascuno di essi. Un'auto a guida autonoma, ad esempio, utilizza il rilevamento degli oggetti per identificare e localizzare pedoni, altri veicoli e segnali stradali.
  • Segmentazione dell'immagine: Questo compito va oltre, identificando i pixel precisi che appartengono a ciascun oggetto in un'immagine. Crea una maschera dettagliata per ogni oggetto, fondamentale per le applicazioni che richiedono una comprensione profonda della forma e dei confini di un oggetto, come ad esempio nell'analisi delle immagini mediche.

Come funziona il riconoscimento delle immagini

Il moderno riconoscimento delle immagini si basa prevalentemente sulle reti neurali convoluzionali (CNN), un tipo di rete neurale particolarmente efficace nell'elaborazione di dati reticolari come le immagini. Il processo prevede in genere:

  1. Raccolta dei dati: Viene raccolto un ampio set di immagini etichettate. Esempi famosi sono ImageNet e COCO.
  2. Formazione del modello: La CNN viene addestrata su questo set di dati. Durante l'addestramento, la rete impara a identificare i modelli, da semplici bordi e texture a parti di oggetti complessi, attraverso un processo chiamato estrazione di caratteristiche. I pesi del modello vengono regolati per ridurre al minimo la differenza tra le sue previsioni e le etichette della verità.
  3. Inferenza: Una volta addestrato, il modello può fare previsioni su nuove immagini non viste. Questo processo di applicazione del modello addestrato si chiama inferenza.

Applicazioni del mondo reale

Il riconoscimento delle immagini è diventato parte integrante di molti settori:

  • Sanità: Nell'IA in ambito sanitario, il riconoscimento delle immagini aiuta i radiologi a individuare tumori, fratture e altre anomalie in radiografie, risonanze magnetiche e TAC. Ad esempio, i modelli possono essere addestrati su insiemi di immagini mediche per identificare i tumori cerebrali con elevata precisione, aiutando i medici a fare diagnosi più rapide.
  • Commercio al dettaglio: I rivenditori utilizzano il riconoscimento delle immagini per la gestione dell'inventario: le telecamere monitorano gli scaffali per rilevare l'esaurimento dei prodotti. Le funzioni di ricerca visiva sui siti di e-commerce, che consentono ai clienti di caricare una foto per trovare prodotti simili, sono un'altra applicazione popolare. Per saperne di più, consultate la nostra pagina dedicata all'intelligenza artificiale nella vendita al dettaglio.

Strumenti e formazione

Lo sviluppo di applicazioni di riconoscimento delle immagini spesso comporta l'utilizzo di librerie e framework specializzati. Le tecnologie chiave includono:

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti