Glossario

Riconoscimento delle immagini

Scopri come il riconoscimento delle immagini consente all'intelligenza artificiale di classificare e comprendere le immagini, promuovendo l'innovazione nei settori della sanità, della vendita al dettaglio, della sicurezza e altro ancora.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Il riconoscimento delle immagini è una branca cruciale dell'intelligenza artificiale (AI) e della computer vision (CV) che consente alle macchine di identificare e interpretare le informazioni visive contenute nelle immagini o nei video. Non si tratta solo di vedere i pixel, ma di comprendere i contenuti, come oggetti, persone, scene e azioni rappresentate nei dati visivi. Questa tecnologia costituisce la base di innumerevoli applicazioni, consentendo ai sistemi di "vedere" e dare un senso al mondo in modo simile agli esseri umani.

Come funziona il riconoscimento delle immagini

Il riconoscimento delle immagini si basa essenzialmente sull'apprendimento automatico (ML), in particolare sugli algoritmi di deep learning (DL). Le reti neurali convoluzionali (CNN) sono un componente fondamentale, progettato per apprendere automaticamente e in modo adattivo gerarchie spaziali di caratteristiche dalle immagini. Il processo prevede in genere l'addestramento di un modello su vasti dataset di immagini etichettate, come il famoso dataset ImageNet, in cui ogni immagine è etichettata con informazioni sul suo contenuto, spesso organizzate utilizzando strutture come la gerarchia WordNet. Durante l'addestramento, il modello impara ad associare specifici schemi e caratteristiche visive (come bordi, texture, forme) a diverse etichette o categorie. Architetture come ResNet hanno prestazioni significativamente avanzate in questi compiti. Una volta addestrato, il modello può analizzare nuove immagini inedite e prevedere gli oggetti o i concetti presenti al loro interno. La comprensione di questi concetti può essere approfondita attraverso risorse come la specializzazione Deep Learning. Se ImageNet è fondamentale per la classificazione, i dataset come COCO sono fondamentali anche per compiti di comprensione visiva più ampi. Una formazione efficace dei modelli richiede un'attenta pianificazione ed esecuzione.

Distinzione dai termini correlati

Sebbene sia correlato ad altre attività di computer vision, il riconoscimento delle immagini è spesso utilizzato come termine più ampio che comprende diverse funzionalità specifiche. È importante distinguerlo da compiti più ristretti:

Il riconoscimento delle immagini può talvolta riferirsi specificamente alla classificazione delle immagini, ma spesso implica la capacità più ampia di comprendere il contenuto dell'immagine, che potrebbe comportare il rilevamento o la segmentazione a seconda delle esigenze dell'applicazione.

Applicazioni del mondo reale

Il riconoscimento delle immagini è alla base di un'ampia gamma di applicazioni in diversi settori:

Il campo è in continua evoluzione, grazie alla ricerca condivisa in sedi come la Conference on Computer Vision and Pattern Recognition (CVPR) e organizzazioni come la Computer Vision Foundation (CVF). Leggi gli approfondimenti pratici sul Google Cloud AI Blog.

Strumenti e formazione

Lo sviluppo di applicazioni di riconoscimento delle immagini spesso comporta l'utilizzo di librerie e framework specializzati. Le tecnologie chiave includono:

Leggi tutto