Glossario

Apprendimento a colpo zero

Scopri l'Apprendimento Zero-Shot: un approccio AI all'avanguardia che consente ai modelli di classificare dati non visti, rivoluzionando il rilevamento di oggetti, l'NLP e molto altro ancora.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Lo Zero-Shot Learning (ZSL) rappresenta un'area affascinante del Machine Learning (ML) in cui un modello viene addestrato a riconoscere e classificare categorie di dati che non ha mai visto esplicitamente durante la fase di addestramento. A differenza dei tradizionali approcci di apprendimento supervisionato che richiedono esempi etichettati per ogni possibile categoria, lo ZSL mira a generalizzare la conoscenza da classi già viste a classi non viste utilizzando informazioni ausiliarie condivise. Questa capacità è particolarmente preziosa negli scenari reali in cui l'acquisizione di dati etichettati per ogni possibile categoria è impraticabile o impossibile.

Come funziona l'apprendimento a colpo zero

L'idea alla base di ZSL è quella di apprendere una mappatura tra lo spazio delle caratteristiche di input (ad esempio, le caratteristiche di un'immagine o di un testo) e uno spazio di incorporazione semantica. Questo spazio semantico in genere codifica proprietà descrittive di alto livello o attributi che sono condivisi tra le classi viste e quelle non viste. Ad esempio, nella computer vision, questi potrebbero essere attributi visivi come "ha le strisce", "ha la pelliccia", "ha le ali", oppure descrizioni testuali. Nell'elaborazione del linguaggio naturale (NLP), gli incorporamenti di parole fungono spesso da spazio semantico.

Durante l'addestramento, il modello impara ad associare le caratteristiche delle classi viste con le loro corrispondenti rappresentazioni semantiche (ad esempio, attributi o embeddings). Al momento dell'inferenza, quando viene presentata un'istanza di una classe non vista, il modello estrae le sue caratteristiche e le mappa nello spazio semantico appreso. Confrontando questa mappatura con le rappresentazioni semantiche note delle classi non viste (fornite separatamente), il modello può prevedere l'etichetta della classe anche senza esempi precedenti. I modelli di Deep Learning, in particolare quelli che utilizzano tecniche di apprendimento contrastivo come CLIP, sono spesso utilizzati per compiti ZSL grazie alla loro capacità di apprendere rappresentazioni ricche di caratteristiche. Puoi esplorare diversi dataset adatti a questi compiti, come quelli elencati nella documentazione sui Dataset diUltralytics .

Applicazioni del mondo reale

L'apprendimento Zero-Shot consente di realizzare potenti applicazioni in vari settori:

  1. Riconoscimento di oggetti nuovi: Nella classificazione delle immagini o nel rilevamento degli oggetti, la ZSL permette ai sistemi di identificare oggetti non presenti nei dati di addestramento iniziali. Ad esempio, un sistema di monitoraggio della fauna selvatica addestrato su animali comuni potrebbe identificare una specie rara o appena scoperta sulla base di una descrizione testuale o di un insieme di attributi semantici forniti da esperti. Modelli come Ultralytics YOLO sfruttano questa capacità per il rilevamento del vocabolario aperto.
  2. Categorizzazione dinamica dei contenuti: ZSL può classificare documenti, articoli di cronaca o contenuti generati dagli utenti in base ad argomenti emergenti per i quali non esistono dati etichettati in precedenza. Un sistema potrebbe essere addestrato sulle categorie esistenti e poi utilizzare le incorporazioni di parole o le descrizioni degli argomenti per classificare i contenuti relativi a eventi o tendenze impreviste.

ZSL vs. paradigmi di apprendimento correlati

È importante distinguere la ZSL dai concetti correlati:

  • Apprendimento a pochi colpi: Mira ad apprendere nuove classi da un numero molto ridotto di esempi etichettati (più di zero).
  • Apprendimento one-shot: Un caso specifico di apprendimento a pochi colpi in cui è disponibile un solo esempio etichettato per ogni nuova classe.
  • Apprendimento di trasferimento: Si tratta di sfruttare le conoscenze acquisite in un compito o in un dominio per migliorare le prestazioni in un compito o in un dominio diverso ma correlato. Spesso comporta la messa a punto di un modello pre-addestrato su dati di destinazione, che di solito includono esempi delle classi di destinazione.

La differenza fondamentale è che lo ZSL opera sotto la stretta condizione di avere zero esempi etichettati per le classi target durante l'addestramento o l'adattamento. Per una panoramica comparativa, consulta la discussione su Comprendere l'apprendimento a pochi colpi, a zero colpi e a trasferimento.

Importanza nell'IA

L'apprendimento Zero-Shot migliora significativamente la scalabilità e l'adattabilità dei sistemi di intelligenza artificiale. Riduce la dipendenza dalla raccolta e dall'annotazione esaustiva dei dati, che spesso rappresenta un collo di bottiglia nello sviluppo di applicazioni di ML su larga scala. Consentendo ai modelli di ragionare su concetti sconosciuti, ZSL spinge i confini della generalizzazione nell'Intelligenza Artificiale (IA), rendendo i sistemi più robusti e capaci di gestire la natura aperta del mondo reale. Piattaforme come Ultralytics HUB facilitano l'addestramento e l'implementazione di modelli, compresi quelli che in futuro potrebbero sfruttare i principi della ZSL. Per maggiori dettagli sulla ricerca ZSL, consulta risorse come la pagina ZSL di Wikipedia o le ricerche accademiche presenti su piattaforme come arXiv.

Leggi tutto