Glossario

Comprensione del linguaggio naturale (NLU)

Scoprite la comprensione del linguaggio naturale (NLU), l'innovazione dell'intelligenza artificiale che consente alle macchine di comprendere, interpretare e rispondere al linguaggio umano.

La comprensione del linguaggio naturale (NLU) è un sottocampo dell'intelligenza artificiale (AI) e dell'elaborazione del linguaggio naturale (NLP) che si concentra sulla capacità delle macchine di comprendere il significato del linguaggio umano. A differenza della semplice elaborazione delle parole, l'NLU mira a interpretare l'intento, il contesto e il sentiment di un testo o di un discorso. È la parte di "comprensione" dell'interazione uomo-macchina, che consente al software di cogliere il vero significato di un utente, anche quando il linguaggio è ambiguo, colloquiale o non strutturato. Questa capacità è fondamentale per creare applicazioni AI più intuitive e potenti, in grado di interagire con le persone alle loro condizioni.

Componenti principali dell'NLU

L'NLU scompone la complessa attività di comprensione del linguaggio in diversi componenti chiave. Un sistema NLU esegue in genere una combinazione dei seguenti compiti per decostruire e interpretare l'input dell'utente:

  • Riconoscimento dell'intento: È il processo di identificazione dell'obiettivo o dello scopo dell'utente. Ad esempio, nella frase "Prenota un volo per New York", l'intento è quello di "prenotare un volo". Questo è un primo passo fondamentale per qualsiasi sistema orientato al compito, come un chatbot o un assistente virtuale. Per saperne di più su come servizi come Microsoft Azure LUIS gestiscono gli intenti.
  • Riconoscimento di entità denominate (NER): Consiste nell'identificare e classificare le informazioni chiave del testo in categorie predefinite, come nomi, organizzazioni, luoghi, date e quantità. Nell'esempio della prenotazione del volo, "New York" è un'entità di localizzazione.
  • Analisi del sentimento: Questa attività determina il tono emotivo di un testo, classificandolo come positivo, negativo o neutro. È ampiamente utilizzata per valutare il feedback dei clienti, la reputazione del marchio e l'opinione pubblica.
  • Estrazione delle relazioni: Questo compito avanzato identifica le relazioni semantiche tra le diverse entità del testo. Ad esempio, identificare che "Elon Musk" è il "CEO" di "Tesla" da un articolo di cronaca. Questo aiuta a costruire una conoscenza strutturata a partire da dati non strutturati.

Tecnologie che alimentano l'NLU

La moderna NLU si basa molto sui progressi del Machine Learning (ML), in particolare del Deep Learning (DL). Le architetture di reti neurali come i Transformers e i modelli pre-addestrati come il BERT hanno rivoluzionato le capacità di NLU catturando efficacemente le complesse relazioni contestuali all'interno del linguaggio. Queste scoperte sono fondamentali per la potenza degli attuali Large Language Models (LLM). Importanti istituti di ricerca sull'intelligenza artificiale come lo Stanford NLP Group e librerie e piattaforme open-source come spaCy e Hugging Face contribuiscono in modo determinante al progresso del settore, mentre organizzazioni come l'Association for Computational Linguistics (ACL) guidano la ricerca.

NLU e concetti correlati

È importante distinguere l'NLU da termini strettamente correlati:

  • Elaborazione del linguaggio naturale (NLP): NLU è un sottocampo specializzato di NLP. Mentre l'NLP è un campo ampio che copre tutti gli aspetti dell'intersezione tra computer e linguaggio umano, l'NLU si concentra specificamente sulla comprensione e sull'estrazione del significato (l'input). L'NLP comprende anche la generazione del linguaggio naturale (NLG), che si occupa della produzione di testi simili a quelli umani (l'output). In breve, l'NLU si occupa di "leggere", mentre l'NLP si occupa di "leggere, scrivere e manipolare" il linguaggio.
  • Visione artificiale (CV): NLU si occupa di dati linguistici, mentre CV si concentra sull'interpretazione di informazioni provenienti da input visivi come immagini e video. Modelli CV come Ultralytics YOLO sono utilizzati per compiti come il rilevamento di oggetti. Tuttavia, i campi si stanno sempre più intersecando in modelli multimodali che elaborano sia il testo che le immagini, consentendo applicazioni a cavallo tra NLP e CV. Anche se piattaforme come Ultralytics HUB si concentrano principalmente sull'IA della visione, i principi di base dell'apprendimento profondo spesso si sovrappongono. Per ulteriori informazioni sulle applicazioni di IA, è possibile consultare la documentazione di Ultralytics.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti