Glossario

Elaborazione del linguaggio naturale (NLP)

Scopri i concetti, le tecniche e le applicazioni di Natural Language Processing (NLP) come i chatbot, l'analisi del sentimento e la traduzione automatica.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'elaborazione del linguaggio naturale (NLP) è un campo dinamico all'interno dell'Intelligenza Artificiale (AI) e dell'Apprendimento Automatico (ML) dedicato a consentire ai computer di comprendere, elaborare, interpretare e generare il linguaggio umano, sia il testo che il parlato. Combina i principi della linguistica computazionale con modelli statistici, di ML e di Deep Learning (DL) per colmare il divario tra la comunicazione umana e la comprensione da parte del computer. L'obiettivo finale è quello di permettere alle macchine di interagire con il linguaggio in modo significativo e utile, automatizzando compiti che tradizionalmente richiedono capacità linguistiche umane.

Concetti chiave della PNL

L'NLP comprende diversi compiti fondamentali che scompongono la complessità del linguaggio in componenti che le macchine possono analizzare e su cui agire:

  • Tokenizzazione: La fase iniziale di scomposizione del testo in unità più piccole, come parole o sottoparole (token).
  • Riconoscimento di entità denominate (NER): Identificazione e categorizzazione di entità chiave in un testo, come nomi di persone, organizzazioni, luoghi, date e valori monetari.
  • Analisi del sentimento: Determinare il tono emotivo o l'opinione soggettiva espressa in un testo (ad esempio, positivo, negativo, neutro).
  • Traduzione automatica: Traduzione automatica di un testo o di un discorso da una lingua all'altra, come avviene in strumenti come Google Translate.
  • Modellazione linguistica: Costruire modelli che prevedano la probabilità di una sequenza di parole, fondamentale per attività come la generazione di testi e il riconoscimento vocale.

Come funziona la PNL

I sistemi NLP impiegano in genere un approccio di tipo pipeline. I dati di testo grezzi vengono prima sottoposti a una pre-elaborazione, che comprende attività come la pulizia del testo (rimozione di caratteri o formattazioni irrilevanti), la tokenizzazione e talvolta la normalizzazione (conversione delle parole in una forma base). Dopo la pre-elaborazione, vengono estratte le caratteristiche rilevanti per il compito. Queste caratteristiche vengono poi inserite nei modelli ML o DL per l'analisi o la generazione.

La PNL moderna si basa molto sulle reti neurali (NN), in particolare su architetture sofisticate come le reti neurali ricorrenti (RNN) per i dati sequenziali e, più recentemente, sui trasformatori. I trasformatori, caratterizzati da potenti meccanismi di attenzione, si sono dimostrati eccezionalmente efficaci nel catturare le dipendenze a lungo raggio e il contesto all'interno del linguaggio. Questa architettura è alla base di molti modelli all'avanguardia, tra cui le varianti di BERT e i modelli GPT come il GPT-4. Piattaforme di ricerca come l'Antologia ACL ospitano numerosi articoli che illustrano questi progressi.

Applicazioni della PNL

La PNL è alla base di una vasta gamma di applicazioni che stanno trasformando i settori e migliorando le interazioni quotidiane. Ecco due esempi importanti:

  1. Assistenti virtuali e chatbot: Sistemi come Siri di Apple e Alexa di Amazon, oltre a innumerevoli chatbot del servizio clienti, utilizzano ampiamente la PNL. Utilizzano il riconoscimento vocale per convertire le parole pronunciate in testo, la comprensione del linguaggio naturale (NLU) per capire l'intento dell'utente e talvolta la generazione di testo per formulare le risposte.
  2. Filtraggio dello spam via e-mail: Le tecniche NLP analizzano il contenuto delle e-mail per identificare gli schemi caratteristici dello spam o dei tentativi di phishing. Gli algoritmi classificano le email in base a parole chiave, reputazione del mittente e struttura linguistica, aiutando a mantenere le caselle di posta pulite e sicure.

Altre applicazioni comuni sono la sintesi del testo per condensare documenti lunghi, i motori di ricerca semantici che comprendono il significato delle query al di là della semplice corrispondenza con le parole chiave e gli strumenti di correzione grammaticale/stilistica come Grammarly. Molti casi d'uso innovativi dell'intelligenza artificiale si basano fortemente sull'NLP.

PNL e concetti correlati

Pur essendo correlata, la PNL si differenzia da alcuni termini simili:

  • Comprensione del linguaggio naturale (NLU): L'NLU è un sottoinsieme della PNL che si concentra in modo specifico sull'aspetto della comprensione: estrarre il significato, l'intento e il contesto dal linguaggio. La PNL è più ampia e comprende anche attività come la generazione di testi e la sintesi vocale.
  • Generazione di testo: Si tratta di una capacità o di un compito specifico della PNL che si concentra sulla produzione di testi simili a quelli umani. Pur essendo una parte fondamentale di molte applicazioni NLP (come i chatbot o la traduzione), non copre gli aspetti di comprensione o analisi dell'NLP.
  • Computer Vision (CV): La CV si occupa di interpretare e comprendere le informazioni provenienti da input visivi come immagini e video, concentrandosi su compiti come il rilevamento di oggetti o la segmentazione di immagini. La PNL, al contrario, si concentra sui dati linguistici. Tuttavia, i due campi si stanno intersecando sempre di più in modelli multimodali che elaborano sia il testo che le immagini, consentendo applicazioni come il sottotitolaggio automatico delle immagini. Per saperne di più sul collegamento tra NLP e CV. Ultralytics è specializzata in CV e offre modelli come Ultralytics YOLO11 per compiti che richiedono alta precisione e velocità.

Strumenti e piattaforme

Lo sviluppo e l'implementazione di applicazioni NLP spesso comporta l'utilizzo di librerie e piattaforme specializzate:

  • Librerie: Le librerie open-source come spaCy e NLTK forniscono strumenti per le attività NLP più comuni come la tokenizzazione, il parsing e il riconoscimento delle entità.
  • Piattaforme: Hugging Face offre un vasto archivio di modelli pre-addestrati (soprattutto Transformers), dataset e strumenti che accelerano notevolmente lo sviluppo. Per gestire il ciclo di vita end-to-end dei modelli di ML, compresi quelli utilizzati in pipeline NLP o combinate CV-NLP, piattaforme come Ultralytics HUB offrono solide funzionalità MLOps, semplificando la formazione, la distribuzione e il monitoraggio. Esplora la documentazione di Ultralytics per ulteriori risorse sullo sviluppo e la distribuzione dei modelli.
Leggi tutto