Scopri i concetti, le tecniche e le applicazioni di Natural Language Processing (NLP) come i chatbot, l'analisi del sentimento e la traduzione automatica.
L'elaborazione del linguaggio naturale (NLP) è un campo dinamico all'interno dell'Intelligenza Artificiale (AI) e dell'Apprendimento Automatico (ML) dedicato a consentire ai computer di comprendere, elaborare, interpretare e generare il linguaggio umano, sia il testo che il parlato. Combina i principi della linguistica computazionale con modelli statistici, di ML e di Deep Learning (DL) per colmare il divario tra la comunicazione umana e la comprensione da parte del computer. L'obiettivo finale è quello di permettere alle macchine di interagire con il linguaggio in modo significativo e utile, automatizzando compiti che tradizionalmente richiedono capacità linguistiche umane.
L'NLP comprende diversi compiti fondamentali che scompongono la complessità del linguaggio in componenti che le macchine possono analizzare e su cui agire:
I sistemi NLP impiegano in genere un approccio di tipo pipeline. I dati di testo grezzi vengono prima sottoposti a una pre-elaborazione, che comprende attività come la pulizia del testo (rimozione di caratteri o formattazioni irrilevanti), la tokenizzazione e talvolta la normalizzazione (conversione delle parole in una forma base). Dopo la pre-elaborazione, vengono estratte le caratteristiche rilevanti per il compito. Queste caratteristiche vengono poi inserite nei modelli ML o DL per l'analisi o la generazione.
La PNL moderna si basa molto sulle reti neurali (NN), in particolare su architetture sofisticate come le reti neurali ricorrenti (RNN) per i dati sequenziali e, più recentemente, sui trasformatori. I trasformatori, caratterizzati da potenti meccanismi di attenzione, si sono dimostrati eccezionalmente efficaci nel catturare le dipendenze a lungo raggio e il contesto all'interno del linguaggio. Questa architettura è alla base di molti modelli all'avanguardia, tra cui le varianti di BERT e i modelli GPT come il GPT-4. Piattaforme di ricerca come l'Antologia ACL ospitano numerosi articoli che illustrano questi progressi.
La PNL è alla base di una vasta gamma di applicazioni che stanno trasformando i settori e migliorando le interazioni quotidiane. Ecco due esempi importanti:
Altre applicazioni comuni sono la sintesi del testo per condensare documenti lunghi, i motori di ricerca semantici che comprendono il significato delle query al di là della semplice corrispondenza con le parole chiave e gli strumenti di correzione grammaticale/stilistica come Grammarly. Molti casi d'uso innovativi dell'intelligenza artificiale si basano fortemente sull'NLP.
Pur essendo correlata, la PNL si differenzia da alcuni termini simili:
Lo sviluppo e l'implementazione di applicazioni NLP spesso comporta l'utilizzo di librerie e piattaforme specializzate: