Scopri i concetti, le tecniche e le applicazioni di Natural Language Processing (NLP) come i chatbot, l'analisi del sentimento e la traduzione automatica.
L'elaborazione del linguaggio naturale (NLP) è un campo dinamico all'interno dell'Intelligenza Artificiale (AI) e dell'Apprendimento Automatico (ML) dedicato a consentire ai computer di comprendere, elaborare, interpretare e generare il linguaggio umano, sia il testo che il parlato. Combina la linguistica computazionale con la modellazione statistica, il ML e i modelli di Deep Learning (DL) per colmare il divario tra la comunicazione umana e la comprensione del computer. L'obiettivo è permettere alle macchine di interagire con il linguaggio in modo significativo e utile.
L'NLP comprende diverse attività fondamentali che scompongono il linguaggio in componenti comprensibili per le macchine:
I sistemi NLP seguono tipicamente un approccio a pipeline. I dati di testo grezzi vengono sottoposti a una pre-elaborazione (come la tokenizzazione e la pulizia) prima di estrarre le caratteristiche. Queste caratteristiche vengono poi inserite in modelli ML o DL. L'NLP moderno si basa molto sulle reti neurali, in particolare su architetture come le reti neurali ricorrenti (RNN) e, più recentemente, i trasformatori. I Transformer, noti per i loro meccanismi di attenzione, eccellono nel catturare il contesto nel linguaggio, alimentando modelli all'avanguardia come il GPT-4. Piattaforme di ricerca come l'Antologia ACL ospitano molti articoli che illustrano questi progressi.
La PNL è alla base di una vasta gamma di applicazioni che trasformano i settori e le interazioni quotidiane:
Altre applicazioni comuni sono il filtraggio delle e-mail di spam, la sintesi del testo, i motori di ricerca semantici e gli strumenti di correzione grammaticale come Grammarly.
Pur essendo correlata, la PNL si differenzia da termini simili:
Lo sviluppo di applicazioni NLP spesso implica l'utilizzo di librerie e framework come spaCy o NLTK e di piattaforme come Hugging Face che forniscono l'accesso a numerosi modelli e dataset pre-addestrati. Per la distribuzione e la gestione dei modelli, compresi quelli utilizzati nelle pipeline NLP o CV-NLP combinate, piattaforme come Ultralytics HUB offrono solide funzionalità MLOps.