Descobre conceitos, técnicas e aplicações de Processamento de Linguagem Natural (PNL), como chatbots, análise de sentimentos e tradução automática.
O Processamento de Linguagem Natural (PLN) é um campo dinâmico da Inteligência Artificial (IA) e da Aprendizagem Automática (AM) dedicado a permitir que os computadores compreendam, processem, interpretem e gerem linguagem humana, tanto texto como discurso. Combina princípios da linguística computacional com modelos estatísticos, ML e modelos de Aprendizagem Profunda (DL) para colmatar a lacuna entre a comunicação humana e a compreensão do computador. O objetivo final é permitir que as máquinas interajam com a linguagem de uma forma que seja significativa e útil, automatizando tarefas que tradicionalmente requerem capacidades linguísticas humanas.
A PNL envolve várias tarefas essenciais que decompõem as complexidades da linguagem em componentes que as máquinas podem analisar e utilizar:
Os sistemas de PNL utilizam normalmente uma abordagem de pipeline. Os dados de texto em bruto são primeiro submetidos a um pré-processamento de dados, que inclui tarefas como a limpeza do texto (remoção de caracteres irrelevantes ou formatação), tokenização e, por vezes, normalização (conversão de palavras para uma forma básica). Após o pré-processamento, são extraídas as caraterísticas relevantes para a tarefa. Estas caraterísticas são depois introduzidas em modelos de ML ou DL para análise ou geração.
A PNL moderna baseia-se fortemente nas redes neuronais (NN), em especial em arquitecturas sofisticadas como as redes neuronais recorrentes (RNN) para dados sequenciais e, mais recentemente, nos transformadores. Os transformadores, que se distinguem pelos seus poderosos mecanismos de atenção, provaram ser excecionalmente eficazes na captação de dependências de longo alcance e de contexto dentro da linguagem. Esta arquitetura está na base de muitos dos modelos mais avançados, incluindo variantes dos modelos BERT e GPT, como o GPT-4. As plataformas de investigação, como a Antologia ACL, acolhem numerosos documentos que detalham estes avanços.
A PNL está na origem de uma vasta gama de aplicações que estão a transformar as indústrias e a melhorar as interações diárias. Eis dois exemplos importantes:
Outras aplicações comuns incluem a sumarização de texto para condensar documentos longos, motores de pesquisa semântica que compreendem o significado da consulta para além da simples correspondência de palavras-chave e ferramentas de correção gramatical/estilo como o Grammarly. Muitos casos de utilização inovadores da IA dependem fortemente da PNL.
Embora relacionada, a PNL difere de alguns termos semelhantes:
O desenvolvimento e a implementação de aplicações de PNL implicam frequentemente o recurso a bibliotecas e plataformas especializadas: