Glossário

Janela de contexto

Descobre como as janelas de contexto melhoram os modelos de IA/ML em PNL, análise de séries temporais e IA de visão, melhorando as previsões e a precisão.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

No domínio da aprendizagem automática, em particular no processamento de linguagem natural (PNL) e na análise de séries temporais, o termo "janela de contexto" refere-se a um intervalo específico de dados de entrada que um modelo considera ao fazer previsões ou processar informações. Esta janela define o âmbito da informação que o modelo analisa para compreender o contexto em torno de um determinado ponto de dados. A dimensão da janela de contexto tem um impacto significativo na capacidade do modelo para captar padrões e dependências relevantes nos dados. Por exemplo, na PNL, a janela de contexto determina quantas palavras antes e depois de uma palavra-alvo o modelo examina para compreender o seu significado e utilização.

Importância das janelas de contexto

As janelas de contexto são cruciais para aumentar a precisão e a eficácia dos modelos de aprendizagem automática. Ao fornecer um âmbito definido de informações relevantes, os modelos podem compreender melhor as relações entre os pontos de dados. Isto é especialmente importante em tarefas como o processamento de linguagem natural (PNL), em que o significado de uma palavra pode mudar com base nas palavras circundantes, ou na análise de séries temporais, em que os valores passados influenciam as previsões futuras. Uma janela de contexto bem escolhida garante que o modelo tenha informações suficientes para fazer previsões precisas sem ser sobrecarregado por dados irrelevantes.

Janela de contexto no processamento de linguagem natural (NLP)

Na PNL, a janela de contexto é um componente essencial para os modelos compreenderem e gerarem linguagem humana. Por exemplo, ao analisar uma frase, um modelo com uma janela de contexto de cinco palavras pode considerar duas palavras antes e duas palavras depois da palavra-alvo. Isto permite ao modelo captar o ambiente linguístico imediato e melhorar tarefas como a análise de sentimentos, o reconhecimento de entidades nomeadas (NER) e a tradução automática. Os modelos de transformação, como o BERT e o GPT, utilizam grandes janelas de contexto para obter o melhor desempenho em várias tarefas de PLN.

Janela de contexto na análise de séries cronológicas

Na análise de séries temporais, a janela de contexto define o número de passos passados que um modelo considera ao prever valores futuros. Por exemplo, um modelo de previsão de preços de acções pode utilizar uma janela de contexto dos dados dos últimos 30 dias. Isto permite ao modelo identificar tendências, padrões sazonais e outras dependências temporais que influenciam os resultados futuros. O tamanho da janela de contexto pode variar consoante a aplicação específica e a natureza dos dados. Técnicas como as redes LSTM (Long Short-Term Memory) e as RNN (Recurrent Neural Networks) são normalmente utilizadas para processar dados sequenciais dentro de uma janela de contexto definida.

Janela de contexto na IA de visão

Embora menos comuns, as janelas de contexto também podem desempenhar um papel em tarefas de visão computacional (CV), especialmente quando se trata de dados de vídeo ou sequências de imagens. Por exemplo, no seguimento de objectos, um modelo pode considerar uma janela de contexto de vários fotogramas consecutivos para prever o movimento e a trajetória de um objeto. Isto ajuda o modelo a manter a consistência e a precisão no rastreio, mesmo quando o objeto está temporariamente ocluído ou se desloca para fora da vista. Ultralytics Os modelosYOLO , conhecidos pelas suas capacidades de deteção de objectos em tempo real, podem ser adaptados para incorporar janelas de contexto para melhorar o desempenho em tarefas de análise de vídeo.

Exemplos de janelas de contexto em aplicações IA/ML do mundo real

Exemplo 1: Chatbots e assistentes virtuais

Os chatbots e os assistentes virtuais dependem muito das janelas de contexto para dar respostas relevantes e coerentes. Ao manter uma janela de contexto das interações recentes, estes sistemas podem compreender a conversa em curso e responder adequadamente. Por exemplo, um chatbot pode utilizar uma janela de contexto das últimas cinco mensagens para compreender a intenção do utilizador e dar uma resposta contextualmente relevante. Esta capacidade é essencial para criar uma experiência de utilizador natural e envolvente.

Exemplo 2: Texto preditivo e preenchimento automático

O texto preditivo e as funcionalidades de preenchimento automático nos teclados e motores de busca utilizam janelas de contexto para sugerir a palavra ou frase seguinte com base no texto anterior. Ao analisar uma janela de contexto das palavras anteriormente digitadas, estes sistemas podem prever a continuação mais provável, melhorando a velocidade e a precisão da digitação. Por exemplo, ao escrever um e-mail, o sistema pode sugerir que completes uma frase com base no contexto das palavras anteriores, tornando o processo de escrita mais eficiente.

Janela de contexto vs. outros termos relacionados

Janela de contexto vs. comprimento da sequência

Em NLP, o termo "comprimento da sequência" refere-se frequentemente ao número total de tokens numa sequência de entrada. Embora relacionada, a janela de contexto refere-se especificamente à parte da sequência que o modelo considera ativamente para uma determinada previsão. Por exemplo, um modelo pode processar uma sequência de 100 palavras, mas utilizar apenas uma janela de contexto de 10 palavras em torno da palavra-alvo para a sua análise.

Janela de Contexto vs. Campo Recetivo

Nas redes neuronais convolucionais (CNN), o campo recetivo refere-se à região do espaço de entrada que uma determinada caraterística da CNN pode "ver" ou pela qual é afetada. Embora ambos os termos estejam relacionados com o âmbito dos dados de entrada considerados por um modelo, a janela de contexto é mais geral e aplica-se a vários tipos de modelos e tarefas, enquanto o campo recetivo é específico das CNN.

Para mais pormenores sobre conceitos e ferramentas específicos mencionados, podes consultar os seguintes recursos:

Lê tudo