Глоссарий

Контекстное окно

Узнай, как контекстные окна улучшают модели AI/ML в NLP, анализе временных рядов и зрительном AI, повышая точность предсказаний.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Контекстное окно - это конечный промежуток предшествующей (а иногда и последующей) информации, который модель машинного обучения учитывает при обработке последовательных данных, таких как текст или временные ряды. Думай об этом как о фокусе или кратковременной памяти модели в любой момент последовательности. Эта концепция очень важна, потому что она определяет, какой объем контекста модель может использовать для понимания взаимосвязей, прогнозирования или генерации релевантных результатов. Размер контекстного окна напрямую влияет на способность модели улавливать зависимости в данных, что сказывается как на ее производительности, так и на вычислительных требованиях.

Контекстное окно в обработке естественного языка (NLP)

Контекстное окно - это фундаментальное понятие в обработке естественного языка (NLP). Такие модели, как трансформеры, которые лежат в основе таких архитектур, как BERT и GPT, в значительной степени опираются на контекстные окна. В этих моделях контекстное окно определяет, сколько предшествующих лексем (слов или подслов) учитывается при обработке конкретной лексемы. Большее контекстное окно позволяет модели понять более дальние зависимости в тексте, что потенциально может привести к более связным и контекстно-ориентированным результатам, как это наблюдается в таких продвинутых моделях, как GPT-4 от OpenAI. Однако большие окна также увеличивают вычислительную нагрузку и расход памяти во время обучения и вывода.

Контекстное окно в искусственном интеллекте зрения

Хотя идея контекстного окна чаще всего обсуждается в НЛП, она также применима в компьютерном зрении (КЗ), особенно при анализе видеопотоков или последовательностей изображений. Например, при отслеживании объектов модель может использовать контекстное окно из нескольких последовательных кадров, чтобы лучше предсказать траекторию движения объекта и справиться с окклюзиями. Этот временной контекст помогает поддерживать согласованность отслеживания. Модели Ultralytics YOLO , в первую очередь известные для обнаружения объектов в реальном времени, могут быть интегрированы в системы, использующие контекстные окна для таких задач, как анализ видео, что расширяет их возможности за пределы обработки одного кадра. Изучи решенияUltralytics , чтобы найти примеры передовых приложений для зрения.

Примеры использования контекстного окна в реальных приложениях AI/ML

  • Чатботы и виртуальные помощники: Такие системы, как чат-боты и виртуальные помощники, используют контекстные окна, чтобы запомнить несколько последних поворотов разговора. Это позволяет им понимать последующие вопросы и давать релевантные ответы, создавая более естественное взаимодействие. Без достаточного контекста ассистент может рассматривать каждый запрос независимо, что приведет к разрозненным беседам. Ты можешь изучить такие платформы, как Ultralytics HUB, для создания и развертывания моделей ИИ.
  • Предиктивный текст и автозавершение: Когда ты набираешь текст на телефоне или используешь поисковую систему, алгоритмы предиктивного текста анализируют контекстное окно недавно набранных слов, чтобы предложить следующее слово или завершить твою фразу. Это происходит на основе статистических закономерностей, полученных из огромного количества текстовых данных, с учетом непосредственно предшествующего контекста, чтобы предложить вероятное продолжение. Такие фреймворки, как PyTorch и TensorFlow часто используются для построения таких моделей.

Контекстное окно в сравнении с другими родственными терминами

  • Контекстное окно против длины последовательности: Под длиной последовательности понимается общее количество лексем во всей входной последовательности, предоставляемой модели. А вот контекстное окно - это конкретная (часто меньшая) часть этой последовательности, которую модель активно использует для предсказания конкретного элемента. Например, длина последовательности в документе может составлять 1000 лексем, но модель может использовать только контекстное окно из 128 лексем вокруг целевого слова. Библиотека Hugging Face Transformers предоставляет инструменты для работы с последовательностями и контекстными окнами.
  • Контекстное окно против рецептивного поля: В конволюционных нейронных сетях (КНС) рецептивное поле описывает пространственный объем входного изображения, который влияет на активацию определенного нейрона. Хотя оба термина относятся к объему рассматриваемого входного сигнала, рецептивное поле характерно для пространственной области в CNN, тогда как контекстное окно обычно относится к последовательной области (например, время или позиция текста) в различных архитектурах моделей, включая рекуррентные нейронные сети (RNN) и трансформеры. Более подробно об архитектурах моделей ты можешь прочитать в документации по моделямUltralytics .
Читать полностью