Глоссарий

Инженерия особенностей

Повышай производительность моделей с помощью фич-инжиниринга: преобразуй данные для улучшения паттернов, точности и предсказаний в ИИ и машинном обучении.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Инжиниринг признаков - важнейший процесс в машинном обучении и искусственном интеллекте, который заключается в преобразовании исходных данных в значимые признаки, повышающие эффективность прогностических моделей. Эффективная инженерия признаков позволяет моделям машинного обучения легче распознавать закономерности, повышать точность и эффективнее предсказывать результаты.

Понимание инженерии характеристик

Инжиниринг функций включает в себя создание новых или изменение существующих функций для улучшения производительности модели. Этот процесс часто требует экспертизы домена, когда знания в этой области используются для выбора или создания функций, которые будут влиять на выход модели. Это смесь искусства и науки, в значительной степени опирающаяся как на интуицию, так и на эксперименты.

Основные этапы проектирования функций включают в себя:

  • Очистка данных: Удаляй из данных шумы и несоответствия, чтобы предотвратить обучение моделей неправильным закономерностям.
  • Создание признаков: Создание новых характеристик на основе существующих данных. Это может включать в себя комбинацию признаков, извлечение части признаков или создание новых точек данных.
  • Трансформация характеристик: Модификация характеристик в соответствии с требованиями модели. Здесь используются такие техники, как нормализация или масштабирование характеристик, чтобы они вписывались в модель соответствующим образом.

Чтобы получить полное представление о подготовке данных, смотри наше руководство по сбору данных и аннотации.

Применение Feature Engineering

Инженерия характеристик может существенно повлиять на широкий спектр приложений:

Применение в реальном мире

  1. Финансы: В прогнозировании финансового состояния инженерия признаков помогает создавать такие признаки, как скользящие средние или индексы волатильности. Они могут дать больше понимания, чем необработанные ценовые данные, помогая в управлении рисками и обнаружении мошенничества. Проницательное применение ИИ в финансах можно найти на сайте AI in Finance.

  2. Здравоохранение: В медицинской диагностике такие инженерные характеристики, как возраст, история болезни и образ жизни, могут использоваться в прогностических моделях для оценки риска заболевания. Этот вопрос подробно рассматривается в книге "ИИ в здравоохранении".

Технические примеры

  • Анализ текста: Генерация n-грамм и term frequency-inverse document frequency (TF-IDF) - это популярные методы инженерии признаков, используемые в обработке естественного языка (NLP) для извлечения полезной информации из текстовых данных.

Понимание того, как разработка характеристик вписывается в общую структуру обучения моделей, очень важно. Открой для себя процесс управления обучающими данными, чтобы понять, как данные питают модели.

Понятия, связанные с данным

Инженерия признаков тесно связана с извлечением признаков, но отличается от него, которое фокусируется на выборе существующих признаков данных, а не на создании новых.

Кроме того, использование методов дополнения данных наряду с разработкой признаков может быть полезным для расширения набора данных и внесения вариативности.

И наконец, понимание компромисса Bias-Variance очень важно, так как и проработка признаков, и учет размерности могут повлиять на производительность и обобщение модели.

Инструменты и ресурсы

Такие инструменты, как Ultralytics HUB, представляют собой надежные платформы для интеграции инженерии функций в рабочие процессы машинного обучения, позволяя беспрепятственно развертывать и управлять моделями ИИ.

Инжиниринг характеристик продолжает оставаться ключевым шагом в создании мощных систем ИИ. Тщательно отбирая и преобразуя данные, организации могут добиться более точных и надежных прогнозов, превращая сырые данные в действенные сведения.

Читать полностью