Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Распознавание именованных сущностей (NER)

Изучите распознавание именованных сущностей (NER) в NLP. Узнайте, как идентифицировать и classify сущности, такие как имена и даты, чтобы получить ценную информацию с помощью AI и Ultralytics .

Распознавание именованных сущностей (NER) — это основная подзадача обработки естественного языка (NLP), которая включает в себя идентификацию и классификацию ключевой информации в неструктурированном тексте. В типичном рабочем процессе модель NER сканирует документ, чтобы найти «сущности» — определенные слова или фразы, которые представляют объекты реального мира — и присваивает им заранее определенные категории, такие как имена людей, организации, местоположения, даты или медицинские коды. Этот процесс необходим для преобразования необработанных, неструктурированных данных, таких как электронные письма, отзывы клиентов и новостные статьи, в структурированные форматы, которые машины могут обрабатывать и анализировать. Отвечая на вопросы «кто, что и где» в тексте, NER позволяет системам искусственного интеллекта (ИИ) автоматически извлекать значимую информацию из огромных массивов данных.

Как работает NER

Современные системы NER используют передовые статистические модели и методы глубокого обучения (DL) для понимания контекста, в котором используется слово. Процесс начинается с токенизации, при которой предложение разбивается на отдельные единицы, называемые токенами. Затем сложные архитектуры, такие как Transformer, анализируют отношения между этими токенами, чтобы определить их значение на основе использования.

Например, слово «Apple» может означать фрукт или технологическую компанию в зависимости от контекста предложения. С помощью таких механизмов, как самоанализ, модель NER распознает, что «Apple выпустила новый телефон» относится к организации, а «Я съел яблоко» относится к общему объекту. Эффективность этих моделей в значительной степени зависит от высокого качества обучающих данных и точности аннотации данных. В мультимодальных приложениях NER часто сочетается с оптическим распознаванием символов (OCR) для извлечения текста из изображений перед его обработкой.

Применение в реальном мире

NER является основополагающей технологией для многих инструментов интеллектуальной автоматизации, используемых в различных отраслях промышленности.

  • ИИ в здравоохранении: медицинские учреждения используют NER для извлечения важных данных из электронных медицинских карт. Извлекая из клинических записей такие элементы, как симптомы, названия лекарств и дозировки, исследователи могут ускорить открытие новых лекарств и улучшить уход за пациентами.
  • classify теллектуальная поддержка клиентов: компании используют чат-ботов, оснащенных NER, для автоматической классификации жалоб клиентов. Если пользователь пишет: «У меня сломался экран ноутбука», система идентифицирует «ноутбук» как продукт, а «сломался экран» как дефект и немедленно направляет заявку в службу технической поддержки.
  • Рекомендации по контенту: потоковые сервисы и агрегаторы новостей используют NER для маркировки контента соответствующими сущностями (например, актерами, жанрами, местоположениями). Затем системы рекомендаций используют эти теги для предложения новых фильмов или статей, которые соответствуют интересам пользователя.
  • Финансовый анализ: Инвестиционные компании используют NER для ежедневного сканирования тысяч финансовых отчетов и новостных статей. Извлекая названия компаний и денежные значения, они могут выполнять прогнозное моделирование для прогнозирования рыночных тенденций.

Отличие NER от смежных понятий

Чтобы понять специфическую роль NER в процессе искусственного интеллекта, полезно отличать его от других задач интерпретации.

  • Обнаружение объектов: в то время как NER идентифицирует сущности в тексте, обнаружение объектов идентифицирует сущности в изображениях. Например, визуальная модель, такая как YOLO26, обнаруживает автомобили и пешеходов в видеопотоках, а NER обнаруживает «Ford» и «водитель» в письменных отчетах. Обе задачи направлены на локализацию и classify интересующих classify в рамках соответствующих модальностей данных.
  • Анализ тональности: эта задача определяет эмоциональный тон (положительный, отрицательный или нейтральный) текста. NER извлекает то, о чем идет речь (например, «iPhone 16»), а анализ тональности определяет, как пользователь к этому относится (например, «потрясающий»).
  • Понимание естественного языка (NLU): NLU — это более широкий термин, обозначающий машинное понимание прочитанного. NER — это конкретный компонент NLU, который часто работает вместе с классификацией намерений, чтобы полностью понять смысл ввода пользователя.
  • Извлечение ключевых слов: в отличие от NER, который классифицирует слова по семантическим категориям (например, «Человек», «Дата»), извлечение ключевых слов просто идентифицирует наиболее часто встречающиеся или релевантные термины в документе, не понимая их тип сущности.

Объединение NER с компьютерным зрением

Сближение текста и изображения является растущей тенденцией в мультимодальном обучении. Модели, такие как YOLO, преодолевают этот разрыв, используя текстовые подсказки для направления обнаружения объектов. В этом рабочем процессе текстовый кодировщик действует аналогично системе NER, интерпретируя семантическое значение имен классов (сущностей), предоставленных пользователем, для поиска соответствующих визуальных объектов.

Следующий пример на Python демонстрирует, как использовать ultralytics библиотека для detect на основе пользовательских текстовых описаний, эффективно связывающая объекты естественного языка с визуальными данными.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Инструменты и реализация

Разработчики имеют доступ к надежной экосистеме инструментов для реализации NER. Популярные библиотеки с открытым исходным кодом, такие как spaCy и NLTK, предоставляют предварительно обученные конвейеры для немедленного использования. Для приложений корпоративного уровня облачные сервисы, такие как Google Natural Language, предлагают управляемые API, которые масштабируются в соответствии со спросом.

Управление жизненным циклом этих моделей ИИ — будь то для текста или изображений — требует эффективных операций. Ultralytics упрощает эти процессы MLOps, предлагая единую среду для управления наборами данных, обучения моделей и развертывания решений. Это гарантирует, что проекты ИИ остаются масштабируемыми и готовыми к производству, поддерживая постоянное совершенствование моделей, таких как YOLO26, для достижения передовой производительности.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас