Изучите основы нейронных сетей. Узнайте, как они питают ИИ, чем отличаются от глубокого обучения и как управляют современными моделями, такими как Ultralytics .
Нейронная сеть (NN) — это вычислительная модель, лежащая в основе искусственного интеллекта (ИИ), предназначенная для распознавания паттернов, интерпретации сенсорных данных и кластеризации информации. Вдохновленные биологической структурой человеческого мозга, эти сети состоят из взаимосвязанных узлов, или «нейронов», организованных в слои. В то время как биологический мозг использует химические сигналы для связи между синапсами, цифровая нейронная сеть использует математические операции для передачи информации. Эти системы являются основополагающей технологией современного машинного обучения (МО), позволяющей компьютерам решать сложные задачи, такие как распознавание лиц, перевод языков и управление автономными транспортными средствами, без явно запрограммированных для каждого конкретного правила.
Хотя эти термины часто используются как синонимы, важно различать базовую нейронную сеть и глубокое обучение (DL). Основное различие заключается в глубине и сложности. Стандартная или «неглубокая» нейронная сеть может иметь только один или два скрытых слоя между входом и выходом. В отличие от этого, глубокое обучение предполагает использование «глубоких» нейронных сетей с десятками или даже сотнями слоев. Такая глубина позволяет автоматически извлекать признаки, благодаря чему модель может понимать иерархические паттерны — простые края становятся фигурами, а фигуры — узнаваемыми объектами. Более подробную техническую информацию можно найти в MIT News, где объясняется глубокое обучение и его эволюция от базовых сетей.
Процесс «обучения» в нейронной сети включает в себя настройку внутренних параметров для минимизации ошибок. Данные поступают через входной слой, проходят через один или несколько скрытых слоев, где происходят вычисления, и выходят через выходной слой в виде прогноза.
Нейронные сети являются движущей силой многих технологий, определяющих современную эпоху.
Современные программные библиотеки позволяют развертывать нейронные сети без необходимости писать математические
операции с нуля. Такие инструменты, как Платформа Ultralytics позволяют
пользователям легко обучать эти сети на пользовательских наборах данных. Следующий Python демонстрирует, как загрузить
предварительно обученную нейронную сеть (в частности, современную модель YOLO26) и выполнить инференцию на изображении с помощью
ultralytics пакет.
from ultralytics import YOLO
# Load a pretrained YOLO26 neural network model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Несмотря на свою мощность, нейронные сети представляют собой определенные проблемы. Как правило, для обучения с учителем им требуются большие объемы помеченных данных. Без достаточного разнообразия данных сеть подвержена переобучению, когда она запоминает примеры обучения, а не учится обобщать. Кроме того, глубокие нейронные сети часто называют «черными ящиками», потому что точно интерпретировать, как они пришли к конкретному решению, может быть сложно, что вызвало интерес к исследованиям в области объяснимой искусственной интеллекта (XAI). Такие организации, как Ассоциация стандартов IEEE, активно работают над стандартами, чтобы обеспечить этичные и безопасные условия использования этих мощных сетей.