Узнай все о новой модели Ultralytics YOLO11, ее особенностях и применении в реальном времени в различных отраслях. Мы расскажем тебе обо всем, что нужно знать.
В понедельник, 30 сентября, Ultralytics официально представила Ultralytics YOLO11, новейшее достижение в области компьютерного зрения, после дебюта на YOLO Vision 2024 (YV24), Ultralytics' ежегодном гибридном мероприятии. ИИ-сообщество гудит от восторга, спеша изучить возможности модели. Благодаря более быстрой обработке, высокой точности и моделям, оптимизированным как для пограничных устройств, так и для облачного развертывания, YOLO11 переопределяет возможности приложений компьютерного зрения в реальном времени.
В интервью основатель и генеральный директор Ultralytics Гленн Джочер поделился: "Мир движется в сторону чистой энергии, но недостаточно быстро. Мы хотим, чтобы наши модели можно было обучать за меньшее количество эпох, с меньшим количеством дополнений и меньшим количеством данных, поэтому мы упорно работаем над этим". Самая маленькая модель обнаружения объектов, YOLO11n, имеет всего 2,6 миллиона параметров - это примерно размер JPEG, что просто безумие. Самая большая модель обнаружения объектов, YOLO11x, имеет около 56 миллионов параметров, и даже это невероятно мало по сравнению с другими моделями. Ты можешь обучить их на дешевом GPU, например, пятилетнем Nvidia GPU , просто с некоторым волнением и небольшим количеством кофе".
В этой статье мы поближе познакомимся с YOLO11, изучим его особенности, улучшения, бенчмарки производительности и реальные приложения, чтобы помочь тебе понять, на что способна эта модель. Давай приступим!
YOLO11 - это последнее достижение в серии моделей компьютерного зрения YOLO (You Only Look Once), и она предлагает значительные улучшения по сравнению с предыдущими версиями, такими как YOLOv5 и YOLOv8. Команда Ultralytics учла отзывы сообщества и передовые исследования, чтобы сделать YOLO11 быстрее, точнее и эффективнее. YOLO11 также поддерживает те же задачи компьютерного зрения, что и YOLOv8, включая обнаружение объектов, сегментацию объектов и классификацию изображений. Фактически, пользователи могут легко перейти на YOLO11 без необходимости менять существующие рабочие процессы.
Одной из главных особенностей YOLO11 является его превосходство в точности и скорости по сравнению с предшественниками. Имея на 22 % меньше параметров, чем YOLOv8m, YOLO11m достигает более высокой средней точности (mAP) на наборе данных COCO, что означает, что он может обнаруживать объекты более точно и эффективно. По скорости обработки данных YOLO11 превосходит предыдущие модели, что делает его идеальным для приложений реального времени, где быстрое обнаружение и реакция имеют решающее значение, и каждая миллисекунда на счету.
Приведенный ниже бенчмарк-график наглядно демонстрирует, чем YOLO11 отличается от предыдущих моделей. По горизонтальной оси он показывает среднюю точность (AP) COCO Box, которая измеряет точность обнаружения объектов. Вертикальная ось отображает латентность с помощью TensorRT10 FP16 на NVIDIA T4 GPU, показывая, насколько быстро модель обрабатывает данные.
С запуском Ultralytics YOLO11 компания Ultralytics расширяет серию YOLO , предлагая модели как с открытым исходным кодом, так и корпоративные, чтобы удовлетворить растущий спрос в различных отраслях.
YOLO11 имеет пять различных размеров моделей - Nano, Small, Medium, Large и X. Пользователи могут выбрать оптимальную модель в зависимости от специфических потребностей своего приложения компьютерного зрения. Пять размеров обеспечивают гибкость при решении таких задач, как классификация изображений, обнаружение объектов, сегментация экземпляров, отслеживание, оценка позы и обнаружение объектов с ориентированными границами (OBB). Для каждого размера существует своя модель для каждой задачи, в итоге получается 25 моделей с открытым исходным кодом , которые составляют основу предложений Ultralytics'. Эти модели идеально подходят для широкого спектра приложений, от легких задач на граничных устройствах, где модель YOLO11n обеспечивает впечатляющую эффективность, до более масштабных приложений, требующих моделей YOLO11l и YOLO11x.
Впервые Ultralytics представляет корпоративные модели, что знаменует собой важную веху в наших продуктовых предложениях, и мы рады поделиться этими нововведениями с нашими пользователями. YOLO11 представляет пять собственных моделей, разработанных специально для коммерческих случаев использования. Эти корпоративные модели, которые будут доступны в следующем месяце, обучены на Ultralytics' новом собственном наборе данных, состоящем из более чем 1 миллиона изображений, и предлагают более надежные предварительно обученные модели. Они разработаны для сложных реальных приложений, таких как анализ медицинских снимков и обработка спутниковых изображений, где очень важно точное обнаружение объектов.
Теперь, когда мы обсудили, что предлагает YOLO11, давай посмотрим, что делает YOLO11 таким особенным.
Одной из главных задач при разработке YOLO11 было найти правильный баланс между конкурирующими приоритетами: сделать модели меньше, быстрее и точнее. Как объяснил Гленн Джочер, основатель и генеральный директор Ultralytics', "Работа над исследованиями и разработками YOLO действительно сложна, потому что ты хочешь двигаться в трех разных направлениях: ты хочешь сделать модели меньше, ты хочешь, чтобы они стали более точными, но ты также хочешь, чтобы они были быстрее на разных платформах, таких как CPU и GPU. Все это - конкурирующие интересы, поэтому тебе приходится идти на компромиссы и выбирать, куда вносить изменения". Несмотря на эти трудности, YOLO11 достигает впечатляющего баланса, обеспечивая улучшение скорости и точности по сравнению с предыдущими версиями, такими как YOLOv8.
YOLO11 привносит существенные улучшения, такие как улучшенное извлечение признаков с помощью переработанной архитектуры позвоночника и шеи, что приводит к более точному обнаружению объектов. Модель также оптимизирована для скорости и эффективности, предлагая более быстрое время обработки при сохранении высокой точности. В дополнение к этим преимуществам YOLO11 обладает высокой адаптивностью к различным средам, без проблем работая на пограничных устройствах, облачных платформах и системах, использующих графические процессоры NVIDIA . Такая адаптивность делает его идеальным выбором для пользователей, которым нужны гибкие возможности развертывания на различных аппаратных установках, от мобильных устройств до крупномасштабных серверов.
Универсальность YOLO11 делает его надежным инструментом во многих отраслях, особенно когда речь идет о сложных сценариях использования. Например, он без проблем работает на пограничных устройствах и может использоваться в приложениях, требующих анализа в реальном времени в условиях ограниченной вычислительной мощности. Отличный пример - автономное вождение, где транспортные средства должны принимать решения за доли секунды, чтобы обеспечить безопасность всех участников движения. YOLO11 помогает в этом, обнаруживая и анализируя объекты на дороге, например пешеходов или другие автомобили, даже в сложных условиях, например при слабом освещении или когда объекты частично скрыты. Быстрое и точное обнаружение помогает предотвратить аварии и гарантирует, что самоуправляемые автомобили смогут безопасно передвигаться.
Еще один интересный пример диапазона YOLO11 - его способность работать с ориентированными ограничительными рамками (OBB). Она необходима для обнаружения объектов, которые не идеально выровнены. Обнаружение объектов с OBB - это функция, которая особенно полезна в таких отраслях, как сельское хозяйство, картография и видеонаблюдение, где на изображениях часто встречаются повернутые объекты, например посевы или здания на аэро- или спутниковых снимках. В отличие от традиционных моделей, YOLO11 может идентифицировать объекты под любым углом и обеспечивать гораздо более точные результаты для задач, требующих точности.
Начать работу с YOLO11 просто и доступно, независимо от того, предпочитаешь ли ты кодирование или вариант без кода. Чтобы работать с YOLO11 через код, ты можешь использовать пакетUltralytics Python , чтобы легко обучать и разворачивать модели. Если ты предпочитаешь работать без кода, Ultralytics HUB позволит тебе опробовать YOLO11 всего в несколько кликов.
Чтобы использовать YOLO11 с Python, тебе сначала нужно установить пакет Ultralytics . В зависимости от твоих предпочтений, ты можешь сделать это с помощью pip, conda или Docker. Для получения подробных инструкций и лучших практик, связанных с процессом установки, обязательно ознакомься с нашим руководством по установкеUltralytics . Во время установки необходимых пакетов для YOLO11, если у тебя возникнут какие-либо трудности, обратись к нашему руководству по общим проблемам, чтобы найти решения и советы.
Как только ты установишь пакет Ultralytics , использовать YOLO11 будет проще простого. Следующий фрагмент кода проведет тебя через процесс загрузки модели, ее обучения, тестирования производительности и экспорта в форматONNX . За более подробными примерами и расширенными возможностями использования обязательно обратись к официальной документации Ultralytics , где ты найдешь подробные руководства и лучшие практики для получения максимальной отдачи от YOLO11.
Для пользователей, предпочитающих подход без кода, Ultralytics HUB предоставляет простой способ тренировки и развертывания моделей YOLO11 всего за несколько кликов. Чтобы начать работу с HUB, просто создай аккаунт на платформе Ultralytics HUB, и ты сможешь приступить к обучению и управлению своими моделями с помощью интуитивно понятного интерфейса.
Сообщество ИИ постоянно развивает область компьютерного зрения, стремясь разработать более быстрые и точные модели для реальных приложений. Ultralytics YOLO11 - важная веха в этих усилиях, обеспечивающая повышенную скорость, точность и гибкость. Он предназначен для работы в реальном времени и для краевых приложений, что делает его идеальным для таких отраслей, как здравоохранение и автономное вождение. Независимо от того, используешь ли ты пакет Ultralytics Python или хаб без кода Ultralytics , YOLO11 упрощает сложные задачи Vision AI. Он обеспечивает мощные возможности компьютерного зрения, что делает его отличным выбором для разработчиков и предприятий.
Загляни в наш репозиторий на GitHub и присоединись к нашему активному сообществу, чтобы узнать больше об искусственном интеллекте. Узнай, как Vision AI способствует инновациям в таких отраслях, как здравоохранение и сельское хозяйство.
Начни свое путешествие с будущим машинного обучения