Khám phá những điểm nổi bật từ Ultralytics ' sự kiện thường niên và sống lại YOLO Trải nghiệm lai ghép tầm nhìn. Chúng tôi sẽ đề cập Ultralytics ' Ra mắt YOLO11, các buổi thảo luận sôi nổi và nhiều hoạt động khác.
Ngày 27 tháng 9, Ultralytics đã tập hợp cộng đồng AI và thị giác máy tính cho sự kiện kết hợp thường niên thú vị của chúng tôi, YOLO Vision 2024 (YV24) . Được tổ chức tại Google cho Startups Campus tại Madrid và được phát trực tuyến trên toàn cầu, sự kiện đã quy tụ các chuyên gia, nhà phát triển và những người đam mê để thảo luận về những tiến bộ mới nhất trong Vision AI, chẳng hạn như mô hình YOLO11 mới của Ultralytics . Sự kiện phát trực tiếp đã đạt hơn 5.400 lượt xem, với hơn 10.600 lượt hiển thị và 469,5 giờ xem, thu hút những người đổi mới trên toàn thế giới.
YV24 bắt đầu với sự chào đón nồng nhiệt từ chủ nhà của chúng tôi, Oisin Lunny , người nhấn mạnh tầm quan trọng của cộng đồng và sự kết nối bằng cách nói rằng, "Tôi là người rất tin tưởng vào sức mạnh của những ý tưởng tuyệt vời và cộng đồng tuyệt vời , và những gì Ultralytics đã tạo ra với YOLO Vision chính là như vậy - một cộng đồng tuyệt vời gồm những con người tuyệt vời với những ý tưởng tuyệt vời.”
Trong bài viết này, chúng tôi sẽ chỉ ra những điểm nổi bật chính từ YOLO Tầm nhìn 2024, từ các cuộc thảo luận nhóm hấp dẫn đến các trường hợp sử dụng thực tế hấp dẫn của tầm nhìn máy tính . Chúng tôi cũng sẽ khám phá các cuộc nói chuyện kỹ thuật từ AI biên đến tăng tốc phần cứng , cũng như các khoảnh khắc xây dựng mạng lưới và cộng đồng đã làm nên thành công của sự kiện. Cho dù bạn quan tâm đến các cải tiến AI, thông báo chính hay tương lai của Vision AI, thì YOLO Tóm tắt sự kiện Vision 2024 bao gồm tất cả những thông tin cần thiết!
Việc ra mắt sản phẩm đã được hé lộ trước YOLO Vision 2024 cuối cùng đã được tiết lộ thông qua thông báo trong bài phát biểu quan trọng đầu tiên của Glenn Jocher , Ultralytics ' Nhà sáng lập và Tổng giám đốc điều hành. Glenn giới thiệu Ultralytics YOLO11 , đánh dấu thế hệ tiếp theo của các mô hình thị giác máy tính , đã được phát triển trong nhiều tháng. Thêm vào sự phấn khích của buổi ra mắt, Glenn sau đó đã được phỏng vấn trên The Ravit Show và chia sẻ những hiểu biết sâu sắc về quá trình phát triển YOLO11 .
Trong bài phát biểu quan trọng của mình, Glenn cũng chia sẻ câu chuyện về hành trình của công ty, bắt đầu từ nền tảng vật lý hạt của ông và cách niềm đam mê tìm hiểu vũ trụ cuối cùng đã đưa ông đến với máy học và thị giác máy tính .
Ông giải thích cách công trình ban đầu của ông trong lĩnh vực vật lý, nơi các nhà nghiên cứu phân tích tương tác hạt, tương tự như phát hiện vật thể trong thị giác máy tính. Sự tò mò và động lực làm việc với công nghệ tiên tiến cuối cùng đã dẫn đến việc tạo ra Ultralytics YOLOv5 . Trong suốt bài nói chuyện của mình, Glenn nhấn mạnh tầm quan trọng của sự hợp tác và đóng góp trong cộng đồng nguồn mở và cảm ơn các nhà phát triển trên toàn thế giới đã cung cấp phản hồi và giúp cải thiện YOLOv5 và Ultralytics YOLOv8 theo thời gian.
Sau đó, ông giới thiệu các tính năng chính của Ultralytics YOLO11 và giải thích rằng nó nhanh hơn, chính xác hơn và hiệu quả hơn so với các mô hình trước đó. Trên thực tế, YOLO11m sử dụng ít hơn 22% tham số so với YOLOv8m nhưng vẫn mang lại độ chính xác tốt hơn trên tập dữ liệu COCO , khiến YOLO11 trở nên hoàn hảo cho các ứng dụng thời gian thực, nơi tốc độ và độ chính xác là yếu tố cơ bản.
Glenn nhấn mạnh quy mô của buổi ra mắt bằng cách nói rằng, "Chúng tôi sẽ ra mắt tổng cộng 30 mô hình, 25 trong số đó là mã nguồn mở, với năm kích thước khác nhau cho năm nhiệm vụ khác nhau. Các nhiệm vụ là phân loại hình ảnh , phát hiện đối tượng , phân đoạn thể hiện , ước tính tư thế và hộp giới hạn định hướng ." Về phía doanh nghiệp, ông thông báo rằng vào tháng tới, các mô hình mạnh mẽ được đào tạo trên một tập dữ liệu độc quyền gồm 1 triệu hình ảnh sẽ có sẵn. Không cần phải nói, thông báo đã khởi động sự kiện một cách tốt đẹp, khiến những người tham dự háo hức tìm hiểu thêm về tiềm năng đổi mới của YOLO11 trên các lĩnh vực như sản xuất và xe tự lái .
Các cuộc thảo luận của hội thảo, được điều hành bởi Oisin Lunny, tại YOLO Tầm nhìn 2024 cung cấp nhiều hiểu biết sâu sắc về AI, thị giác máy tính và xây dựng cộng đồng.
Bảng đầu tiên có sự góp mặt của Glenn Jocher, Jing Qiu (một nhân vật chủ chốt trong sự phát triển của YOLO các mô hình tại Ultralytics ), và Ao Wang từ Đại học Thanh Hoa , đồng tác giả YOLOv10 . Hội thảo đã thảo luận về những phát triển gần đây trong AI tạo sinh và thị giác máy tính , tập trung vào những điểm tương đồng, khác biệt và tác động của từng lĩnh vực đối với lĩnh vực kia. Bất chấp sự gia tăng gần đây của các mô hình ngôn ngữ lớn (LLM) , hội thảo lưu ý rằng thị giác máy tính truyền thống vẫn cần thiết cho các nhiệm vụ cụ thể trong các ngành như chăm sóc sức khỏe .
Phiên thảo luận tiếp theo sẽ giải quyết những thách thức mà phụ nữ phải đối mặt trong vai trò lãnh đạo AI , với các diễn giả: Ultralytics 'Giám đốc tăng trưởng Paula Derrenger , cựu CPO và COO tại SaaS Bruna de Guimarães , Trưởng nhóm Latinas tại Tech Madrid Mariana Hernandez và Nhà sáng lập Dare to Data Christina Stathopoulous chia sẻ kinh nghiệm của họ, đồng thời thảo luận về tầm quan trọng của hoạt động cố vấn và nhu cầu phụ nữ phải chủ động thực hiện các bước để tìm kiếm vai trò lãnh đạo. Hernandez khuyên rằng, "Hãy chủ động, đừng chờ đợi mọi thứ xảy đến với bạn" và khuyến khích phụ nữ trong khán phòng khẳng định bản thân và chủ động theo đuổi các cơ hội. Hội thảo cũng thảo luận về giá trị của việc tạo ra môi trường làm việc hỗ trợ nhiều hơn.
Hội thảo cuối cùng khám phá cách xây dựng cộng đồng mạnh mẽ có thể thúc đẩy sự đổi mới trong AI. Burhan Qaddoumi , Harpreet Sahota và Bart Farrell thảo luận về các cách để thu hút khán giả kỹ thuật, cả trực tuyến và tại các sự kiện trực tiếp. Nhận định của Farrell, "Bạn phải gặp họ ở nơi họ đang ở", đồng cảm với tầm quan trọng của việc kết nối với các thành viên cộng đồng theo các điều khoản của họ để khuyến khích sự hợp tác và học tập chung.
Một số cuộc nói chuyện tại YV24 đã làm sáng tỏ cách YOLO các mô hình đang được áp dụng để giải quyết những thách thức trong thế giới thực trong nhiều ngành công nghiệp khác nhau. Jim Griffin , người dẫn chương trình podcast AI Master Group , đã nói về một dự án sử dụng các mô hình YOLOv8 để theo dõi chuyển động của cá mập dọc theo bờ biển California thông qua giám sát bằng máy bay không người lái . Hệ thống này cảnh báo cho nhân viên cứu hộ, chủ cửa hàng lướt sóng và phụ huynh, đảm bảo an toàn cho những người đi biển bằng cách phát hiện cá mập từ độ cao 200 feet so với mặt nước biển. Griffin giải thích rằng thách thức thực sự không phải là bản thân mô hình AI mà là các chuyến bay bằng máy bay không người lái và việc thu thập dữ liệu rộng rãi cần thiết để đào tạo mô hình .
Tương tự như vậy, David Scott từ The Main Branch đã thảo luận về việc mở rộng tầm nhìn máy tính từ phát hiện đối tượng đơn giản đến phân tích hành vi. Bài nói chuyện của ông nêu bật các ứng dụng trong thế giới thực như theo dõi hành vi của gia súc và xác định các hoạt động đáng ngờ trong các cửa hàng bán lẻ . Scott đã chia sẻ cách YOLOv8 có thể được sử dụng để theo dõi sức khỏe của gia súc bằng cách phân tích các hành vi cụ thể, chẳng hạn như ăn, uống và đi lại.
Hơn nữa, một bài phát biểu quan trọng đặc biệt chân thành đến từ Ousman Umar của NASCO Feeding Minds , nơi ông chia sẻ cách tổ chức của mình đang thay đổi cuộc sống bằng cách cung cấp giáo dục CNTT tại Ghana. Quỹ của ông đã thành lập 17 trung tâm CNTT, đào tạo hơn 65.000 sinh viên, với mục tiêu tạo ra việc làm công nghệ địa phương để giúp giải quyết các vấn đề như nhập cư bất hợp pháp. Câu chuyện mạnh mẽ của Umar đã truyền tải cách giáo dục và công nghệ cùng nhau có thể thúc đẩy sự thay đổi lâu dài trong các cộng đồng chưa được phục vụ đầy đủ.
YV24 cũng có các cuộc nói chuyện khác nhau tập trung vào cách AI và phần cứng kết hợp với nhau để tạo ra những ý tưởng mới. Các chuyên gia từ các công ty như Intel , Sony và NVIDIA đã giải quyết việc triển khai YOLO các mô hình trên các thiết bị biên và tối ưu hóa hiệu suất. Dmitriy Pastushenkov và Adrian Boguszewski từ Intel đã phác thảo cách phần cứng của họ hỗ trợ các mô hình YOLO trên NPU, CPU , Và GPU , trong khi Amir Servi và Wei Tang của Sony chia sẻ cách YOLO tích hợp với nền tảng AITRIOS để triển khai AI biên hiệu quả. Guy Dahan từ NVIDIA đã nói về việc sử dụng của họ GPU kiến trúc để cải thiện YOLO suy luận mô hình.
Các công ty khác như Qualcomm , Hugging Face và Lightning AI cũng giới thiệu cách nền tảng của họ giúp các nhà phát triển tích hợp và triển khai dễ dàng hơn YOLO mô hình. Devang Aggarwal từ Qualcomm đã trình bày cách các mô hình như YOLOv8 có thể được tối ưu hóa cho các thiết bị Snapdragon thông qua Qualcomm AI Hub.
Tương tự như vậy, Pavel Lakubovskii từ Hugging Face đã mô tả cách các công cụ nguồn mở của họ cho phép tích hợp liền mạch các mô hình như YOLOv8 vào nhiều quy trình làm việc khác nhau, trong khi Luca Antiga từ Lightning AI đã hướng dẫn chúng tôi cách các nhà phát triển có thể dễ dàng kết hợp các mô hình như YOLOv8 ở cấp độ mã để tạo mẫu và lặp lại nhanh hơn.
Trong tuần dẫn đến YV24, Ultralytics nhóm đã tập trung tại Madrid để tham gia các buổi hội thảo, họp cộng tác và các hoạt động ngoài trời. Các hoạt động này không chỉ dừng lại ở công việc, mà còn nuôi dưỡng các mối quan hệ bền chặt hơn và tạo ra bầu không khí tích cực trước sự kiện. Kết thúc bằng một bữa tiệc sau tiệc mừng, những người tham dự và diễn giả có cơ hội giao lưu, chia sẻ những thông tin quan trọng và khám phá các hoạt động hợp tác trong tương lai. Sự kết hợp giữa tinh thần đồng đội và tình đồng chí đã khiến YV24 trở thành một sự kiện thành công về mặt chuyên môn và là một trải nghiệm đáng nhớ toàn diện.
YV24 đã tập hợp sự đổi mới, hợp tác và cái nhìn về tương lai của thị giác máy tính. Với sự ra mắt của YOLO11, các hội thảo hấp dẫn và các cuộc thảo luận về phần cứng AI và các giải pháp biên, sự kiện tập trung vào cách Vision AI có thể tạo ra sự khác biệt và cách công nghệ đang thay đổi để theo kịp những tiến bộ trong AI. Sự kiện cũng tăng cường kết nối trong cộng đồng. Các chuyên gia và người đam mê đã chia sẻ ý tưởng và khám phá tiềm năng của thị giác máy tính và YOLO . Sự kiện kết thúc bằng một buổi đố vui, nơi Ultralytics áo hoodie được rao bán, khiến mọi người háo hức chờ đợi nhiều sáng kiến như YOLO11 trong tương lai.
Truy cập kho lưu trữ GitHub của chúng tôi và kết nối với cộng đồng đang phát triển của chúng tôi để tìm hiểu thêm về AI. Xem cách Vision AI đang định nghĩa lại sự đổi mới trong các lĩnh vực như chăm sóc sức khỏe và nông nghiệp . 🚀
Bắt đầu hành trình của bạn với tương lai của machine learning