Tìm hiểu cách tính toán khoảng cách trong các ứng dụng thị giác máy tính bằng cách sử dụng Ultralytics YOLO11 giúp đo khoảng cách của các vật thể theo thời gian thực.
Khi bạn băng qua đường và thấy một chiếc xe đang tiến về phía mình, bạn có thể ngay lập tức biết được khoảng cách ước chừng của chiếc xe đó. Phán đoán nhanh chóng, gần như theo bản năng này là nhờ vào sự hiểu biết về không gian xung quanh bạn. Dựa trên giác quan này, bạn có thể quyết định có nên tăng tốc, dừng lại hay tiếp tục đi bộ không.
Tương tự như vậy, thị giác máy tính là một nhánh của trí tuệ nhân tạo (AI) giúp máy móc có thể phát triển khả năng hiểu biết về môi trường xung quanh bằng cách diễn giải dữ liệu trực quan. Giống như cách bạn có thể đánh giá khoảng cách của ô tô để đưa ra quyết định nhanh chóng, các mô hình thị giác máy tính có thể phân tích hình ảnh và video, giúp máy móc cảm nhận và phản ứng với thế giới xung quanh.
Ví dụ, Ultralytics YOLO11 là một mô hình thị giác máy tính có thể phát hiện và theo dõi các đối tượng trong hình ảnh và video theo thời gian thực. Nói một cách đơn giản, YOLO11 hoạt động bằng cách xem toàn bộ hình ảnh cùng một lúc, thay vì từng phần, giúp nó nhanh hơn và hiệu quả hơn. Nó cũng có thể xử lý các tác vụ thị giác máy tính như phân đoạn trường hợp, ước tính tư thế và phân loại hình ảnh.
Đặc biệt, YOLO11 Khả năng của 'có thể được sử dụng để tính toán khoảng cách giữa các vật thể với nhau, điều này hữu ích trong nhiều lĩnh vực như sản xuất, bán lẻ và quản lý đám đông, giúp cải thiện tính an toàn và hiệu quả.
Trong bài viết này, chúng ta sẽ khám phá cách YOLO11 có thể được sử dụng để tính toán khoảng cách trong các ứng dụng thị giác máy tính, lý do tại sao nó quan trọng và tác động của nó trong các ngành công nghiệp khác nhau.
Tính toán khoảng cách trong thị giác máy tính bao gồm việc phát hiện, định vị và đo các điểm ảnh giữa hai đối tượng trong một hình ảnh. Điểm ảnh là các đơn vị riêng lẻ tạo nên một hình ảnh kỹ thuật số, mỗi điểm ảnh đại diện cho một điểm duy nhất có giá trị màu sắc hoặc cường độ cụ thể.
Để chuyển đổi các phép đo pixel thành khoảng cách thực tế, hiệu chuẩn là chìa khóa. Bạn có thể nghĩ về nó như việc sử dụng thước kẻ để đo một thứ gì đó và sau đó sử dụng phép đo đó để hiểu kích thước của các vật thể khác. Bằng cách tham chiếu các vật thể có kích thước đã biết, hiệu chuẩn tạo ra một liên kết giữa các pixel và khoảng cách vật lý thực tế.
Hãy xem một ví dụ để xem cách thức hoạt động của nó. Trong hình ảnh bên dưới, đồng xu là vật thể tham chiếu và kích thước của nó (0,9in x 1,0in) đã được biết. Bằng cách so sánh các phép đo pixel của các vật thể khác với kích thước của đồng xu, chúng ta có thể tính toán kích thước thực tế của chúng.
Tuy nhiên, tính toán khoảng cách được thực hiện trên mặt phẳng hai chiều (2D), nghĩa là nó chỉ đo khoảng cách theo chiều ngang và chiều dọc giữa các vật thể. Điều này khác với ước tính độ sâu, đo khoảng cách của các vật thể trong không gian ba chiều, bao gồm khoảng cách của chúng từ máy ảnh.
Trong khi máy ảnh độ sâu có thể đo độ sâu thực và cung cấp thông tin không gian chi tiết hơn, trong nhiều trường hợp, một khoảng cách hiệu chuẩn đơn giản là đủ. Ví dụ, biết được khoảng cách giữa các vật thể trong mặt phẳng 2D hoạt động tốt cho các tác vụ như theo dõi vật thể hoặc quản lý hàng đợi, do đó không cần ước tính độ sâu trong những tình huống đó.
Tiếp theo, chúng ta hãy cùng tìm hiểu cách tính khoảng cách giữa hai vật thể bằng cách sử dụng YOLO11 hỗ trợ phát hiện và theo dõi đối tượng . Sau đây là phân tích chi tiết:
Điều quan trọng cần nhớ là khoảng cách được tính toán bằng phương pháp này chỉ là ước tính vì chúng dựa trên phép đo pixel 2D.
Xem xét rằng việc tính toán khoảng cách sử dụng YOLO11 là một ước tính, bạn có thể thắc mắc: Có thể sử dụng ước tính này ở đâu và nó có thể tạo ra sự khác biệt như thế nào?
Vì hiệu chuẩn được sử dụng để đưa ra những ước tính khoảng cách này nên chúng đủ chính xác để giúp ích trong nhiều tình huống thực tế. YOLO11 Ước tính khoảng cách đặc biệt hữu ích trong các môi trường năng động, như nhà kho, nơi các vật thể liên tục chuyển động và cần phải điều chỉnh theo thời gian thực để mọi thứ hoạt động trơn tru.
Một ví dụ thú vị là sử dụng YOLO11 để theo dõi các gói hàng trên băng chuyền và ước tính khoảng cách giữa chúng theo thời gian thực. Điều này giúp người quản lý kho đảm bảo các gói hàng được sắp xếp đúng cách, tránh va chạm và duy trì hoạt động trơn tru.
Trong những trường hợp như vậy, không phải lúc nào cũng cần khoảng cách chính xác. Thông thường, một phạm vi hoặc ngưỡng cho khoảng cách tối ưu được thiết lập, do đó, ước tính hoạt động tốt cho các loại ứng dụng này.
Nhiều ứng dụng thị giác máy tính có thể được hưởng lợi từ việc tính toán khoảng cách giữa các vật thể bằng cách sử dụng YOLO11 . Ví dụ, trong phân tích bán lẻ, nó giúp cải thiện việc quản lý hàng đợi bằng cách theo dõi vị trí của khách hàng theo thời gian thực. Điều này giúp các doanh nghiệp phân bổ nguồn lực tốt hơn, giảm thời gian chờ đợi và tạo ra trải nghiệm mua sắm mượt mà hơn. Bằng cách điều chỉnh động mức độ nhân sự và quản lý luồng khách hàng, các cửa hàng có thể ngăn ngừa tình trạng quá tải và tối ưu hóa việc sử dụng không gian.
Tương tự như vậy, trong quản lý giao thông , ước tính khoảng cách giúp theo dõi khoảng cách giữa các phương tiện và phân tích các mô hình giao thông. Điều này có thể được sử dụng để phát hiện các hành vi nguy hiểm, như bám đuôi, và điều chỉnh tín hiệu giao thông để duy trì lưu thông thông suốt. Nó có thể giúp đường an toàn hơn bằng cách xác định các vấn đề tiềm ẩn và cải thiện quản lý giao thông tổng thể theo thời gian thực.
Một ứng dụng độc đáo khác của công nghệ này xuất hiện trong đại dịch COVID-19 khi nó giúp thúc đẩy giãn cách xã hội. Nó đảm bảo mọi người giữ khoảng cách an toàn ở nơi công cộng, cửa hàng và bệnh viện, giảm nguy cơ lây lan vi-rút.
Bằng cách theo dõi khoảng cách theo thời gian thực, cảnh báo có thể được gửi đi khi mọi người ở quá gần, giúp các doanh nghiệp và nhà cung cấp dịch vụ chăm sóc sức khỏe phản ứng nhanh chóng và duy trì môi trường an toàn hơn cho mọi người.
Bây giờ chúng ta đã thảo luận về một số ứng dụng của tính toán khoảng cách bằng thị giác máy tính, sau đây là cái nhìn sâu hơn về những lợi ích liên quan khi thực hiện việc đó:
Mặc dù có những ưu điểm này, vẫn có một số hạn chế cần lưu ý khi triển khai các hệ thống như vậy. Sau đây là cái nhìn tổng quan nhanh về các yếu tố chính cần cân nhắc khi tính toán khoảng cách bằng thị giác máy tính:
Tính khoảng cách giữa các đối tượng bằng cách sử dụng YOLO11 là giải pháp đáng tin cậy có thể hỗ trợ ra quyết định. Nó đặc biệt hữu ích trong các môi trường năng động như kho hàng, bán lẻ và quản lý giao thông, nơi theo dõi khoảng cách của vật thể có thể cải thiện hiệu quả và an toàn.
YOLO11 giúp tự động hóa các tác vụ mà thông thường đòi hỏi nỗ lực thủ công. Mặc dù có một số thách thức, chẳng hạn như nhạy cảm với các yếu tố môi trường và mối quan tâm về quyền riêng tư, nhưng những lợi ích, như tự động hóa, khả năng mở rộng và tích hợp dễ dàng, khiến nó có tác động. Khi thị giác máy tính tiếp tục được cải thiện, đặc biệt là trong các lĩnh vực như tính toán khoảng cách, rất có thể chúng ta sẽ thấy sự thay đổi thực sự trong cách máy móc tương tác và hiểu môi trường xung quanh.
Tham gia cộng đồng của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về Vision AI. Nếu bạn quan tâm đến việc tận dụng thị giác máy tính, hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và xem tác động của AI trong nông nghiệp bằng cách truy cập các trang giải pháp của chúng tôi!
Bắt đầu hành trình của bạn với tương lai của machine learning