Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Làm thế nào để tính toán khoảng cách bằng mô hình thị giác máy tính?

Tìm hiểu cách tính toán khoảng cách trong các ứng dụng thị giác máy tính bằng cách sử dụng Ultralytics YOLO11 giúp đo khoảng cách của các vật thể theo thời gian thực.

Khi bạn băng qua đường và thấy một chiếc xe đang tiến về phía mình, bạn có thể ngay lập tức biết được khoảng cách ước chừng của chiếc xe đó. Phán đoán nhanh chóng, gần như theo bản năng này là nhờ vào sự hiểu biết về không gian xung quanh bạn. Dựa trên giác quan này, bạn có thể quyết định có nên tăng tốc, dừng lại hay tiếp tục đi bộ không. 

Tương tự như vậy, thị giác máy tính là một nhánh của trí tuệ nhân tạo (AI) giúp máy móc có thể phát triển khả năng hiểu biết về môi trường xung quanh bằng cách diễn giải dữ liệu trực quan. Giống như cách bạn có thể đánh giá khoảng cách của ô tô để đưa ra quyết định nhanh chóng, các mô hình thị giác máy tính có thể phân tích hình ảnh và video, giúp máy móc cảm nhận và phản ứng với thế giới xung quanh.

Ví dụ, Ultralytics YOLO11 là một mô hình thị giác máy tính có thể phát hiện và theo dõi các đối tượng trong hình ảnh và video theo thời gian thực. Nói một cách đơn giản, YOLO11 hoạt động bằng cách xem toàn bộ hình ảnh cùng một lúc, thay vì từng phần, giúp nó nhanh hơn và hiệu quả hơn. Nó cũng có thể xử lý các tác vụ thị giác máy tính như phân đoạn trường hợp, ước tính tư thế và phân loại hình ảnh.

Đặc biệt, YOLO11 Khả năng của 'có thể được sử dụng để tính toán khoảng cách giữa các vật thể với nhau, điều này hữu ích trong nhiều lĩnh vực như sản xuất, bán lẻ và quản lý đám đông, giúp cải thiện tính an toàn và hiệu quả.

Trong bài viết này, chúng ta sẽ khám phá cách YOLO11 có thể được sử dụng để tính toán khoảng cách trong các ứng dụng thị giác máy tính, lý do tại sao nó quan trọng và tác động của nó trong các ngành công nghiệp khác nhau.

Hình 1. Một ví dụ về việc sử dụng YOLO để tính toán khoảng cách hạ cánh của máy bay.

Tổng quan về tính toán khoảng cách trong thị giác máy tính

Tính toán khoảng cách trong thị giác máy tính bao gồm việc phát hiện, định vị và đo các điểm ảnh giữa hai đối tượng trong một hình ảnh. Điểm ảnh là các đơn vị riêng lẻ tạo nên một hình ảnh kỹ thuật số, mỗi điểm ảnh đại diện cho một điểm duy nhất có giá trị màu sắc hoặc cường độ cụ thể. 

Để chuyển đổi các phép đo pixel thành khoảng cách thực tế, hiệu chuẩn là chìa khóa. Bạn có thể nghĩ về nó như việc sử dụng thước kẻ để đo một thứ gì đó và sau đó sử dụng phép đo đó để hiểu kích thước của các vật thể khác. Bằng cách tham chiếu các vật thể có kích thước đã biết, hiệu chuẩn tạo ra một liên kết giữa các pixel và khoảng cách vật lý thực tế.

Hãy xem một ví dụ để xem cách thức hoạt động của nó. Trong hình ảnh bên dưới, đồng xu là vật thể tham chiếu và kích thước của nó (0,9in x 1,0in) đã được biết. Bằng cách so sánh các phép đo pixel của các vật thể khác với kích thước của đồng xu, chúng ta có thể tính toán kích thước thực tế của chúng.

Hình 2. Một đồng xu có thể được sử dụng làm chuẩn để đo kích thước thực tế của các vật thể khác.

Tuy nhiên, tính toán khoảng cách được thực hiện trên mặt phẳng hai chiều (2D), nghĩa là nó chỉ đo khoảng cách theo chiều ngang và chiều dọc giữa các vật thể. Điều này khác với ước tính độ sâu, đo khoảng cách của các vật thể trong không gian ba chiều, bao gồm khoảng cách của chúng từ máy ảnh.

Trong khi máy ảnh độ sâu có thể đo độ sâu thực và cung cấp thông tin không gian chi tiết hơn, trong nhiều trường hợp, một khoảng cách hiệu chuẩn đơn giản là đủ. Ví dụ, biết được khoảng cách giữa các vật thể trong mặt phẳng 2D hoạt động tốt cho các tác vụ như theo dõi vật thể hoặc quản lý hàng đợi, do đó không cần ước tính độ sâu trong những tình huống đó.

Hiểu cách tính khoảng cách bằng cách sử dụng YOLO11 tác phẩm

Tiếp theo, chúng ta hãy cùng tìm hiểu cách tính khoảng cách giữa hai vật thể bằng cách sử dụng YOLO11 hỗ trợ phát hiện và theo dõi đối tượng . Sau đây là phân tích chi tiết:

  • Phát hiện và theo dõi các đối tượng : YOLO11 có thể được sử dụng để phát hiện các đối tượng bằng cách nhận dạng chúng trong một khung hình và theo dõi chuyển động của chúng qua các khung hình trong video. Nó chỉ định một ID theo dõi duy nhất cho mỗi đối tượng, cho phép hệ thống theo dõi vị trí và chuyển động của chúng trong suốt video.
  • Hộp giới hạn : Các hộp giới hạn được vẽ xung quanh các đối tượng được phát hiện dựa trên YOLO11 kết quả phát hiện đối tượng, xác định vị trí của chúng trong hình ảnh.
  • Chọn đối tượng : Có thể chọn hai đối tượng để tập trung vào và YOLO11 cập nhật các hộp giới hạn khi các đối tượng di chuyển theo thời gian thực.
  • Tính toán trọng tâm : Trọng tâm (điểm chính giữa của hộp giới hạn hai đối tượng) được tính toán dựa trên tọa độ của các góc hộp giới hạn, biểu diễn vị trí của các đối tượng.
  • Tính toán khoảng cách : Trọng tâm của hai đối tượng sau đó có thể được sử dụng để tính khoảng cách Euclidean giữa chúng. Khoảng cách Euclidean là khoảng cách đường thẳng giữa hai điểm trên mặt phẳng 2D, được tính bằng cách sử dụng sự khác biệt theo cả hướng ngang và hướng dọc. Điều này cung cấp khoảng cách giữa hai đối tượng theo pixel.

Điều quan trọng cần nhớ là khoảng cách được tính toán bằng phương pháp này chỉ là ước tính vì chúng dựa trên phép đo pixel 2D.

Hình 3. Sử dụng Ultralytics YOLO để phát hiện một người và tính toán khoảng cách. 

Tác động của YOLO ước tính khoảng cách

Xem xét rằng việc tính toán khoảng cách sử dụng YOLO11 là một ước tính, bạn có thể thắc mắc: Có thể sử dụng ước tính này ở đâu và nó có thể tạo ra sự khác biệt như thế nào? 

Vì hiệu chuẩn được sử dụng để đưa ra những ước tính khoảng cách này nên chúng đủ chính xác để giúp ích trong nhiều tình huống thực tế. YOLO11 Ước tính khoảng cách đặc biệt hữu ích trong các môi trường năng động, như nhà kho, nơi các vật thể liên tục chuyển động và cần phải điều chỉnh theo thời gian thực để mọi thứ hoạt động trơn tru.

Một ví dụ thú vị là sử dụng YOLO11 để theo dõi các gói hàng trên băng chuyền và ước tính khoảng cách giữa chúng theo thời gian thực. Điều này giúp người quản lý kho đảm bảo các gói hàng được sắp xếp đúng cách, tránh va chạm và duy trì hoạt động trơn tru. 

Trong những trường hợp như vậy, không phải lúc nào cũng cần khoảng cách chính xác. Thông thường, một phạm vi hoặc ngưỡng cho khoảng cách tối ưu được thiết lập, do đó, ước tính hoạt động tốt cho các loại ứng dụng này.

Hình 4. Phát hiện các gói sử dụng YOLO11 và tính toán khoảng cách giữa chúng.

Tính toán khoảng cách trong ứng dụng thị giác máy tính

Nhiều ứng dụng thị giác máy tính có thể được hưởng lợi từ việc tính toán khoảng cách giữa các vật thể bằng cách sử dụng YOLO11 . Ví dụ, trong phân tích bán lẻ, nó giúp cải thiện việc quản lý hàng đợi bằng cách theo dõi vị trí của khách hàng theo thời gian thực. Điều này giúp các doanh nghiệp phân bổ nguồn lực tốt hơn, giảm thời gian chờ đợi và tạo ra trải nghiệm mua sắm mượt mà hơn. Bằng cách điều chỉnh động mức độ nhân sự và quản lý luồng khách hàng, các cửa hàng có thể ngăn ngừa tình trạng quá tải và tối ưu hóa việc sử dụng không gian.

Tương tự như vậy, trong quản lý giao thông , ước tính khoảng cách giúp theo dõi khoảng cách giữa các phương tiện và phân tích các mô hình giao thông. Điều này có thể được sử dụng để phát hiện các hành vi nguy hiểm, như bám đuôi, và điều chỉnh tín hiệu giao thông để duy trì lưu thông thông suốt. Nó có thể giúp đường an toàn hơn bằng cách xác định các vấn đề tiềm ẩn và cải thiện quản lý giao thông tổng thể theo thời gian thực.

Hình 5. Tính toán khoảng cách bằng thị giác có thể được sử dụng để theo dõi giao thông.

Một ứng dụng độc đáo khác của công nghệ này xuất hiện trong đại dịch COVID-19 khi nó giúp thúc đẩy giãn cách xã hội. Nó đảm bảo mọi người giữ khoảng cách an toàn ở nơi công cộng, cửa hàng và bệnh viện, giảm nguy cơ lây lan vi-rút. 

Bằng cách theo dõi khoảng cách theo thời gian thực, cảnh báo có thể được gửi đi khi mọi người ở quá gần, giúp các doanh nghiệp và nhà cung cấp dịch vụ chăm sóc sức khỏe phản ứng nhanh chóng và duy trì môi trường an toàn hơn cho mọi người.

Ưu và nhược điểm của tính toán khoảng cách trong thị giác máy tính

Bây giờ chúng ta đã thảo luận về một số ứng dụng của tính toán khoảng cách bằng thị giác máy tính, sau đây là cái nhìn sâu hơn về những lợi ích liên quan khi thực hiện việc đó:

  • Tự động hóa : Vision AI có thể tự động hóa các tác vụ tính toán khoảng cách vốn đòi hỏi phải theo dõi thủ công, giúp giảm lỗi của con người và chi phí lao động đồng thời tăng năng suất.
  • Tối ưu hóa tài nguyên : Bằng cách biết khoảng cách và vị trí gần đúng của các đối tượng, các tài nguyên (như nhân viên hoặc máy móc) có thể được tối ưu hóa, giảm thiểu lãng phí và cải thiện quy trình làm việc.
  • Độ phức tạp khi thiết lập tối thiểu : Sau khi thiết lập, các hệ thống tính toán khoảng cách hỗ trợ thị giác có nhu cầu bảo trì tương đối thấp và ít cần sự can thiệp của con người hơn so với các hệ thống khác dựa vào dữ liệu thủ công hoặc máy móc phức tạp.

Mặc dù có những ưu điểm này, vẫn có một số hạn chế cần lưu ý khi triển khai các hệ thống như vậy. Sau đây là cái nhìn tổng quan nhanh về các yếu tố chính cần cân nhắc khi tính toán khoảng cách bằng thị giác máy tính:

  • Độ nhạy với các yếu tố môi trường : Độ chính xác của tính toán khoảng cách có thể bị ảnh hưởng bởi điều kiện ánh sáng, bóng tối, phản chiếu hoặc vật cản, dẫn đến các lỗi tiềm ẩn hoặc không nhất quán.
  • Mối quan ngại về quyền riêng tư : Sử dụng công nghệ thị giác máy tính để theo dõi đồ vật hoặc con người có thể gây ra các vấn đề về quyền riêng tư, đặc biệt là ở những nơi công cộng hoặc môi trường nhạy cảm, nơi có thể liên quan đến dữ liệu cá nhân.
  • Độ phức tạp trong các tình huống có nhiều đối tượng : Trong môi trường có nhiều đối tượng chuyển động, việc tính toán chính xác khoảng cách giữa nhiều đối tượng cùng lúc có thể dẫn đến nhầm lẫn, đặc biệt nếu chúng ở gần nhau hoặc giao nhau.

Những điểm chính

Tính khoảng cách giữa các đối tượng bằng cách sử dụng YOLO11 là giải pháp đáng tin cậy có thể hỗ trợ ra quyết định. Nó đặc biệt hữu ích trong các môi trường năng động như kho hàng, bán lẻ và quản lý giao thông, nơi theo dõi khoảng cách của vật thể có thể cải thiện hiệu quả và an toàn. 

YOLO11 giúp tự động hóa các tác vụ mà thông thường đòi hỏi nỗ lực thủ công. Mặc dù có một số thách thức, chẳng hạn như nhạy cảm với các yếu tố môi trường và mối quan tâm về quyền riêng tư, nhưng những lợi ích, như tự động hóa, khả năng mở rộng và tích hợp dễ dàng, khiến nó có tác động. Khi thị giác máy tính tiếp tục được cải thiện, đặc biệt là trong các lĩnh vực như tính toán khoảng cách, rất có thể chúng ta sẽ thấy sự thay đổi thực sự trong cách máy móc tương tác và hiểu môi trường xung quanh.

Tham gia cộng đồng của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về Vision AI. Nếu bạn quan tâm đến việc tận dụng thị giác máy tính, hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và xem tác động của AI trong nông nghiệp bằng cách truy cập các trang giải pháp của chúng tôi! 

Logo FacebookBiểu trưng TwitterBiểu tượng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning