Khám phá cách cửa sổ ngữ cảnh cải thiện các mô hình AI/ML trong NLP, phân tích chuỗi thời gian và AI thị giác, cải thiện dự đoán và độ chính xác.
Cửa sổ ngữ cảnh đề cập đến khoảng hữu hạn của thông tin trước đó (và đôi khi là thông tin tiếp theo) mà mô hình học máy xem xét khi xử lý dữ liệu tuần tự, chẳng hạn như thông tin văn bản hoặc chuỗi thời gian. Hãy coi đó là trọng tâm hoặc bộ nhớ ngắn hạn của mô hình tại bất kỳ thời điểm nào trong chuỗi. Khái niệm này rất quan trọng vì nó xác định mức độ ngữ cảnh mà mô hình có thể tận dụng để hiểu các mối quan hệ, đưa ra dự đoán hoặc tạo ra các đầu ra có liên quan. Kích thước của cửa sổ ngữ cảnh ảnh hưởng trực tiếp đến khả năng nắm bắt các phụ thuộc trong dữ liệu của mô hình, ảnh hưởng đến cả hiệu suất và yêu cầu tính toán của mô hình.
Cửa sổ ngữ cảnh là một khái niệm cơ bản trong Xử lý ngôn ngữ tự nhiên (NLP) . Các mô hình như Transformers , hỗ trợ các kiến trúc như BERT và GPT , phụ thuộc rất nhiều vào cửa sổ ngữ cảnh. Trong các mô hình này, cửa sổ ngữ cảnh xác định có bao nhiêu mã thông báo trước đó (từ hoặc từ phụ) được xem xét khi xử lý một mã thông báo cụ thể. Cửa sổ ngữ cảnh lớn hơn cho phép mô hình hiểu các phụ thuộc phạm vi dài hơn trong văn bản, có khả năng dẫn đến đầu ra mạch lạc hơn và nhận thức theo ngữ cảnh hơn, như được thấy trong các mô hình nâng cao như GPT-4 của OpenAI . Tuy nhiên, cửa sổ lớn hơn cũng làm tăng tải tính toán và sử dụng bộ nhớ trong quá trình đào tạo và suy luận.
Mặc dù được thảo luận nổi bật nhất trong NLP, ý tưởng về cửa sổ ngữ cảnh cũng có thể áp dụng trong thị giác máy tính (CV) , đặc biệt là khi phân tích luồng video hoặc chuỗi hình ảnh. Ví dụ, trong theo dõi đối tượng , một mô hình có thể sử dụng cửa sổ ngữ cảnh của một số khung liên tiếp để dự đoán tốt hơn quỹ đạo của đối tượng và xử lý các điểm che khuất. Ngữ cảnh thời gian này giúp duy trì tính nhất quán của việc theo dõi. Ultralytics YOLO Các mô hình, chủ yếu được biết đến với khả năng phát hiện đối tượng theo thời gian thực, có thể được tích hợp vào các hệ thống sử dụng cửa sổ ngữ cảnh cho các tác vụ như phân tích video, nâng cao khả năng của chúng vượt ra ngoài khả năng xử lý một khung hình. Khám phá các giải pháp Ultralytics để biết ví dụ về các ứng dụng tầm nhìn tiên tiến.