Thuật ngữ

Biểu đồ tri thức

Khám phá cách biểu đồ kiến thức cách mạng hóa AI bằng cách mô hình hóa các mối quan hệ phức tạp, cho phép tìm kiếm ngữ nghĩa, đề xuất được cá nhân hóa, v.v.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Biểu đồ kiến thức tổ chức thông tin bằng cách kết nối các thực thể trong thế giới thực (như con người, địa điểm hoặc khái niệm) và mô tả mối quan hệ giữa chúng. Hãy nghĩ về nó như một mạng lưới hoặc bản đồ kiến thức, trong đó các điểm biểu diễn các thực thể và các đường biểu diễn cách chúng liên quan. Cách tiếp cận có cấu trúc này cho phép các hệ thống Trí tuệ nhân tạo (AI) , đặc biệt là trong Học máy (ML) , hiểu ngữ cảnh, rút ra suy luận và truy cập thông tin thông minh hơn là chỉ tìm kiếm thông qua văn bản thô hoặc cơ sở dữ liệu bị cô lập.

Các khái niệm cốt lõi

Biểu đồ kiến thức được xây dựng bằng cách sử dụng các nút (đại diện cho các thực thể hoặc khái niệm) và các cạnh (đại diện cho các mối quan hệ giữa các nút này). Ví dụ, một nút có thể là " Ultralytics YOLO " và " Phát hiện đối tượng " khác, được kết nối bằng một cạnh có nhãn "là một loại". Cấu trúc này cho phép các truy vấn phức tạp và khả năng suy luận, cho phép các hệ thống suy ra các sự kiện mới từ dữ liệu hiện có. Các công nghệ như Resource Description Framework (RDF) cung cấp một mô hình chuẩn để trao đổi dữ liệu, trong khi các ngôn ngữ truy vấn như SPARQL cho phép người dùng truy xuất thông tin dựa trên các mối quan hệ này. Việc xây dựng KG thường liên quan đến việc trích xuất thông tin từ nhiều nguồn khác nhau, bao gồm cơ sở dữ liệu có cấu trúc và văn bản không có cấu trúc, đôi khi sử dụng các kỹ thuật Xử lý ngôn ngữ tự nhiên (NLP) và có khả năng liên quan đến các hệ thống suy luận phức tạp.

Biểu đồ tri thức so với các khái niệm khác

Mặc dù liên quan đến các cấu trúc dữ liệu khác, biểu đồ kiến thức có những đặc điểm riêng biệt:

  • Cơ sở dữ liệu: Cơ sở dữ liệu quan hệ truyền thống lưu trữ dữ liệu trong các bảng có lược đồ được xác định trước, tập trung vào việc lưu trữ và truy xuất hiệu quả các bản ghi có cấu trúc. KGs xuất sắc trong việc biểu diễn các mối quan hệ phức tạp, thường không đồng nhất và suy ra kiến thức mới, điều này ít đơn giản hơn trong cơ sở dữ liệu chuẩn.
  • Ontology: Một ontology định nghĩa từ vựng và quy tắc (sơ đồ) cho một miền, chỉ định các loại thực thể và mối quan hệ. Biểu đồ kiến thức thường là một trường hợp của ontology, biểu diễn các sự kiện cụ thể theo các quy tắc đó. Ngôn ngữ Ontology Web (OWL) là một tiêu chuẩn chung để định nghĩa ontology.
  • Cơ sở dữ liệu vectơ : Những cơ sở dữ liệu này lưu trữ dữ liệu dưới dạng vectơ nhiều chiều (nhúng), nắm bắt được sự tương đồng về mặt ngữ nghĩa. Chúng rất tuyệt vời để tìm các mục tương tự nhưng không xác định rõ ràng các mối quan hệ như KG. KG lưu trữ các kết nối rõ ràng, có thực.

Ứng dụng trong AI/ML

Biểu đồ kiến thức hỗ trợ nhiều ứng dụng thông minh:

  • Kết quả tìm kiếm nâng cao: Các công cụ tìm kiếm như Google sử dụng KG (như Biểu đồ tri thức Google ) để hiểu các truy vấn tìm kiếm theo ngữ nghĩa và cung cấp câu trả lời trực tiếp, tóm tắt và các thực thể liên quan trong bảng thông tin, vượt ra ngoài việc khớp từ khóa đơn giản để cho phép Tìm kiếm ngữ nghĩa tốt hơn.
  • Hệ thống đề xuất : Nền tảng sử dụng KG để mô hình hóa các kết nối giữa người dùng, sản phẩm, nội dung và các thuộc tính của chúng (ví dụ: thể loại, diễn viên, đạo diễn). Điều này cho phép đưa ra các đề xuất sắc thái hơn dựa trên các mối quan hệ đã khám phá, cải thiện trải nghiệm người dùng trong các lĩnh vực như AI trong bán lẻ thời trang .
  • Trí tuệ nhân tạo theo ngữ cảnh: Trong Thị giác máy tính (CV) , việc phát hiện một đối tượng như một tòa nhà cụ thể bằng mô hình YOLO Ultralytics như YOLOv8 có thể kích hoạt truy vấn KG để lấy lịch sử, kiến trúc hoặc giờ mở cửa của đối tượng đó, làm phong phú thêm hiểu biết của ứng dụng. Dữ liệu theo ngữ cảnh này có thể được quản lý và sử dụng trong các nền tảng như Ultralytics HUB . KG cũng cải thiện các hệ thống Trả lời câu hỏi bằng cách cung cấp kiến thức nền có cấu trúc.
  • Khám phá thuốc: KG tích hợp nhiều dữ liệu sinh học khác nhau (gen, protein, bệnh, thuốc) để giúp các nhà nghiên cứu xác định các mục tiêu và tương tác thuốc tiềm năng, đẩy nhanh các giải pháp AI trong chăm sóc sức khỏe .

Xây dựng và sử dụng biểu đồ kiến thức

Việc tạo và duy trì KG có thể bao gồm các kỹ thuật trích xuất tự động, quản lý thủ công hoặc kết hợp. Các biểu đồ kiến thức nguồn mở như DBpedia (có nguồn gốc từ Wikipedia) và Wikidata cung cấp một lượng lớn dữ liệu có cấu trúc. Các công nghệ cơ sở dữ liệu biểu đồ chuyên biệt như Neo4j được thiết kế để lưu trữ và truy vấn dữ liệu biểu đồ một cách hiệu quả. Các mô hình ML ngày càng được sử dụng cho các tác vụ như nhận dạng thực thể và trích xuất quan hệ để tự động điền KG từ văn bản hoặc thậm chí dữ liệu trực quan có nguồn gốc từ nhiều tập dữ liệu thị giác máy tính khác nhau.

Đọc tất cả