Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Vektör Veritabanı

Vektör veritabanlarının anlamsal arama için yüksek boyutlu gömülü verileri nasıl yönettiğini keşfedin. Ultralytics ve benzerlik araması ile AI uygulamalarını güçlendirmeyi öğrenin.

Vektör veritabanı, yüksek boyutlu vektör verilerini yönetmek, indekslemek ve sorgulamak için tasarlanmış özel bir depolama sistemidir ve genellikle gömülü olarak adlandırılır. Yapısal verileri tam anahtar kelime eşleşmesi için satır ve sütunlar halinde düzenleyen geleneksel ilişkisel veritabanlarından farklı olarak vektör veritabanı, anlamsal arama için optimize edilmiştir. Akıllı sistemlerin, kavramsal olarak benzer olan veri noktalarını, aynı olanları değil bulmasını sağlar. Bu yetenek, modern yapay zeka (AI) altyapısı için temel öneme sahiptir ve uygulamaların, aralarındaki matematiksel ilişkileri analiz ederek görüntü, ses, video ve metin gibi yapılandırılmamış verileriişlemelerine ve anlamalarına olanak tanır. Bu veritabanları, akıllı ajanlar için uzun vadeli bellek görevi görür ve görsel arama ve kişiselleştirilmiş öneriler gibi görevleri kolaylaştırır.

Vektör Veritabanları Nasıl Çalışır

Vektör veritabanının işlevi, veri öğelerinin çok boyutlu bir koordinat sisteminde noktalar olarak eşleştirildiği vektör uzayı kavramına odaklanır. Süreç, derin öğrenme (DL) modelinin ham girdileri sayısal vektörlere dönüştürdüğü özellik çıkarma ile başlar. Bu sayısal vektörler, daha sonra vektör veritabanında depolanır.

  1. Alınma: Veriler, en son teknoloji olan YOLO26 gibi bir sinir ağı tarafından işlenerek gömülü değerler üretilir. Bu vektörler, girdinin anlamsal anlamını yoğun bir kayan nokta sayıları listesine sıkıştırır.
  2. Dizinleme: Geri getirme sırasında düşük çıkarım gecikmesi sağlamak için, veritabanı bu vektörleri özel algoritmalar kullanarak düzenler. Hiyerarşik Gezinilebilir Küçük Dünya (HNSW) veya Ters Dosya Dizini (IVF) gibi teknikler, sistemin her bir girişi taramadan milyarlarca vektörü verimli bir şekilde gezinebilmesini sağlar.
  3. Sorgulama: Bir kullanıcı bir arama sorgusu gönderdiğinde (örneğin, belirli bir ayakkabı stilinin resmi), sistem sorguyu bir vektöre dönüştürür ve kosinüs benzerliği veya Öklid mesafesi gibi mesafe ölçütlerini kullanarak depolanan vektörlere olan yakınlığını hesaplar. Öklid mesafesi, iki vektör arasındaki en kısa mesafeyi ölçer.
  4. Geri alma: Veritabanı, bağlamsal olarak en alakalı sonuçları temsil eden "en yakın komşuları" döndürür. bağlamsal olarak en alakalı sonuçları temsil eden "en yakın komşuları" döndürür.

Aşağıdaki Python , standart bir ultralytics model, vektör veritabanını doldurmadan önce gerekli olan ön koşul adımdır.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

Gerçek Dünya Uygulamaları

Vektör veritabanları, günümüzde kurumsal ortamlarda kullanılan birçok gelişmiş bilgisayar görme (CV) ve Doğal Dil İşleme (NLP) uygulamasının arkasındaki itici güçtür.

  • Geri Getirme ile Güçlendirilmiş Üretim (RAG): Üretken yapay zeka çağında, vektör veritabanları Büyük Dil Modellerinin (LLM'ler) özel, güncel verilerden oluşan geniş bir kütüphaneye erişmesine olanak tanır. Kullanıcının komutunun anlamsal anlamına dayalı olarak ilgili belgeleri geri getirerek, sistem LLM'lerdeki halüsinasyonları azaltır ve gerçeklere dayalı, bağlamı dikkate alan yanıtlar sağlar. *
  • Görsel Öneri Motorları: Perakende sektöründe yapay zeka, platformlar vektör veritabanlarını kullanarak "benzer stilleri satın al" özelliklerini desteklemektedir. Bir kullanıcı belirli bir yazlık elbiseyi görüntülerse, sistem veritabanında benzer görsel gömülü öğelere (eşleşen desenler, kesimler ve renkler) sahip diğer ürün görsellerini sorgular ve basit etiket tabanlı filtrelemeden daha iyi bir kullanıcı deneyimi sunar.
  • Anormallik ve Tehdit Algılama: Güvenlik sistemleri, anormallik algılama için vektör veritabanlarından yararlanır. "Normal" davranışların veya yetkili personelin gömülü verilerini depolayarak, sistem vektör uzayında beklenen kümenin dışında kalan aykırı değerleri anında işaretleyebilir ve böylece veri güvenliğini ve tesis izlemeyi geliştirebilir.

İlgili Kavramların Farklılaştırılması

Bu sistemleri etkili bir şekilde uygulamak için, vektör veritabanını makine öğrenimi operasyonları (MLOps) alanındaki ilgili teknolojilerden ayırmak yararlıdır.

  • Vektör Veritabanı ve Vektör Arama: Vektör arama, benzer vektörleri bulma eylemi veya algoritmik süreçtir ("nasıl"). Vektör veritabanı ise verileri depolamak, dizini yönetmek ve bu aramaları büyük ölçekte gerçekleştirmek için oluşturulmuş sağlam bir altyapıdır ("nerede").
  • Vektör Veritabanı ve Özellik Deposu: Özellik deposu, model eğitimi ve çıkarımında kullanılan özellikleri yönetmek ve tutarlılığı sağlamak için merkezi bir depodur. Özellik verilerini işlerken, vektör veritabanını tanımlayan benzerlik tabanlı arama sorguları için öncelikli olarak optimize edilmemiştir. Özellik deposu, vektör veritabanı ile karşılaştırıldığında daha basit bir mimariye sahiptir.
  • Vektör Veritabanı ve Veri Gölü: Bir veri gölü, büyük miktarda ham veriyi kendi formatında depolar. Bir vektör veritabanı ise, benzerlik araması için özel olarak optimize edilmiş, bu verilerin işlenmiş, matematiksel temsillerini (gömülü) depolar. .

Modern Yapay Zeka İş Akışları ile Entegrasyon

Vektör veritabanının uygulanması genellikle, verimli YOLO26 gibi modellerin gömme motoru olarak işlev gördüğü bir boru hattını içerir. Bu modeller, görsel verileri uçta veya bulutta işler ve elde edilen vektörler Pinecone, Milvus veya Qdrant gibi çözümlere aktarılır.

Veri kürasyonu ve otomatik açıklama ekleme işlemlerinden model eğitimi ve uygulamaya kadar tüm bu yaşam döngüsünü kolaylaştırmak isteyen ekipler için Ultralytics kapsamlı bir ortam sunar. Model eğitimini verimli uygulama stratejileriyle entegre ederek, geliştiriciler vektör veritabanlarını besleyen gömme işlemlerinin doğru olmasını sağlayabilir ve böylece daha yüksek kaliteli arama sonuçları ve daha akıllı AI ajanları elde edebilirler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın