Vektör Veritabanı
Vektör veritabanlarının anlamsal arama için yüksek boyutlu gömülü verileri nasıl yönettiğini keşfedin. Ultralytics ve benzerlik araması ile AI uygulamalarını güçlendirmeyi öğrenin.
Vektör veritabanı, yüksek boyutlu vektör verilerini yönetmek, indekslemek ve sorgulamak için tasarlanmış özel bir depolama sistemidir ve
genellikle gömülü olarak adlandırılır. Yapısal verileri tam anahtar kelime eşleşmesi için satır ve sütunlar halinde düzenleyen
geleneksel ilişkisel veritabanlarından farklı olarak
vektör veritabanı, anlamsal arama için optimize edilmiştir. Akıllı sistemlerin, kavramsal olarak benzer olan veri noktalarını,
aynı olanları değil bulmasını sağlar. Bu yetenek, modern
yapay zeka (AI)
altyapısı için temel öneme sahiptir ve uygulamaların, aralarındaki matematiksel ilişkileri analiz ederek
görüntü, ses, video ve
metin gibi yapılandırılmamış verileriişlemelerine ve anlamalarına olanak tanır. Bu veritabanları, akıllı ajanlar için uzun vadeli bellek görevi görür ve
görsel arama ve kişiselleştirilmiş öneriler gibi görevleri kolaylaştırır.
Vektör Veritabanları Nasıl Çalışır
Vektör veritabanının işlevi, veri öğelerinin çok boyutlu bir koordinat sisteminde noktalar olarak eşleştirildiği vektör uzayı kavramına odaklanır.
Süreç,
derin öğrenme (DL) modelinin ham girdileri sayısal vektörlere dönüştürdüğü
özellik çıkarma ile başlar.
Bu sayısal vektörler, daha sonra vektör veritabanında depolanır.
-
Alınma: Veriler, en son teknoloji olan YOLO26 gibi bir sinir ağı tarafından işlenerek gömülü değerler üretilir. Bu vektörler, girdinin anlamsal anlamını yoğun bir kayan nokta sayıları listesine sıkıştırır.
-
Dizinleme: Geri getirme sırasında düşük
çıkarım gecikmesi sağlamak için,
veritabanı bu vektörleri özel algoritmalar kullanarak düzenler.
Hiyerarşik Gezinilebilir Küçük Dünya (HNSW) veya
Ters Dosya Dizini (IVF) gibi teknikler, sistemin her bir girişi taramadan milyarlarca vektörü
verimli bir şekilde gezinebilmesini sağlar.
-
Sorgulama: Bir kullanıcı bir arama sorgusu gönderdiğinde (örneğin, belirli bir ayakkabı stilinin resmi), sistem
sorguyu bir vektöre dönüştürür ve kosinüs benzerliği veya
Öklid mesafesi gibi mesafe ölçütlerini kullanarak depolanan vektörlere olan yakınlığını hesaplar.
Öklid mesafesi, iki vektör arasındaki en kısa mesafeyi ölçer.
-
Geri alma: Veritabanı, bağlamsal olarak en alakalı sonuçları temsil eden "en yakın komşuları" döndürür.
bağlamsal olarak en alakalı sonuçları temsil eden "en yakın komşuları" döndürür.
Aşağıdaki Python , standart bir ultralytics model,
vektör veritabanını doldurmadan önce gerekli olan ön koşul adımdır.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Gerçek Dünya Uygulamaları
Vektör veritabanları, günümüzde kurumsal ortamlarda kullanılan birçok gelişmiş
bilgisayar görme (CV) ve
Doğal Dil İşleme (NLP)
uygulamasının arkasındaki itici güçtür.
-
Geri Getirme ile Güçlendirilmiş Üretim (RAG):
Üretken yapay zeka çağında, vektör veritabanları
Büyük Dil Modellerinin (LLM'ler) özel, güncel verilerden oluşan
geniş bir kütüphaneye erişmesine olanak tanır. Kullanıcının komutunun anlamsal anlamına dayalı olarak ilgili belgeleri geri getirerek,
sistem LLM'lerdeki halüsinasyonları azaltır ve
gerçeklere dayalı, bağlamı dikkate alan yanıtlar sağlar.
*
-
Görsel Öneri Motorları: Perakende sektöründe
yapay zeka, platformlar vektör veritabanlarını kullanarak
"benzer stilleri satın al" özelliklerini desteklemektedir. Bir kullanıcı belirli bir yazlık elbiseyi görüntülerse, sistem
veritabanında benzer görsel gömülü öğelere (eşleşen desenler, kesimler ve renkler) sahip diğer ürün görsellerini sorgular ve
basit etiket tabanlı filtrelemeden daha iyi bir
kullanıcı deneyimi sunar.
-
Anormallik ve Tehdit Algılama: Güvenlik sistemleri, anormallik algılama için vektör veritabanlarından yararlanır.
"Normal" davranışların veya yetkili personelin gömülü verilerini depolayarak, sistem vektör uzayında beklenen kümenin dışında kalan aykırı değerleri anında işaretleyebilir ve böylece veri güvenliğini ve tesis izlemeyi geliştirebilir.
İlgili Kavramların Farklılaştırılması
Bu sistemleri etkili bir şekilde uygulamak için, vektör veritabanını
makine öğrenimi operasyonları (MLOps)
alanındaki ilgili teknolojilerden ayırmak
yararlıdır.
-
Vektör Veritabanı ve Vektör Arama:
Vektör arama, benzer vektörleri bulma eylemi veya algoritmik süreçtir ("nasıl").
Vektör veritabanı ise verileri depolamak, dizini yönetmek ve bu aramaları büyük ölçekte gerçekleştirmek için oluşturulmuş sağlam bir altyapıdır ("nerede").
-
Vektör Veritabanı ve Özellik Deposu:
Özellik deposu, model eğitimi ve çıkarımında kullanılan özellikleri yönetmek ve tutarlılığı sağlamak için merkezi bir depodur.
Özellik verilerini işlerken, vektör veritabanını tanımlayan benzerlik tabanlı arama sorguları için öncelikli olarak optimize edilmemiştir.
Özellik deposu, vektör veritabanı ile karşılaştırıldığında daha basit bir mimariye sahiptir.
-
Vektör Veritabanı ve Veri Gölü: Bir veri
gölü, büyük miktarda ham veriyi kendi formatında depolar. Bir vektör veritabanı ise, benzerlik araması için özel olarak optimize edilmiş, bu verilerin işlenmiş, matematiksel
temsillerini (gömülü) depolar.
.
Modern Yapay Zeka İş Akışları ile Entegrasyon
Vektör veritabanının uygulanması genellikle, verimli
YOLO26 gibi modellerin gömme motoru olarak işlev gördüğü bir boru hattını içerir. Bu modeller,
görsel verileri uçta veya bulutta işler ve elde edilen vektörler
Pinecone, Milvus veya
Qdrant gibi çözümlere aktarılır.
Veri kürasyonu ve otomatik açıklama ekleme işlemlerinden model eğitimi ve
uygulamaya kadar tüm bu yaşam döngüsünü kolaylaştırmak isteyen ekipler için Ultralytics kapsamlı bir
ortam sunar. Model eğitimini verimli uygulama stratejileriyle entegre ederek, geliştiriciler vektör veritabanlarını besleyen
gömme işlemlerinin doğru olmasını sağlayabilir ve böylece daha yüksek kaliteli arama sonuçları ve daha akıllı AI
ajanları elde edebilirler.