Alma Destekli Üretim (RAG)
Retrieval Augmented Generation (RAG) teknolojisinin gerçek zamanlı verilerle LLM'leri nasıl optimize ettiğini keşfedin. Görsel RAG için Ultralytics kullanarak çok modlu boru hatları oluşturmayı öğrenin.
Geri Alma ile Güçlendirilmiş Üretim (RAG), yapay zeka alanında,
Büyük Dil Modeli'nin (LLM)
çıktısını, eğitim verilerinin dışındaki
yetkili bilgi tabanına başvurarak optimize eden gelişmiş bir tekniktir. Geleneksel üretici modeller, yalnızca ilk eğitimleri sırasında öğrenilen statik
bilgilere dayanır ve bu da güncel olmayan cevaplara veya halüsinasyonlar olarak bilinen kesin yanlışlıklara yol açabilir
. RAG, şirket veritabanları, güncel haberler veya
teknik kılavuzlar gibi harici kaynaklardan ilgili, güncel bilgileri alarak ve yanıt oluşturulmadan önce bunları modele bağlam olarak besleyerek bu boşluğu doldurur. Bu süreç,
AI'nın çıktılarının sadece dilbilimsel olarak tutarlı olmasını değil, aynı zamanda gerçeklere dayalı ve belirli verilere dayalı olmasını da sağlar.
RAG Sistemleri Nasıl Çalışır?
Bir RAG sisteminin mimarisi genellikle iki ana aşamadan oluşur: geri alma ve oluşturma. Bu iş akışı,
geliştiricilerin sık sık yeniden eğitim gibi pahalı bir ihtiyaç olmadan
temel modeli sürdürmelerine olanak tanır.
-
Geri getirme: Bir kullanıcı bir sorgu gönderdiğinde, sistem önce
vektör veritabanı adı verilen özel bir depolama
sisteminde anlamsal arama yapar. Bu veritabanı,
"gömme" olarak bilinen sayısal temsil biçimine dönüştürülmüş veriler içerir ve sistemin sadece anahtar kelimeleri eşleştirmek yerine kavramsal olarak
benzer bilgileri bulmasını sağlar.
Bu, sistemin daha önce hiç görmediği yeni verilerle de çalışabilmesini sağlar.
-
Oluşturma: Geri getirme sırasında bulunan ilgili belgeler veya veri parçacıkları,
kullanıcının orijinal sorusuyla birleştirilir. Bu zenginleştirilmiş komut istemi daha sonra üretici modele gönderilir. Model, sağlanan bu
bağlamı kullanarak bir cevap oluşturur ve yanıtın geri getirilen gerçeklere dayandığından emin olur. Mekanizmayı daha derinlemesine incelemek için
IBM, RAG iş akışları hakkında kapsamlı bir kılavuz sunmaktadır.
IBM, RAG iş akışları hakkında kapsamlı bir kılavuz sunmaktadır.
Görsel RAG: Bilgisayar Görüşünün Entegrasyonu
RAG geleneksel olarak metin tabanlı olsa da,
çok modlu öğrenmenin yükselişi ile birlikte
"Görsel RAG" ortaya çıkmıştır. Bu senaryoda,
bilgisayar görme modelleri geri alma
mekanizması olarak işlev görür. Görüntüleri veya video akışlarını analiz ederek nesne adları, sayılar veya
etkinlikler gibi yapılandırılmış metin verilerini çıkarırlar ve bu veriler daha sonra görsel sahneyle ilgili soruları yanıtlamak için bir LLM'ye aktarılır.
Örneğin, bir geliştirici YOLO26'yı kullanarak bir görüntüdeki detect
ve bu nesne listesini bir metin modeline aktararak açıklayıcı bir rapor oluşturabilir.
from ultralytics import YOLO
# Load the YOLO26 model for state-of-the-art detection
model = YOLO("yolo26n.pt")
# Perform inference to 'retrieve' visual facts from an image
results = model("https://ultralytics.com/images/bus.jpg")
# Extract class names to build a text context for an LLM
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
context_string = f"The scene contains: {', '.join(detected_classes)}."
print(context_string)
# Output example: "The scene contains: bus, person, person, person."
Gerçek Dünya Uygulamaları
RAG, AI ajanlarının özel veya gerçek zamanlı verilere güvenli bir şekilde erişmesini sağlayarak endüstrileri dönüştürüyor.
.
-
Kurumsal Bilgi Tabanları: Şirketler, RAG'yi kullanarak çalışanların
İK politikaları veya teknik belgelerle ilgili sorularını yanıtlayan dahili sohbet robotları oluşturur. LLM'yi canlı bir belge deposuna bağlayarak,
sistem eski politika bilgilerini sunmaktan kaçınır. Kurumsal uygulamalar hakkında daha fazla bilgi için,
Google Vertex AI'daki RAG genel bakışına bakın.
-
Klinik Karar Desteği:
Sağlık hizmetlerinde yapay zeka, RAG sistemleri
doktorların teşhis koymasına yardımcı olmak için hasta geçmişini ve son tıbbi araştırma makalelerini
geri getirebilir ve tavsiyelerin en son klinik çalışmaları dikkate almasını sağlar.
-
Akıllı Perakende Asistanları: Perakendede
AI kullanan uygulamalar, canlı envanter
veritabanlarını kontrol etmek için RAG'den yararlanır. Bir müşteri bir sohbet robotuna "Bu koşu ayakkabısının 10 numarası var mı?" diye sorarsa, model
cevap vermeden önce gerçek zamanlı stok seviyelerini alır ve stokta olmayan ürünler nedeniyle müşterinin hayal kırıklığına uğramasını önler.
RAG ve İnce Ayar
RAG'yi ince ayarlamadan ayırmak çok önemlidir, çünkü
ikisi farklı sorunları çözer.
-
RAG (Retrieval Augmented Generation): Dinamik, sık sık değişen verilere (ör.
hisse senedi fiyatları, haberler) veya kamuya açık eğitim setinde bulunmayan özel verilere erişmek için en iyisidir. Çalışma zamanında
yeni bilgiler sağlamaya odaklanır.
-
İnce Ayar: Modelin davranışını, stilini veya terminolojisini uyarlamak için en uygun yöntemdir. Belirli bir veri kümesinde
model ağırlıklarının güncellenmesini içerir.
İnce ayar, modelin belirli bir dil modelini (tıbbi jargon gibi) öğrenmesine yardımcı olur, ancak
gerçek zamanlı bilgilere erişim sağlamaz.
Karar verme çerçeveleri için
OpenAI'nin ince ayar ve RAG kılavuzuna bak ın.
İlgili Kavramlar
-
LangChain: Retriever'ları ve LLM'leri birbirine bağlayarak RAG uygulamalarının oluşturulmasını basitleştirmek için özel olarak tasarlanmış popüler bir açık kaynak
çerçevesi.
LLM'ler.
-
Bilgi Grafiği: Bir veri kaynağı olarak kullanılabilen, basit vektör benzerliğinden daha zengin bağlamsal ilişkiler sunan, yapılandırılmış bir veri temsil etme yöntemi.
-
Prompt Mühendisliği: Modeli yönlendirmek için girdiler oluşturma sanatı.
RAG, temelde otomatikleştirilmiş bir prompt mühendisliği biçimidir ve burada
"prompt", programlı olarak alınan verilerle zenginleştirilir.
-
Ultralytics : RAG metin
üretimini üstlenirken, bu tür platformlar, görsel verileri multimodal RAG boru hatlarına besleyen görsel modellerin
veri ön işleme ve eğitiminin yönetimi için
gerekli.