AI ve Bilgisayar Görme için hızlı mühendislik konusunda uzmanlaşın. Üstün sonuçlar elde etmek için LLM'ler ve Ultralytics gibi çok modlu modeller için girdileri optimize etmeyi öğrenin.
Prompt mühendisliği, yapay zeka (AI) modellerinin doğru, alakalı ve yüksek kaliteli çıktılar üretmesini sağlamak için girdi metnini tasarlama, iyileştirme ve optimize etme stratejik sürecidir. Başlangıçta GPT-4 gibi Büyük Dil Modellerinin (LLM) yükselişiyle öne çıkan bu disiplin, metin, görüntü ve video gibi çeşitli modalitelerde üretken AI sistemleriyle etkileşim kurmak için kritik bir beceriye dönüşmüştür. GPT-4 gibi Büyük Dil Modellerinin (LLM) yükselişiyle öne çıkan bu disiplin, metin, görüntü ve video dahil olmak üzere çeşitli modalitelerde üretken AI sistemleriyle etkileşim kurmak için kritik bir beceriye dönüşmüştür. Yeniden eğitim yoluyla temel model ağırlıklarını değiştirmek yerine, prompt mühendisliği görevi sistemin en iyi anlayabileceği şekilde çerçeveleyerek modelin mevcut bilgisini kullanır ve insan niyeti ile makine yürütme arasındaki boşluğu doldurur.
Temelde, hızlı mühendislik, temel modellerin bağlamı ve talimatları nasıl işlediğini anlamaya dayanır. İyi yapılandırılmış bir komut istemi, açık kısıtlamalar, istenen çıktı formatları ( JSON veya Markdown gibi) ve ilgili arka plan bilgileri sağlayarak belirsizliği azaltır. İleri düzey uygulayıcılar, kullanıcının istenen modeli göstermek için komut isteminde birkaç giriş-çıkış çifti örneği sağladığı few-shot öğrenme gibi teknikleri kullanır.
Bir başka güçlü strateji ise düşünce zinciri yönlendirmesi olup, bu strateji modeli karmaşık akıl yürütme görevlerini ara adımlara bölmeye teşvik eder. Bu, mantık ağırlıklı sorgularda performansı önemli ölçüde artırır. Ayrıca, bağlam penceresinin(bir modelin aynı anda işleyebileceği metin miktarının sınırı) kullanımının optimize edilmesi, uzun etkileşimlerde tutarlılığı korumak için çok önemlidir. OpenAI'nin komut tasarımı kılavuzu gibi harici kaynaklar, sınır durumlarını etkili bir şekilde ele almak için yinelemeli iyileştirmenin önemini vurgulamaktadır.
Genellikle metinle ilişkilendirilse de, komut mühendisliği Bilgisayar Görme (CV) alanında giderek daha önemli hale gelmektedir. Modern çok modlu modeller ve YOLO gibi açık sözlük dedektörleri, kullanıcıların önceden tanımlanmış sayısal sınıf kimlikleri yerine doğal dil işleme (NLP) kullanarak algılama hedeflerini tanımlamasına olanak tanır.
Bu bağlamda, "komut" nesnenin metin açıklamasıdır (örneğin, "kırmızı kask takan kişi "). Sıfır atış öğrenme olarak bilinen bu özellik, sistemlerin görsel özellikler ve anlamsal gömüler arasındaki öğrenilmiş ilişkileri kullanarak açıkça eğitilmedikleri nesneleri detect sağlar . Sınıfların sabit olduğu yüksek hızlı üretim ortamlarında, geliştiriciler sonunda promptlu modellerden YOLO26 gibi verimli, yeniden eğitilmiş modellere geçebilirler, ancak hızlı prototip oluşturma ve esnekliğin anahtarı prompt mühendisliği olmaya devam eder.
Prompt mühendisliği, esnek ve akıllı otomasyonu mümkün kılarak çeşitli sektörlerde değer yaratır:
Aşağıdaki örnekte istem mühendisliğinin programlı olarak nasıl uygulandığı gösterilmektedir
ultralytics paket. Burada, hangi nesneleri arayacağımızı dinamik olarak tanımlamak için metin komutlarını kabul eden bir YOLO modeli kullanıyoruz.
Bu, standart modellerin aksine
YOLO26 sabit sınıf listeleri kullanan.
from ultralytics import YOLO
# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolov8s-world.pt")
# Apply prompt engineering to define custom classes dynamically
# The model maps these text descriptions to visual features
model.set_classes(["person in safety vest", "forklift", "blue hardhat"])
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Show results - the model only detects objects matching the prompts
results[0].show()
Ultralytics aracılığıyla AI çözümlerini etkili bir şekilde uygulamak için, prompt mühendisliğini benzer optimizasyon tekniklerinden ayırmak önemlidir: