NLP'de Adlandırılmış Varlık Tanıma (NER) özelliğini keşfedin. AI ve Ultralytics ile içgörüler elde etmek için isimler ve tarihler gibi classify varlıklarını nasıl tanımlayıp classify öğrenin.
Adlandırılmış Varlık Tanıma (NER), yapılandırılmamış metinlerdeki önemli bilgileri tanımlama ve sınıflandırma işlemini içeren Doğal Dil İşleme (NLP) işleminin temel bir alt görevidir. Tipik bir iş akışında, bir NER modeli bir belgeyi tarayarak "varlıkları" (gerçek dünyadaki nesneleri temsil eden belirli kelimeler veya kelime öbekleri) bulur ve bunları kişi isimleri, kuruluşlar, konumlar, tarihler veya tıbbi kodlar gibi önceden tanımlanmış kategorilere atar. Bu süreç, e-postalar, müşteri yorumları ve haber makaleleri gibi ham, yapılandırılmamış verileri makinelerin işleyip analiz edebileceği yapılandırılmış biçimlere dönüştürmek için gereklidir. Bir metnin "kim, ne ve nerede" sorularını yanıtlayarak, NER, Yapay Zeka (AI) sistemlerinin büyük miktarda bilgiden otomatik olarak anlamlı içgörüler çıkarmasını sağlar.
Modern NER sistemleri, bir kelimenin bağlamını anlamak için gelişmiş istatistiksel modeller ve Derin Öğrenme (DL) tekniklerinden yararlanır. Süreç, bir cümlenin token adı verilen bireysel birimlere ayrıldığı tokenleştirme ile başlar. Transformer gibi sofistike mimariler, daha sonra bu tokenler arasındaki ilişkileri analiz ederek kullanımlarına göre anlamlarını belirler.
Örneğin, "Apple" kelimesi cümleye bağlı olarak bir meyveyi veya bir teknoloji şirketini ifade edebilir. Kendi kendine dikkat gibi mekanizmalar sayesinde, bir NER modeli "Apple yeni bir telefon çıkardı" ifadesinin bir Kuruluşu ifade ettiğini, "Bir elma yedim" ifadesinin ise genel bir nesneyi ifade ettiğini ayırt eder. Bu modellerin performansı, büyük ölçüde yüksek kaliteli eğitim verilerine ve hassas veri açıklamalarına bağlıdır. Çok modlu uygulamalarda, NER genellikle Optik Karakter Tanıma (OCR) ile eşleştirilerek, işlenmeden önce görüntülerden metin çıkarılır.
NER, çeşitli endüstrilerde kullanılan birçok akıllı otomasyon aracının temel teknolojisidir.
NER'yi diğer yorumlama görevlerinden ayırmak, AI sürecindeki özel rolünü anlamak açısından yararlıdır.
Metin ve görmenin birleşmesi, Çok Modlu Öğrenmede giderek yaygınlaşan bir trenddir. YOLO gibi modeller, nesne algılamayı yönlendirmek için metin komutları kullanarak bu boşluğu doldurur. Bu iş akışında, metin kodlayıcı bir NER sistemine benzer şekilde çalışır ve kullanıcı tarafından sağlanan sınıf adlarının (varlıkların) anlamsal anlamını yorumlayarak karşılık gelen görsel nesneleri bulur.
Aşağıdaki Python örneği, aşağıdakilerin nasıl kullanılacağını göstermektedir ultralytics kütüphane, özel metin açıklamalarına dayalı olarak detect ve doğal dil varlıklarını görsel verilerle etkili bir şekilde ilişkilendirir.
from ultralytics import YOLOWorld
# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")
# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])
# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")
# Display the results with bounding boxes around detected entities
results[0].show()
Geliştiriciler, NER'yi uygulamak için sağlam bir araç ekosistemine erişebilirler. spaCy ve NLTK gibi popüler açık kaynak kütüphaneleri, hemen kullanıma hazır önceden eğitilmiş boru hatları sağlar. Kurumsal ölçekli uygulamalar için, Google Natural Language gibi bulut hizmetleri, talebe göre ölçeklenebilen yönetilen API'ler sunar.
Metin veya görsel için olsun, bu AI modellerinin yaşam döngüsünü yönetmek verimli operasyonlar gerektirir. Ultralytics , bu MLOps süreçlerini basitleştirerek veri kümelerini yönetmek, modelleri eğitmek ve çözümleri uygulamak için birleşik bir ortam sunar. Bu, AI projelerinin ölçeklenebilir ve üretime hazır kalmasını sağlar ve en son teknoloji performansı için YOLO26 gibi modellerin sürekli iyileştirilmesini destekler.