Sözlük

İsimlendirilmiş Varlık Tanıma (NER)

Adlandırılmış Varlık Tanıma (NER) ile içgörülerin kilidini açın. Yapay zekanın yapılandırılmamış metinleri çeşitli uygulamalar için nasıl eyleme dönüştürülebilir verilere dönüştürdüğünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Adlandırılmış Varlık Tanıma (NER), Doğal Dil İşleme'de (NLP ) temel bir görev ve modern Yapay Zeka'nın (AI) önemli bir bileşenidir. Yapılandırılmamış metin içindeki "adlandırılmış varlıklar" olarak bilinen belirli bilgi parçalarının otomatik olarak tanımlanmasını ve sınıflandırılmasını içerir. Bu varlıklar genellikle kişiler, kuruluşlar, konumlar, tarihler, ürün adları, parasal değerler ve daha fazlası gibi gerçek dünya nesnelerini temsil eder. NER'in birincil amacı, ham metni yapılandırılmış verilere dönüştürerek makinelerin çeşitli yapay zeka kullanım durumları için değerli içgörüleri anlamasını, işlemesini ve çıkarmasını kolaylaştırmaktır.

Adlandırılmış Varlık Tanıma Nasıl Çalışır?

NER sistemleri, varlıkları bulmak ve kategorize etmek için metnin dilsel yapısını ve bağlamını analiz eder. İlk sistemler büyük ölçüde dilbilgisi kurallarına ve sözlüklere (bir tür Sembolik YZ) dayanırken, modern yaklaşımlar Makine Öğreniminden (ML), özellikle de Derin Öğrenimden (DL) yararlanmaktadır. Transformers gibi modeller, genellikle aşağıdaki gibi platformlarda bulunur Hugging Facebağlamı ve ince dil kalıplarını anlamada üstündür ve bu da daha yüksek doğruluk sağlar. Süreç genellikle tokenizasyonla ilgili teknikleri kullanarak potansiyel varlıkları (kelimeler veya kelime öbekleri) tanımlamayı ve ardından bunları önceden tanımlanmış kategorilere (örneğin KİŞİ, KURULUŞ, YER, TARİH, MISC) sınıflandırmayı içerir. Bu sınıflandırma, genellikle NER görevleri için özel olarak eklenmiş büyük veri kümeleri üzerinde eğitim sırasında öğrenilen özelliklere dayanır.

Örneğin, "4 Temmuz'da Sarah Jones, Acme Corp'u temsil ederken Eyfel Kulesi'ni ziyaret etti" cümlesinde, bir NER sistemi bunu tanımlayacaktır:

  • TARİH olarak "4 Temmuz"
  • PERSON olarak "Sarah Jones"
  • LOCATION olarak "Eiffel Kulesi"
  • ORGANİZASYON olarak "Acme Corp"

Bu yapılandırılmış çıktı, veri analizi veya bir bilgi grafiğini doldurma gibi sonraki görevler için tek başına orijinal metinden çok daha kullanışlıdır. Daha derin teknik bilgiler için NER teknikleri üzerine bir anketi inceleyebilirsiniz.

Uygunluk ve Uygulamalar

NER, metinsel bilgiyi yapılandırarak çeşitli alanlarda çok sayıda uygulamaya olanak sağlayan temel bir teknolojidir:

  • Bilgi Çıkarma: Haber makaleleri, raporlar veya e-postalar gibi belgelerden önemli ayrıntıları otomatik olarak çekme. Örneğin, finansal haber akışlarından şirket adlarının, yönetici unvanlarının ve konumlarının çıkarılması.
  • İçerik Kategorizasyonu ve Önerisi: Organizasyonu iyileştirmek ve öneri sistemlerini güçlendirmek için makaleleri veya gönderileri ilgili varlıklarla etiketleme.
  • Müşteri Desteği: Bahsedilen ürünleri, konumları veya belirli sorunları belirlemek için müşteri geri bildirimlerini veya destek biletlerini analiz ederek daha hızlı yönlendirme ve çözüm sağlama. "iPhone 16" ve "New York mağazası "ndan bahseden destek e-postalarını otomatik olarak etiketleyen bir sistem hayal edin.
  • Sağlık Hizmetleri: Klinik notlardan hasta adlarını, teşhisleri, ilaçları ve dozajları çıkararak tıbbi kayıt yönetimini kolaylaştırmak, raporlarla birleştirildiğinde tıbbi görüntü analizi gibi alanlara katkıda bulunmak.
  • Anlamsal Arama: Arama motorlarını, içindeki varlıkları tanıyarak sorguların arkasındaki anlamı anlayacak şekilde geliştirmek (örneğin, "Louvre yakınlarındaki restoranlar" için arama yapmak, "Louvre "u bir YER olarak tanımlamayı gerektirir). Google Cloud Natural Language AI gibi araçlar NER yetenekleri sunar.
  • Finansal Analiz: Piyasa analizi ve tahmine dayalı modelleme için finansal raporlardan şirket adlarının, parasal değerlerin ve tarihlerin çıkarılması.
  • Uyumluluk ve Güvenlik: Veri gizliliğini ve GDPR gibi yönetmeliklere uygunluğu sağlamak için belgelerdeki isimler veya adresler gibi hassas bilgileri tanımlama.

Veri ek açıklaması ve model dağıtımı dahil olmak üzere NER modelleri için makine öğrenimi yaşam döngüsünü yönetmek, Ultralytics HUB gibi platformlar tarafından kolaylaştırılabilir.

İlgili Kavramlardan Temel Farklılıklar

NER genellikle diğer NLP görevleriyle birlikte kullanılır ancak farklı bir odağı vardır:

  • Duygu Analizi: Metinde ifade edilen duygusal tonu (olumlu, olumsuz, nötr) belirler. NER neyin tartışıldığını tanımlarken, duygu analizi yazarın bu konuda nasıl hissettiğini tanımlar.
  • Metin Özetleme: Temel bilgileri koruyarak bir metnin daha kısa bir versiyonunu oluşturmayı amaçlar. NER, tüm metnin yoğunlaştırılmış bir özetini değil, belirli varlık sözlerini çıkarır.
  • Nesne Algılama: Sınırlayıcı kutular kullanarak görüntülerdeki nesneleri tanımlayan ve konumlandıran bir Bilgisayarla Görme (CV) görevi. NER, görsel veriler üzerinde değil, yalnızca metin verileri üzerinde çalışır. Ultralytics YOLO modeller algılama görevleri için yapar.
  • Doğal Dil Anlama (NLU): Amaç tanıma, ilişki çıkarma ve coreference çözümleme dahil olmak üzere metin anlamının genel olarak kavranmasını kapsayan daha geniş bir alan. NER, NLU içinde yalnızca varlık tanımlama ve sınıflandırmaya odaklanan özel bir alt görevdir.
  • Anahtar Kelime Çıkarma: Bir metindeki, adlandırılmış varlıklar olabilecek veya olmayabilecek önemli terimleri veya kelime öbeklerini tanımlar. NER özellikle insanlar, yerler ve kuruluşlar gibi önceden tanımlanmış kategorileri arar.

Bu ayrımları anlamak, Bilgisayarla Görme Projesinin Adımları gibi kılavuzlarda belirtildiği gibi, belirli bir sorun için doğru NLP tekniğini seçmek için çok önemlidir (CV'ye odaklanmış olsa da, ilkeler geçerlidir).

Tümünü okuyun