Adlandırılmış Varlık Tanıma (NER) ile içgörülerin kilidini açın. Yapay zekanın yapılandırılmamış metinleri çeşitli uygulamalar için nasıl eyleme dönüştürülebilir verilere dönüştürdüğünü keşfedin.
Adlandırılmış Varlık Tanıma (NER), Doğal Dil İşleme'de (NLP ) temel bir görev ve modern Yapay Zeka'nın (AI) önemli bir bileşenidir. Yapılandırılmamış metin içindeki "adlandırılmış varlıklar" olarak bilinen belirli bilgi parçalarının otomatik olarak tanımlanmasını ve sınıflandırılmasını içerir. Bu varlıklar genellikle kişiler, kuruluşlar, konumlar, tarihler, ürün adları, parasal değerler ve daha fazlası gibi gerçek dünya nesnelerini temsil eder. NER'in birincil amacı, ham metni yapılandırılmış verilere dönüştürerek makinelerin çeşitli yapay zeka kullanım durumları için değerli içgörüleri anlamasını, işlemesini ve çıkarmasını kolaylaştırmaktır.
NER sistemleri, varlıkları bulmak ve kategorize etmek için metnin dilsel yapısını ve bağlamını analiz eder. İlk sistemler büyük ölçüde dilbilgisi kurallarına ve sözlüklere (bir tür Sembolik YZ) dayanırken, modern yaklaşımlar Makine Öğreniminden (ML), özellikle de Derin Öğrenimden (DL) yararlanmaktadır. Transformers gibi modeller, genellikle aşağıdaki gibi platformlarda bulunur Hugging Facebağlamı ve ince dil kalıplarını anlamada üstündür ve bu da daha yüksek doğruluk sağlar. Süreç genellikle tokenizasyonla ilgili teknikleri kullanarak potansiyel varlıkları (kelimeler veya kelime öbekleri) tanımlamayı ve ardından bunları önceden tanımlanmış kategorilere (örneğin KİŞİ, KURULUŞ, YER, TARİH, MISC) sınıflandırmayı içerir. Bu sınıflandırma, genellikle NER görevleri için özel olarak eklenmiş büyük veri kümeleri üzerinde eğitim sırasında öğrenilen özelliklere dayanır.
Örneğin, "4 Temmuz'da Sarah Jones, Acme Corp'u temsil ederken Eyfel Kulesi'ni ziyaret etti" cümlesinde, bir NER sistemi bunu tanımlayacaktır:
Bu yapılandırılmış çıktı, veri analizi veya bir bilgi grafiğini doldurma gibi sonraki görevler için tek başına orijinal metinden çok daha kullanışlıdır. Daha derin teknik bilgiler için NER teknikleri üzerine bir anketi inceleyebilirsiniz.
NER, metinsel bilgiyi yapılandırarak çeşitli alanlarda çok sayıda uygulamaya olanak sağlayan temel bir teknolojidir:
Veri ek açıklaması ve model dağıtımı dahil olmak üzere NER modelleri için makine öğrenimi yaşam döngüsünü yönetmek, Ultralytics HUB gibi platformlar tarafından kolaylaştırılabilir.
NER genellikle diğer NLP görevleriyle birlikte kullanılır ancak farklı bir odağı vardır:
Bu ayrımları anlamak, Bilgisayarla Görme Projesinin Adımları gibi kılavuzlarda belirtildiği gibi, belirli bir sorun için doğru NLP tekniğini seçmek için çok önemlidir (CV'ye odaklanmış olsa da, ilkeler geçerlidir).